AI智能问诊系统(基于LLM大模型)
完整正文:进入精读全文
原文结构
- AI智能问诊系统(基于LLM大模型)
- 一、意图识别与分类
- 1.混合意图识别架构
- 多模态输入解析:
- 三级分类体系:
- 基于传统NLP算法的智能客服交互痛点
- 2.动态特征增强
- 上下文感知模型:
- 实时知识注入:
- 二、场景化任务编排
- 1.工作流引擎设计
- 1)可视化流程编排:
- 可选落地方案一:基模 + Prompt
- CoT 思维链
- 思考步骤为了完成上述目标,请按照下面的过程,一步一步思考后完成: 1.首先需要先理解候选的意图信息共有如下{}个类别,每个意图的含义或常见描述如下:{}
- Few-Shot 少样本学习
正文摘录
1.混合意图识别架构
多模态输入解析:
支持文本、语音(ASR转写)多模态输入,通过大模型语言提取语义特征。
三级分类体系:
提示 一级场景分类:
基于传统NLP算法的智能客服交互痛点
提示 在传统NLP技术体系下,有几个问题导致体验无法进一步提升。 比如复杂语境下的意图识别问题、上下文理解和多轮对话问题、泛化推理问题等。
2.动态特征增强
上下文感知模型:
1)可视化流程编排:
基于工作量=流平台构建可拖拽式工作流,支持200+节点类型(API调用、条件分支、数据转换)。
示例:导诊流程包含症状采集→科室匹配→医生推荐→导航引导4个核心节点。
可选落地方案一:基模 + Prompt
提示
方案特点:开发成本低,适用于需要快速上线,对延时要求不高,分类相对简单的场景。
1)跨流程数据共享:
通过全局上下文管理器,实现预问诊填写的过敏史自动同步至用药咨询场景。
2)多模态输出适配:
根据终端类型动态渲染结果:手机端推送图文卡片,互联网医院推送微信消息。
三、大模型推理与检索增强(RAG)
1.领域增强型模型架构
提示 选用医助大模型72B,注入300G医疗文本(电子病历、指南文献)进行领域增量预训练。 使用院10万条脱敏医患对话数据,优化咨询场景生成效果;
采用多任务学习:同步训练意图识别、实体抽取、报告生成任务。
2.知识检索增强(RAG)
4.进阶方案:自动质检和自动微调链路
通过设计完整的离线质检工程链路。
持续自动训练和部署最新模型,解决生产准确率、训练集和微调模型成本的问题。 该方案通过多步骤处理流程,实现了自动对线上意图质检及自动重新训练的流程。总体上分为在线流程和离线流程两部分。 以下是详细的流程描述: 在线流程: