AI智能问诊系统(基于LLM大模型)

完整正文:进入精读全文

原文结构

  • AI智能问诊系统(基于LLM大模型)
  • 一、意图识别与分类
  • 1.混合意图识别架构
  • 多模态输入解析:
  • 三级分类体系:
  • 基于传统NLP算法的智能客服交互痛点
  • 2.动态特征增强
  • 上下文感知模型:
  • 实时知识注入:
  • 二、场景化任务编排
  • 1.工作流引擎设计
  • 1)可视化流程编排:
  • 可选落地方案一:基模 + Prompt
  • CoT 思维链
  • 思考步骤为了完成上述目标,请按照下面的过程,一步一步思考后完成: 1.首先需要先理解候选的意图信息共有如下{}个类别,每个意图的含义或常见描述如下:{}
  • Few-Shot 少样本学习

正文摘录

1.混合意图识别架构

多模态输入解析:

支持文本、语音(ASR转写)多模态输入,通过大模型语言提取语义特征。

三级分类体系:

提示 一级场景分类:

基于传统NLP算法的智能客服交互痛点

提示 在传统NLP技术体系下,有几个问题导致体验无法进一步提升。 比如复杂语境下的意图识别问题、上下文理解和多轮对话问题、泛化推理问题等。

2.动态特征增强

上下文感知模型:

1)可视化流程编排:

基于工作量=流平台构建可拖拽式工作流,支持200+节点类型(API调用、条件分支、数据转换)。

示例:导诊流程包含症状采集→科室匹配→医生推荐→导航引导4个核心节点。

可选落地方案一:基模 + Prompt

提示 方案特点: 开发成本低,适用于需要快速上线,对延时要求不高,分类相对简单的场景。

1)跨流程数据共享:

通过全局上下文管理器,实现预问诊填写的过敏史自动同步至用药咨询场景。

2)多模态输出适配:

根据终端类型动态渲染结果:手机端推送图文卡片,互联网医院推送微信消息。

三、大模型推理与检索增强(RAG)

1.领域增强型模型架构

提示 选用医助大模型72B,注入300G医疗文本(电子病历、指南文献)进行领域增量预训练。 使用院10万条脱敏医患对话数据,优化咨询场景生成效果;

采用多任务学习:同步训练意图识别、实体抽取、报告生成任务。

2.知识检索增强(RAG)

4.进阶方案:自动质检和自动微调链路

通过设计完整的离线质检工程链路。

持续自动训练和部署最新模型,解决生产准确率、训练集和微调模型成本的问题。 该方案通过多步骤处理流程,实现了自动对线上意图质检及自动重新训练的流程。总体上分为在线流程和离线流程两部分。 以下是详细的流程描述: 在线流程: