意图识别

定义

从用户输入的对话内容（如文本、语音等形式）中分析并判断出用户的目的或者意图，关联实际场景并输出结构化指令标签或关联参数。

重要组件

预训练模型选择：

语义理解的桥梁
- 任务精准触发: 基于模糊语言实现精确的下游任务路由
- 应用场景：任务模块路由 —— 长程任务将用户请求分配给相应任务模块
保障任务准确性与鲁棒性
- 领域知识注入: 通过RAG等手段保证垂域场景下的意图识别精度
- 冲突消解: 低置信度请求 + 重述机制保证意图识别鲁棒性
- 应用场景：动态上下文管理 —— 保证意图的连贯性，避免多轮交互导致目标偏离
支持复杂系统集成
- 多Agent协作枢纽: 拆解复杂指令意图，指派特定Agent
- 标准化接口: 统一意图标签对接下游API，降低系统改造成本
- 应用场景：资源分在均衡 —— 根据意图复杂度和调用频率分配计算资源
提升交互效率与体验
- 个性化适配: 结合用户画像等辅助手段动态调整潜在意图权重
- 低延迟响应: 小参数模型可以缩短响应时间，降低token消耗
- 应用场景：安全与合规过滤 ——拦截高风险意图，或对敏感操作添加二次确认环境

使用提示词强化类型名称 + 分类规则
意图识别提示词四段式定义
- 角色定义： 1. 你是一个善于分析用户问题并识别其意图的对话机器人
- 类别描述: 2. 你只能从以下意图中选择一项进行结果输出： 1. intent_1: description
- 分类规则： 3. 你可以借助以下规则来帮助进行意图判断：规则1：... ，规则2：...
- 输出规范: 4. 遵循上述规则，并严格按照以下格式进行输出： format

具身智能意图识别: 不同参数量模型使用相同训练配置在上限(全量SFT数据)与下限(Prompt)方面的精度表现

具身智能意图识别: 不同比例训练集进行SFT的精度

类别数量\参数量	0.5B	7B	32B以及以上	GPT-4o
2	70%-80%	85%-92%	90%-95%	95以上
3-5	60%-75%	70%-85%	80%-90%	90%-98%
6-10	30%-50%	60%-70%	70%-80%	85%-95%
10以上	30%以下	40%-60%	60%-75%	75%-85%

不同类别数量与参数量模型使用Prompt可达成的理论精度经验值

若已实行Prompt工程，在不考虑垂域知识的前提下，以98%准确率作为交付标准，不同规模的分类模型所需数据量(包括对抗样本/平行样本)估算:

类别数量\参数量	0.5B	7B	32B以及以上
2	800-1000	100-300	100以内
3-5	1000-1500	300-500	100-300
6-10	1500-2500	500-1000	300-800
10以上	2500+	1000+	800+

训练方案决策的考量方面 —— 人力成本与交付效果的综合考量

Multi-LoRA（多重低秩适应）是一种在单个基础大语言模型(LLM)上应用多个低秩适配模块的技术，可以在不修改核心模型权重的情况下，为模型赋予不同的专业化能力。