智能问答
算法简介
模型中输入为经过字符清洗后的用户查询文本,在其前后添加与预训练中相同的句子起始与终止标识。采用预训练中所得的词向量对其进行向量化表示Word Embedding,结合位置向量表示Position Embedding得到输入文本在模型中的向量输入x,经过上述Transformer 模型中的编码过程可得到基于自注意力机制抽取的特征图谱Squence Outpt。
分别将其输入至左侧前馈神经网络再由softmax函数得到对应问题类别的概率分布;同时将特征图谱输入右侧前馈神经网络再由softmax函数得到特征图谱中每一维输出对应实体标注的概率分布,从而实现对用户查询的实体抽取与问题分类。
专家介绍
算法示意图
应用场景
问答系统中的首要任务即为对用户查询的意图解析。意图解析可分为查询中的实体抽取与查询的类别判断两个信息抽取任务,也可以看作是序列标注和文本分类问题,这两个任务之间具有较高的关联性,因此通过构建双向 Transformer 的多任务联合模型同时进行实体抽取与问题分类,从而完成对查询的意图解析工作,该模型的输入为用户查询,输出为查询中的实体或关系词以及查询所属的预设类别。通过该方法,可以从用户输入的文本解析用户意图,获取问句中的关键信息,根据获取的意图和槽位信息,可以通过适当的匹配方式从数据库或语料中获取相应的反馈结果。