会话机器人在电话场景中的实践

时间:2024-03-16 00:31:33 阅读:

突然想写一篇电话场景下的对话机器人的介绍,算是对自己之前工作项目的一个小总结吧,只说自己知道的,算是抛转引玉吧。电话场景下返回给用户不是文本,而是语音,设计中需要引入语音合成技术。...

突然想写一篇关于电话场景中的对话机器人的介绍。 可以算是我对之前工作项目的一个简短的总结。 我只说一下我所知道的,也算是一个预告吧。

首先简单说明一下英语口语对话机器人技术,这里所说的会话机器人并不是指常见的聊天机器人英语口语对话机器人技术,而是指应用于客服、营销等场景的会话机器人。 它们需要与相应的行业知识相结合。 比如电信小智、10086等。我们可以大致分为客服和外呼(Inbound和Outbound)。 客服的典型特点就是用户打电话,机器人接听。 拨打电话时,由机器人发起通话。 从对话表现来看,前者多以用户主导,后者多以机器人为主。 常见客服机器人的主要核心功能是检索,简称FAQ或KBQA。 FAQ的核心是文本向量表示和相似度匹配。 没有时间和经验我不会谈论后者。 本文的重点是出站对话机器人。 ,并且它基于电话场景。

功能模块

1.对话管理DM

2. 语音转录ASR

3.口语理解SLU

4. 业务问答常见问题

5. 文字转语音 TTS

对话管理

因为是主动呼叫用户,所以自然是有目的的(这是与聊天机器人最大的区别),并且有明确的流程规划,比如财务催收、销售保险产品等场景对话机器人(流程示例如下) ),通常通过 if- 来实现 else 规则,定义先说什么再说什么,如何结束对话等。还有一个关键点就是问题之间的连接跳转。 Q1和Q2代表机器人需要提出的业务问题。 该过程根据用户的回答进行跳转。 它实际上是一个有限状态机FSM。

人机英语口语对话训练_英语口语对话机器人技术_英语语音对话机器人

英语语音对话机器人_人机英语口语对话训练_英语口语对话机器人技术

语音转录

这部分我没有深入接触过。 当时我只是调用其他同事开发的API,也只是用户端。 然而,实际上已经被证明是非常重要的(强调是后加的)。 在电话场景中,用户分散在世界各地,各种方言电影正在起飞会话机器人在电话场景中的实践,环境噪声的影响也不容忽视,往往获得的转录文本并不理想。 在特定场景下,语音转录模型需要在相应场景的数据上进行重新训练,以提高识别准确率,否则对话机器人将无法正常工作。

口语理解

口语理解实际上是对用户答案的​​分析,这与机器人的问题有关。 如果是封闭式问题(答案可以枚举)英语口语对话机器人技术,则是对用户意图的分类。 如果是开放性问题,就是对答案的分析。 前者是文本分类。 后者可以看作是序列识别。 例如,在上面给出的集合示例中,问题“是人吗?”的答案分为是和否。 Q2 可以看作是一个开放式问题,目标是从用户的回答中识别出时间/日期(这部分信息在图例中不用作跳转条件)。 在实践中,另一个不可忽视的问题是,用户的回答可能不是机器人问题的答案,而可能是反问句。 询问有关机器人的身份和呼叫目的的问题。 这部分是业务问答。

业务问答

这部分其实可以看成是一个客服机器人。 用户提出问题,机器人回答。 在实现时,需要预先定义答案对(FAQ集合),然后选择相似的匹配模型。 操作上可以是QQ匹配,也可以是QA匹配。 该方法可以是无监督的,也可以是有监督的。 无监督可以基于计算文本相似度(tf-idf、bm25)。 在监督方法的操作中,匹配文本被记录为正类。 为了平衡样本,负类是从不匹配的文本中随机抽取的。 对于采样,该算法可以提取文本特征,然后应用传统的分类模型,或者使用端到端的语义网络模型。 如果问答数据量很大学英语,可以参考搜索引擎的方法,首先通过文本检索引擎(如ES)召回topK文本,然后可以使用有监督的方法重新排序并重新排序,最后返回匹配的答案或匹配查询对应的答案。 一个重要的问题是,机器人返回答案后英语口语对话机器人技术,需要回到正常的对话流程,继续对话。

语音合成

在电话场景中,返回给用户的不是文本,而是语音,设计中需要引入语音合成技术。 在现有的市场环境下,用户对机器人是比较排斥的(很多情况下,机器人会立即挂断,通话无法进行)。 这对语音合成提出了很高的要求。 但根据现有的认识,现有的技术很难实现,所以在实践中,为了用户体验,往往会聘请专业人士按照本文进行记录。 录音之间可以插入少量的语音合成内容学英语,实现简单的个性化对话。 此外,由于整个对话的所有可能文本都是预先定义的,因此可以进行录音。

简要总结

本文主要介绍外呼场景下的对话机器人的设计和一些技术要点。 比较简单英语,很多细节没有涉及到,比如语音转录文本的预处理、对话机器人的预设响应、对话效果的评估等等,有机会我会补充~

猜你喜欢

下载并安装口语帮助应用程序的官方版本

能够通过软件进行语音跟读训练,这样能够让学生更好的进行对话交流提供了许多常见的情景对话交流内容,在软件中用户就可以轻松的进行情景对话...

口语100app v5.5.8020 安卓版

口语100app怎么用现在每个学生可以自己拥有一对一的智能口语教练。是世界上智能度最高的机器口语教练。过去,只有高端口语训练才采用的秘密武器,现在,让每个学习者可以享用。...
凭借自主研发的“海云天英语人机对话考试系统”,海云天科技(拓维信息002261子公司)继成功中标2018年宁波、嘉兴中考英语人机对话考试技术服务项目后,近日...
学英语口语最好的app英语流利说是一款智能口语打分软件,内置各种以场景为主题的课程,你可以模仿跟读,它会根据你发音的情况给你打分。学英语口语最好的app是阿卡索口语秀。阿卡索口语秀的核心功能是配音视频。英语流利说是一款智能口语打分软件,内置各种以场景为主题的课程,你可以模仿跟读,它会根据你发音的情况给你打分。口语侠是国内第一款专注于帮你找外教在线练口语的app。英语流利说是一款智能口语打分软件,内置各种以场景为主题的课程,你可以模仿跟读,它会根据你发音的情况给你打分。3、学英语口语最好的app是阿卡索口语...

口语机器人苹果版 v2.3.0

口语机器人苹果版app是一款高品质的英语口语学习应用,在这里用户可以和智能口语机器人进行对讲练习,还可以在线进行语音评分,欢迎朋友们下载使用!CC英语口语机器人,是一款融合国际领先的智能人机对话、感知计算,语音评分技术和新口语教学理念的英语口语学习应用。...
为此,本文分析智能语音测评技术在中考英语听说能力考试(以下称“人机对话”)应用过程中存在的问题,并提出相应的解决策略,以期为相关研究和实践提供参考。S市于2009年启动英语听力口语人机对话考试的试点工作,并于2011年全面推开。该市中考英语人机对话考试采用智能语音技术支持,考务管理、试卷制作均采用计算机辅助完成。...

人工智能应用实例(人工智能应用实例视频)

在英语自主学习的过程中,可以利用云计算技术、语音识别技术等人工智能技术,深度分析英语交流行为和教学过程中重点提及的英语词汇,通过随堂检测分析自身的英语水平,在反复多次的英语练习中认识到自身的不足之处,及时调整英语学习思路。人工智能技术创新英语学习方法...

发表评论

评论列表