1、服务器硬件配置:硬件配置一般是以Intel或AMD CPU为主,内存至少8G,硬盘容量至少120G;
2、操作系统配置:操作系统可以安装主流的Linux或Windows系统;
3、应用软件安装:安装智能机器人所需要的相关软件,如:
(1)智能语音识别软件:Nuance(纳斯)、FreeTTS(自由语音)、Microsoft Bing Voice(必应语音)等;
(2)自然语言处理软件:Stanford CoreNLP(斯坦福核心NLP)、Apache OpenNLP(开源NLP)等;
(3)智能机器人软件:Chatterbot(话语机器人)、AIML(人工智能标记语言)等;
4、机器人相关配置:针对不同的机器人软件进行相应的配置,如:
(1)Chatterbot:设置话语模板,记录对话记录,制定话语回复等;
(2)AIML:构建模板,定义变量,设置语言模式等。
要求语音识别引擎。Office XP 带了语音识别引擎,但可能还没有安装。
如要确定您的计算机是否安装了语音识别引擎,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
查找“语音识别”选项卡。如果“语音属性”中提供了“语音识别”选项卡,则表明安装了语音识别引擎。如果不可用,则表明该引擎没有安装。
一个高质量的近距(头戴式)麦克风。我们建议使用 USB 麦克风。
一台 400 MHz 或更快的具有 128 MB 内存的计算机。
Microsoft Internet Explorer 5.0 版本或更高版本的 Internet Explorer。
如果已安装语音识别引擎,请转到“如何设置您的硬件”部分。如果未安装此引擎,请转到“如何安装语音识别引擎”部分。
如何安装语音识别引擎
此部分介绍如何安装语音识别引擎。首先是第一部分“使用"添加或删除程序"安装语音识别”。然后,转到“打开 Microsoft Office 2003 和 2002 中的语音识别”部分。如果您作为一种文字服务删除了语音识别并希望重新添加该功能,则转到“作为文字服务添加语音识别”部分。
使用“添加或删除程序”安装语音识别
“添加或删除程序”安装语音识别,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control appwiz.cpl add new hardware,然后按 Enter。此时将显示“添加或删除程序”窗口。
单击“Microsoft Office XP”,然后单击“更改”。
单击“添加或删除功能”,然后单击“下一步”。
在“要安装的功能”下面,双击“Office 共享功能”。
双击“可选用户输入”,单击“语音”,单击下拉箭头,然后单击“从本机运行”。
单击“更新”。现在,语音识别在所有 Office 程序和其他启用它的程序(如 Internet Explorer)中都可用。
如果安装语音识别时收到错误,或如果无法安装语音识别,请转到“后续步骤”部分。
安装语音识别引擎后,“麦克风向导”可能会自动启动。如果该向导自动启动,则可以立即安装和配置硬件。或者,您可以退出该向导,使用“如何设置您的硬件”部分在其他时间设置硬件。
在 Microsoft Office 2003 和 2002 程序中打开语音识别
若要在 Microsoft Office 2003 和 2002 程序中打开语音识别,请按照下列步骤操作:
启动您要在其中使用语音识别的 Microsoft Office 2003 或 2002 程序。
在“工具”菜单上,单击“语音”。
安装并打开语音识别后,你可以做几件事情:
若要更改语音识别引擎或选定引擎上的特定设置,请转到“如何配置语音识别引擎”部分。
如果对您的语音引擎设置满意,请转至“如何设置您的硬件”部分以设置您要使用语音识别的硬件。
如果已安装硬件,请转到“如何训练语音识别”部分。为保证最佳效果,我们建议您至少花费 15 分钟针对环境和语音音量训练语音识别。
作为文字服务添加语音识别
若要作为一种文字服务添加语音识别,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control intl.cpl,然后按 Enter。此时将显示“区域和语言选项”窗口。
单击“语言”选项卡,然后单击“文字服务和输入语言”下的详细信息。
在“已安装的服务”下,单击“添加”。
在“输入语言”列表中,单击一种语言。
选中“语音”复选框,然后在列表中单击一个选项。
如何配置语音识别引擎
更改语音识别引擎
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“语音识别”选项卡。显示在“语言”框中名称为活动引擎。
单击活动引擎或使用箭头以显示可用引擎的列表。
单击新引擎,然后单击“确定”或“应用”以接受此新引擎。
停止使用语音的所有程序,然后重新启动您想使用的程序以启动新的语音引擎。
注意您可能无法通过引擎的名称确定该引擎支持的语言。有关该引擎的详细信息,请参阅该引擎的文档。此信息包括受支持的语言及辞典用途。辞典用途指出该语言是一般语法还是特定于某个专业(如法律专业或医学专业)的术语。
更改语音引擎设置
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
在“语音识别”选项卡上,单击“语言”部分中的“设置”,然后按照对话框中的说明或该引擎文档中的说明操作。特殊功能因引擎的制造商而异。
注意如果选择的语音引擎不支持自定义功能,则“语言”部分中的“设置”选项将不可用。
继续执行语音识别的下一部分以设置您的硬件。如果已经设置硬件,请转至“如何训练语音识别”部分以准备使用语音识别。
如何设置您的硬件
如何设置输入硬件
设置麦克风
找到声音连接插口,然后将麦克风插孔连接到计算机。多数计算机都使用内置声卡而且连接处通常在计算机的背面。
有多个与麦克风插孔大小和直径都相同的连接插口。找到麦克风连接插口。连接插口用一个小的麦克风图标或一个说明性标签来标记。
将麦克风插头插入到该麦克风连接插口中。
如要测试麦克风连接,请按照下列步骤操作:“麦克风”框显示一个输入声音的线性指示器。如果麦克风在接受输入,就会显示一个表示声音级别的条。普通语音的指示位置应比一半高度稍低一些。如果没有声音指示,请确保麦克风已打开。有些型号有静音开关。另外,请验证到计算机的连接。有些计算机具有几个插入麦克风的位置
首先,转到“配置麦克风”部分,查看是否可以进行一些将解决此问题的调整。
如果声音仍然没有指示,请转到“选择音频输入设备线路”部分以查看线路是否不是您使用工作的线路,然后转到“更改输入音量级别”部分对该线路进行声音级别调整(如有必要)。
如果这样做不能解决该问题,请转到“如何解决语音识别中的疑难问题”部分查找问题诊断步骤。
如果有声音指示,则继续执行下一部分以配置您的麦克风(如果系统向您提供此选项)。如果未向您提供该选项,但是您的麦克风正在运行,请转到“如何设置输出硬件”以确保已正确安装扬声器。
如果您有多个麦克风并且希望一个麦克风用于语音识别,其他麦克风用于所有其他声音输入,请转到“选择音频输入设备”部分。
如果连接麦克风后没有声音指示,则可以尝试多种方法:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击“语音识别”选项卡。
直接对准麦克风说话。声音级别应在“话筒级别”指示器中指示。
配置麦克风
若要配置麦克风,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“语音识别”选项卡,然后单击“配置麦克风”,以启动“麦克风向导”。所支持的功能因引擎厂家而异。
注意仅当当前引擎支持麦克风训练时,“配置麦克风”选项才可用。
按照屏幕上出现的说明操作。
选择音频输入设备线路
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
依次单击“语音识别”选项卡、“音频输入”,然后单击“属性”。
单击下列选项中的任何一项:
使用自动选择线路:当您单击此选项时,输入线路设置为由语音系统确定的默认线路。由于在驱动程序、能力和所用的语言上存在着差别,所以在选择的选项上会有一些不同。
默认值并不能适用于所有的选项。如果默认线路不能正常工作,则手动选择一个新的线路。为此,请单击“使用此音频输入线路”。
使用此音频输入线路:当您单击此选项时,可以为音频输入选择其他线路。该选项包括计算机的所有音频线路。但请注意,并非所有的音频线路都支持语音。
选择音频输入设备
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“语音识别”选项卡,然后单击“音频输入”。
单击下列选项之一:
使用首选的音频输入设备:当您单击此选项时,输入设备设为计算机的默认设备。如果想让您的语音程序把同一输入设备同时还作为计算机所有其他声音设备的输入设备,请单击此选项。通常,计算机只有一种输入设备,如头戴式麦克风。此设备在“语音”属性中是默认设备。对于每一个操作系统,都在控制面板中的声音或多媒体属性中指定了默认设备。
使用这个音频输入设备:当您单击此选项时,您可以选择另一设备专门用于语音程序。单击此选项以更改为其他输入设备。仅当其他设备可用时,下拉列表才可用。在此下拉列表中,单击您想使用的设备。如果您在此做了选择,其他音频程序的默认设备不会更改。例如,您可能想让所有的语音输入使用头戴式麦克风而不是无定向麦克风。
更改输入音量级别
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
依次单击“语音识别”选项卡、“音频输入”,然后单击“音量”。
将显示一个音量控制混音器。将音量调节到您希望的级别。
注意并非所有的设备都以同样的方式支持此选项。有些设备不支持音量控制并且“音量”选项不可用。其他引擎可能使用其自己的界面。在此情况下,请按照屏幕上显示的说明或者按照专门针对特定引擎的说明进行操作。
如果要设置扬声器或另一个输出设备,则继续执行“如何设置输出硬件”部分。如果您不需要设置输出设备,请转到“如何训练语音识别”部分以准备使用语音识别。
如何设置输出硬件
设置扬声器
若要设置扬声器,请按照下列步骤操作:
找到声音连接处并将扬声器插孔连接到计算机。由于多数计算机都使用内置声卡,因而连接处通常位于计算机的背面。有多个与扬声器插孔大小和直径都相同的连接插口。通常,有两种声音输出连接插口:
一种是标记为输出的连接。多数需要单独电源供应(如变压器或电池)的扬声器使用此连接插口。此连接插口还用于将放大的声音导出到录音设备,例如可录制 CD 和盒式磁带系统。
另一种连接插口用于无源扬声器。由于计算机会放大信号,如果在此处连接有源扬声器,会造成损坏。
将扬声器插头插入正确的连接插口。
如要测试扬声器连接,请按照下列步骤操作:
如果您听到声音,请转到“设置音频输出设备选项”部分以设置高级音频输出选项,或转到“如何训练语音识别”部分以准备使用语音识别。
如果您有多个输出设备并且希望一个设备仅用于语音识别,其他设备用于所有其他声音输出,请转到“选择音频输出设备”部分。
如果您连接扬声器之后听不到声音,请转到“如何解决文本语音转换中的疑难问题”部分。
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“文本到语音”选项卡,然后单击“预听语音”以听取选定的语音。文本于是就可以读出来,而且说到的单词将突出显示。如果扬声器工作正常,您将听到说出的单词。
选择音频输出设备
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“文本到语音”选项卡,然后单击“音频输出”。
单击下列选项中的任一选项:
使用首选的音频设备:当您单击此选项时,输出设备设为计算机的默认设备。如果想将此语音输出设备同时用于系统的所有其他声音输出,请单击此选项。它也是“语音”属性的默认选项。通常,计算机只有一种输出设备,如一对扬声器。对于每一个操作系统,都在控制面板中的声音或多媒体属性中指定了默认设备。
使用这个音频输出设备:当您单击此选项时,您可以选择另一设备专门用于语音程序。仅当其他设备可用时,下拉列表才可用。在此下拉列表中,单击您想使用的设备。在此做选择时,其他音频程序的默认设备不会更改。例如,您可能希望所有语音输出都使用耳机而不是扬声器。
设置音频输出设备选项
“音频输出”可用。按照屏幕上显示的说明或引擎文档中的说明操作。
若要设置音频输出设备选项,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control mmsys.cpl sounds,然后按 Enter。将显示“声音、语音和音频设备”窗口。
在“声音、语音和音频设备”窗口中单击“语音”。
注意如果您没有“声音、语音和音频设备”窗口,但是有“声音和音频设备”窗口,则语音组件可能在一个单独的窗口中。在这种情况下,请按照下列步骤操作:
单击「开始」,然后单击“运行”。
在“打开”框中键入 control,然后按 Enter。
双击“语音”。
单击“文本到语音”选项卡,然后单击“音频输出”。
按照屏幕上的指示操作。
完成音频设置后,请继续执行“如何训练语音识别”部分以准备使用语音识别。
如何训练语音识别
序言
随着人工智能命题的提出,近年来涌现出一大批基于人工智能的呼叫中心业务服务商和集成商,仅智能外呼这一模块儿就将近百家公司在推广和运营。可以说整个基于人工智能技术的市场开始蓬勃的发展起来了。
简单介绍一下什么叫做智能语音交互平台。其实大实话就是在呼叫中心基础上,集成 ASR、 TTS、的呼叫服务平台。
那么如何我们自己去搭建智能语音系统呢?
我们先列出搭建智能外呼系统的搭建需要那些技术和服务:
个人认为:
[if !supportLists]· [endif] 首先最重要的是交换机:
[if !supportLists]1. [endif]PBX也就是交换机,商用设备原厂包括像华为、Avaya、思科、东汇等这些生产硬件交换机,
[if !supportLists]2. [endif]还有就是目前FreeSitch、asterrisk、OpenPBX这些软件交换机。
[if !supportLists]· [endif] 其次是AI技术: 及包含语音识别、语义理解、语音合成这三种技术是核心组成部分。语音识别相当于人的“耳朵”,接进电话后,对人的话语进行处理转义成系统能够识别的数据交由系统处理去识别。在进一步的话,可以转义为文字。语义理解相当于人的"大脑",根据话语识别人的意图。语音合成,相当于人的”嘴巴“,识别人的意图之后,依照特定的回答方式,去回复和引导对话。
[if !supportLists]· [endif] 再者是前端服务平台:即用户登录、配置呼叫流程,建立呼叫任务、统计呼叫数据、导出呼叫报表的网站,这个是终端用户唯一可以看到并且操作的界面。
[if !supportLists]· [endif] 最后是外呼线路:其中包括三大运营商以及其他小型的集成线路供应商,主要目的是外呼电话或者是接入电话。
也有人可能有疑问:”智能语音交互系统最重要的不是人工智能么,和交换机有啥关系?”为什么说最重要的是交换机呢,原因是不管我们是外呼还是接入电话、都需要前端服务平台把外呼请求发送给交换机,通过外呼线路而拨出去。换句话说交换机是控制整体的外呼情况。硬件的交换机,比如说像华为的交换机,价格在大约几万到几百万不等的价格。对于想要建立自己的智能语音交互系统来说,价格对于一些小型公司来说承受不起,而FreeSitch这种软交换则大大方便了小型公司建立自己的智能语音交互系统。
什么是FreeSwitch?
FreeSitch是一个电话的软交换解决方案,包括一个软电话和软交换机用以提供语音和聊天的产品驱动。FreeSitch 可以用作交换机引擎、PBX、多媒体网关以及多媒体服务器等。支持多种通讯技术标准,包括 SIP, H.323, IAX2 以及 GoogleTalk ,同时也可以方便的与其他开源的PBX系统进行对接。而且具有很强的伸缩性。旨在为音频、视频、文字或任何其他形式的媒体,提供路由和互连 通信协议 。
FreeSwitch 的典型功能
[if !supportLists]· [endif]在线计费、预付费功能。
[if !supportLists]· [endif]电话路由服务器。
[if !supportLists]· [endif]语音转码服务器。
[if !supportLists]· [endif]支持资源优先权和QoS的服务器。
[if !supportLists]· [endif]多点会议服务器。
[if !supportLists]· [endif]IVR、语音通知服务器。
[if !supportLists]· [endif]VoiceMail服务器。
[if !supportLists]· [endif]PBX应用和软交换。
[if !supportLists]· [endif]应用层网关。
[if !supportLists]· [endif]防火墙/NAT穿越应用。
[if !supportLists]· [endif]私有服务器。
[if !supportLists]· [endif]SIP网间互联网关。
[if !supportLists]· [endif]SBC及安全网关。
FreeSwitch最典型的功能是作为一个服务器,并用电话客户端软件连接到它。虽然FreeSwitch支持众多的通信协议,但其最主要的协议还是SIP,通过SIP中继发起会话协议。
使用FreeSwitch这种软交换的好处在于,你只需要一台服务器就可以随时搭建自己的外呼中心,而且FreeSwitch支持跨平台运行。能够原生运行Windows、Linux、BSD等诸多32/64位平台。
FreeSwitch内部使用线程模型来处理并发请求,每个连接都在单独的线程中进行处理,不同的线程间通过Mutex互斥访问共享资源,并通过消息和异步事件等方式进行通信。FreeSwitch本身是比较稳定的,它是比较优秀的开源软件。另一方面来讲,FreeSwitch又是比较激进的,它的开发分支里会有大量的新特性加入,因此在测试不全面的情况下,很容易出现不稳定的情况。而在用于生产环境的情况下,系统的稳定性是系统能否正常被使用的关键。之前我们在做项目的过程中,就遇到一些FreeSwitch不稳定的情况,导致外呼情况不理想。举一个例子:我们在进行测试外呼的时候,语音通话断断续续,虽然前端服务平台可以很好的接受到数据的传输,但是,真正在与人工进行沟通的时候,会出现各种各样的沟通障碍,为了解决这一个问题,我们花费了几个月的时间,去研究FreeSwitch的结构特性。终于把这个问题解决掉。我们的项目才得以继续推动,最终得以真正落地部署实施。
也有人可能有疑问:”FreeSwitch软交换虽然重要,但是既然是智能语音交互系统人工智能不重要吗?”,重要,当然重要!容我慢慢道来~
AI 技术
1. 通信原理
先简单解释一下正常打电话这个流程
流程:A→PSTN→B
解释:PSTN是Public
Switched Telephone Network,意思为公共交换电话网络,也就是我们的运营商的网络电话,
那我们平时如何给呼叫中心比如打电话是如何打的?:个人A打电话给呼叫中心1***6 打电话,拨通后听到录音,您好,拨打人工台,请按0键,按键之后,出现盲音,真正接通之后,客服接通了电话。
流程:A→PSTN→PBX→IVR→客服
解释:PBX也叫交换机、相当于整个呼叫中心的出入口
IVR也叫互动/交互式语音应答,语音导航,也就是相当于咨询业务请按键,这一环节,根据业务去分流到客服。
智能语音交互平台(智能机器人)落实到具体具体业务场景是如何实现的:
如:”个人A要在某一个大型酒店预订位子“,
A拨通后先听到了声音,“您好,我是机器人小岳,需要我帮您订位子是吗?
个人A说,“我不要和机器人说话,找个真人来”。
然后听到录音,“为您转接很贵的真人客服,排队中,请稍后”。
几分钟后接通,真人客服接了电话。
流程:A→PSTN→PBX→IVR(TTS→ASR→NLP→TTS)→ACD→客服
解释:在IVR部分:不再需要提示按键,而是直接问来电方需要办理什么业务,然后识别语音、理解意图后,根据用户的需求,回答后转入对应的业务队列排队。
上边是接通的流程,呼出的流程与之相反,就不在赘述了。
2. 现在市场上的AI技术的运用
目前市场上的不管是ASR、TTS、NLP都被阿里百度科大讯飞等巨头公司所占据,这些技术在国内基本已经成为定局。像ASR这类引擎市场上大部分都是用的阿里云和讯飞云的,要不就是百度云。阿里云和讯飞云的识别率高一些,可以达到97%左右、百度的差一些,识别率在80%左右,我们当初在做项目的时候选择ASR做过测试,事实证明阿里云识别率更高同时也可以识别方言。因此,我们在做项目的时候,当仁不让的选择了阿里云的
TTS我们选择的是讯飞的,选择的理由很简单,毕竟科大讯飞是人工智能领域巨头级的公司,质量当然有的保证。
3. AI 能力对接
在具体落地中,这个领域的常规参与者通常具备呼叫中心能力或者AI能力其中一种,而主要的对接点也就在于AI能力与呼叫中心设备去对接,而ASR/TTS与呼叫中心设备对接的常规协议主要是mrcp/sip。
媒体资源控制协议(Media Resource Control
Protocol, MRCP)是一种通讯协议,用于语音服务器向客户端提供各种语音服务(如语音识别和语音合成)。有两个版本的MRCP协议,版本2使用SIP作为控制协议,版本1使用RTSP。
实际对接的时候,会遇到不少技术问题,当我们ASR/TTS引擎做私有云部署,为了避免了内外网穿透时防火墙的诸多设置和语音流的时延。这在我们当时对接的时候也花费了好大一番功夫。
前端服务平台:
其中最重要的就是配置呼叫流程这一块儿了,
这一块儿很容易被忽视,但是这反而是可以出成绩的地方。一般来说一套最佳话术模板,可以以一敌万。心理学基础必须要有,一句话怎么说能让接电话的人最大概率的顺着自己的思路走,达成目的,从而形成特定细分领域机器人话术模板,得到最佳的外呼效果(接通率、通话时长、电销意愿、催收意愿)或者是接通效果(满意度)
其余的基本就是web端的东西了,具体功能点呢,即用户登录、配置呼叫流程,建立呼叫任务、统计呼叫数据、导出呼叫报表,这些功能点基本实现就可以,因为站在产品角度,产品最重要的价值就是可以呼通或者接通用户的电话,并且能够准确的识别用户的意图,并且准确的回答用户。这就是智能语音交互系统的最终目标,也一直是我们的最终目标。
外呼线路厂商:
一般如果是购买系统的话,是给提供线路的,只需交一些线路费用。如果是自己做项目的话,网上、淘宝上一大堆,费用可以谈,也给提供线路对接的接口。
结语
虽然现在市场上做智能语音交互系统的比较多,但一般只限于各个行业的电话销售,真正意义上的智能语音交互还是很少的。原因很简单,虽然原理不是很难但是真正落地实施的时候,遇到的困难非常的多,几乎是一步一个坑。好在现在已经真正的落地实施了,方方面面的效果都还是很不错的。一年多的辛苦没有白费。哈哈~
写这篇文章尝试给大家简单介绍一下智能语音交互系统,然才疏学浅,疏漏和不当之处在所难免,权当给大家抛砖引玉。
诸多细节限于主题和篇幅的要求不做详细记述,如有问题,欢迎随时交流。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)