语音门户

生活百科 2023-01-17 17:57生活百科www.aizhengw.cn

语音门户

语音门户是建立于XML 语言规范基础之上,是一种套用于语音浏览的标记语言。利用VoiceXML可以建立基于WEB的语音套用和服务。本文简要描述了VoiceXML规范及相关术语,并给出了一种基于VoiceXML的语音与数据集成模型,它主要由语音浏览器、语音识别、语音合成和VoiceXML网关等部分组成。

语音门户,可以方便地建立各种基于WEB的语音套用系统。关键字 VoiceXML 集成 模型 语音浏览器1 引言随着电子商务、客户服务等信息服务的普遍化,互动式语音应答系统(IVR ,Interactive Voice Response)在各种商业系统中的套用越来越广泛。这种语音互动方式存在以下缺点(1)移植性、灵活性差;(2)在实际系统上做套用开发的难度很大,特别是涉及到话音流程的编写及调试问题;(3)无法综合利用现在的WEB资源。而将IVR系统Internet化,可以增加系统可重用的机会,降低成本,这必将成为今后语音套用的一种主要趋势。
另一方面,到目前为止,人们从Internet获取各种资源时,还只能是藉助计算机来实现。而实际上,电话具有比计算机更高的普及率,如果允许人们通过电话来访问Internet的资源,那幺这对于Internet的套用发展必将是一次质的飞跃。在这类套用前景的驱动下,VoiceXML [2] 标準被提出来了,它是由World Wide Web Consortium (W3C)制定的。利用这种技术,用户可以通过电话按键或语音来访问Internet上的各种资源,它是语音浏览技术以及语音网际网路的核心。与XML标準类似,VoiceXML是一种基于文本的语言,它只定义了数据的存取方式,用户必须编写程式,以便能解释、生成、传送VoiceXML文档。VoiceXML为语音套用领域展现了一个广阔的未来,在语音门户、语音呼叫中心(Call Center) 、语音信息服务、语音电子商务等领域有着广泛的套用。而这些套用或服务可以很容易地和原有的数据系统结合起来,甚至可以轻易地从原有的各类套用中延展出来。使用VoiceXML的套用系统中,不要求用户学习複杂的高级语言,就可灵活扩充新业务。而无需再与开发商联繫,重新定製开发,只需要编写几个VoiceXML页面就可以实现新的业务流程。而且编制好的VoiceXML脚本可以随时随地加入到系统中,而不会影响系统的正常运行。本文简要描述了VoiceXML规范及主要术语,给出了一个基于VoiceXML的语音与数据集成模型。该模型通过VoiceXML解释器和浏览器访问Internet上的VoiceXML文档及资料库,从而实现语音和数据的集成,达到了语音浏览的目标。2 VoiceXML规范2.1 结构模型VoiceXML的结构模型[2] 如图1所示。主要包括文档伺服器、VoiceXML解释器程式、VoiceXML解释程式环境和执行平台组成。 图1 VoiceXML 的结构模型文档伺服器,可以是一台WEB伺服器,它处理VoiceXML解释程式的请求数据包,文档伺服器产生VoiceXML文档并送给VoiceXML解释程式。解释程式对文档中的标识进行分离,产生相应的数据或动作命令,引导和控制用户与执行平台之间的互动作用。,VoiceXML解释程式环境和解释程式一起监控用户的输入。比如,一个解释程式环境可能监听用户的操作帮助请求;另一个环境可能监听用户请求更改音量或文本语音输出的某些特性。执行平台是由解释程式环境和解释程式控制的,例如,在一个互动式的语音应答套用中, VoiceXML解释程式环境能可靠地监测到呼叫,获得初始的VoiceXML文档,并且回答这一呼叫,在回答之后VoiceXML解释程式引导这一对话。执行平台产生事件回响用户的动作(说话或者字元输入)和系统事件(例如计时器溢出)。这些事件中的一部分依照相应的VoiceXML文档按照VoiceXML解释程式的解释加以执行,其他的被VoiceXML解释程式环境控制。执行平台提供字元和语音的输入和音频输出,包括合成语音的输出(TTS,text to speech)、音频档案的播放、话音输入的识别(ASR ,automated speech recognition)、DTMF按键的识别、语音输入的录音等。 2.2 术语VoiceXML中的基本术语[2]主要有 会话和子会话(Dialogs and Subdialogs)会话用于描述应用程式对用户所说的各种提示,定义和收集用户做出的回响,并描述应用程式控制的流程。用户和套用系统用会话轮流进行互动。有两种类型的会话表格和选单。表格负责执行会话定义中描述的所有操作,用于封装用户的输入和输出相关的命令。在表格中,可以包含一些域,可以从表格中得到这些域的值。而每个域可以规定允许用户输入的语法定义。选单允许用户进行选择,而进入到所选的对话中。一个子会话类似一个函式调用,它引起一个新的互动作用并且返回给上一层的表单。例如,子会话可以用于创建一个在资料库查询时需要的确认序列;创建在单一请求中的多个文档共享的一批组件;或创建一个在多个请求中共享的可重用的会话库。 会话(session)会话期从用户与VoiceXML解释程式语境互动开始,持续进行文档的装载和处理,直到由用户、文档或解释程式环境发出终止请求才结束。 请求一个请求就是一组共享同一个请求根文档的文档。在一个请求中,无论何时用户与文档互动,请求根文档总是被载入。请求根文档被载入后,它的变数作为请求变数被其它文档使用,而且它的文法在请求的持续时间一直起作用。当用户在同一个请求中的不同文档间转换时,请求根文档总是被载入,只有用户转换到别的请求中的文档时,请求根文档才被卸载。 文法(grammar)每一个会话有一个或多个语音和(或)DTMF文法。在定向对话套用中,一个会话的文法只有在使用者与此会话互动时才起作用。在混合主动式对话中,计算机和用户交替控制下一步的操作,一些会话被标记以使它们的文法(如侦听呼叫)即使当用户在同一文档的其它会话时也起作用。在这种情况下,如果用户进行的操作与另一个会话的有效文法匹配,执行就会转移到另一个会话。 事件(Event)VoiceXML提供一种表单填充机制以处理"正常"的用户输入。,VoiceXML也定义了处理异常事件的机制。如用户在一定时间内没有作出应答,请求系统帮助等情况下平台会产生事件。如果解释程式在VoiceXML文档中发现语义性错误也会产生事件。 连结(Links)连结支持混合主动式对话,当用户在连结的作用範围时它指定的文法就起作用。如果用户的输入与连结的文法匹配,控制就转移到连结的目的URI。可以用来产生一个事件跳转到目的URI。 套用(Applications) 一个套用是由许多有共同套用根的文档组成。套用根在其中一个文档激活时就被装入,,在同一个套用的不同文档之间跳转时,根文档仍然驻留在记忆体,只有当用户在不同的套用之间跳转时,才会被弃。套用根文档的变数和语法定义都可以被其中的文档访问。3 基于VoiceXML的语音与数据集成3.1 总体结构模型一个VoiceXML套用模型,如图2所示。主要由以下几个部分组成VoiceXML网关,WEB伺服器,资料库伺服器。各部分的功能介绍如下。 图2 VoiceXML套用模型3.2 文档结构及其执行过程VoiceXML以套用、会话期、文档为单位建立套用结构,以会话为互动单位,逐个完成对话确定流程导向。可以看作一个包含会话的容器,所有的VoiceXML文档都是由一系列会话构成的。一组VoiceXML文档之间可以互相跳转,并且构成一个会话的有限状态机。用户总是处于某一会话中,每一个会话决定要转移到的下一个会话。转移由URIs指定,URIs定义下一个要使用的文档和会话。根文档是一个VoiceXML程式的开始,其中可以包括form、script、var、grammars等元素。VoiceXML程式总是从元素form开始执行,当程式需要跳转时,也是从一个form跳转到另一个form。一般採用多文档的套用结构,在一个套用中有一个根文档,其他文档中用来引用。一个套用的例子,如下Application root document (app-root.vxml)<?xml version="1.0"?> operator Leaf document (leaf.vxml)<?xml version="1.0"?>
Shall we say ?
一个VoiceXML的套用是一系列VoiceXML文档的集合。而且每一个套用都包含一个“根文档”,这有点像一个动态网站的default.asp或是index.asp。在VoiceXML套用调用的时候,“根文档”始终被调用。 3.3 VoiceXML网关3.3.1 语音识别语音识别使计算机能理解用户的语音命令,产生相应的文字结果,送回VoiceXML解析程式做处理。在VoiceXML网关中,语音识别引擎为命令式的识别引擎,其根据有限的文法)来识别用户的语音信号,并产生对应语法定义的识别结果。在VoiceXML语音浏览器中,文法决定了用户能说什幺以及如何说。好的语法能带给用户良好的互动感觉,也能从逻辑上提高语音识别引擎的识别率。VoiceXML网关中,语音识别不仅需要处理对用户语音信号的识别,也需要处理对用户按键的识别,按键和语音以同样的机制被处理和传递。一个典型的语音识别流程[3]如图3所示。 图3 典型的语音识别流程可以针对软体结构做一些调整[4],进行数据压缩传输。如图4是一个基于client/server方式的改进方法。 图4 基于client/server方式得语音识别
上一篇:证券市场行情分析 下一篇:许常德

Copyright@2015-2025 www.aizhengw.cn 癌症网版板所有