语音理解

定义

语音理解起源于美国，1971年，美国远景研究计画局(ARPA)资助了一个庞大的研究项目，该项目要达到的目标叫做语音理解系统。由于人对语音有广泛的知识，可以对要说的话有一定的预见性，所以人对语音具有感知和分析能力。依靠人对语言和谈论的内容所具有的广泛知识，利用知识提高计算机理解语言的能力，就是语音理解研究的核心。

利用理解能力，可以使系统提高性能①能排除噪声和嘈杂声；②能理解上下文的意思并能用它来纠正错误，澄清不确定的语义；③能够处理不合语法或不完整的语句。，研究语音理解的目的，可以说是与其研究系统仔细地去识别每一个单词，倒不如去研究系统能抓住说话的要旨更为有效。

一个语音理解系统除了包括原语音识别所要求的部分之外，还须添入知识处理部分。知识处理包括知识的自动收集、知识库的形成，知识的推理与检验等。还希望能有自动地作知识修正的能力。语音理解可以认为是信号处理与知识处理结合的产物。语音知识包括音位知识、音变知识、韵律知识、词法知识、句法知识，语义知识以及语用知识。这些知识涉及实验语音学、汉语语法、自然语言理解、以及知识搜寻等许多交叉学科。

初步研製成功的语音理解系统称为HEARSAY系统。它是利用一种公用“黑板"作为知识库，环绕此黑板的是一系列专家系统，分别提取及搜寻有关音位、音变……等各种知识。以后能进一步达到预计目标的系统是HARPY系统，该系统用语言的有限状态模型，通过唯一的一个统一的网路把彼此分离的各种知识源集中起来，这个统一的网路，称为知识编译器。不同理解系统在利用知识的策略或组织方面各有不同的特点。

完善的语音理解系统是人们梦寐以求的研究理想，但这并非短期内能够完全解决的研究课题。面向确定任务的语音理解系统，例如只涉及有限的辞彙量，有一般比较通用的说话句型的语音理解系统，以及可供一定範围的工作人员使用的语音理解系统，是可以实现的。，它对某些自动化套用领域已有实用价值，例如飞机票预售系统、银行业务、旅馆业务的登记及询问系统等。

语音识别

语音识别（speech recognition) 利用计算机自动对语音信号的音素、音节或词进行识别的技术总称。语音识别是实现语音自动控制的基础。

语音识别起源于20世纪50年代的“口授打字机”梦想，科学家在掌握了元音的共振峰变迁问题和辅音的声学特性之后，相信从语音到文字的过程是可以用机器实现的，即可以把普通的读音转换成书写的文字。语音识别的理论研究已经有40多年，转入实际套用却是在数位技术、积体电路技术发展之后，现在已经取得了许多实用的成果。

语音识别一般要经过以下几个步骤①语音预处理，，包括对语音的幅度标称化、频响校正、分帧、加窗和始末端点检测等内容。②语音声学参数分析，包括对语音共振峰频率、幅度等参数，以及对语音的线性预测参数、倒谱参数等的分析。③参数标称化，主要是时间轴上的标称化，常用的方法有动态时间规整（DTW)，或动态规划方法(DP）。④模式匹配，可以採用距离準则或机率规则，也可以採用句法分类等。⑤识别判决，通过的判别函式给出识别的结果。

语音理解

语音理解

基本介绍

定义

语音识别

搜索

癌症治疗

癌症预防

癌症症状

语音理解

语音理解

基本介绍

定义

语音识别

生活常识

搜索

癌症治疗

癌症预防

癌症症状