automated speech recognition:自动语音识别
自动语音识别(Automatic Speech Recognition,ASR)的目标是让计算机能够辨别出人们所说的话的内容。ASR通常有以下几种分类方法:(1) 特定人和非特定人;(2) 小词汇量、中词汇量和大词汇量;(3) 语音命令(孤立词)识别、关键词检出,以及连续语音识别(听写)等。其中语音命令识别引擎要求用户所说的语音中最多只能含有一个词表中定义的词;而关键词检出引擎中则允许用户所说的语音中除了含有一个或多个词之外,还可以包含其它无关的内容,识别器将只检测出那些在词表中定义过的词,同时忽略其它无关的内容;连续语音识别引擎则会把用户所说的语音逐字逐句地转换为文字,是实现“声音”到“文字”转换的技术,它的实现中涉及到声学模型和语言模型:声学模型用以从声音信号中识别出“音(例如拼音)”,而语言模型用以把“音”转换成“字(例如有意义的文本语句)”。
最近更新时间:2008-12-15 EN
相关推荐
-
如何成功运行IT试点项目
正确的软件可以帮助公司获得竞争优势,但错误的软件可能会增加关键流程的复杂性和失败率。这意味着,测试潜在软件在企 […]
-
AI能源使用增加,技术工作负载限制IT
能源的可用性和成本正在成为技术使用的制约因素,随着企业AI应用程序增加计算需求,IT经理必须计划解决这一问题。 […]
-
减少关键技术债务的策略
现在的IT领导者、项目经理和软件开发领导者必须优先考虑预防技术债务。 技术债务会带来深远的负面影响。出于速度或 […]
-
生成式AI能耗增加,但尚不清楚投资回报率
在为生成式AI构建商业案例时,IT领导者需要考虑很多成本考虑因素,有些显而易见,有些则是隐藏成本。 其中最明显 […]