点击此处下载pdf文档
中科信利嵌入式语音识别引擎简介
北京中科信利技术有限公司
中科信利嵌入式语音识别引擎(简称MSR)是一款为移动设备比如PDA、手机语音应用而设计的语音识别引擎。其内核基于隐马尔科夫模型(HMM),所采用的搜索算法针对嵌入式移动设备的特点作了针对性的改进以提高速度和识别率。所用的中文语音模型是基于大量的不同场合,不同人群和不同口音的真实语音数据训练出来的,具有较好的鲁棒性。根据不同移动设备的资源情况,该识别引擎可以被定制成不同的配置,使得它可以在某种设备上让语音识别的应用性能达到最优。
特点和需求:
说话人无关识别技术,支持汉语普通话且允许说话者带有口音(但不支持各地的方言)
支持动态词表的增减(提供API接口)
支持中英文混合词表的识别
支持动态的英文孤僻词汇的标注(提供API接口)
标准的C程序接口,易于第三方开发
嵌入式语音识别引擎MSR的运行资源要求:
CPU不低于25MIPS,并配有DSP支持用于特征提取
内存需求同词表大小有关(以200词为例)
RAM: 70KB (包括动态内存) FLASH: 50KB ROM: 310KB
内存(RAM+FLASH)的增加率为每个词570字节,ROM的占用不变
性能和速度
在通常的使用情况下(包括办公室、马路上、汽车内),词表大小在200词的时候,识别准确率不小于95%;词表大小到2000词时,识别准确率不小于90%;汉字全音节的识别率,首选音的准确率不小于80%,前三选的准确率不小于97%,前五选的准确率不小于99%;
在满足运行资源的最低要求下保证实时性
编程模式和接口
中科信利语音识别引擎软件封装在一个DLL文件里,它提供了一组C的API函数以开发各种应用。应用程序通过回调函数的方式接受从引擎发送过来的消息与之通信。
|