有专家说,语音识别用途广泛,潜力巨大,但要真正实现人与计算机的自然交流却很难,它不仅需要高深的基础理论的突破,更需要大量的实际工作的积累。
语音交互就要实现?
1996年,IBM公司发布了VoiceType中文语音识别软件,首次将其语音识别产品介绍给中国用户;1997年9月,IBM推出了ViaVoice中文连续语音识别系统,标志着中文语音识别技术商业化进程开始启动。
然而,语音识别技术并不是一夜之间冒出来的神话,自从有了计算机,人们就开始了语音识别技术的研究,因此可以说语音识别的历史和计算机一样长。特别是在70年代前后,研究的脉络日渐清晰,贝尔实验室和IBM等都先后建立了专门的研究机构。今天这两家公司在这一领域都已取得了显著的成果,并且在商业上应用成功,贝尔实验室主要偏重于电信方面应用的语音识别系统,如电话查询等;而IBM则偏重于商务应用,因而在连续语音识别上取得了不小的成功。
不谈商业方面的应用,事实上,很多公司都提供语音识别的引擎(Engine),并且都表示能支持微软的SAPI。看一看SAPI 4.0SUITE就不难发现,微软在这方面的研究并不逊色,只是很奇怪它居然没有将成果商业化。微软同时提供了一系列引擎,如SpeechRecognition(语音识别)、Command&Control(发布指令并控制)、PhoneQuery(电话语音识别)、Texttospeech(文本语音转换)等。
今天,许多用户已能享受到语音技术的优势了,可以对计算机发送命令,或者要求计算机记录用户所说的话,以及将文本转换成声音朗读出来。尽管如此,距离真正的人机自由交流的境界似乎还很遥远。现在已有商用系统存在的主要问题是:系统鲁棒性还有待改进,如对于噪声环境下或方言的语言识别率和稳健性等都不尽如人意。
不可否认,语音识别技术还有一段路需要走,要做到真正成功的商业化,它还需要在很多方面取得突破性进展,这实际上也是其技术的未来走向。
语音识别难在哪儿?
计算机自动语音识别就是让计算机能听懂人说话。这一问题曾经被一位知名的美国教授称之为是“比登月还难”的科学难题。其实,人们很早就认识到语音识别对于人类生活的重要性。世界上第一台计算机问世之后,马上就有人想到要让计算机听懂人说话。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已经经历了好几代,今天已经进入到了普通家庭。但是,语音识别方面的产品却迟迟未能进入市场。那么,它难在哪儿呢?
计算机语音识别是一个模式识别匹配的过程。在这个过程中,计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。
一个语音识别系统性能好坏的关键首先是它所采用的语音模型能否真实地反映话音的物理变化规律,所用的语言模型能否表达自然语言所包含的丰富语言学知识。然而无论是语音信号还是人类的自然语言都是随机、多变和不稳定的,很难把握。这就是目前语音识别过程中的最大难点。
其次,模板训练的好坏也直接关系到语音识别系统识别率的高低。为了得到一个好的模板,往往需要有大量的原始语音数据来训练语音模型。因此,在开始进行语音识别研究之前,首先要建立起一个庞大的语音数据库和语料数据库。一个好的语音数据库包括足够数量、具有不同性别、年龄、口音说话人的声音,并且必须要有代表性,能均衡地反映实际使用情况。
有了语音数据库及语音特征,就可以建立语音模型,并用语音数据库中的语音来训练这个语音模型。训练过程是指选择系统的某种最佳状态(如对语音库中的所有语音有最好的识别率),不断地调整系统模型(或模板)的参数,使系统模型的性能不断向这种最佳状态逼近的过程。这是一个复杂的过程,要求计算机有强大的计算能力,并有很强的理论指导,才能保证得到良好的训练结果。
当语音识别系统对语音进行识别时,相对来说,其识别过程要比训练过程简单,对计算机的运算能力要求也很低,并且速度较快。这有利于实时地实现语音识别系统和进行商品化开发应用。
那么,制约语音识别技术发展的根本是什么呢?接受记者采访的清华大学王作英教授认为,语音识别的关键是其依据的模型和算法,模型算法是计算机描述语音的能力能否抓住人的语音的本质的关键。在语音识别领域,
认准语音识别的“内核”
来源:互联网 发布日期:2011-08-17 23:28:41 浏览:15266次
导读: 有专家说,语音识别用途广泛,潜力巨大,但要真正实现人与计算机的自然交流却很难,它不仅需要高深的基础理论的突破,更需要大量的实际工作的积累。 语音交互就要实现? 1996年,IBM公司发布了VoiceType中文语音识别软件,首次将其语音识别产品介绍给中国用...
上一篇:机器人知识传播活动知识问答
下一篇:语音识别技术
相关内容
- 波士顿动力又放大招,人形机器人Atlas迎来全面电动化
- Kria开发板搭配QNX软件,AMD、黑莓宣布合作推进下一代机器人系统
- 人形机器人产业热度超乎想象 商业化与降本难题亟待破解
- 从液压Atlas到电动Atlas,人形机器人的拐点时刻
- 人形机器人,突然就“卷”了起来
- 上市公司积极布局人形机器人赛道
- 马斯克称最快明年底前开卖人形机器人Optimus!网友:真能那么快吗?
- 第一个具有情商的聊天机器人来了,这可能是未来 Siri 的样子
- 昊志机电:目前公司谐波减速器等产品尚未应用于人型机器人领域
- 波士顿动力宣布停止开发人形机器人:Atlas
- 采茶姑娘隐退!采茶机器人登台
- AI Pioneers|星海图高继扬:人形机器人不是具身智能的唯一答案
- 特斯拉或将在2025年底前销售人形机器人Optimus,机器人100ETF(159530)一度涨超1%
- 优必选:在为人形机器人Walker S年底小批量量产做准备
- 人形机器人公司星动纪元携手临港集团,其“小星家族”获姚期智点赞
- 北大硕士造机器人,拿下15个亿!
- 李彦宏上车直播:汽车机器人就是未来,相当于司机和助理
- 如何参与机器人浪潮?——中国共振,机器人元年来临
- 苹果从汽车转向家用机器人,机器人100ETF(159530)投资机会备受关注
- 苹果欲进军家用机器人领域!这些A股上市公司布局相关业务
AiLab云推荐
最新资讯
- 马斯克:可能在明年年底前出售特斯拉人形机器人 Optimus
- 苹果中国工厂回收机器人首次露面,规避了哪些电子回收弊端?
- 特斯拉或将在2025年底前销售人形机器人Optimus,机器人100ETF(159530)一度涨超1%
- 马斯克:“擎天柱”机器人仍在试验阶段 最早明年年底上市
- 马斯克称最快明年底前开卖人形机器人Optimus!网友:真能那么快吗?
- 外媒:马斯克透露,“擎天柱”机器人仍在试验阶段,最早明年年底上市
- 投资300亿!机器人产业爆发:几大趋势
- 人形机器人公司星动纪元携手临港集团,其“小星家族”获姚期智点赞
- 因会产生烧焦气味,日本世嘉玩具公司召回猫咪机器人
- AI Pioneers|星海图高继扬:人形机器人不是具身智能的唯一答案
本月热点
- 人形机器人崛起:OpenAI、微软洽谈投资Figure AI,望募资5亿美元
- OpenAI 悄悄升级 ChatGPT:可在对话中调用不同的自定义聊天机器人 | 懂点AI
- 麒麟信安入股超能机器人 或尝试打开新业绩增长点?公司最新回应来了
- Limbic开发AI心理咨询机器人,帮用户避免与人类交流可能引发的焦虑感
- 灿瑞科技:已有产品应用于消费级机器人领域
- 英伟达官宣AI聊天机器人,本地RTX显卡运行,这是要挑战OpenAI?
- 人形机器人企业暂时得救了
- Meta联合研发家务机器人,能在零人力帮助下自主整理房间
- 端到端纯视觉!OpenAI押注的人形机器人献艺拜年了
- 波士顿动力 Atlas 机器人能力升级,可灵活搬运汽车零件
热门排行
-
斯坦福家政机器人火了但又翻车了!多数是真人操控编排的
阅读量:165342
-
斯坦福团队发布新机器人Mobile Aloha,人形机器人将迎来产业元年?
阅读量:163010
-
我的同事是 GPT-4 机器人,我们在 Slack 上一起工作
阅读量:159435
-
谷歌起草“机器人宪法”,以确保 AI 机器人不会伤害人类
阅读量:157575
-
人形机器人崛起:OpenAI、微软洽谈投资Figure AI,望募资5亿美元
阅读量:101736
-
大疆回应停售青少年教育产品:将资源聚焦在大学生高校机器人赛事
阅读量:65393
推荐内容
- 2024第三十二届中国(深圳)国际礼品及家居用品展览会(深圳礼品展)
- 2024第二十届中国(上海)国际医疗旅游展览会
- 2024年科隆东盟少儿用品展览会 (Kind+Jugen ASEAN 2024)
- 2024中国(太原)国际锂电池技术设备展览会
- 海名·2024第九届西安餐饮供应链博览会
- 2024年盐城风能展
- 2024年中国风电展业大会暨展览会
- 2024第二十三届浙江国际智能楼宇技术与智慧安防产品展览会暨浙江(杭州)国际人工智能,物联网,大数据博览会(杭州智博会)
- 2024年中国郑州食品加工及包装机械展
- IOTE 2024第二十一届中国国际物联网博览会(上海站)
- 2024年日本东京IT展Japan IT Week Spring
- 2024越南国际采矿暨设备技术展览会暨2024越南建筑工程展览会
- 2024年第28届土耳其国际电力及能源展览会 土耳其输配电机电工展览会
- 2024年第28届土耳其国际电力及能源展览会
- 2024第三十二届中国国际电子生产设备暨微电子工业展(NEPCON China)
- 2024第十四届中国西部国际物流产业博览会 第八届中国(西安)智慧交通博览会
- 第四届中国国际数字产品博览会
- 2024年俄罗斯第23届国际石油和天然气工业设备及技术展览会
- 2024年法国巴黎国际工程机械展
- 2024年俄罗斯电力电工及电气工程展览会
- 2024江苏国际工业自动化及智能装配展览会
- 2024石家庄印刷出版博览会
- 2024年第36届俄罗斯国际通信展览会
- 第36届俄罗斯国际通信展(SVIAZ 2024)
- 2024第45届中国(江西)美博会 江西中医养生理疗及大健康博览会
- 2024年德国“汉诺威工业博览会”
- 2024韩国国际机械展