智能语音识别控制系统算法系统

智能语音识别如何实现?看完这些你就懂了
智能化生活是什么样子的?
当你睁开双眼体味着清晨第一抹阳光,智能设备就已经在自动工作了,机器人帮你打扫屋子,处理文件,烹饪早餐!
走出街道搭乘AI汽车,进入公司,迎面是智能前台。就连工作当中接到的电话or收到的信息,都有可能经过智能化处理。这些场景在几十年前根本是不敢想象的,而如今大部分已经实现!
作为人工智能基础研究的语音识别技术,一直都是横亘在研究者面前的难关,而让计算机领会人所说的话,实现人机对话已经研究了近30年!从思维模型到具体实现,科学研究者攻克了无数难关。那么今天就让我们了解一下略显神秘的语音识别技术吧!
什么是智能语音识别系统?
语音识别实际就是将人说话的内容和意思转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。
语音识别的目的就是让机器听懂人类口述的语言,包括了两方面的含义:第一是逐字逐句听懂而不是转化成书面的语言文字;第二是对口述语言中所包含的命令或请求加以领会,做出正确回应,而不仅仅只是拘泥于所有词汇的正确转换。
如何进行语音识别?
那么语音识别是如何进行的呢?以硅语电话机器人为例:
1.对语音信号进行分析和处理,除去冗余信息。
2.提取影响语音识别的关键信息和表达语言含义的特征信息。
3.后台按照不同语法,依照先后次序识别字词。
4.系统紧扣特征信息,用最小单元识别字词。
5.智能算法能把语法逻辑当作辅助识别条件,有利于分析和识别。
6.系统进行语义分析,给关键信息划分段落,取出所识别出的字词并连接起来,同时根据语句意思调整句子构成。
7.最后智能结合语义,仔细分析上下文的相互联系,对当前正在处理的语句进行适当修正。
语音识别如何提高辨识度?
语音的交互是一个认知与辨识的过程,所以绝对不能与语法、语义和用语规范等方面分裂开来。系统会先对原始语音信号进行处理,再进行特征提取,消除噪声和不同说话人的发音差异带来的影响,使处理后的信号能够更完整地反映语音的本质特征提取。算法会消除噪声和不同说话人的发音差异带来的影响,使处理后的信号能够更完整地反映语音的本质特征。
智能语音系统的未来
实现人机间自由的语音交互成为未来AI的发展趋势。一项新技术投入市场伴随着一些兴奋点,但也会存在一定的改善空间。
首先,智能语音市场需要针对特定的人群,特定的场景做适当的改变。目前来看人机交互在实时性、准确性等方面还需提高。其次,语音输入的内容会涉及各种各样专业的知识,智能语音系统在了解人类语言表面意思的基础上,更进一步识别其深层含义,所以智能语音系统的知识图谱也是很大的挑战,对输入输出、编码译码都要做很高的要求,才能让人机交互达到一个爆发点。
语音识别技术借助飞速发展的高速信息网,可实现计算机的全球联网和信息资源共享,因此被广泛应用在语音输入和控制系统、电销机器人、智能电话查询系统、智能家电及玩具等方面。
因此,语音识别功能是一项非常有发展潜力的技术。可以设想,我们平时生活中很多地方都可以用到它,它可以大大便利我们的生活和工作,比如智能手机,智能空调及冰箱,电动门,汽车导航,机器人控制,医疗设施,军事设备等。
可以毫不夸张地说,21世纪将会是语音识别普及的时代,而语音识别产品和设备也会以其独特的魅力引领时代潮流,成为时代追逐的焦点。
关注微信公众号“硅语智能电话销售机器人AI”,获知更多硅语智能电话机器人资讯
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
全年连续工作,智能完成人机沟通! ,公众号“硅语智能电话机器人AI”
全年连续工作,智能完成人机沟通! ,公众号“硅语智能电话机器人AI”
今日搜狐热点专业全球外包服务,您最为
信赖的战略合作伙伴。
享受简单快捷全面的IT服务
服务器商城
云服务官方商城
天元数据网
ERP官方商城
数字媒体官方商城
照明官方商城
&&&&&&&&&&&&
语音识别人工智能解决方案
  语音识别人工智能解决方案
背景介绍:
  语音识别技术,也被称为自动语音识别(Automatic Speech Recognition ,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
  语音识别系统一般分训练和解码两阶段。训练,即通过大量标注的语音数据训练声学模型;解码,即通过声学模型和语言模型将训练集外的语音数据识别成文字,训练的声学模型好坏直接影响识别的精度。
  语音识别技术已经发展了几十年,直到2009年,Hinton把人工智能深度学习解决方案引入语音识别中,语音识别才取得了巨大突破。本质上是把传统的混合高斯模型(GMM)替换成了深度神经网络(DNN)模型,传统GMM提取语音特征(如左下图所示)经过多个过程,而DNN模型提取语音特征(如右下图所示)可以精简不少工作,不需要对语音数据分布进行假设,不需要切分成stream来分段拟合;DNN的输入可以将相邻语音帧拼接成包含时序结构信息的矢量,在帧层次利用更多的上下文信息,相对识别错误率一下降低20%多,这个改进幅度超过了过去很多年的总和。这里的关键是把原来模型中通过GMM建模的手工特征换成了通过DNN进行更加复杂的特征学习。在此之后,在深度学习框架下,人们还在不断利用更好的模型,如RNN,LSTM和更多的训练数据进一步改进结果,深度学习使得语音识别的准确率能达到99%,足以在实验测试以外的实际场景中应用,并且被广泛商用。
解决方案介绍:
  语音识别技术已经发展了几十年,直到2009年,Hinton把人工智能深度学习解决方案引入语音识别中,语音识别才 取得了巨大突破。本质上是把传统的混合高斯模型(GMM)替换成了深度神经网络(DNN)模型,传统GMM提取语音 特征(如左下图所示)经过多个过程,而DNN模型提取语音特征(如右下图所示)可以精简不少工作,不需要对语音数据分布进行假设,不需要切分成stream来分段拟合;DNN的输入可以将相邻语音帧拼接成包含时序结构信息的矢量,在帧层次利用更多的上下文信息,相对识别错误率一下降低20%多,这个改进幅度超过了过去很多年的总和。这里的关键是 把原来模型中通过GMM建模的手工特征换成了通过DNN进行更加复杂的特征学习。在此之后,在深度学习框架下,人 们还在不断利用更好的模型,如RNN,LSTM和更多的训练数据进一步改进结果,深度学习使得语音识别的准确率能达到 99%,足以在实验测试以外的实际场景中应用,并且被广泛商用。目前所有的商用语音识别算法没有一个不是基于深度学 习的,采用深度学习进行语音识别整个处理过程如下图所示。
客户收益:
相关产品:
在社交媒体上关注我们
(C)1996 - 2018 INSPUR Co., Ltd. 鲁ICP备号文章有更新通知您!
  [ ]& 日前,汽车在官网提前透露,其将在2018年CES国际消费类电子产品展览会(以下简称CES)中推出与SoundHound公司共同合作研发的“Intelligent Personal Agent”智能语音识别系统,该系统不仅能帮助驾驶者控制汽车的各项功能而且还能基于个人驾驶者主动提供实用建议。  SoundHound公司的总部设立于美国加州,是全球知名语音识别企业,它打造的语音识别系统能够通过对外界声音的提炼与解析做出相应的反应。因此不难猜想,现代与之联手所打造的“Intelligent Personal Agent”智能语音识别系统,在语音助理辅助方面将有很强的竞争力。  现代汽车表示,驾驶人只要通过语音识别系统说出“Hi 现代”,即能通过语音的方式操作多项功能,包含车门锁、天窗、空调系统等;此外,这套系统不仅仅会按照指令执行任务而且还能主动协助,例如它会主动提醒车主会议时间,或是解析交通状况后提醒驾驶人,是否应该提早出发以避开塞车,准时抵达下一个行程等。  当然,有些人可能会说,这样的辨识程度其实在市场上并不稀奇,对此,现代汽车表示,除了上述功能外,这套智能语音识别系统还可以更准确的辨识车主语音指令,包括同时说出的复数指令,例如:请告诉我明天的天气状况,并且把家里客厅的灯关闭。这时系统不仅能给出问题的答案还会关掉电灯。『现代燃料电池』  现代汽车将在2018 CES中展出这套“Intelligent Personal Agent”智能语音识别系统,虽然新系统要等到2019年才会上线,但它会于明年在下一代燃料电池车中部署简化版并展开测试。值得一提的是,这套系统目前只能识别英语,其他语言版本会陆续增加。(消息来源:u-car;文/汽车之家 陈硕)查看同类文章:更多精彩内容:
文章标签:
好评理由:
差评理由:
错别字太多
语句不通/文章阅读困难
汽车之家精彩活动推荐
差评理由:
错别字太多
语句不通/文章阅读困难政法 > 观察-->&&>&&
这套智能语音识别系统,浙江检察官用得很欢乐
14:39&&来源:平安浙江网&&责任编辑:王淑静
字号 &分享至:
  话音刚落就生成笔录,还“懂”法律术语
  这套智能语音识别系统,检察官用得很欢乐
  检察官正运用智能语音识别系统进行远程提审
  讯(询)问笔录系统
  自动转换成的讯问笔录
  该系统也被应用于日常办案中
  检察官:“现在从事什么工作?”
  嫌疑人:“个体经营女装。”
  检察官:“因为本案什么时候被刑事拘留?”
  嫌疑人:“9月3号凌晨3点多被查获的,当天拘留。”
  9月6日,浙江省杭州市西湖区检察院的远程提审室。这一边,公诉人对着麦克风进行远程提审;那一边,提审语音自动被转换成了笔录。
  实现这一点的,是最高检正在杭州市西湖区检察院试点开展的智能语音识别技术。通过该技术和远程提审的结合,西湖区检察院公诉科的助理检察官姜琪轻松地完成了两起危险驾驶案的提审。
  话筒一闪动,语音瞬间变成笔录
  一次讯问用时10分钟
  提审语音是如何自动转换成笔录的?昨天记者现场观摩了这场远程提审,发现确实很神奇。
  早上9点半不到,姜琪准备好了各种文书材料,提前下楼到远程提审室准备提审。此时的远程提审室,各项设备已经“就位”。姜琪座位面前,一台电脑,旁边一个黑色话筒。打开电脑桌面上的讯(询)问笔录系统图标,电脑桌面出现的就是智能语音识别系统界面:界面分左右两个文本框,左边是记录并转换语音为文字的素材窗口,右边则是讯问笔录的编辑窗口。从不远处墙上的显示屏可以看到,嫌疑人也已经在位置上坐好,准备接受讯问。他的面前,也有一个话筒。
  “报一下你的出生年月……”随着提审的开始,素材窗最下面的话筒标识闪动,姜琪在提审中讯问的每一句话语以及嫌疑人的回答,都在素材窗口内自动转换成了文字。同时显示的,还有讯问和回答的时间。
  此时,姜琪只要用鼠标双击需撷取的文字段,就能添加到右边的笔录编辑窗口,自动形成笔录。
  语音转换成文字需要多少时间?记者看到,说话人语音刚落,电脑上就自动形成了文字。也就是说,转化几乎是即时完成的,不存在等待时间。
  等到讯问完毕,姜琪对笔录内容进行检查和修改后,就可以将笔录远程打印给犯罪嫌疑人,并由其签字确认。至此,这次提审的讯问部分就全部完成,用时约10分钟。
  记者发现,这套智能语音识别系统不仅转换速度快,还能把所有问答全都一字不落地记录下来,并自动添加标点符号。另外,电脑打字输入中一些容易出错的路名、地名和法律词汇等,这里也能准确录入。不过,有时它也会犯一些“小儿科”的典型错误。比如,当嫌疑人报出某酒吧的名字,姜琪向其确认是否是“酒吧”时,系统就记录成了“九八”;而在检察官讯问嫌疑人所驾驶车辆的牌号,嫌疑人回答“浙ABJ***”时,系统也“傻傻地”记录成了“这AB级***”。
  “小毛病”少了
  保俶路、甲来路,路名和罪名都不会错
  在西湖区检察院,本科学软件工程专业的姜琪,本来就是同事们眼中操作电脑的一把好手,但进入检察院工作五年后,他惊喜地发现,他的公诉人梦也会和自己大学所学的专业挂上钩,“真的是越来越‘智慧’了!”
  去年8月,西湖区检察院开始试点使用智能语音识别系统,当时在杭州是第一家。启用以后,该院公诉科的检察官们发现,这个智能系统把语音自动转换成笔录,确实能省时省力,但它也有一些“小毛病”,尤其是碰到需要录入杭州的地名、路名和一些法律专业术语时,它就常常“听错”。
  “比如西湖区的保俶路、甲来路、紫金港路等,转换出的都是同音错别字。”姜琪说,一边讯问,一边改错字,对检察官来说,讯问的思路常会被打断,也增加了嫌疑人等候的时间。所以,刚开始时,公诉人修改笔录也拼“手速”,练的是“眼疾手快”的功夫。
  不过,也正得益于检察官们在实际操作中发现的这些问题,以及他们提出的针对性改进意见,才有了现在更智慧的语音识别系统。据了解,为了修正路名、地名常常出错的问题,后来该系统导入了杭州城区所有地名、路名。这样,当系统再识别到这些地名、路名的语音后,就会优先录入杭州相应的地名、路名。另外,“危险驾驶”“血检结果”等刑事速裁案件中常用的法律专业词汇,也都被录入系统词汇库,在使用时会被系统优先推送,大大提高了转化的准确率。
  “运用这个系统,嫌疑人回答讯问的每一句话都是实时生成的,保证了讯问笔录的真实性,同时也能让检察官把主要精力放在对案件事实、情节的审查上,进一步保证了办案质量。”姜琪说,除了运用于刑事速裁案件的办案中,在西湖区检察院,智能语音识别系统还被运用于审查报告的撰写等日常工作中,大大减少了办案人员的工作量。
  据了解,试点以来,西湖区检察院公诉部门已在339件案件中试用智能语音识别系统制作笔录,占所办案件的三分之一。另外,他们在对运用该系统办理的61个案件进行统计发现,通过语音转化形成的正确文字量达6万余字。如果按平时笔录制作每分钟35个字左右计算,需要用时1700多分钟,而使用该系统后,平均用时在每件15分钟左右,总用时在1000分钟左右,大大节省了时间。可以说,智能语音识别系统通过解放检察官的双手,显著提升了办案的质效。记者还了解到,目前在全国其他一些试点省市,该系统还有增加方言识别功能的改进方向。据研发人员介绍,这个软件的一大特点就是,可以根据不同的需要,来调整词汇库。
  在今年2月最高检举办的“全国检察机关电子检务工程成果展”上,杭州市检察机关试用的“智能语音识别系统”的成果就被作为“智慧检务”建设典型事例向全国发布。目前,该系统已开始在全省检察机关推广应用。(记者许梅 通讯员 西检)
尽管设想过无数种场景,但当进入现场的那一刻,我还是禁不住打了个冷颤。
9月5日,由东北网与黑龙江省高级人民法院一同打响的“执行难”攻坚战,东北网直播团队前往牡丹江宁安市,与宁安市人民法 ...
志愿服务组织是志愿服务的重要主体。《条例》明确规定,志愿服务组织是指“依法成立,以开展志愿服务为宗旨的非营利性组 ...
不怕辛苦,辛苦有人理解便是甘甜;不怕付出,付出如有所获,便是欣慰。}

我要回帖

更多关于 车载智能语音系统使用 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信