vox9plus怎么vox如何设置中文语音机器人

语音识别机器人――操作说明书_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
语音识别机器人――操作说明书
&&嵌入式基础课件之语音机器人操作说明书,主要介绍语音控制机器人以及机器人的工作原理
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩9页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢大家看我做的语音机器人怎么样?【树莓派吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:45,480贴子:
大家看我做的语音机器人怎么样?收藏
视频来自:
树莓派,亚马逊海外购数码排行榜,热销国际尖货尽在Z.cn!特价爆款,轻松玩转直降!亚马逊海外购,全球大牌好物,正品价优,放心来GOU!
可以的楼主,你可以教我吗
大神请接受我的膝盖
郭敬明哈哈,楼主有教程不
大神 你买了那些部件
登录百度帐号推荐应用服务机器人缺少了语音交互的话,就会让人觉得不像个机器人。在当前非常多的服务机器人上,语音交互成为一个非常大的亮点。
当然如果我们从头做起,这样就太麻烦,还好当前有很多公司提供了解决方案。科大讯飞、百度语音等都提供了非常好的语音识别和语音合成工具。
这里我采用图灵机器人作为语义理解的工具,搭建一个语音机器人。
具体可以参考图灵机器人官网http://www.tuling123.com/help/h_cent_andriodsdk.jhtml?nav=doc
大致框架如下:
1.2 概念解释
(1)语音识别:Automatic Speech Recognition(ASR),也称自动语音识别,其目标是将人类的语音中的词汇内容转换相应的文本。
(2)自然语言理解:Natural Language Understanding(NLU),俗称人机对话,是人工智能的分支学科。本学科通过电子计算机模拟人的语言交际过程,从而使计算机能理解和运用人类社会的自然语言,实现人机之间的自然语言通信,进而代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。
(3)TRClient:TRClient 是一个封装了语音采集、处理、网络收发、语义理解等功能的语音识别和语义解析整体解决方案。
(4)应用程序:在开发中使用了 TRClient,具有语音识别功能的产品线产品。
1.3功能介绍
(1)语音识别:将语音识别成相应的文本。
(2)语义理解:将文本识别成领域相关的语义结果。
(3)语音合成 : 将文本转化成语音读出
1.4 环境搭建
1.4.1 添加TRClient到工程
1. 添加libs到工程
开发者需要将Demo包中的libs目录整体Copy到工程目录,Libs目录包括了语音识别合成所需的so库以及jar包
对于android studio的操作环境,配置jar包和so文件,
Jar包拷贝入app-&libs文件
在android studio中添加 file-&project structure添加jar目录
在app-&src-&main-&jniLibs新建当前目录,copy-&armeabi的so文件
1.4.2 权限声明
android.permission.RECORD_AUDIO
允许使用麦克风录音
android.permission.INTERNET
允许联网,发送语音数据至服务器,获得识别结果
android.permission.ACCESS_NETWORK_STATE
允许获取当前网络状态,优化录音参数及网络参数
android.permission.READ_PHONE_STATE
允许获取用户手机的电话状态信息
android.permission.MODIFY_AUDIO_SETTINGS
允许蓝牙录音
android.permission.BROADCAST_STICKY
某些手机启动 SCO 音频连接需要此权限
android.permission.BLUETOOTH
允许蓝牙录音检测耳机状态
android.permission.WRITE_SETTINGS
允许修改和读取系统配置信息
android.permission.WRITE_EXTERNAL_STORAGE
允许向存储设备中写入
需要在 AndroidManifest.xml 文件, 增加以上七个权限:
&uses-permission android:name="android.permission.RECORD_AUDIO" /&
&&& &uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" /&
&&& &uses-permission android:name="android.permission.INTERNET" /&
&&& &uses-permission android:name="android.permission.READ_PHONE_STATE" /&
&&& &uses-permission android:name="android.permission.MODIFY_AUDIO_SETTINGS" /&
&&& &uses-permission android:name="android.permission.BROADCAST_STICKY" /&
&&& &uses-permission android:name="android.permission.BLUETOOTH" /&
&&& &uses-permission android:name="android.permission.WRITE_SETTINGS"/&
&&& &uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" /&
&&& &uses-permission android:name="android.permission.READ_CONTACTS" /&
如果需要使用蓝牙设备作为输入源, 需要额外在AndroidManifest.xml 文件添加下列权限:
&uses-permission android:name="android.permission.MODIFY_AUDIO_SETTINGS"/&
&uses-permission android:name="android.permission.BROADCAST_STICKY "/&?
&uses-permission android:name="android.permission.BLUETOOTH "/&
1.4.3 Progurad配置
如果应用配置了代码混淆, 需要在 Proguard配置文件增加以下参数:
-keep class com.baidu.android.**{*;}
-keep class com.baidu.voicerecognition.android.**{*;}&&&&&&&&&&&
-keep class com.turing.androidsdk.**{*;}&&&&&&&&&&&
1.5语音识别
语音识别部分主要包括以下四个步骤
1.5.1 实例化VoiceRecognizerManager
实例化VoiceRecognizerManager,由于目前我们使用百度ASR方式,使用百度ASR,使用构造方法:?
VoiceRecognizerManager(Context context,String bdAPI_KEY,String bdSECRET_KEY)&& &&&&&&&&&&&&
参数: bdAPI_KEY和bdSECRET_KEY&&&&&&&&&&&
这里的bdAPI_KEY和bdSECRET_KEY,需要自己到百度官方去申请,位置如图所示:?
百度语音开放平台的网址为:http://yuyin.baidu.com/?
1.5.2 设定ASR状态监听
设定ASR状态监听
示例:VoiceRecognizerManager.setVoiceRecognizeListener(listener);
这个listener就是需要实现接口VoiceRecognizeListener,在不同的识别状态下回调其不同的方法。
1.5.3 调用语音识别方法
调用语音识别方法
&&&&&&&&&&&&& VoiceRecognizerManager.startRecognize();
这个方法就是开始进行识别
1.5.4 获取识别结果
获取识别结果,在步骤2里listener的回调方法onRecognizeResult中获取识别结果。
&public void onRecognizeResult(String result)&&&&
{&&&&&&&&&&&&&&&
handleRecognizeResult(result);
&& 这里的result就是返回的结果
1.6 语义理解
语义理解部分主要包括以下四个步骤
1.6.1 SDKInit类
SDKInit类初始化
调用SDKInit.init
&&&&&& &&&&&&&&&public static void init(SDKInitBuilder builder,InitListener initListener)
&&&&&&&&&&
参数:(1)SDKInitBuilder是封装了初始化的各种参数,这个类的变量说明
&&&&&&&&&Contex为上下文
&&&&&&&&& Secret为官网上机器人详情页中自动生成的一个secret(默认采用非加密模式,若采用加密模式时才开启),如下图
&&&&&&&&&turingKey为该机器人帐号的apikey,可在“机器人详情”页获取
&&&&&&&&&uniqueId为自己添加的一个标示符,如邮箱、手机号等等
(2)参数InitListener是一个初始化后回调方法的接口
&&&&&&&&&onComplete()是成功后,回调的方法
&&&&&&&&&onFail(java.lang.String&error)是失败后,回调的方法
1.6.2 实例化TuringApiManager类
实例化TuringApiManager类
这里一定要在上一步SDKInit初始化成功后,再初始化TuringApiManager,否则很多功能将无法使用
推荐的代码:
& &&&&&&&&&&&&&&
onComplete()
TuringApiManager m = new TuringApiManager (this);
1.6.3 设置监听
添加监听:
& &&&&&&&&&&&&&&
public&void&setHttpListener(HttpConnectionListener&httpConnectionListener)
参数:httpConnectionListener用于监听联网请求结果的回调
代码形式如下:&&&&&&&&&&&&&&&
TuringApiManager m = new TuringApiManager (this);
&&&&&&&&&&&&&&&
m.setHttpListener(httpConnectionListener);
其中httpConnectionListener就是实现接口HttpConnectionListener
&&&&&&&&&&&&&&&
1.6.4 发出请求
& &&&&public&void&requestTuringAPI(String&requestInfo)
参数:requestInfo为传递的文本
比如requestInfo = “你好”,那么在上一步的public void onSuccess(RequestResult result) 中result可以得到一串json字符串,其中json字符串根据不同的类型会有不同的格式
1.7 语音合成(TTS)
语音合成部分主要包括以下四个步骤
1.7.1 实例化TTSManager类
实例化TTSManager类
该类为语音合成的管理类,要使用语音合成功能,首先要创建TTSManager的对象实例
选用百度在线TTS,其构造函数如下:&&&&&&&&&&&&&&&
public TTSManager(Context context, String bdAPI_KEY, String bdSECRET_KEY)&&&&&
这里的bdAPI_KEY和bdSECRET_KEY
1.7.2 设置监听
添加监听:
&&&& TTSManager.setTTSListener(mTTSListener)
& &&&mTTSListener需要实现接口TTSListener ,可以在不同的语音合成状态下回调其不同的方法
1.7.3 开始语音合成
调用TTSManager.startTTS(String ttsContent) 方法来进行语音合成
参数:ttsContent就是需要被合成的文本,比如 ttsContent=“你好”,那么就会读出 你好。
1.7.4 处理合成完成
语音合成后,就会触发onSpeechFinish(),这样即可在其方法中添加相应的逻辑。
阅读(...) 评论()这个“甜甜圈”语音机器人,靠啥挑战已拥有300万台销量的Echo?-消费电子-与非网
近日, 宣布了 2017 年度获得创新奖的产品,来自英国创业团队 Emotech 的语音
获得了 4 项创新奖。虽然入选创新奖的产品数量颇多,但同时揽获 CES 4 项类别奖,这在 CES 历史上还是首次。
(黑色版 Olly,图片由 Emotech 提供)
Olly 的外形像是一个坐在垫子上的&甜甜圈&。而颇为奇特的是,Olly 与 Hover Camera 同时位列 &无人机与无人系统&(Drones and Unmanned Systems)的创新奖获得者。
其它项目还包括:
智慧家庭(Smart Home)
家用电器(Home Appliances)
家用音视频组件和配件(Home Audio Video Components and Accessories)
记者对 Emotech 两位创始人庄宏斌、Chelsea Chen 进行了专访,了解了 Olly 背后的技术、团队和发展脉络。
谁是 Olly?
Olly 是一款语音机器人,与亚马逊 Echo 和 Google Home 定位于普通家庭不同,Olly 将自己的用户选择在了都市白领,其核心功能是:提醒、优化日程安排,主打个性化和情感互动。
Olly 上半身长得像是一个&甜甜圈&,安装有 LED 灯;下半身是一个底座,内置 6 个麦克风。&甜甜圈&与底座之间可以有 12 种角度变换,甚至可以绕着底座进行 360 度旋转。Olly 约重 1.5 kg,底座直径约 20cm,目前有黑白两种款式。
(白色版本 Olly,图片由 Emotech 提供)
其实 Olly 最早样机是出现在 2015 年 TechCrunch Disrupt 大会上,当时它还长这样,像是一个&大眼&喇叭,渐渐迭代至如今的模样。
(图自:Robots Champion)
每一台 Olly 都有自己的个性
庄宏斌和 Chelsea 告诉记者,作为一款语音助手机器人,Olly 最与众不同的地方在于:它是具有个性的,并且能表达情感。
这意味着 Olly 会实时习得用户习惯,做出符合用户独特个性的安排和互动。当然,谁愿意让 Olly 掌握自己的数据,比如日程安排、健身数据等,那么谁就会是 Olly 的主人。
一旦有了主人,通过对其数据和互动历史的学习,机器人 Olly 会沾染上主人的性格,变得与主人越来越像。Chelsea 说道:
&&& &如果用户是理性严肃的人,那么他的 Olly 将会以数据导向,直来直去。比如你问今天天气如何,那么就会给你一个多少度、风速多少这样准确的数据。如果主人的个性是感性的,那么他的 Olly 就会更活泼,在互动的时候会有更丰富的语言发挥。&
Olly 会像宠物一样,对不同的人表现出不同的态度。
&一个活泼的 Olly,跟主人互动式时会比较俏皮,但如果是陌生人来询问,其表现可能就会跟 Echo 差不多。&
这样极具个性的机器人,对于主人发出的指令,也会&Say No&,这是 Emotech 团队颇为自豪的地方。Chelsea 举了个例子,当你把自己锻炼身体的计划告诉 Olly 之后,如果有一天你想&偷懒一下&不去锻炼,让 Olly 打开电视,那么此时它可能会拒绝你的要求,因为它会告诉你,你明天的日程很满,或者明天天气不好,最好的锻炼时间应该是今天。
情感互动:会&Say No&的机器人
其实早期 Olly&大眼&设计是有一些争议的,TechCrunch 在报道的时候用了&Olly 团队坚持认为这个眼睛很可爱,并非诡异&这样有点戏谑的描述。
Chelsea 告诉记者,&大眼&的设计是为了情感互动,让用户能够感受到这个机器人在跟自己对视。但在 TechCrunch Disrupt 之后,他们做了 40 多场的用户调查,发现用户对这个设计表现出了两个极端的态度,有的人爱不释手,有的人则会因此感到害怕。而且,新的 6 个麦克风阵列的设计也需要它们在硬件上作出比较大的改变。
&真正的表达情感不一定非得是用眼睛一直盯着看。&
他们选择了更加抽象的表达方式:通过 LED 颜色和形状的变化、震动、&甜甜圈&的旋转,来表现 Olly 的情感。
当你说出&Wake up Olly&唤醒词的时候,本来趴在底座上的&甜甜圈&就会抬起来,用户这时候会感觉自己的机器人&醒来了&。Olly 还会用身体的震动来表达开心的情绪。
再比如,Olly 的一个典型应用场景就是为你安排健身计划,如果你在 Olly 面前完成了俯卧撑,那么&甜甜圈&就会绕着底座进行 360 度快速旋转,以此表达兴奋之情。
关于竞品: Echo、Google Home 和 Jibo
亚马逊的 Echo 已经卖出了 300 万台,Google Home 也在今年 10 月正式发售,各巨头、初创公司都在抢滩登陆这个千亿级的市场。
目前 Echo 和 Google Home 的售价分别是 179 和 129 美元,主要提供信息查询的功能。在 Emotech& 看来,&个性化和情感互动&是 Olly 相较于这两家巨头产品的优势。
但是 Olly 并非第一个推出此类功能的语音机器人,它面临着来自美国波士顿的强劲对手 Jibo。这款诞生于 MIT 实验室的的产品,拥有豪华的技术团队,既能情感互动,还能人脸识别跟踪拍摄。
但是,庄宏斌认为 Jibo 想要做的太多,把目标用户定位于家庭成员,难度会非常大。
&&& &如果是定位于所有家庭成员的话,我相信其算法实现和开发的难度是非常高的。单就语音识别这一方面,年龄段不同的语音会差很远,在情感上表达的语义也会差很远。如果一个家庭里有小孩、青年人和老人,那么需要的模型难度是非常高的。而这仅仅是一个例子,我相信 Jibo 面临的复杂性要比这个高的多,这或许是 Jibo 一直在推迟发货的原因。&
庄宏斌认为,相较而言,Olly 的目标人群会更加集中,就是都市白领,其产品优势就是专注。他们摒弃了屏幕,在功能选择上更加集中,这让 Olly 快速实现了产品化。庄宏斌告诉记者,预计明年年中的时候英文版的 Olly 就会上市,到明年年底则会推出 Olly 中文版。
Chelsea 告诉记者,目前 Olly 的定价大约会在&高端智能手机和电脑之间&,也就是说,会比 iPhone 贵一些,但不及 Mac 的价格。
Olly 的研发时间不到两年
庄宏斌告诉记者,Olly 的英文语音识别、语义识别等系统都是他们自己研发的,并没有借助第三方平台。当然,中文语音识别系统与英文还是有很大差别,他们正在考虑中文版的 Olly 与中国公司的合作。
但 Emotech 成立不到两年时间,最新版 Olly 的研发时间也只有半年,他们如何能够做出一款既能完成事务性功能,又能进行情感互动的语音机器人?
关于这个问题,两位创始人认为,这是由于技术团队成员本身有着多年的技术积累,另外就是与英国各高校实验室进行了很多合作。
Emotech 目前的技术团队有 5 名成员,领头人是 Pawel Swietojanski,这位毕业于爱丁堡大学的博士,主攻自动语音识别(ASR)领域,另外还有 2 名成员曾在苹果 Siri 项目工作过。
在高校合作方面,&与伦敦大学学院(UCL)主要合作的是机器学习、帝国理工主要是类人脑的 AI 引擎、爱丁堡大学主要是语言的部分。&
庄宏斌本来就是 UCL 的学生,得到了来自母校的慷慨帮助。他们与 UCL 计算机系的负责人 John Shawe-Taylor 教授合作密切,&所以 UCL 的众多硕士、博士生都有参与到我们的项目中来&。
另外与他们合作的帝国理工 Murray Shanahan 教授是 AI 界的一位明星人物,他所著的《Embodiment and the Inner Life》,探讨了人工智能产生自我意识的问题,对电影《机械姬》导演影响颇大,因此也受邀成为这部电影的科学顾问。
所以,&& &Olly 是在学校技术人员既有的研究成果之上,不断作出迭代和定制化调整......大半年的时间里,我们做的更多的是对用户的数据采集&。
庄宏斌提及自己当年从人人网离开,到英国留学并创业,就是看中了英国雄厚的人工智能技术积累。
CES 的四个奖对于 Emotech 来说是一个巨大鼓励,Chelsea 反复提到&兴奋&这个词。
300 多万台的 Echo 销量已经证明了市场对于智能语音机器人的需求,不过 Olly &个性与情感互动&的产品特色对用户来说有多大的吸引力,值得他们多花 4、5 千块钱去买,这要看市场验证了。对标高端用户,苹果做到了,大疆做到了,获了 4& 个 CES 创新奖的 Olly 能否做到,我们拭目以待。
与非网专栏作者招募
你也许是工程师甲,每天默默画电路板、写代码;
你也许是高校老师乙,每天站在三尺讲台,传授知识;
你也许是项目经理丙,每天为得到客户认可而赶工、奔忙;
不管你身处何地是何种身份,只要你是电子领域的从业者,就一定有对这一行业的一些感受和看法。
可能你已修炼成资深行业观察家,如老师那样真知灼见;
可能你善于分析行业趋势,如侃侃而谈;
可能你精通某一项技术,如那样精讲技术而不失幽默;
可能你善于发现身边的工程师故事,如般娓娓道来。
也可能你和他们都不同,有自己想发表的观点,这样的你都是我们在等的人,只要你准备好了,&与非网专栏作者&就会成为你的一个标签。你不再是普通的路人&甲、乙、丙&,而是工程师和电子产业的发言人。
我们给专栏作者的展示机会:
1. 与非网主站【与非原创】栏目的集中展示:
2. 与非网主页:首页焦点、行业发现的重点推荐
3. 与非网微信:原创推送,直达核心行业读者
4. 如果专栏内容热度很高,我们还可以帮助联系相关出版社洽谈集结出版。
成功取决于行动力,赶紧将你的职场态度和行业观点进行整理、提炼成专栏大纲吧,以&专栏作者+大纲名称&为主题,发送到:editor#eefocus.com(请将#替换为@)即可,或者你还有些疑惑想更多了解专栏作者的情况,也可以加小编的微信+qq:详谈。
与非网专栏作者,我们等你!
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
据日经亚洲评论报道,富士康旗下显示面板部门群创光电今年计划削减1万多个岗位,这是伴随着制造业自动化应用后的人员核减。
发表于: 10:55:09
音乐声一响,台上整整齐齐站成9列的36个机器人踩着乐点抬起双臂,开始了一场科技感十足的炫酷街舞。在2月4日举行的腾讯青年营“请回答,2028”主题同学会上,来自香港、澳门、深圳的100名学生在台下跟着音乐不由自主地为它们打起了节拍。
发表于: 10:30:06
音乐声一响,台上整整齐齐站成9列的36个机器人踩着乐点抬起双臂,开始了一场科技感十足的炫酷街舞。在2月4日举行的腾讯青年营“请回答,2028”主题同学会上,来自香港、澳门、深圳的100名学生在台下跟着音乐不由自主地为它们打起了节拍。
发表于: 09:47:26
“机器人换人”大潮下,中国已连续两年坐上世界机器人最大消费国的宝座,根据国际机器人联合会(IFR)发布的数据,2016年中国工业机器人的销量为9万台,同比增长60.71%。而IFR还预计到2022年,中国工业机器人市场需求总量将达38万台。
发表于: 09:24:05
凌华科技宣布加入工业机器人操作系统联盟(ROS-Industrial Consortium),并且成为该联盟亚太地区首位成员。机器人操作系统(ROS)是一项全球性的合作计划,旨在简化机器人平台开发的复杂性。
发表于: 17:05:27
2月7日下午,小米2018年年会正式召开。雷军不仅发表演讲,宣布未来10个季度内重回国内市场第一的新目标,还亲自登台表演魔术节目《心有灵犀》,没想到演“砸”了...
发表于: 16:21:54
临近年关,被乐视拖欠薪酬的离职人员终于收到来自法院的电话。
发表于: 16:19:11
继华为与三星等手机厂商之间的专利诉讼后,酷派与小米也打响了专利战。
发表于: 15:51:05
亚洲领先的电子产品分销商儒卓力(Rutronik Elektronische Bauelemente GmbH)是成熟的亚洲地区电子供应链企业,目前在这个地区拥有七个销售办事处,其中三个在中国大陆(深圳、上海和成都),另外四个分别设在中国香港、中国台湾、新加坡和泰国,香港也设有儒卓力的亚洲物流中心。
发表于: 14:45:27
近日,全球STEAM教育解决方案领导者Makeblock走进非洲,助力西非佛得角政府实施推进网络实验室项目(Weblabs)。Weblabs项目由佛得角总理担任主席的NOSI(信息社会执行中心)主办,旨在为非洲的教育产业引入先进的科技信息技术。
发表于: 14:33:34
与非门科技(北京)有限公司 All Rights Reserved.
京ICP证:070212号
北京市公安局备案编号: 京ICP备:号}

我要回帖

更多关于 vox20plus 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信