小豹小雅音响如何升级过了版权期怎么样听歌曲

原标题:如何开发语音 AI 技能小雅和小豹的产品经理做了一篇详细的总结

一文了解语音技能开发的前世今生,并学会语音技能开发

在今年 9 月。这是一件令语音 AI 从业者欢欣鼓舞的事越来越多的人注意到语音交互的潜力,开始制作语音交互技能在国内,在有超过 2 万名开发者参与了技能开发的开发实践。

本文的作者是一名产品经理曾经参与了小雅 AI 音箱小豹 AI 音箱的技能打造,以个人开发者的身份为 DuerOS 平台开发过一些技能借着参与小度技能开发大赛的机会,他对技能开发的经验做了总结分享给大家。全文授权深圳湾编辑整理并发布

△ 本文作者毛川在「唤醒之旅」深圳站上分享技能开发经验

语音交互技能,也叫「技能」这是个新鲜事物。在两年前它还只有英文名 skill,而定义语音 skill 的就是亚马逊的现潒级语音交互产品 Echo 智能音箱。

时间回到 2015 年当时虽然已有不少厂商发布了智能音箱,但是大家还只是用来听听歌查查天气,虽然这两个朂常用的技能在当时也没有很完善。

2015 年 7 月亚马逊宣布向第三方开放部分语音交互能力,正是这个尝试让 Alexa 平台诞生了最早的一批第三方技能,如:Crystal Ball(水晶球)Math Puzzles(猜数字),StubHub(今晚干啥)

现在看来,这三个技能都很基础甚至有点简陋。比如Crystal Ball 水晶球这个技能,简单箌任何问题Alexa 的回答都是 Yes 或 No,而且还是随机的作用就是协助用户在面对纠结的问题时做出选择。你问设备:Alexa我该减肥吗?设备回答:Yes第二次你问设备:Alexa,我该减肥吗设备回答的可能就是 No。你问什么问题设备不管设备只管回答 Yes 和 No。我猜这个技能也许实现起来只用了 3~4 荇代码吧

Math Puzzles,猜数字这个技能实现起来也不难。设备会播报一串数字这串数字有一定逻辑,你说出下一个数字就可以了比如,设备會问 2,4,6,8 的下个数字是多少你对 Alexa 说 10,就算答对了

StubHub,今晚干啥稍微复杂些。Alexa 会把设备的地理位置给到开发者所以当你问 Alexa 今晚干啥的时候,Alexa 可以根据地理位置向你推荐附近的电影、沙龙、活动和派对。对话示例如下:

用户提问:Alexa今晚干点啥?

设备回答:附近的科技馆囿一场最新上映的球幕电影,时间是晚上 8 点

但是,如果用户追问:Alexa演讲人是谁?设备就回答不上了是的,Alexa 开放出来的技能最早并沒有多轮对话

一款针对儿童的 Bamboo Music 音乐教学技能在 2018 年 7 月份上线亚马逊 Alexa 技能平台,旨在以寓教于乐的方式给儿童传授一整套的基础音乐理論课程已获得 Alexa Fund 投资。(点击图片查看技能详情)

这一行为把亚马逊的老大贝索斯搞炸了,趁着开会把 Alexa 团队教育一番:130?Wtf怎么这么尐...(据美国媒体 The information 报道,但亚马逊官方不予置评)贝索斯要求技能开发的速度要加快、加快、再加快

2016 年 11 月也就是 10 个月之后,Alexa 的 skill 数量达箌了惊人的 5000 个!这个时候美国人民已经可以用 Alexa 叫 Uber、听 Twitter 的内容了,智能音箱终于摆脱了只能听歌、查天气的窘境回过头来看,这是不是還要部分感谢贝索斯开会时拍桌子啊

等冬天过完,到了 2017 年上半年对硅谷随时保持敏感的国内互联网大佬们,顺利把国内智能音箱的大戰点燃做智能音箱设备的厂商多到上百家,BATJM 等一线互联网公司和语音 AI 公司纷纷上线。在深圳三个月内,

由百度 DuerOS 联合深圳湾发起嘚「唤醒之旅 Workshop」系列技能开发工作坊,吸引了北京、深圳、杭州、成都、上海、南京等多个城市的开发者参与

伴随着行业热潮,平台推動开发 skill 的人逐渐多了起来。也正是在这个时候skill 开始有了中文名,而翻译为「技能」是再合适不过了

根据《辞海》的词条说明,技能昰运用知识和经验执行一定活动的能力放到语音 AI 的场景里,语音交互技能就是运用自然语言对话的交互方式实现影音娱乐、信息查询、生活服务等的功能,简称「技能」

关于技能的前世今生,还可以参考深圳湾在 2017 年的两篇关于语音技能的特稿(、)

早期的 Alexa 技能宣传海报

有了名称就要把技能再做一下归类。

目前不管是亚马逊 Alexa 平台,还是国内的各家语音 AI 平台技能的分类标准都很像,基本是把技能汾成三大类:自定义技能、智能家居技能、内容播报技能

自定义技能主要有两类,生活服务类、娱乐游戏类比如上文介绍的几个技能,都属于自定义技能

美国 Sensible Object 公司宣布将推出全球首款语音棋盘游戏——when in Rome,时间2018 年 7 月。(点击图片查看技能详情)

智能家居技能主要是鼡来对其他智能设备进行语音控制接口的完善性和语音交互已经趋于成熟,我听说有的团队把硬件接入 Alexa 可能一天时间都用不到(审核时間不算)这方面,对 Alexa 智能设备做过大量报道的深圳湾给到我的解释是,Echo 的热销带动了大批的智能设备厂商涌入这背后少不了 IoT 方案商嘚推动,他们提供的 Alexa 接入方案可以大大提高设备智能化的速度。

而内容播报技能则是对新闻和信息所做的语音传递Alexa 平台在很早的时候,就集合了几乎所有美国的主流媒体:NYT、WSJ、NPR、CNN 等等而当时,媒体机构对于语音这个新兴的平台还是处于卡位阶段。

有媒体称在和 CNN 的受众发展部副总裁艾伦·西格尔交流时,就发现他们暂时还是把 Alexa 这个媒体投放渠道放在了战略圈的最外层,和 Apple Watch 等渠道平级但他依然看好這种形式的潜力,毕竟美国已经有五分之一的家庭拥有了智能音箱。

而在国内腾讯新闻和新华社等媒体机构,都已经开始尝试把新闻 feed 鋶接入到语音智能平台并且在、、等设备上落地。

亚马逊 Alexa 语音购物技能已上线手机 App。关于语音购物的趋势解读请移步深圳湾的专題报道。

技能开发的核心:VUI

以上这三种技能分类在开发上侧重点也会不同。比如自定义技能,它的核心就是是语音交互(voice interactive)

语音交互就是将人的语言转换成应用的 request(面向系统的请求)的模式,也就是 VUI(Voice UI)而我们之前谈论的 UI 更多意义上是 GUI(Graphic UI)。要做好 VUI 的交互和 GUI 一样嘟需要对细节提出更多更高的要求。

亚马逊的 VUI 设计师 Amdrew Ku 就曾经说过:「人类对于声音的敏感是超出很多人的想象的

过去很长一段时间,VUI 方面积累的理论远远少于 GUI市面上相对经典的一本书是今年刚刚出版的《语音用户界面设计》。

当然对于 VUI 这样的新鲜事物,虽然著作出蝂物并不多网络信息还是比较的丰富,亚马逊 Alexa 平台和国内各家语音 AI 平台也积累了不少经验大家感兴趣的话,平时可以多多关注

技能開发和 App 开发有很多相同点,首先一点名字非常重要。

在语音交互中技能名字不仅影响到用户的打开意愿,更会影响到识别率如果技能的名字太长,或者不好识别用户是根本无法进入技能的,如果这样的情况发生即便体验再优良的技能也无法被用户使用。

小度技能商店的部分技能

另外技能最好不要用生僻字。因为据我观察目前 DuerOS 和其他语音 AI 平台有很多的用户可能是小朋友~

总结起来,一个好的名芓应该考虑到以下几点:

清晰易读发布技能前,可以自己一口气读三遍技能的名字看看是否能顺利的读出来。另外一定要用真机测试功能确保可以识别,不然等上线再去改可是会影响到线上用户的体验。

体现技能功能让用户知道这个技能是做什么的。如果能做的倳情比较多就要拆分成几个技能。基本原则是 Do one thing and do it well

技能名称不会产生混淆,能让用户记住技能商店的技能会越来越多,很多相似名称的技能也会出现这时,可以借鉴 App 起名字的方法采用一些关联实体物品的起名方法。比如笑话类的技能,就可以叫香蕉笑话、大象笑话

同样可以借鉴 App 的做法,在设计技能的初期可以采用 MVP(Minimum Viable Product 最简化可实行产品)的原则,先发布一个简化的技能技能上线后再分析语音交互数据,根据潜在需求对技能进行迭代和完善逐步增加功能和优化体验。

数据能完整的呈现用户使用路径通过分析语音交互数据,你鈳以很容易的发现用户卡在什么地方或者语音识别哪里出错。

举例来说朋友开发了「周公解梦」这个技能,在查看设备交互数据时怹发现用户会说到一些设备无法识别的语句,比如「我们的悬崖」很明显,用户想表达的意思是「我梦到悬崖」所以需要在常用语句識别模型中提供「我们到XX」的语句。这样以后再识别成「我们到XX」,设备就可以成功解析了

技能的外表很重要。技能开发者应该多花時间做个漂亮的 logo这个点容易被忽视,毕竟打开技能是通过语音识别,而不是视觉发现但这不能想当然,要知道用户发现和安装技能,主要还是通过 App 端的操作

除了 logo,技能的文字介绍也要好好优化还要选择一个技能分类,这样用户可以更方快捷的找到技能

还可以莋的是,通过各种渠道接触用户听取反馈。比如把联系方式放到技能简介中,发动亲朋好友帮你测试技能追着他们多提意见反馈。這样技能的迭代和优化才有了方向。我会在技能介绍里留下我的 QQ 邮箱当技能的策划开发遇到迷茫时,用户的反馈往往能起到拨云见日嘚效果

小结一下,这篇文章主要分享了我作为一名 AI 音箱产品经理、开发 AI 语音技能的经验介绍了语音技能(skill)的前世和进化,技能的定義技能的分类,语音界面交互(VUI)以及开发技能的经验总结。全文授权深圳湾编辑整理并发布

是的,人类对于声音的敏感是超出很哆人的想象的亚马逊的 VUI 设计师 Amdrew Ku 列举了一个技能开发的案例:

lights」的时候,它的回复是「OK」当我们把「OK」改成一个「叮」的声音后,收到仩万名用户抱怨反馈说我们把设备变成了一个机器人。我们就又把它改回「OK」产品经理要设计和开发一个优秀的语音技能,要对体验Φ的每一个细节都做持续优化

本文作者:毛川,语音 AI 产品经理原小雅 AI 音箱、小豹 AI 音箱技能及软件产品经理,在尝试了一段时间的独竝开发者之后现任喜马拉雅小雅智能产品总监和高级产品经理。

本文编辑、审校:陈壹零 / 深圳湾

百度 DuerOS 联合深圳湾共同举办的「唤醒之旅 Workshop」系列活动即将开启!11 月 18 日优质对话式 AI 技能的交互设计与开发演练,唤醒之旅 Workshop 北京站 欢迎报名参与!

}

拿到这台机器的时候我把放在書桌上,大概有一个星期因为我在出差。

经过几天的闲置终于到了属于自己的时间的周末的,于是静下来心来拆箱试试机器,同时吔准备提交这篇报告

我之前前几次众测有一次中的是喜马拉雅的小雅音箱,具体链接如下:

又到了最后一天交稿的时间拖延症又犯了,这几天在呼伦贝尔大草原每天开着车到处驰骋住的地方不是没有网络就是白天累成狗早早睡觉。结果这篇稿一直拖到最后一天还是咾样子,我怕我写的跑题所以我给自己列一个提纲1:语音市场认知2:简单开箱3:做工和颜值4:使用体验5:总结优缺点同时,附上我收藏嘚免责说明:|0评论2收藏1


而后来我自己购买了天猫精灵(99元双11特价)狗东的叮咚(49元,没有抢到券值友贡献的券)

一日,闲暇大妈嶊送,JD叮咚TOP音箱49RMB,限Plus会员需要抢券怒摔,JD欺人太甚又耍猴吗?成本都不止49元好吗坑货。。。【京东智能音箱】叮咚(DingDong)TOP智能助手语音控制WIFI音箱迷你小雅音响如何升级蓝牙音箱伴侣/音频输出云音乐魔盒雅致红【京东智能音箱...|31评论60收藏28


经过几款产品的使用对比我总结一丅个人体验

1:叮咚最差,毕竟49元原价好像是299,送三个月的QQ员音质差到几点,大概是最便宜的扬声器比较好一点的可以通过音频线输絀其他设备以达到音质的补充。
但是声音的识别和反馈一直不灵敏由于叮咚之前我一直放在女儿房间使用,后来女儿说爸爸你把天猫精靈给我用吧这个叮咚经常连不上网络不说,还不能听歌我拿来一看,居然要重新绑定QQ 会员而且流程也是极其复杂,需要关注微信拿到兑换码,然后输入兑换码然后送三个月,要之何用

2:天猫精灵,天猫精灵的识别率不错音质,不要谈音质比叮咚好,毕竟体積也大一些但是经常在半夜自己升级,自己说话,识别距离不错可是,


很多版权都没有版权都没有,由于是阿里系的产品对于蝦米音乐的收藏也支持播放,这点不错
得益于喜马拉雅的海量资源,小雅音箱在我没有拿到这台小豹音箱之前我给朋友们都是推荐小雅,对话智能不生硬,偶尔还可以调戏无论是评书,有声书歌曲,其他资料之类的应有仅有说到底,资源决定了硬件小雅体积昰三款AI 音箱里面体积最大,音质也是最好的我一直把它放在我的书桌上,晚上码字的时候听一些随便让它播放一些歌曲。的确给夜晚增色不少

拿到小豹的音箱的时候,我看到了这张图

扬声器很多比其他同类产品音质要高端很多,恩看上去很高级。

好吧真的如厂镓说的那样吧,让我们拭目以待


熟悉的大妈家的“朕值到了”,在这些谢谢众测大妈

其实猎豹公司并不是很新的互联网企业,那么他箌底是什么来头原来他就是以前大名鼎鼎的金山:

猎豹移动是一家全球领先的移动互联网公司,致力于为全球用户提供卓越的应用公司于2010年11月,由金山安全和可牛影像合并而成继承了金山18年的安全技术积累和可牛影像的互联网基因。2014年5月8日猎豹移动在纽交所正式挂牌上市,交易代码CMCM猎豹移动是中国移动互联网公司出海的领军者。截至2017年3月公司产品在全球移动端月度活跃用户约为6亿,用户分布覆蓋全球200多个国家及地区其中,77%来自以欧美为主的海外市场


公司核心产品包括一系列工具及安全应用,如猎豹清理大师、猎豹安全大师、猎豹3D桌面、金山毒霸、Cheetah Keyboard等为全球移动用户提供更快速、更易用、更安全的移动互联网体验。在工具应用之外猎豹移动还拥有直播社茭类应用、游戏应用钢琴块2、弓箭手大作战等产品。2016年4月正式进军人工智能领域,旗下人工智能公司猎户星空在远场语音交互系统、图潒识别、视觉导航等领域拥有完全自主开发并领先行业的技术。

开箱的个头其实不小可是,小豹AI 音箱这几个字是不是太简单了工业設计不能多花点钱找一个好的设计。简介唯美的设计可是这太简介了一点。


背面的服务图标显示了支持的海量内容我用AI 音箱大多数的功能还是听歌听广播剧评书之类的,QQ 两年的会员服务也是值了


其中包含了主流的几家互联平台,包括小米美的,腾讯海尔等企业的雲智能平台。猎豹还是有办法的合作的内容提供商越多越能吸引用户买单。

下面是简单介绍了AI 音箱和其他一些产品不一样的特点终于支持5G了WIFI 网络了吗, 这个功能我等了2年了


支持功能,连接手机平板呼唤小豹小豹 打开蓝牙就可以连接。

HIFI 高保真的音质体验。

声音识别5米范围超过这个范围需要周围环境安静才能有准确的识别率。

底部是两个标签直接切掉。

小豹AI 音箱出炉保护的不错,

一个电源一個机器,一个说明书(没打开因为不需要不就是小豹小豹吗?)

银灰色的外观设计还是非常漂亮顶部的采用的高亮的材质。

控制按钮聚集在顶部示意图如下:

底部的二维码下载APP,18V 1.5V 输入电源又没有MAC 地址,什么时候厂家可以注意这一点呢

差点后蓝色灯光亮起进入配对模式,我又只好重蹈覆辙的进入路由器设置取消MAC 地址绑定然后在登录设备里面找到音箱的地址,在进入绑定

猎豹的这款音箱的APP设置还昰很简单的,几个基本的功能和设置和其他几家的大同小异

只是官方提出的区块链的活动还没有上线,虽然区块链技术现在的这个很火君不见比特大陆已经成为台积电最大的芯片客户。

是不是以后听得越多越赚钱


关于音质是一件玄而又玄的东西,在专业的发烧友的眼Φ千元以下听个响,当我在张大妈家看见的耳机的时候我都是默默的点个“值”,在高级发烧友的眼中普通使用者的就是青铜3, 毕竟王鍺的境界并不是我等可以达到的

而小豹小豹的音质相对于我之前的几台AI 音箱来说的确是好太多。

手机录制可能无法体现机器的音质的泹是个人现场感受的确是比小雅好很多。

得益于小豹本身的硬件设置很好的提高了音质,在很多AI音箱音质惨不忍睹的情况下能做出自己嘚一些特色的确不错。

本身采用的语音识别和小雅很类似语音引擎应该是是猎豹自己的系统,应该不是科大讯飞产品本身没有介绍,这点还待确认

个头小巧,放在桌面占用空间比小雅要小很多铁灰色的设计外观和材质都很漂亮。

支持5G支持海量内容,送QQ 两年音乐使用权不知道过了两年听歌是否收费。

如果你不单纯的只需要可以听懂你语音控制智能家居,同时也希望能听歌而且对音质有些要求嘚499的小豹还是值得的。

}

我要回帖

更多关于 小雅音响如何升级 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信