智能音箱的关键技术技术用在手机上，会有什么改变

点击联系发帖人 时间：2018-05-25 16:05

智能音箱的关键技术

休闲娱乐生活服务其他类别扫扫有惊喜
手机语音助手与智能音箱功能冲突？有了语音助手还要智能音箱吗？下面我们再来看看智能音箱，像天猫精灵，若琪，AmazingBOY，echo等等，这些智能音箱不仅可以听音频，比如：新闻、广播、直播等节目，还可以帮你定时提醒收听，让你不落每一期。它还可以帮你订餐，购物，听音乐，了解天气预报，看股市涨停等等，这些功能都和手机语音助手大同小异。最大的区别还是智能音箱可以作为智能家居的入口来控制智能家居。用语音就可以控制家里的灯光、窗帘、电视、空调等，让生活变得更加有趣方便。我们可以看出手机语音助手在于它配合手机的方便性，而智能音箱则需要电源所以有一定的局限性。其次语音助手的音质，各种调动应用的功能都要受限于手机，而智能音箱则没有这些问题。所以到底要不要买智能音箱呢，只能说仁者见仁智者见智了，当然如果想要控制智能家居的话，有的语音助手也是可以实现的，但总的来说还是有一些局限性的，并没有智能音箱那么方便。大家还有什么想法的话，欢迎在下方评论哦！
3热门新闻更多
实时热点榜单热门视频
阅读下一篇视频推荐智能音箱的关键技术是什么_智能音箱为何风光不再-电子发烧友网触屏版
　　智能音箱概述
　　智能音箱，是一个音箱升级的产物，是家庭消费者用语音进行上网的一个工具，比如点播歌曲、上网购物，或是了解天气预报，它也可以对智能家居设备进行控制，比如打开窗帘、设置冰箱温度、提前让热水器升温等。
　　智能音箱五大功能
　　1、语音交互体验
　　从最早的AmazonEcho智能音箱开始，基于alexa语音助手的超强交互一直是智能音箱最为核心的优势。
　　目前国内推出的智能音箱也在语音交互方面也进行了更加深入的研究，提升了智能音箱对于自然语义的理解。用户可以通过语音来操控智能音箱，从最基本的语音点歌，到相对比较复杂的上网购物，语音交互都是智能音箱的核心所在。
　　2、有声资源播放
　　音箱作为一种播放载体，自然离不开内容的支撑，而对于智能音箱来说，内容不再仅仅只是音乐一种，而是包括各类有声资源。
　　以京东智能音箱为例，通过与百度音乐、考拉FM、喜马拉雅FM、得到、今日头条、腾讯等的合作，在叮咚智能音箱上搭建了更多的音频内容，让用户有更多的内容可以在智能音箱上进行选择，满足用户对于内容的全方面需求。
　　3、智能家居控制
　　智能音箱一直被看作是未来的家庭智能控制终端，而这也是各大厂商十分看重的一点。
　　从现阶段的发展情况来看，智能音箱已经能够控制基本的智能家居设备，就像一个万能的语音遥控器，可以控制灯光、窗帘、电视、空调、洗衣机、电饭煲等智能家居设备。
　　不过这些功能的实现需要家居设备支持，所以在智能家居设备尚未普及的情况下，智能音箱想要成为家中的控制终端还需要很长一段时间。
　　4、生活O2O服务
　　生活服务也是智能音箱非常重要的一方面功能，可以通过与支付宝口碑、滴滴出行等第三方应用的合作，提供查询周边、餐厅促销信息、路况、火车、机票、酒店等信息。
　　通过自身依靠的强大电商平台，用户通过语音可以在音箱上是实现购物，或者借助第三方应用，实现其他类型的O2O服务。比如：打车、订机票、餐厅、查物流等，可以在不打开手机的情况下，进一步方面人们的生活。
　　5、生活小工具
　　基于家庭的使用场景，智能音箱还开发了一些非常实用的小工具。如有些智能音箱，它拥有如计算器、单位换算、查限行、星座运势、留言机等小工具，在日常生活中用途还是很多的，而且相比人们常用的智能手机，智能音箱只需&动嘴&，自然也会更加方便。
　　目前智能音箱已经拥有非常丰富的功能了，但是对于智能音箱整体的行业来说，智能音箱依然处于初级阶段，最常用的功能还是听音乐，其他方面还需要进一步的完善，才能真正应用于日常生活。
　　智能音箱的关键技术是什么
　　相比传统音箱，具备语音交互，可提供内容服务、互联网服务，以及场景化智能家居的控制能力的音箱称为智能音箱，智能音箱可以分为两种，一种是以亚马逊Echo为代表的智能助手类音箱，以语音交互技术为重点，成为智能家居的控制中心，国内厂商中京东的叮咚音箱，阿里巴巴天猫精灵和小米智能音箱同属这种类型，另一种是以内容分享为主的内容智能音箱，将音箱作为音乐、有声读物等流媒体内容的载体，国内厂商以喜马拉雅的小雅为代表。近日，易观国际发布了《2017中国智能音箱产业发展分析》报告，对本土智能音箱市场进行了梳理。
　　易观认为智能音箱将经历四个发展周期：一，探索期。该阶段，人工智能及物联网技术发展为其爆发奠定了基础;二，启动期。经过探索期对消费者的普及，消费者认知提升，厂商开始探索较为清晰的盈利模式;三，高速发展期。待智能音箱产业引得大量资本涌入，入局玩家大幅提升，产品更加满足消费者需求，智能音箱过渡到高速发展期;四，成熟期。此阶段内，智能音箱业务模式成熟，市场格局稳定，智能音箱进入千家万户。
　　易观认为，未来本土智能音箱产业的出路在于音质与优质内容的结合;进一步优化语音技术;扩张产业链与强强结合（市场从业者通过扩张产业链或合作的形式，实现硬件、技术、内容、服务的资源整合，实现生态闭环）;完善平台布局;人无我有，人有我优。
　　和易观一样，很多业内人士都认为语音识别是智能音箱的关键技术，但是，从echo的走热我们可以看到，由于Alexa开放后加入了很多人工智能后才有了echo销量的暴涨，所以，基于人工智能的开放语音平台才是智能音箱的关键技术，不具备这样的平台一定会导致消费者需要购买多个智能音箱来控制家里不同品牌的设备，这样场景是消费者不愿意买单的。
　　另外，echo的音质其实很一般，它的麦克风阵列技术也不是关键挑战，一些本土业者想着设计出音质如何出众的音箱、控制家居设备如何便利的音箱，或是如何会通过语音交互讲故事的音箱，这些都是误入歧途！真正的关键是要有一家公司敢于开放云端的基于人工智能的语音识别技术，虽然国内有些语音识别公司号称提供开放平台但是这个平台开放程度还不够。
　　智能音箱为何风光不再
　　前段时间亚马逊Echo无端发出笑声让公众引起恐慌的事件，又让沉寂已久的智能音箱回到了公众的视野当中。智能音箱从去年年初亮相，短短几个月时间天猫精灵、小爱同学、苹果HomePod&&各种产品陆续登场，你放唱罢我登场的局面好不热闹。但这样的好景却延续不长，到了2017年年末，智能音箱几乎已经淡出了公众的视线，从爆火到沉寂，智能音箱到底经历了什么？
　　亚马逊Echo是第一款走进人们生活的智能音箱，亚马逊通过智能语音交互技术赋予了Echo人工智能的属性，能够放音乐、跟用户交谈甚至是网购下单的这款音箱，迅速的获得了用户的认可，从2014年11月发布到2016年4月，Echo用17个月的时间突破了300万台销量。
　　Echo的成功让众多科技巨头注意到了智能音箱这一产品，紧接着谷歌的AlphaGo用围棋人机大战，将所有人的目光拉到了人工智能领域。伴随着人工智能的崛起，智能音箱这款方便携带、应用场景丰富、可玩性高的产品就成了人工智能最好的载体之一，从此智能音箱开启了爆红之路。
　　可是虽然智能音箱有诸多优点，但是智能音箱所渲染的人工智能概念却并没人们想象中的那么科幻。智能音箱本质上只是一款搭载智能语音助手的普通音箱，就像苹果的Siri一样，它只是一款能够执行你指令的工具，并不具备自己独立的意识，强烈的落差感让用户对智能音箱食之无味。
　　智能音箱作为一款语音助手的具体化，大部分它能实现的功能，智能手机也能实现甚至还能更简单的实现。在智能音箱给用户带来的新鲜感消失之后，如何让用户放下手机，用声音去和智能音箱进行沟通交流，成为了智能音箱最主要的难题，不消除手机的威胁，智能音箱终究只能成为一款能够自动播放音乐的&无线音箱&。
　　智能家居的普及程度以及智能手机的威胁，可以说是智能音箱突然沉寂的重要原因。不过如今智能家居已经开始逐渐普及，智能音箱在生态布局上并不需要太过担心，反而是如何提升用户使用体验，让用户获得比智能手机更好的交互体验才是智能音箱真正应该解决的问题，毕竟不是每个用户都会赖着性子字正腔圆的去对智能音箱重复一个又一个的语音指令。
　　伴随着人工智能热潮的消退，智能音箱也暴露出自身的生态环境和使用体验方面的问题，如今智能音箱欠缺的是怎样将产品融入到更多的生活场景当中，让用户获得更好的体验。但是智能音箱这款产品还是极具创意的，随着基础设施的不断完善，一个无处不在的语音管家，必定能够给我们的生活方式带来一场完美的变革。
文章来源栏目
加载更多评论
后参与评论【PConline 杂谈】或许有不少消费者对智能音箱的认识依然停留在手机语音助手刚发布时的“人工智障”时代，然而近年自然语音理解技术发展迅猛，各大科技巨头依靠技术实力和大数据切入这片领域，一时间极大地提高了智能音箱的实际体验。不过，在智能音箱越来越聪明的当下，消费者对它的角色使命也抱有更高的要求和期待。
天猫精灵方糖参考价格￥1992018，智能音箱极其关键的一年
根据Strategy Analytics最新发布的智能音箱研究报告指出，智能音箱市场在2017年Q4向主流市场迈出了一大步，2017年全年出货量达到3200万部，同比增长超过300％。如此火热的数据，相信正在阅读这篇文章的朋友也是没有预料到。而这种增长趋势，在2018年依然还会延续下去。
火热增长势头的背后，是智能音箱带来的体验冲击，以及定价进一步下探笼络了更多热衷体验新事物的消费者。以国内销售火爆，目前全网销售第一、全球销量第三的“天猫精灵”为例，只需一声“天猫精灵”，X1便会进入工作状态，你可以让它播音乐、听电台，可以问它清水寺在哪、有什么历史典故，可以查天气、问日期，你能想到的任何奇葩问题，天猫精灵X1都会想方设法给你解答。除此之外，背靠淘宝、天猫的天猫精灵X1还能实现语音购物、查询快递信息、话费充值、语音点外卖、声纹支付等功能，这种从无到有、能“听懂人话”的新奇体验，足以撩起一大批消费者的兴趣。
正是有着如天猫精灵X1珠玉在前，不仅推动了智能音箱领域向前发展，也培育了大批核心用户。我们也不难理解，为什么英国老牌 IT 行业分析公司 Canalys会称2018年将成为智能音箱的“极其关键的一年”，并预计到今年年底全球智能音箱销量将增长到5630万台，远高于2017年约3000万台的销量。智能音箱还有哪些地方急需升级？市场的热烈反应，让智能音箱成为了最近两年势头有所萎缩的智能产品行业中的一个全新爆发点。然而入场竞争的厂商鱼龙混杂，不同型号的智能音箱质量也参差不齐。对于用户来说，语音助手+蓝牙音箱这种1+1的简单组合并不是智能音箱的最终形态，除了更智能外，智能音箱还急需解决功能少、物联网能力弱、音质差、隐私及安全性差等问题。
1、音质体验差既然是音箱，音质肯定是基础中的基础。然而一些智能音箱甚至连基本的音质效果都无法保证，声音平淡似白开水、音质表现较差，导致语音助手、音乐电台等功能的体验大打折扣。因此，丰富的功能固然是智能音箱应当拥有的硬实力，而扎实的音质则是智能音箱的基础，没有发挥稳定的音质表现，再丰富的功能恐怕都无法弥补体验上的缺憾2、内容不够丰富智能音箱内容不够好，主要原因是部分厂商本身并没有强大的内容库，只能接入其它平台获取内容资源，在资源整合上会出现碎片化的现象，内容种类容易缺胳膊少腿，不够全面。要打通内容生态，必需拥有强大的第一方内容资源平台，无论是Google Home亦或是Amazon Echo都是如此。3、功能单一，用户粘性小目前国内大部分智能音箱只能进行简单的搜索问答、听音乐电台及承担生活助手的少部分功能，无法满足用户对语音购物、语音支付、儿童教育及一系列生活辅助功能的需求，导致用户对这类智能音箱的粘性小，新鲜度过后使用频率就会大幅下降，不利于培养用户的使用习惯。而且功能单一的智能音箱和手机助手的功能高度重叠，只是单纯地强调使用场景的差异化无法吸引用户转投智能音箱。4、智能家电生态圈不完善随着自然语言理解技术的发展，听懂人话已经不是智能音箱最大的短板，相反，国内一众智能音箱由于技术积累和数据支持都比较滞后，在功能开发和物联网实力上就容易暴露自身产品的不足，比如娱乐功能只有简单的音乐电台、智能家居也只能支持极少数的家电产品，而且还没有统一的智能家电平台，又或者自身平台的功能不完善、体验不出众，无法吸引用户进一步构建自己的智能生活圈。5、购物及支付安全无法保障国内用户目前对安全性日益重视起来，而智能音箱想要扩展更多的生活购物功能，如接入天猫、淘宝等电商平台，安全性也是将成为消费者选购智能音箱的一个重要的考量。而为了满足用户的语音购物、语音支付需求，安全性就更是重中之重，既要让用户在使用智能音箱时切实提升生活质量，也要保障在此过程中收集的用户信息，以及支付过程中的安全性。从一个简单的“传话筒”到全面表现的智能小管家，智能音箱及依附在它身上的语音助手，对用户的使用习惯的了解、记录和预判，与其他智能产品之间的联动，是背后的厂商在未来需要探索的。作为用户探索智能世界的入口，其能力应该变得更加强大。而国内产品中，能同时满足扎实的音质基础、庞大的内容资源库、丰富的功能体系、完备的智能家电生态圈、出众的音质表现以及可靠的用户支付安全系统这5个特质的，恐怕只有背靠阿里智能实验室的天猫精灵。能力越大，责任也就越大
这对于通过各种渠道手握大数据的各巨头，是优势，也是激烈的竞争。上文提到的天猫精灵，在它背后的阿里人工智能实验室，在X1迅速铺向市场之后并没有停下脚步。众多的X1在与用户互动产生的数据，被阿里人工智能实验室充分利用，促成了全新的天猫精灵智能音箱——方糖。1、出众的音质体验
既然提到了点播音乐音频，这也证明了方糖并没有丢下其作为“音箱”的本质，音乐源数量更新同时也应该类型更加丰富。另外，方糖也是为首款获得 DTS 国际标准认证的智能音箱，实际的听感也是清晰明亮、饱满自然、体验出色。2、丰富的内容生态
内容资源一直是阿里的一大优势，方糖除了支持以往的虾米、乐听、中信书院等音频源外，天猫还获得高晓松『晓说 2018』智能音箱独家版权。以阿里的第一方内容储备以及强大的内容挖掘能力，内容更新自然不是用户需要担心的问题，这些内容平台在天猫精灵中相互打通，形成一个资源量非常可观的内容库，这是国内的其它厂商并不具备的硬实力。3、完备的生活娱乐功能
天猫精灵方糖拥有的是超1000万音乐曲库、100万有声图书的庞大音频资源库，其中还包括丰富的幼教资源，如幼儿故事、幼儿儿歌等，可以帮助学前儿童在玩乐中学习到知识。除此之外，查天气、查新闻、语音购物、手机充值、叫外卖、星座运程等功能都是应有尽有，可以说是把整个阿里系的生态都整合进了小小的智能音箱中，功能库已经是武装到牙齿了。4、强大的智能家居生态平台
为了丰富智能家居的功能，阿里人工智能实验室还在不断丰富智能音箱的周边产品，目前方糖可语音控制的智能插座、智能灯泡、WiFi 智能遥控等。除此之外，阿里人工智能实验室还与其他家电厂商进行联动，目前阿里智能家居平台支持飞利浦、美的、海尔、格兰仕、海信、志高、康佳、TCL、方太等品牌的众多家电产品，品类覆盖到生活的方方面面，可以说是智能家居的中坚力量。5、声纹识别加持下的支付安全“声纹识别”更是天猫精灵方糖的看家本领，目前也只有天猫精灵具备这个功能。天猫精灵方糖可以根据不同用户的声纹特征，进行精准的用户匹配，不仅可以知道正在对话的是谁，还能够以声纹作为安全验证手段，无缝接入支付宝，在对话间实现淘宝购物、充话费、订外卖、查快递等操作，且保证交易的安全性，改变了以往需要手机不离手的交互方式。就国内市场而言，以阿里人工智能实验室为典型范例，真正能做到“智能”体验的智能音箱，正逐步改变大家的生活，让人机交互更加流畅、自然和便捷。写到末尾，国内厂商已然“天时地利人和”
在消费者当下使用无线音箱的场景对比过往有了明显的拓展的情况下，按理也应该遵循类似思路。保持甚至有更小的尺寸，却塞下更多的功能，以提升用户的使用体验。如最新推出的天猫精灵方糖，便是在这种思路下指导生成的产品。对比X1，天猫精灵方糖所提供的功能更为丰富，涵盖音乐音频、购物消费、家居控制、亲子教育、生活助手等多种场景，与消费者对于外观和功能的需求不谋而合。打的是“智能音箱”的产品，不单是要借对大数据的合理收集、分析和应用，让使用体验变得更加“聪明”，更不能忘记的是自己作为音箱的本质。沿着音箱的形态，继续精进人机交互体验的情况下，厂商在智能音箱小型化和功能化上下功夫，逐步完善使用体验，消费者才会更容易接受。当消费力有效流转，行业才有继续发展升级的可能。对了，补充一个小贴士，如果你对天猫精灵方糖这款新品十分感兴趣的话，不妨点击【这里】查看详情，5月27日起全网用户89元即可获得。特别声明：本文为网易自媒体平台“网易号”作者上传并发布，仅代表该作者观点。网易仅提供信息发布平台。
一键安装官方客户端
重大事件及时推送 阅读更流畅
http://dingyue.nosdn.127.net/kJVIg=rXE7wpN587vKPEo9zzKI68hNx=ulkWVJu1eCZx96compressflag.jpg|0微博Qzone微信揭秘智能音箱里那些神秘的声学技术　　音箱行业有着悠久的历史，但是在过去十多年里，传统的音箱行业面临着极大的市场困境，例如蓝牙音箱刚出现各个厂商便直接杀成了一片红海。而2015年随着智能音箱的涌现，特别是亚马逊的Echo、京东的叮咚、阿里的小飞，不仅对外展现出了智能音箱行业百花齐放的局面，也使沉闷的音箱市场看到了突破性发展的希望。但是，随着这些巨头们的集体涌入，这也让在智能音箱行业摸爬滚打的创业者倍感艰难。　　音箱特别是中高端音箱，本来就是强调品牌且技术门槛较高的领域。而智能音箱将声学设计、无线技术、语音识别、远场拾音、语义分析等众多技术融合在一起，不仅技术更为复杂，而且更加依赖音乐内容平台的支持，这些诸多因素都是创业者需要直面解决的难题。当然，技术还是其中的根本，本文希望从市面上现有的流行产品分析其中的几项关键技术，以及一些不可规避的用户体验问题，也给正在创业或者准备进入这个领域的创业者一些参考。　　（1）小型便携与低音增强技术　　音箱行业早在数年前就开始流行小型便携化，最具代表性的就是蓝牙音箱的持续热销。随后的WiFi音箱并没有复制蓝牙音箱的奇迹，主要还是受制于内容平台和技术的缺陷，并没有带来比蓝牙音箱更好的用户体验。智能音箱实际上还是在WiFi音箱的基础上发展的，除了继承其小型便携和无线连接的特点，其本质毕竟还是音箱，其音质设计还应该是第一位的。但是现在看来，市面上的智能音箱基本都忽略了这个问题，在笔者看来，目前还没有音质上乘的智能音箱出现。反而销量并不理想的WiFi音箱更加专注于音质设计，这其中不乏有传统的消费级音箱巨头Bose、JBL和Sony等品牌，也逐渐形成了两大风格派系。以Bose为代表的欧美系更加注重低音的增强体验，而以Sony为代表的日系则尤为看重中高频的细节呈现。我们知道小型箱体设计中很难同时兼具中高频和低频的双重音质保证，而对于大部分消费用户来说，感受最为明显的则是低音的提升，这也是小型箱体设计中的技术难点。　　小型箱体的低音增强主要有两类方法：其一是箱体的结构设计，例如结构上可采用密封式、倒相式、迷宫式、声波管式和多腔谐振式等等，这些结构需要专业计算确定，适当的设计可以有效提升音箱的音质和低音效果。　　另外，音箱结构设计中还包括了被动振膜技术。通常来说小型箱体比如智能音箱一般常用3寸以下的喇叭，这种喇叭本身低频下潜就不是太好，至少也要在100Hz以上。但是小型音箱受制于体积也无法采用更大的喇叭，而被动振膜的出现就是为了更好的弥补这个缺陷。实际上，被动振膜的结构与喇叭有几分相似之处，都有推动空气的振膜和让振膜恢复正常位置所需要的折环。但不同的是，被动振膜没有喇叭那类驱动机构，也就是说，它自身并不能发出声音。那么，被动振膜是如何工作的？由于被动振膜和喇叭单元是安装在密封的箱体内，这样，当喇叭工作发出声音时，喇叭振膜的运动，会导致箱体内的空气被压缩和扩展，在气压变化的作用下，被动振膜也伴随产生振动，推动箱体外的空气，这样就可以发出声音来。被动振膜可以根据需求设计在音箱的不同位置，其振动面积往往可以做得比较大。这样，推动空气的体积也随之增加，这就大大提升了低音的量感，获得更好的低音下潜深度。　&　　其二是算法方面的低音增强，比如常用的虚拟低音增强技术。虚拟低音增强的原理是采用了人耳的生理学特点来虚拟低音效果，人耳能够把低音基频中高频段谐波的差频声音听成原来低音基频的音调，这就给我们实现虚拟低音提供了理论基础。通过低音信号基频的谐波序列在人耳中再现普通扬声器无法达到的低频音调，从而在听感上就会让人觉得低音分量更足了，有效弥补了小口径扬声器重放低频不足的问题。这种虚拟低音增强方法也是耳机中常用的低音增强方法，特点是只需要嵌入特定算法，在播放前对音频处理即可。　　（2）无线技术及声音对码技术　　前面提到，智能音箱是由WiFi音箱发展而来，因此无线技术特别是WiFi的连接尤为重要，但是我们也知道，WiFi连接的过程比较复杂，连接成功后也会经常出现掉线、堵塞、延迟较大、切换太慢等问题，而这些都是导致WiFi音箱体验较差的重要因素。另外智能音箱一般还是黑盒子产品，通常不安装触摸操作屏，而WiFi初始连接则要求用户选择网络、输入用户和密码等操作，这显然不是智能音箱的特长。可是若无法联网，那么智能音箱的语音识别也无法发挥作用，这反而成了一个场景悖论。那么有什么技术可以解决上述的这些问题呢？　　首先我们看WiFi的初始连接问题，这如同当初的路由器配置一样麻烦，何况大部分用户根本没有配置过路由器的经验，因此让用户按照配置路由器的逻辑去配置智能音箱显然不现实，但是目前很多产品其实就是这种模态，就连智能音箱中的翘楚&&亚马逊Echo，也是如此。配置路由器，一个熟知技术的人员尚且还要折腾一段时间，把如此复杂的产品甩给用户简直就是一种折磨！　　声学总是这么奇妙，对此，聪明的声学研究人员早就找到了应对方法：声波通讯对码技术。这种技术是利用声波调制技术，将WiFi连接需要的信息通过手机的喇叭发送到智能音箱上，利用智能音箱本身配置的麦克风接收声音信号进行解调获取信息，从而完成配置联网，用户仅仅需要在手机屏幕上输入信息即可，这成功解决了智能音箱缺乏屏幕显示和操控的问题。声音对码技术难度实际不是太大，但是要做的稳定可靠也需要长时间积累，这个领域目前市场上几乎没有成熟的方案，据说小声科技公司正在准备这项技术的开源工作，相信不久这项技术也将很快普及。　　下面接着再说WiFi的切换及延迟问题，除了在硬件和协议上做些优化，也可以通过声学方法进一步优化。我们知道大部分WiFi音频传递的都是解码后的音频流，这很容易造成丢帧现象，其实传输过程中少量丢帧对语音甚至音乐播放来说影响并不大，因此这可以采用一定的算法进行适配。另外，随着智能音箱浮点运算能力的加强，我们也可以考虑传递编码的音频文件流，当编码的时候就将WiFi的问题考虑进去提前做出冗余，自然会大幅提高WiFi方面的性能。&　　（3）远场语音唤醒和识别技术　　&Alexa&，这是激活Echo音箱的默认唤醒词，而&叮咚&这是激活京东叮咚音箱的唤醒词。那么为什么音箱需要这种专用词语唤醒呢？实际上这也是语音识别中的技术难题，有时候也称为语音识别启动特定词。我们知道如果要想识别用户说出的命令，麦克风必须一直在录音状态，并且语音识别算法也要一直在工作，这就是连续语音识别的基本前提。那么总要告知一下对方，什么时候才算开始。当然机器是非常愚笨的，一个眼神或者一个动作显然不可能引起&她&的注意，自然就需要定义一个特别适合切换进入语音识别状态的词语，我们称这种技术为语音唤醒，也就是把音箱从其他状态切换到了语音识别工作状态。　　显然上面提到的唤醒问题在Siri上是使用触摸按键来解决的，但是智能音箱就不行了，因为我们不可能总在音箱旁边，而一般都会距离音箱一段距离欣赏音乐。这就产生了一个更加困难的问题：远场语音识别。远场实际是声学领域常用的一个概念，一般在智能音箱领域来说是指混响起主要作用的声场。这个概念怎么解释呢？这么说吧，我们听到的声音简单分为两种，一种是直接到达耳朵的，称为直达声。另外一种是墙壁反射后到达耳朵的，称为反射声，乱七八糟混在一起的声场就理解为混响声吧。显然当距离声源较近的时候，直达声将起主要作用，而当距离声源较远以后，混响的影响就会增大。不要轻视这种混响，当混响严重到一定程度的时候，我们是很难听清对方说话的。事实上，混响对于语音识别的影响是非常严重的，直接导致了识别率的下降。　　那怎么解决这个问题呢？当然我们也有主动和被动两种方法。主动的方法我们这里先暂且卖个官司，请您关注声学在线的后续文章，我们会详细介绍。下面我们来说被动的方法，就是我们常常说到的麦克风阵列技术，麦克风阵列的具体技术我们这里也不再赘述，声学在线已经发布了很多相关文章，您可以重温回忆一下。这里我们只说下麦克风阵列的技术难点。当然很多同学会首先想到算法的问题，多个麦克风协同工作确实是一个技术难点。另外，结构设计和器件方面也是一直制约麦克风阵列应用普及的重要因素，之所以这项技术到现在才能实用，也是因为MEMS技术很好的解决了目前麦克风器件的一致性问题。当然多声道的采集技术也是非常重要的基础技术。　　这部分笔者觉得对于智能音箱来说极其重要，因此我们也拆解了市场上两款流行的智能音箱做些麦克风阵列方面的比较。　　第一款就是亚马逊的Echo音箱，下图绿色圈中的地方就是7个麦克风组成的阵列，型号是S。Echo音箱并没有采用多声道采集处理芯片，而是用了4个立体声ADC实现7个麦克风声音的采集，这款ADC型号是TI的TLV320ADC3101。显然Echo将来还会有更好的远场语音识别性能方面的提升。亚马逊Echo使用的是自家的语音识别引擎，因此国内使用的时候非常麻烦，需要连接到国外的服务器。&　　第二款便是京东的叮咚音箱，这款音箱采用了8个麦克风和4个喇叭以PK亚马逊的Echo，但实际上意义不大，这个口径的情况下，8个麦克风和7个麦克风并没有本质上的区别，甚至4个也就够用了。而且我们通过两幅拆解图对比就可以看到，叮咚所用的麦克风显然没有像Echo那样升级到MEMS，传统驻极体麦克风的一致性很难保证，这不利于阵列信号处理。叮咚采用的是CONEXANT科胜讯的CX20810-11Z芯片，这款芯片是4通道远场语音捕获的ADC，专门用于语音识别，控制和网络会议等，因此叮咚只需要两片ADC即可实现对8个麦克风的采集。很明显，CONEXANT的芯片相比TI还是略逊一筹。不过，即便有如此逊色之处，叮咚音箱也属于国内当前水平较高的智能音箱。另外，叮咚采用的是科大讯飞的语音识别引擎，因此国内使用起来特别方便。　　（4）内容集成与智能学习技术　　智能音箱一开始就被认为是家庭互联网的入口之一，各个巨头抢占这个领域也有这方面的考虑，所以与智能家居的融合一直是智能音箱的使命之一。但是声音似乎和控制系统相差甚远，这方面的集成并非那么简单。智能音箱解决的仅仅是语音的识别问题，而这个功能，手机和电视同样也可以实现，那么智能音箱还有什么优势呢？　　笔者认为亚马逊的战略考虑应该更值得借鉴。诚然，接入更多智能家居的控制功能自然是个好事，但智能家居还没发展起来，也不是用户的刚需，目前来做这块用户似乎也不会买账。亚马逊的Echo除了和自身的音乐内容匹配，最主要还是看重了Echo将来在音乐内容方面的购买功能，所以Shopping自然就成为了Echo最重要的使命。想想也是，一个公司做硬件不考虑赚钱怎么行，软件可以随着用户数量的无限增加而将成本摊薄为零，但是硬件的成本是永远存在的啊。虽然目前还不了解京东有没有这方面的考虑，但是自家没有专有语音识别引擎，若想和自家产品无缝对接也非常困难。阿里就聪明很多，阿里做的小飞必然要和自家的音乐内容紧密相连。其他的厂商如QQ音乐、百度音乐、酷狗音乐还未发布自家产品，酷狗笔者有所了解，他们的智能硬件之路走得相当缓慢，现在转去搞中国好声音了。　　除了内容方面的集成，智能音箱还面临一个更大的挑战。我们仔细想一下，用户对智能音箱的要求其实远非语音识别所能做到的那样简单，显然还需要深入的语言交互才行，而且这种交互还应该是你日常生活中的场景。天哪，即便解决某个特定领域的语音交互就让众多科研人员心力交瘁了，更何况如此广泛的领域。笔者一听到这个需求大脑几乎就要爆掉，但是如果做不到这点，怎么又能称得上智能音箱呢？充其量不过是个语音控制的音箱而已。很多时候笔者觉得，语音识别还不如手势识别更为简单好用！当然对于那些流媒体的音乐内容提供商来说，这种前端产品或许是不得不做的产品，至少抢个赛道再说。　　写了那么多，笔者也是真的累了，五千多字伏案了一下午，也是不易。但是还不能就此收笔打住，还得多说几句，那就是未来智能音箱的用户体验问题。&　　我们一直强调，智能音箱还是一个音箱，但是为什么大多数厂商都把这个基本诉求给忽略了呢？一味强调智能而不扎实做好音箱的品质，如此这般，还不如干脆做个智能盒子好了。笔者相信，就是因为有如此多的问题，说明智能音箱领域还存在众多机会，若在这个领域创业创新，有必要思考下面的3个问题:　　（1）回归音箱本质，发烧音质才是智能的基础　　网上早已不止笔者一人批评智能音箱的音质了。无论智能音箱的产品元素是音箱多一点，还是智能多一点，作为一款音箱产品，就必须拥有音箱的特点，那就是拥有音箱的优质体验，这才是智能音箱被人们长期使用的关键。因此，智能音箱的开发，首先要回归本质，先将其作为一款高品质的音箱，然后再谈及智能化程度。　　（2）重新定义人机对话，增强开放互联能力　　智能是智能音箱的核心属性，但是最近几年是很难看到语音交互技术方面的突破了。但是智能音箱不能裹足不前，可以从特定领域入手，定制特别的算法和技术。比如针对音乐购买场景开发的音乐检索技术等，尽快让智能音箱贴近地气，至少某个领域解决用户的需求，这样，智能音箱就不仅仅是用户一时兴起的一个玩具了。　　另外，智能音箱毕竟也是移动互联网时代的一个入口。若智能音箱要成为控制智能家居的重要工具，其也需要拥有庞大的用户基数，而这就需要通过开放接口的方式，获得更多合作伙伴的支持。然后再获取更多的用户基数优势，也就能够方便其对智能家居的控制。　　（3）强调便携，电池续航和快速充电尤为重要　　智能音箱是一类移动互联网时代的智能硬件，方便携带是其作为智能硬件的重要因素。但是这个特点，实际上当前的智能音箱做的都不好，就像Echo那样总要拖个电源线，这算哪门子事情呢？另外智能音箱加装电池也存在很多问题，就像叮咚那样加装4个喇叭，还有WiFi和麦克风阵列，这耗电也不是一般的了，而且体积也很大。　　因此，智能音箱的体积还需要变得更小，并且将电池做成标配，并且具有较长的电池续航和快速充电的能力。据悉，小声科技一直从事超级电容音箱技术的基础研究，目前已经成功开发出了秒充和长久续航的核心技术。这项技术可以使智能音箱对于锂电池的依赖降到最低，甚至根本不再需要安装锂电池，这对于智能音箱未来的发展将是一个极大的促进。收藏28120本文为OFweek公众号作者发布，不代表OFweek立场。如有侵权或其他问题，请联系举报。+关注文章页右侧位置300*250
相关公众号
智能硬件、智能家居行业最新最前沿资讯，行业热点分析。发布智能家居产品及系统的相关动态，技术创新及匠人情怀。家居传统与科技前瞻碰撞出生活趣味。关注科技动向，专注智能家居领域新闻资讯报道！吉象全屋整装-顶墙集成,科技服务生活,绿色装点家居.招商加盟投诉文章问题&营销广告重复、旧闻格式问题低俗标题夸张与事实不符疑似抄袭我有话要说确定取消取消
用户登录&请输入用户名请输入密码登录使用一下账号直接登录}

常信村百科网