Alter

Alter聊IT

公告

Alter,互联网观察者,长期致力于对智能硬件、O2O、手机等行业的观察研究。

文集

科技(502)

统计

今日访问:7073

总访问量:9270378

AI要大声“说出口”|音箱或引领智能时代

2017年09月07日

评论数(0)

音箱曾经是播放音乐的载体,但在人工智能的时代下,这一角色似乎变得不再那么纯粹。有人说它是通向智能家居生态的“敲门砖”,更有看好者说它将逐渐取代智能手机在“AI时代”的地位。

智能音箱究竟能发展到什么程度?是否能像当年“智能手机”取代“电脑”一般引发迭代革命?我们不得而知,但可以确定的是,“智能音箱”这个风口已然来临。

巨头涌入,智能音箱战场诸侯争霸

亚马逊是第一个“吃螃蟹”的人,它推出的智能音箱Echo似乎成了打开智能家居入口的那把“钥匙”。第三方数据显示,Amazon Echo系列音箱占到了美国智能音箱市场份额的70.6%,截止目前销量已经超过一千万台。

正因为Echo在智能音箱行业的强势表现,各大巨头纷纷效仿,生怕错过了这场盛宴。谷歌的Google Home、苹果的Home Pod、微软的Cortana相继上线。国内的科技巨头们也一一布局,京东于2015年3月联合科大讯飞率先推出智能音箱“叮咚”,也由此拉开了国内智能音箱战争的序幕。阿里于今年七月发布“天猫精灵X1”,腾讯同时期推出“小微”,小米则是以一贯的作风主打性价比发布了智能音箱“小爱同学”。还有另辟蹊径的百度,推出智能音箱设备的开发平台DuerOS,试图成为智能音箱领域的“安卓”……

巨头的相继涌入,智能音箱战场不可谓不热闹。面对这个全新的领域,巨头们姿态有所不同,但对于这块市场的“野心”却是心照不宣的。谁能抓住这个智能家居的切入点,就能在智能家居市场这块“蛋糕”上占得更多的“甜头”。

音箱成为了智能家居的切入点,巧合还是必然?

第三方数据显示,我国智能家居市场规模已经达到了605.7亿,同比增长了50.15%,而预计这个数字在2018年底将达到匪夷所思的1400亿。面对这么大的市场,各巨头都不约而同的采用了“音箱”作为切入点。笔者认为,以亚马逊为首的智能音箱厂家在此领域获得成功并非巧合,更是一种必然。

智能音箱是人工智能落地家庭的最好方式,越来越多的场景下,它将革新我们传统人与手机“界面交互”的模式,为用户提供“语音交互”的新思路。未来人工智能的发展方向不仅仅是简单的响应用户命令,而是能够准确揣测并自动执行满足用户的需求。这种趋势对于UI的设计提出了更高的要求,需要设计师将思维从单纯屏幕UI中跳出来,以更宽广的角度去设计,语音交互为其提供了一种设计思路。

不过现阶段智能音箱的痛点依然存在,最为直接的问题是如何更加精确的识别语音。语音交互过程往往是“多对一”的指令。用户的一种意愿可能通过多种的方式表达出来,这就要求语音系统有强大的学习能力,能“听懂”用户的习惯用语,甚至能“揣度”客户的“话外音”。

搜集有效声音的过程又称“拾音”。不同于Siri为代表的近场拾音,远场拾音对噪声抑制、回声消除等方面有着更高的要求。目前国内外主流的智能音箱厂家都采用了“麦克风列阵”的解决方案,该技术经过长时间的发展,分化出了线性和环形两种路线。

第一种是以亚马逊、科大讯飞为代表的经典波束形成路线,该方式对麦克风数目和列阵拓扑结构要求较高。

以国内在此方面技术领先的“叮咚”音箱为例,其采用的降噪策略是在音箱顶部配8个麦克风,通过一定数量的麦克风配合特定的结构,使得波束的空间区分性更强,从而完成对噪音的过滤,保证拾音效果。此外,凭借科大讯飞领先的远场识别技术,让叮咚智能音箱和用户在较远的距离下仍可以完成交互。

第二种则是以Google Home为代表的线性路线,采用数量相对较少的麦克风,更多依赖于语音增强算法。通过自适应降噪、降低混响、语音分离等技术完成“拾音”。

智能音箱另一个巨大的挑战来自生态服务的不开放性,智能音箱要想真正完成对智能家居的对接,所覆盖的生态圈大小直接决定了成败。亚马逊的Alexa语音助手拥有超过1.5万个功能,反观国内,智能家居产品接口协议的不统一这个问题暴露无疑。百度推出了DuerOS系统,意在链接云端、硬件、服务、用户,打造生态中枢。

不难发现,智能音箱已经是语音交互领域相对成功的案例,接下来要做的无非是延伸出更多的商业场景。

智能音箱何去何从?

陆奇曾说过,人工智能落地最关键的是找到场景和商业模式,做出极致体验,并快速迭代。那么,智能音箱未来将如何发展?

亚马逊给出的未来方向是在音箱本身加了一块屏幕,意在通过屏幕实现更好的人机交互和用户体验。但智能音箱的核心竞争力是无屏幕的语音交互,音箱只是一个“载体”,背后真正有价值的是提供了一种让双手和眼睛脱离被屏幕的控制的全新交互模式。而亚马逊这么做恰恰让用户从刚培养起来的语音交互模式打回以苹果触控为核心的界面操作模式,并非是“明智之举”。

此外,在笔者试用的叮咚音箱A2身上,智能音箱正在逐渐摆脱对手机的依赖,有独立的内容源、独立联网,可以通过音箱去控制电视、冰箱等其他设备,甚至提供了购物等电商服务,已然形成了“计算中心”的雏形。换而言之,智能音箱不再是手机、电脑等传统计算中心的附庸,反倒有了几分成为AI时代新主角的可能。

总之,摆在智能音箱厂商面前的选择有两个,一个是提高语言交互模式下的用户体验,实现个体体验的“个性化”,深挖用户需求,形成更强的粘性;另一方面,“得生态者得天下”,这场关于智能音箱的战役,最终会演变成资源整合能力的大战,为智能音箱找到更多的场景,提供更完整的服务链条,才是在这场竞争中脱颖而出的关键。

文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+Alter聊IT。