智能相对论

人工智能交互暗战迭起,开放生态成竞争赛点

2017年11月23日

评论数(0)

作为早于人工智能大潮出现的产品形态,AI助手某种程度上并不是什么新奇事物,但随着人工智能的日趋火热,围绕智能终端的AI助手之争又再度成为焦点。

一直以来,各大巨头,无论新旧对此领域都非常关注,前赴后继地加入这个战场,就在1121日,三星旗下的人工智能平台Bixby中文(普通话)版正式在中国发布。之前就听说Bixby的定位是“作为用户设备生态的控制中枢”,即除了面向智能手机的功能升级,Bixby还能连接智能家电,这无疑标志着AI交互领域的对抗强度又被加码。

那么,人工智能时代到来、AI技术竞争成为科技主旋律后,在智能手机、PADPC甚至智能家居上大行其道的AI交互产品,究竟要靠什么构建核心竞争力赢得市场,从激烈的竞争中脱颖而出,开辟出硬件之外的另一片江山呢?

 

从“助手”到“平台”,AI交互竞争持续加码

在回答“什么才是核心竞争力”之前,我们先来看看为什么硬件厂商、互联网大佬等都对AI交互如此热衷。

事实上,软件领域竞争的兴起某种程度上是因为硬件领域竞争的白热化,软件能力不再只是过去智能硬件刚刚兴起时的锦上添花,而成为了主导消费者选购的主要因素之一。

PC时代初期,IBM、苹果电脑的硬件本身就自带光环,适配的软件不过是让它更亮眼;在智能手机时代初期,拥有一台iOSAndroid设备就足够吸引人,搭载的软件实现更多功能让消费者更满意;在智能家居出现时,一个可以被信息化控制的家电也已经十分新奇。

后来,这些硬件领域的竞争逐渐升级,当硬件同质化越来越严重时,消费者的目光就转到了软件交互上,软件成为支撑他们做出消费决策的重要因素,“恰逢”人工智能大潮来袭,这一波提升用户体验的软件改造任务就落在了人工智能身上,“万物智能”成为消费升级的核心追求之一,加码本已存在的AI助手就成为了自然而然的事。

上得了台面的最早的AI助手应算是苹果的Siri了,这个老牌的语音助手在市场的褒贬不一中创世,又在用户的“调戏”中走过6个年头,如今已经成为领域的“竞争标杆”,面对重重威胁,Siri加紧了升级步伐,例如最近苹果就计划在iMac Pro上支持通过“Hey, Siri”快速唤醒。

PC领域吊打苹果的微软自然不会放过做PC上的AI助手的机会,2014Cortana登录Win系统,初试市场反响良好后,随后又登录iOSAndroid,直接瞄准Siri。目前微软宣布Cortana每月的活跃用户已达1.48亿,除了跨系统,还深度嵌入到Skype中。

Amazon Alexa与微软Cortana同年发布,但舆论更喜欢拿它与2016年才出生的Google assistant对比,两者都希望利用内置的特点来吸引第三方开发者,通过应用的增加来赋予自家AI助手更强大的功能,目前看来战情的焦灼度在不断升级。

2017年随着三星S8推出的Bixby则有点姗姗来迟,不过AI领域后来居上的事发生太多了,Bixby也不例外。

从定义上来说,Bixby可能是真正意义上的AI平台,因为其他产品多数都是只有智能语音控制功能,而Bixby包含了Vision, Voice, Home, Reminder四大功能服务,语音只是其中一项。在交互方式上,Bixby具备多种方式,不仅仅可以用语音和它进行对话,还可以使用文本、触摸、视觉对它下达命令,按需选择较为方便的方式与其沟通。毫无疑问,Bixby打破了“助手”的概念,而变成了一个人工智能交互平台。


也许是作为后来者看到了太多的成功与失败,Bixby的出品一开始就带有建立开放生态的意味,除了支持内置应用,还开放了主流APPCP融合,这次Bixby中文(普通话)版更是直接跳出智能手机,面向贴近生活方方面面的智能家电。

可以认为,作为后来者,至少在生态开放态度上Bixby从一开始就超越了其他助手。而从AI交互肩负的“使命”和本质属性来看,通过CP兼容开放生态的程度,可能恰恰决定了AI交互产品所能获得竞争优势的程度。

 

交互立身,开放生态才是应有之义

交互的本质不过是“发出指令-执行操作-获得反馈”的过程,AI在交互上所能做的,应当是使得用户指令发出更便捷、操作执行更到位、反馈更简洁有效。从这个角度去看AI交互产品的应有之义也就十分明朗了。

1、“裘千尺模式”是用户的最终需求

电视剧《神雕侠侣》中,被其夫挑断手筋脚筋的角色裘千尺,几乎所有的生活“交互”都靠嘴巴指令来完成,所谓裘千尺模式,指的是在完全没有双手双脚介入情况下也能实现操控。

也即,如果用户想要,他凭借一张嘴就能完全控制智能终端。从Siri开始,智能终端上的人工智能交互之所以出现这么多年,消费者都并没有形成一致的好评,原因就在于它们的交互都存在这样那样的不足,用户的智能交互体验是“量变”的,限定在各处存在,用户始终觉得离智能还差那么一点。

“裘千尺模式”实际是一种体验的“质变”,让用户真正自由、真正感受到智能,这也应该是人工智能交互的最终追求,否则人工智能的意义就存在疑问。本次Bixby发布会上,三星方面表示,Bixby是人工智能的一次变革,旨在代替Touch交互,此前能够用手操作的功能,用户都可以利用Bixby来实现,这大概就是对体验“质变”的追求。

2、开放兼容助推“质变”的用户体验

在得出结论前,我们先对比一下两款典型产品的智能化交互体验,再深挖其背后的原因。这两款产品就是最知名、最老牌的Siri和最新出的Bixby,智能终端采用最新的iPhone8及三星Note8

场景1:解锁手机。唤醒SiriBixby后,语言指令要求解锁手机,iPhone8Siri反馈无法解锁手机,Bixby则可以设置语音密码用于唤醒。

场景2QQ发送消息。两款产品实测都能够直接要求在QQ里向指定的联系人发送指定内容的信息,非常方便。但Siri无法理解要求“撤回刚刚发送的消息”指令而卡住,Bixby径直找到了最新发的消息进行了撤回。

场景3QQ发红包。发出打开QQ给某人发送1块钱红包的指令时,Bixby把红包准备好,等你输入密码即可发出,而Siri则略“搞笑”,正准备把“1块钱红包”这句话发给指定的联系人。

场景4:天气。这是最常规的生活场景互动,询问后,二者都能根据所处的地理位置提供详细的天气,所不同的是Bixby还能精确到区域,且天气是动态的。

场景5:随意玩法。Siri相对“正统”,只会尽自己所能去回答,而除了和Siri一样可以被“调戏”,Bixby还能自定义问题和答案,玩法相对更为丰富。而且,基于Innoetics (被三星收购的一家意大利创业公司)能够听取讲话来模拟真人声音的技术,Bixby的声音是自然人声,不是其他助手一样的机器人生硬的声音,且还有男声可供选择(虽然一般没人选),未来,也许让周杰伦给你讲个笑话、让宋慧乔报个天气都将成为可能。

对比发现,通过Bixby用户几乎不用动手,操作“全凭一张嘴”,随性、自由,相较于Siri的卡壳(CortanaAlexaAssistant等也存在类似的情况),用户体验有着质的不同。

从实测可以看出,BixbySiri等一系列产品不同的是,Bixby有更强的语义理解能力,识别中文的能力更强,复杂的中文一般都难不倒它,并可根据识别完成多步骤操作。

细究Bixby背后的产品战略,就发现这种质的不同来源于其CP融合的程度的差异。这种融合体现在两个方面,一是深度,要深挖应用可能涉及的操作内容并内化到Bixby中,覆盖掉用户所有可能的操作,这是响应复杂操作必然的要求;二是广度,除了尽可能多去覆盖手机中本地应用之外,Bixby目前也支持将近20个第三方中文应用,都是主流APP,比如QQ/微博/支付宝,这些应用都能通过Bixby进行各种语音操作,CP兼容远超领域内其他产品。

正因为如此,开放的姿态又让Bixby有了更多学习素材,通过内置的学习型AI不断练习理解力与执行反馈的准确性,配合后台深度学习机制,Bixby又能够更快实现迭代更新,从而实现了产品自我提升的“良性循环”。

3AI交互要做的是平台系统,而不是额外组件

开放兼容的背后,实际上还有一个理念上的不同:把AI交互做成平台系统,而不是额外组件。

例如,Bixby除了发短信,还能在微博上发文字加图片;除了语音识别,还能够记录使用习惯,经过自主学习后,能快速准确的识别用户的语音指令;除了文本之外,还支持图像输入,包括从摄像头、相册直接启动来查找或搜索网页上的图片;还能根据上下文语境自动提供有用的信息,甚至还可以通过人脸识别技术来采集信息。

在截图、上下滑动、左右滑动、语音解锁屏幕、摄像这些动作上,Bixby都超越Siri等产品。究其原因,Bixby的定位是“人工智能平台”,做的是系统层级的整合,也只有如此,AI交互才能更深、更广,否则只是以一个额外APP的形式出现,系统操作上能做的有限,应用的CP融合也将面临诸多商务上、技术上的困难。

 

走出语音和手机,AI交互还可以有更多可能

诚然,语音功能是用户直观上最喜欢采用的交互方式,智能手机在当今时代也是与用户关系最为密切的智能化产品。

但实际上,一方面,交互的含义包含很多种,提升用户体验也有不同的路径,另一方面,智能终端的类型和产品越来越多,AI交互的发展空间也随之扩大,这就给了AI交互走出语音和手机的动力和必要性。

例如,BixbyAI交互平台上,语音助手只是一部分,其他功能同样亮眼,Bixby视觉通过摄像头可以检测文本并提取、翻译,是出国旅行利器,还能搜索类似图片、搜索购物信息;还增加了场景感知功能,可以进行实体街景对比并定位,在街景的相机视窗中即能看到相关功能的电子信标,十分“酷炫”。未来,除了语音,围绕AI交互Bixby计划实现更多亮眼功能,把“人工智能”坐实。

另外,在智能终端的扩展上,各个AI交互产品都有延伸动作,例如AmazonEcho爆款智能音箱,全球卖疯,Google推出的Home智能音箱也同样收获颇丰,连一向“引领潮流”的苹果最后也不得不跟随式地推出Siri智能音箱。

但我们发现,这些终端扩展,还是以智能音箱为主。同样是大佬的三星似乎不愿意跟风,而是剑指“作为用户设备生态的控制中枢”,直指物联网智能功能系统,包含三星智能电视、冰箱等家电上都将预装Bixby。除此之外,三星还将以开放态度向第三方完全公开开发者工具。

推广到全球200多个国家和地区,被设计成完整体系的Bixby现在不但能控制三星手机,还能连接其他三星家电,实际上,Bixby已经成为三星打造互联生态系统的重要环节,超出了为智能手机增添功能的范畴,其磨砺的更简单、方便、直观的操作方式,也能更好地操作所有可适配的设备。

可以预见到的是,未来的AI交互产品将渗透所有的智能电子设备,成为物联网智能的“基础设施”,而谁能在这个潮流中以更开放、更兼容姿态营造出互联生态,谁就能在AI交互的大战中胜出。

文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+智能相对论。