2021年02月18日
评论数(0)伴随文明信息载体的演变,视频和图文需求的此消彼长,视频搜索趋势同样无法逆转,注定会成为更多互联网巨头又一个争夺的战场——视频搜索,也就会凸显出它的更大价值所在。
作者 | 杨铭
编辑 | 黄枪枪
“视频搜索这种更具画面感、个性化的搜索方式,会成为未来搜索引擎新趋势吗?”
这是2月17日,字节跳动CEO张楠透露,抖音视频搜索月活用户超5.5亿,日均视频搜索量已达4亿,抖音将加大对搜索的投入力度之后,在知乎,由官方“知乎科技”发起,已有400来人参与的热门问答。
在移动端积极布局搜索业务的不止抖音,其早已成为所有巨头布局方向。2021年微信公开课上,微信搜一搜首次完整亮相。更早之前,字节跳动等互联网巨头也公开宣布发力搜索业务。区别在于,无论是微信搜一搜,还是其他互联网巨头,重点发力方向都是通用搜索,而不是视频搜索。
搜索,英文名Search。过去30年来,作为用户需求、依赖最多的领域,搜索对互联网发展有天翻地覆的影响,如果没有搜索,那么大概率不会有如今的互联网。
从文字搜索到整合搜索、图片搜索、音频搜索,乃至现在的视频搜索,搜索成为互联网进化最快的领域之一。直到如今,智能设备和信息技术大爆炸仍持续影响着搜索方式,推动搜索变得越来越更聪明。
这也让过去多年来,众多业界人士,甚至谷歌搜索产品和用户体验副总裁玛丽莎.梅耶尔(Marissa Mayer),在十多年前的《搜索的未来》中发出相同提问:
搜索引擎会成为过去时吗?未来的搜索,又会是什么模样?
毋庸置疑。也许谷歌、百度会没落,但搜索引擎不会过时,它本就是一部在技术不断革新中变得更好的搜索简史——面对日益复杂的各种内容,越来越懂得用户的查询需求,并迅速为用户提供更精准的信息和答案,本就是搜索引擎诞生以来一直致力的前进方向。
归根结底,无论百度、谷歌、微软、雅虎、Pintrest,还是YouTube、抖音、微信搜索,尽管各大搜索引擎获取信息的方式已不尽相同,但其目标都一致:谁更准确理解用户想找什么,谁就将引领下一代搜索潮流。
搜索引擎原理,很大程度源于传统文件检索技术。它的简史,要从30多年前互联网萌芽并兴起时代说起。
1990年以前,万维网还未出现,没人能搜索互联网。这一年,加拿大麦吉尔大学的三位学生发明了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,它没有机器人(Robot)程序,还不是真正的搜索引擎。
时代巨轮,正悄然启动。1993年,美国副总统戈尔提出“信息高速公路计划”,并由此爆发了互联网超常规发展的黄金十年。
信息高速公路网,也许就是搜索引擎。1994年,Lycos推出基于人工分类目录的搜索引擎,用户输入关键词就可根据内容需要查找网页,在此之前,用户需要通过人工收集和整理“网址索引”才能进入网页,雅虎正是这方面的代表。
早期的搜索引擎百花齐放,虽然功能都不完善、命运多舛,但为后来跨时代发展奠定了基础。
跨时代变革在1998年到来。这一年,拉里·佩奇和谢尔盖·布林在斯坦福大学学生宿舍开发了谷歌,他们发明了叫做PageRank的链接分析技术,使得搜索结果相关性大大增强,并且在界面等实现了革命性创新。
谷歌搜索引擎的出现,标志着全民互联网时代的来临。从此,世界网民都认识到,搜索是一个简单动作,输入关键词,就能在一页页蓝色链接中寻找到结果。
在国内,李彦宏携120万美元风险投资回国,成立众里寻他千百度的“百度”,通过建立在海量网站基础上的“超链分析”技术,走到了舞台中央。
此后,更多公司受搜索市场前景和谷歌神话吸引,积极进入搜索引擎市场,谋求一席之地。但也因为浏览器劫持、恶意捆绑等行为,在备受争议后寂然无声。
2004年9月,谷歌推出简体及繁体两种中文版本的搜索引擎,与百度在内地市场分庭抗礼,加上360、搜狗、网易有道等的出现,搜索引擎大战在国内爆发。
2010年谷歌退出内地市场,百度开始在国内一家独大无人撼动,一度在国内PC搜索市场占据83%以上市场份额。尽管它与谷歌占据全球90%以上市场份额相比,从全球来看依然是小众搜索。
回头看去,虽然外界对谷歌、百度迄今仍有诸多争议,但归根结底,他们能在PC时代占据统治地位,是通过技术让搜索质量有了质的飞跃,用户获得信息更快更准确,让搜索引擎真正成为互联网的第一流量入口。
在这个基础上,还诞生了搜索广告、搜索引擎优化(SOE)、搜索引擎营销(SEM)等技术与商业化形式。而知识图谱、个性搜索、云计算、乃至人工智能等技术的发展,某种程度上也被搜索技术的进步所影响和推动。
这是谷歌、百度在搜索历史中所起到的巨大重要作用,也是谷歌、百度能成为科技巨头的根本原因,如同李彦宏所说:“搜索是百度成功的所有秘密”。
无论是谷歌,还是百度,他们仍然一直沿用的是上世纪的关键词来生成网址索引的模式——在互联网内容日益复杂、庞杂后,通用搜索越来越难以满足用户的搜索细分意图,导致大把时间都被消磨殆尽了。
这就是过去多年来,搜索引擎是否过时说法的主要原因。2011年,时任微软Bing的主管就如此批评:“在过去12年里,搜索本质上没有什么改变,传统搜索正在走向失败。搜索的概念不再有效,在网页上、在反向链接上、在所有一切上寻找文本不再管用了。”
潮起潮落,随着移动互联网兴起,PC端逐渐向移动端流量转移,搜索也开始进入移动时代。
移动搜索与传统搜索有着很大不同,搜索诉求、搜索方式、输入方式、输出结果,都因为各种移动设备而变得更自然、更广泛和更智能——人们不仅可以随时随地通过 Siri搜索,还可以在跑步时用可穿戴设备搜索,也可以懒洋洋地躺在沙发上用Alexa搜索。
文字搜索远远满足不了亿万网民需求后,语音搜索、图片搜索、视觉搜索,是过去移动互联网10年三大最有代表性的搜索方式。
2011年开始,在智能手机、可穿戴设备、智能语音助手、智能音箱等助推下,语音搜索让众多巨头兴奋不已。不过,几年发展后,尽管大多数语音识别技术识别率已达到了一个较高水准,但识别并不等同于理解,算法速率和准确率需要进一步提升,同时无法排除嘈杂的环境干扰,对使用者的说话语气、语速、口音等要求颇高。
从咨询公司Roast2018年一份研究22个垂直行业的语音搜索情况来看,Google智能助理能回答的问题不足一半,即使是能回答的问题,答案类型也是千差万别。
语音搜索在某些人士看来,目前还是鸡肋的同时,图片搜索、视觉搜索又开始兴起。
图片搜索和视觉搜索背后的技术逻辑相通,比如都是基于算法和数据,与数据库中的特征照片进行对比,识别和搜索目标图片中的语义标签。因此无论是谷歌、百度、Facebook、微软、亚马逊,还是Pinterest(图片版的推特),他们都早早进入了上述领域并投入了大量的研发资金。
两者在输入上却完全不同。前者是一种以反馈图像有效信息结果的搜索模式,只需输入文本、关键字或者图片就可以得出结果,门槛相对较低;后者是用智能手机或其他摄影头来识别物理世界所有对象信息的模式,再使用发展近30年历史的图像识别技术,结合用户特征和搜索场景得出相关信息。
谷歌在2011年推出图片搜索,这个功能的意义是,让互联网信息共享跨入新时代。不过,基于单幅图片来进行搜索,相对有局限性。
业界持有更大希望的是视觉搜索。2009年,谷歌为安卓手机开发的Google Goggles可以说是最早的视觉搜索应用。Goggles目的在于搜索识别现实世界中拍摄对象的图片信息,并且能够使用物品的条形码进行产品搜索。
但Goggles技术非常基础,本质上是一个搜索引擎公司的Pinterest也在2015年就推出了它的视觉搜索功能,并取得了技术上的重大突破,比如如何更有效将图像识别和视觉搜索功能结合起来,包括能够在更广的可视范围内中逐个建立单个识别对象,并在视觉应用上显示搜索信息。
2019年2月,Pinterest推出了图片搜索功能Lens。经过1年探索,Pinterest用户每月至少进行6亿次视觉搜索,且搜索总数在不断上升。其受欢迎原因在于,它能够为每一位用户创建一个独特的“品味图谱”,激发用户购买欲。
谷歌也在2017年通过图像识别和OCR技术推出了Lens功能,让机器学会“看图说话”,并且用它正式取代了Goggles。不过,直到2020年6月,谷歌才宣布可以在所有稳定版本中使用Google Lens。
和传统搜索相比,用户在使用图片搜索、视觉搜索时,寻找的是图片而不是关键词,进一步满足了用户的搜索需求和体验需求。
这并不能宣告,搜索引擎已从文本搜索进入了图片或视觉搜索时代。
因为哪怕图像识别技术已有很大进步,比如利用深度学习来训练视觉搜索并从图像中提取信息,但由于设备问题,加上对图片中各种元素的识别、标记效率不够、交互不够自然,以及隐私保护等原因,都是视觉搜索模式已经出现多年,却很少在日常生活中使用它们的原因。
必须承认,20多年来,一直在努力变得更聪明的搜索引擎,图文搜索依然占据搜索主要份额——其根本原因,是互联网上内容都是以HTML图文方式呈现,搜索围绕图文为重点,是时代必然,也是图文搜索很难被完全取代重要原因。
但时代终究不同。移动互联时代,APP成为各自领域内容重要入口,也让每一个APP都成为一座数据孤岛。传统通用搜索引擎难以搜到APP优质内容,无论是国外的Facebook、YouTube,还是国内的抖音快手、携程美团中的内容,传统通用搜索引擎都很难搜索到。
这让搜索引擎市场格局开始发生变化。比如百度,由于内容壁垒加深,以及用户注意力被分散到短视频、电商、垂直应用等各个移动端口,搜索及相关业务也被其他不同搜索业务和平台缓慢蚕食。
从市场份额来说,百度搜索在国内独占鳌头格局虽暂时无人撼动,但搜索业务正呈现出多元化与差异化发展的趋势——如同知乎答主“PANSZ”所说,人们用淘宝搜商品,用知乎搜问题,用美团搜团购,用哈罗搜自行车,用滴滴搜快车,用高德搜地点,同样也会用抖音搜视频。
可以说,这些互联网巨头和平台都有同一的目的:在最擅长领域内,做自己的搜索引擎,以缩短搜索和服务目标之间的链条。
但放在更宏大历史背景中,上述绝大部分搜索,不过是基于自身APP内部的用户需求行为,其对互联网的改变和推进意义,远远小于谷歌、百度带来的图文搜索。
那么,当通用搜索到更丰富内容越来越难的时候,有没有一种搜索方式,可能在图文搜索之后,代表着未来趋势和方向?
詹姆斯·格雷克在《信息简史》一书中说:信息仅仅存在是不够的,它还必须为人所知。
事实上,无论是哪种搜索模式,最重要的,仍是以所有用户为中心,精准提供其他渠道没有的、更有价值的信息和服务。
目前来看,满足上述搜索核心价值理念,并且符合人类文明、互联网未来发展趋势的,只有视频搜索。
当前,伴随5G、大数据、云计算、物联网、人工智能等技术的飞跃,人类文明记载方式,正从图文到视频演变——尽管以图文为媒介的内容,在短时间内依然还会是主体,但在感官、现场、个性化、直观等全面碾压图文内容的视频,早在各领域井喷。
CNNIC数据就显示,截至2020年12月,我国网络视频用户规模达9.27亿,较2020年3月增长7633万,占网民整体的93.7%。其中短视频用户规模为8.73亿,较2020年3月增长1.00亿,占网民整体的88.3%。视频化表达将成为接下来内容领域的重要方向,这一点早在业内达成共识。
视频需求的井喷,一方面意味着视频的形式,可以降低专业内容的受众门槛,吸引更多大众用户;而另一方面,意味着用户对答案直观、有效信息的搜索追求、体验需求与日俱增,这同样是一场不输于短视频崛起的变革。
视频搜索有着和短视频技术融合的天然性。无论是国外的YouTube,还是国内的抖音,都早已经搭建好了基础的搜索架构,能通过对算法的提高,和搜索引擎技术相融合,去改善搜索质量和搜索体验——抖音崛起过程中,备受推崇的核心技术正是基于智能推荐引擎。
从技术角度而言,以用户兴趣推荐驱动搜索,其结果会更加个性化、精准化。这意味着,在进行视频搜索时,搜索结果相比图文搜索的内容丰富度、匹配准确度有了相当大提升(这也是搜索的两大核心需求重点),用户体验会更好。这也是视频搜索,与传统搜索最大的区别。
比如,在抖音搜索“红烧肉”,纵向信息流里是推荐与“红烧肉”相关的热门视频和头部主播视频,“红烧肉”的话题入口等。横轴上则提供“视频”、“直播”和“商品”等一些细分入口。
这就是视频搜索的最大好处,不用高度抽象的文字、不用静态的图片,通过短短几分钟直观视频,一种接近于人和人之间的真实沟通交流,照葫芦画瓢就能烧出一份红烧肉。从创作者角度来说,这样的搜索算法,也降低了内容竞争门槛,提高内容曝光,增加粉丝黏性。
某种程度上,这正是YouTube成为全球最大短视频平台的同时,也早在2008年就成为全球第二大搜索引擎的关键原因——注意,YouTube的基础设施,是搜索引擎而不是社区。
抖音也是同样如此。2018年5月,抖音上线了第一个搜索入口,不到三年的时间,抖音视频搜索的月活就达到5.5亿。这个数字,甚至超过百度APP在2020年9月份的月活数据5.44亿。
对抖音来说,视频搜索能在三年内时间里就达到5.5亿日活,与推荐形成互补,其空间可以想象。由此可以理解,为何视频搜索会成为抖音在2021年,甚至更长未来大力发展的重要战略级动作。
和通用搜索全网检索结果不同,视频搜索难度显然更大。比如,内容丰富度的前提,是平台自身储备有内容池,才能快速找出并推荐用户想要的内容。而匹配精准度,则依赖于平台对更丰富视频内容的理解。
事实上,无论是YouTube,还是抖音,目前距离终极形态的“视频检索”,也就是视频语义层面的多模态检索,都还有一段距离——目前的视频搜索,仍比较依赖文本检索,通过关键词匹配视频的标题、介绍、关键词、以及字幕信息(OCR),得到答案。
字节跳动CEO张楠承认:“把视频搜索做好很难。”但她仍对视频搜索寄予厚望。张楠表示,如果抖音希望成为人类文明的视频版百科全书,那视频搜索就将是这部书的索引,是寻找答案,收获新知的入口。
现阶段看,作为一种全新搜索方式,视频搜索目前与图文搜索仍是互为补充阶段,无论是今日头条发力搜索,还是微信对话框全量上线搜一搜功能,可以看出通用搜索仍是当前搜索领域竞争重点。
但在不久的未来,伴随文明信息载体的演变,视频和图文需求的此消彼长,视频搜索趋势同样无法逆转,注定会成为更多互联网巨头又一个争夺的战场——到那时,视频搜索,也就会凸显出它的更大价值所在。