深几度

吳儁宇

公告

作者系独立撰稿人,钛媒体、品途网2016年度十大作者,腾讯科技2015年度最具影响力自媒体。关注人工智能、移动互联网以及数码家电的产业融合,文章在界面新闻、今日头条、搜狐科技、腾讯、新浪、网易等30余家平台发布。

文集

科技(5)

统计

今日访问:5544

总访问量:6189430

疫情下的搜索大数据,一个民意价值舆论场

2020年02月22日

评论数(0)


文|吴俊宇

这一次疫情袭来,大量事实表明,我们这片土地依旧不成熟。公众参与和社会治理都需要进一步提高现代化水平。

一个真正成熟的社会需要民众参与,也需要民意的反映,更需要政府、机构去倾听社会的声音,及时发现社会中存在的问题。

欧美发达社会的成熟之处在于,民众有数十年甚至上百年的公共参与,调研机构不断在民众中利用“定性+定量”的方式对民意进行调研。调研数据会在媒体上公布,形成舆论场,舆论场会一点点影响决策层。民众意见能够通过这些手段及时传递。

民调一直被视为是欧美社会机器有效运转的一个重要齿轮。

因为民调引发的社会舆论倒逼以及公共治理变革往往会持续推动社会进步。欧美社会针对各个领域的社会话题都会进行长期、持续、追踪调研,并推出相关民调数据。

这次疫情期间,民众的搜索行为沉淀了大量高价值可洞察的数据。这些“主动数据”其实具备民调数据的特征,用户行为可以展现出可观测性,具备挖掘价值。

搜索的价值一度被外界唱“衰”。然而疫情之下人们却发现根本离不开搜索,搜索就像是水和空气,在关键时刻人们才会发现,它无比重要。一次又一次的点击探寻也沉淀了每日以数十亿计的搜索大数据。

搜索大数据正是民调的重要组成部分,它可以让研究人员、社会学者以及媒体记者对舆论结构、逻辑联系和突变跟踪研究。即使最为普通的民调,长久来看,也会成为重要的研究主题,它会成为社会精神变化的重要一环。

它是我们社会进程演变的地图和指南针。

“卡特里娜”飓风运行轨迹

以2005年曾突袭全美的“卡特里娜”飓风为例,1998年开始,路易斯安那州立大学就成立了飓风研究中心成立,这个研究中心通过大数据研究模拟了飓风从路易斯安那州东南部登陆可能会带来的灾害。

后来,美国联邦应急管理局在2004年7月末还进行了一次防灾模拟演习。13个月之后,“卡特里娜”就在同一个地点登陆了,而且登陆轨迹和最初预计的几乎没有太多差别。然而,美国联邦应急管理局的表现却不尽如人意。

这次飓风之所以带来了不可阻挡的损失,原因在于两点。

  • 路易斯安那州立大学飓风研究中心和飓风公共健康中心多年工作研究未得到重视;
  • 大规模、跨部门应急撤退方案未能在日常得到充分实践,以至灾难来袭时毫无准备;

很多危机尚未发生时,人们总会用结果导向的思维去思考完整的保护机制是否有存在的必要。然而,我们不能倒果为因直接否定它的存在。

这就像空气无处不在,我们却不能因为感知不到因此就说它没有存在的意义。

在中国,我们同样需要构筑自己的社会灾害预警保护机制。搜索大数据和社会民调互为表里,它其实和社会、舆论、决策可以构筑一个成熟社会的稳定铁三角。

搜索大数据与社会民调其实有三个特质值得我们关注。

  • 社会反馈:人们的日常思考、社会焦虑会在搜索大数据上得到完整反映,报告式呈现之后往往就是民意的真实反馈;
  • 舆论倒逼:搜索大数据的报告式呈现往往会带来严密的逻辑佐证,铁一般的事实往往是具备社会影响力的,它会影响到决策层的心智;
  • 科学决策:决策机构的决策其实是需要科学数据作为支撑的,搜索大数据很大程度上可以成为决策机构了解社会问题以及社会民意的一环。

社会反馈、舆论倒逼和科学决策三者结合在一起时,往往可以形成持久的良性循环。

搜索大数据的深度挖掘

我们不妨去看看国外是如何把这三者稳定结合在一起的。

2009年美国甲型H1N1流感爆发的时候,官方数据依旧是习惯性滞后。不过,“咳嗽”和“发烧”、“关节或肌肉疼痛”这些与流感症状相关的关键词在流感爆发期间明显增多。

这一观察结果使谷歌工程师认为,他们有可能比传统的疾病控制中心方法更快地追踪报告流感发病率。

谷歌把5000万条美国人最频繁检索的词条和美国疾控中心在2003-2008年间季节性流感传播时期的数据进行比较,分析人们的搜索记录,以此判断这些人是否患上了流感。

谷歌因此成了一个更有效、更及时的指示标甚至不需要分发口腔试纸和联系医生,就形成明晰的社会洞察。美国公共卫生机构官员因此获得了非常有价值的数据信息。

后来约翰霍普金斯大学的Scott Levin以及约翰霍普金斯医学院的Richard E Rothman这两位研究者根据谷歌的Google Trends根据七个季节(2004-2011年)每周确诊流感病例数,分为训练和样本外验证集,建立了提前一周预测的预测模型。

流感病例的整数值自回归提供了一个强大的基础预测模型,而Google流感趋势的加入增强了该模型,证实了基于搜索查询的综合征监测的预测能力。这种可访问的和灵活的预测模型可以由各个医疗中心使用,以提供对未来流感病例的高级警告。

这一次百度搜索大数据同样反映出了疫情期间的社会趋势以及群体心态。疫情期间,用户都在搜素引擎上不断查看疫情进展以及防护知识,百度因此沉淀了大量搜索大数据。

一个数字是,日均超10亿人次在百度APP搜索、浏览疫情信息。搜索,这个互联网时代的“水电煤”又一次在无形之中彰显了它的价值。越是纷乱芜杂的信息环境,越是民众聚焦的社会事件,主动搜索对于民众也愈发重要。

从这些数据中可以提取大量有价值的信息,我们列举几个典型案例。

在经济领域,大家关注的是,中国经济是否会受影响,疫情之后的各个细分领域将发生哪些变化。民众在经济、生活里方方面面的搜索行为,在无形之中积累出了清晰的经济指向——比如受到影响的旅游业,以及因疫情出现用户增长的教育、医疗、娱乐产业。

在社会领域,大家关注的是复工防疫知识,比如早期搜索口罩以及具体口罩用法信息的大数据,它向我们透露了武汉地区物资紧缺和粤浙两地民众对疫情防控的重视急迫。

心理研究层面,中期湖北地区心理疏导搜索量激增,它向我们指示应尽快对湖北地区的民众进行心理疏导。

搜索大数据显示,大年三十当晚22时-23时,这一春晚的黄金时段却也是武汉市民在百度搜索疫情相关消息的全天波峰时段,其焦虑不安的情绪可见一斑。

此外,1月下旬,“心理疏导”在湖北区域的资讯指数,相邻7天环比上涨7428%,搜索指数7天环比上涨55%。为此,1月底相关部门迅速组织起了心理专家,紧急筹备开通心理支持热线和网络辅导服务。

以我身边从事行业调研和市场研究的朋友为例,他们依旧还是在使用百度搜索大数据进行市场调研分析,对比钉钉、企业微信、华为welink乃至今日头条飞书之间的竞争关系。

这位研究机构的研究员把这次疫情期分成了三个时间波段,把返工前,返工后第一个波段,返工后第二个波段分开分析,再根据双重标准化来处理,解决了各品牌整体数据基数不一致的问题。

他根据模型分析最后得出的结论是,钉钉虽然负面舆情很多,但是负面效应很小;企业微信负面舆情很少,但是负面效应非常强。

在统计学以及各项研究模型的辅助之下,各种看似不起眼的数据之中,往往潜藏着巨大的乾坤,它值得长期挖掘。

成熟社会的稳定关系

一个真正成熟的社会,需要决策机构、企业、机构、公众四者之间形成稳定的参与关系。

一个健康的社会必然是各方都积极主动参与协作的,社会的成熟需要企业、机构、公众都普遍介入其中,通过社会公共参与的方式不断自我训练。

财新在2月18日发布了一篇名为《用智慧手段助力疫情防控,推动城市治理现代化》,这篇文章在末尾提到:

鼓励多主体参与城市治理。构建“自下而上”的多主体参与模式,重视发挥各种社会力量,聆听社会多种声音,积极推动形成决策层、企业、机构、公众多元主体共建、共治、共享的社会治理格局。提升网络环境中的公众参与,通过运用网络和社交媒体,完善信息公开和公众反馈机制,提升透明度。

企业作为社会主体之一,同样可以参与到社会治理之中。

疫情之后,我们能不能形成持续、稳定的社会机制?

比如,ToB侧通过开放搜索大数据的方式帮助企业重新寻找商业机遇;

一些大数据研究和归因机构可以通过对搜索大数据以及移动归因数据对各个企业、产品的数据进行研究分析,帮助企业提升自身的业务能力。比如这一次疫情中最热门的在线教育行业,便在其中得到了发展机遇。

ToG侧通过长期追踪调研帮助政府科学理性决策,预测、分析下一个阶段的走势;

今年疫情期间,百度发布了《新型冠状病毒肺炎搜索大数据报告-拒绝野味篇》。报告通过搜索大数据还原了一个真实又令人震惊的现实:

非典过去17年,中国人对野味的搜索热度不降反升,尤其“野味的做法”“野味馆”“果子狸做法”等关键词的搜索指数持续走高。事实上,国人丝毫未从非典上吸取足够多的教训。

搜索大数据早已给了我们警醒,我们对禁食野生动物的力度还远远不够。

在信息社会,大数据尤其搜索大数据也有着其自身的社会责任属性,正确权威的信息可以有效的引导用户真实的了解事件发展过程,从而建立正确的认知观。

我在《在搜索框和回车键里,寻觅我们的社会脉络》一文中就提到:

在国内,程序员、产品经理因专业、精力所限无法发掘其中数据中的问题,它需要有经验的人在其中发挥作用。成熟企业往往会招聘政府、法律背景员工,参与业务和数据研究。

企业的话语体系、决策部门的话语体系、研究机构的话语体系存在差异,三套话语体系需要碰撞融合,共同服务公众。

决策机构更需要在其中充当协调者。在日本甚至出现了“产学合作协调者”一词。

产学合作、官民合作、跨学科研究、不同行业交流等联结不同领域的活动,既能帮助解决问题,又有助于创造新知识。

协调者要做的事情正是联合企业、机构组建团队,通过技术手段,从搜索大数据中获得更多民众、企业等诉求性的数据,后期展开数据研究,分析需求背后的内在发展逻辑和趋势,并形成针对社会具体问题的解决方案,定制完善的计划,并加以引导,使各方合作者达成共识,确定统一目标。

真正的成熟社会是流动的,它会为僵化现象提供预防效果。成熟社会的稳定四角关系,恰恰是构建起它的基石。

——END——

作者 | 吴俊宇 公众号 | 深几度

前南都、中经记者,关心技术、文化与人

钛媒体2015、2016、2018、2019年度作者

新浪创事记2018年度十大作者

腾讯科技2015年度最具影响力自媒体

转载、商务请联系个人微信852405518

文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+吳儁宇。