2014年05月12日
评论数(2)目前各个行业都在谈大数据在行业内的应用,但是目前提出的思路非常多,在企业内部实现具体效果的却很少。在这里就想谈一下,你的企业遇到的问题到底是“大数据”的问题,还是“数据大”的问题。字面之差,解决问题的方式却截然不同,所需投入的成本当然也就截然不同。
目前在零售领域,数据分析越来越被经营者看重,特别是顾客消费行为分析,商品构成分析,资本运行效率(周转率)等等。现在各种ERP产品以及专门的BI产品在这方面都做了很多的工作,用很多报表的形式对这些数据进行了展示,也都提出了自己针对这些报表的一些解读的方法。但是就目前来看有这么几个不足的地方。第一个分析的“深度”不够。报表展示的毕竟只是一些数字,具体反映了什么问题还是要“人脑”加工判断,报表不能够很直观的反映出企业目前的问题及可能选择的解决方法。第二个,数据“广度”不够。这个问题的产生很多都是因为企业已经信息化的部分,基础数据采集,保存的不够完整造成的。比如要分析顾客的消费行为,基本的小票信息,会员信息,促销活动信息,当时的库存、价格、甚至天气信息都是需要的,但事实上企业能够将这些信息收集完整并且持续保存的不是很多。当然,现存的BI系统或者ERP系统本身不具备这样的分析能力是个主要的问题。第三个问题,系统处理能力不够。假设第一个,第二个问题都解决的话,系统本身架构的处理能力就成了最大的瓶颈。你想看报表的时候,系统却不那么给力,数据抽不出来或者等待时间很长,更有甚者系统崩溃了。其实到这个问题的时候,才是真正“大数据”或者“数据大”的问题。
接下来我们具体谈谈“大数据”与“数据大”的区别。其实作为非IT人士对这个“大数据”是存在一定误解的。很多场合把“数据大”当成了“大数据”。“大数据”这个词的由来是由一定互联网背景的。在互联网时代,特别是社交网络的诞生以后,网络上聚集的大量的信息,这些信息如果经过加工整理,对很多行业都有很重要的意义,都能从中找到自己需要的具体信息,但是因为这些数据首先是巨量的,一般的数据库技术已经很难支撑。其次是非结构化的,不像我们的数据库里面的表,具有明确的字段,每个字段的意义明确,长度可预知。再次这些数据虽然巨量,但是“垃圾”也很多,如何剔除这些“垃圾”数据也是影响分析结果精准的一个问题。在“大数据”这个课题上,很多公司提出了自己的解决方案。比较成功的算是“舆情分析”领域。在零售领域目前并没有看到很有代表性的成功案例。
谈到这里可能对“大数据”有个大体的认识了,然后我们转过头来看看我们流通企业面临的问题。作为流通企业,我们保存的数据都是有针对性的“质量”非常高的,“高密度”价值的数据。因为我们每一条数据可能都反映了一个商品属性信息或者交易信息。每一个字段都有他固定的意义。我们的系统无法支持我们现在的经营决策以及跟上我们的管理水平主要还是“数据大”的问题。而不应该是“大数据”的问题。通过对“大数据”与“数据大”的内容的区别我们也能够看出,两者却别还是很大的,肯定也不能用完全一样的技术手段来解决。
其实到这里我还想强调一点,跟我我们对流通企业的了解,大家追求的或者说期待的一个数据分析的效果主要还是如何将数据的价值反映到实际经营中来,“数据”只不过是一个原材料或者是手段而已。只不过这些年大数据的概念比较火爆,一定程度上“误导”了大家。所以,我们在选用基于数据分析的决策支持类的系统的时候,千万不要被“大数据”“云计算”这样的词眼迷惑,更重要的是看这个分析的结果如何反映到企业的运营中来,价值如何得到体现。当然“大数据”“云计算”是个未来的趋势,是个好东西这个不能否定。目前对用户企业来讲正处在传统IT产品与云计算产品转型的阶段,选择的时候可能比较困难。话说回来,我们采购系统都是为了解决我们实际的问题,传统的还是云架构的都是手段,只要能提供出价值来,对企业来讲没有大的差异。如果企业规模比较大,系统的部署跟维护成本比较高或者企业发展比较快,IT需求变化频的情况下,当然还是选用云架构比较合理,毕竟云架构在这方面还是很有优势的。