平台型企业的大数据应用策略有何特点?阿里巴巴、百度、腾讯等一批平台型企业,汇集了海量用户和商家,聚集成富有张力的生态系统,它们的大数据应用不再仅仅局限于企业本身,正逐渐成为滋养整个大生态系统的血液,为平台上寄生的众多企业提供更多的数据产品和服务,同时也是这些平台企业未来的收入增长引擎。
2005年,阿里巴巴开发出主要供内部运营人员使用的数据产品——淘数据,阿里巴巴由此进入了数据化运营阶段,此时,阿里巴巴在大数据方面关注的重点是,怎么利用平台上海量的消费者和商家数据,来改进自身经营,大数据仅仅局限于内部。2009年,阿里巴巴的大数据应用开始走向外部,让淘宝商户分享数据。2011年,阿里巴巴开发数据魔方,通过淘宝数据魔方平台,商家可以直接获取行业宏观情况、自己品牌的市场状况、消费者在自己网站上的行为等情况。2011年4月,“页面点击”诞生,它可以监控每个页面上每个位置的用户浏览点击情况。紧接着,天猫携手阿里云、万网宣布联合推出聚石塔平台,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务。2012年,正式公布了阿里巴巴三步走发展策略,“平台、金融、数据”。
从数据化运营到运营数据
阿里巴巴的大数据策略意味着什么?阿里巴巴数据委员会主席车品觉一语道破,“在数据化运营阶段时,数据就产生价值,你有意识地用它,但却没有关注它。而当你发现数据已经和战略融合后,你认识到要有意识收集它,管理它。”如果将阿里巴巴的大数据比做食材,那么自己用原料做菜,和将食材提供给其他厨师,对原料的关注度完全不同。
由此,阿里巴巴的大数据应用策略正从数据化运营向运营数据转变。集团首席战略官曾鸣预测,“阿里本质上,未来会是一家数据运营公司。”前者,是如何将大数据用好,而后者则意味着,如何让大数据更好用。
从淘宝创立之时,阿里巴巴就开始搜集平台上的数据,直至支付宝、聚划算、一淘等平台,随着业务的爆发式增长,阿里诸平台上的数据成倍增加,汇集成海。这些数据包括交易数据、用户浏览和点击网页数据、购物数据等等。当海量数据开始聚集时,它们也变得良莠不齐,鱼龙混杂,充斥着大量失真、标准混乱的数据。另一问题是,当海量数据在一起,它们是无序的,不能直接使用,必需要提炼加工。再者,阿里纵有海量数据,却也只是大数据之海中的一个孤岛,无法全部满足平台商家的数据需求,比如商家需要了解用户在其它平台上的购买情况,阿里巴巴迫切需求外部数据。
车品觉称:“一开始,我们在用好数据,但是随着数据战略与平台战略紧密结合,我们开始刻意地去管理数据(保证数据安全、质量和对于商家的可用性),养数据(有意识地收集外部数据),沉淀数据。”
让大数据更好用?阿里巴巴是如何实现这种转变?从六个地方入手:确保数据安全(保护商家和个人的隐私)、保证数据的质量(去除虚假数据)、实现各个部门数据标准的统一(如转化率)、让原始数据变得更精细化(更符合商家的应用情景)、获得外部数据(如并购新浪微博,和其它平台合作、购买数据信息等)、建立数据委员会。
具体做法
1 去除源头污染,净化数据质量
自阿里巴巴数据委员会建立以来,数据质量就成了部门的核心工作,车品觉认为数据质量是大数据的命门,如果将大数据比作水流,“来自任何支流的数据,如果质量有问题,都会带来整个水源的污染。”由于淘宝等平台上的数据往往良莠不齐,不少数据虚假,带来很大的噪音干扰。“有时,在淘宝平台上,对于一个人,我们会看到两个手机,一个iPad,三张信用卡,五个淘宝帐号,收集数据时,以为是多个人,但实际上就是一个人。但如果依照这个数据,商家可能就将红包给了一个不活跃的账户。”为此,阿里巴巴试图剔除虚假的数据,让收集的数据能反映真实的消费情景。比如上面的案例,就要鉴定所有这些账户、信用卡等是否为同一个人所有。再如,阿里巴巴经常要做产品界面测试,有时临时修改界面,会一下子多出一个按钮,这就会带来大量误点击操作,数据收集时,就会得到很多失真的用户行为数据。阿里巴巴的数据人员目前的工作就是要将这些失真的数据剔除,或者将数据还原到真实的场景。
责编:王薇
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友