扫描二维码

订阅畅享网微信

看百度如何获取大数据时代的“船票”

来源:互联网  
2014/4/30 8:43:05
如何获得大数据时代的“船票”,作为拥有海量数据及处理能力的公司——百度在这方面已开始快速布局。通过参与百度技术开放日,并结合百度之前的系列动作,笔者对百度的战略有一些新的观察和思考。

本文关键字: 百度 大数据

,而更大的挑战则来自不同企业、不同行业间数据流通与关联之后。要知道,不同领域的数据关联不是“加”的关系,而是“乘积”的关系。本就巨大的数据,在关联后成指数倍增长,如何计算这样的海量数据,成为无法回避的问题。

 

百度大数据引擎的组件之一——开放云解决的主要就是存储与计算问题。

据百度大数据部总监李钢江介绍,百度开放云可以支持EB级别的存储,单一集群可管理百亿级文件;数据处理能力达上百PB/每天,拥有毫秒级响应能力。此外,百度数据中心已拥有并顺利管理着数十万台服务器规模,数据中心去年年均PUE(国际上衡量数据中心能效的指标,越接近1越好,行业均值为2)为1.32,最好时达到1. 16。这使得百度数据中心比行业其他机房平均省电30%到40%,造就了百度存储和计算方面低成本优势。

数据存储之后,进行数据查询也是一大难题。“例如,我们买了很多书,存到大型图书馆中,然而没有好的查询引擎,书很难被利用起来。”李钢江表示,百度大数据引擎的“数据工厂”组件,就能够提供快速的大数据查询和分析服务。

在过去的小数据时代,我们常用SQL做小数据查询,但在大数据时代,这些数据库服务都没法很好地发挥作用。“而百度数据工厂则可以支持单次百TB级别异构数据查询,数据扫描能力达到百GB/秒,单集群并发查询能力达到十万QPS,即每秒可并发处理十万量级请求”。

也许这些技术语言已经把你绕晕了,不过就笔者所知,这些能力称之“世界领先”并不为过。而另一个值得称道的能力就是“智能化”——让机器拥有人类的思考能力。百度大脑就是这样的一个组件。

“人脑是最大的神经网络系统,神经元达数千亿,而百度大脑类似人脑,目前已成为拥有两百亿参数的深度神经网络,是业界最大规模神经网络系统。我们每天将获得的各种各样的数据灌入系统中,使系统像人脑一样无时无刻地学习和成长,无时无刻地进化与演进,并最终将发展成非常智能的人工智能系统。”百度深度学习研究院常务副院长余凯在会上介绍了百度大脑的特征。

据悉,百度大脑目前的智商相当于两三岁小孩,能很好地处理语音、图象、文字,而这些技术和能力已经实际应用在了百度许多产品与服务中。

开放云、数据工厂、百度大脑,这些高门槛的技术能力无疑成为百度拿到大数据时代“船票”的核心竞争力。

开放与合作,助推数据流通

如今,企业、公共机构自身都拥有众多数据,他们或多或少地利用这些数据来服务业务,但这就是大数据的真实价值么?笔者认为,这只是大数据的一个初级阶段,即自身大数据的利用;而大数据的价值要得到爆发或升华,应该是跨企业、跨行业数据的相互融合。用技术一点儿的词来说,就是将不同领域的数据进行关联。

责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918