我们并不热衷于数据的出售,而是更希望用其他的形式,比如实现云与数据的结合,为用户提供云数据服务,从而实现数据变现。
中国联通信息化事业部副总经理范济安
在日前召开的“2016中国通信行业云计算峰会”上,中国联通信息化事业部副总经理范济安透露,按照规划,2016年中国联通大数据平台存储量将达到150PB,分布在4400个数据节点之上。明年则上升到220PB的存储规模,分布在6000个数据节点上。
2012年,中国联通成功将大数据和Hadoop技术引入到“移动通信用户上网记录集中查询与分析支撑系统”。截止到2015年,中国联通已经部署20PB的存储空间,分布在2000个数据节点上,使得系统每天有能力处理千亿条的上网记录。
“不过,中国联通大数据平台的演进并没有真正跟上云计算的步伐。”范济安有些遗憾地表示,“不管是最初的Hadoop技术,还是如今采用的Spark技术,平台底层采用的仍然是基于x86系统的物理机,并没有用到虚拟化技术。”
究其原因,是中国联通经过测试验证发现,针对Hadoop数据处理,物理机和虚拟机的性能差别非常大,达到2-3倍的数据,虚拟机无法承载大量的数据处理任务。“因此,我们采用物理机为主的方式搭建了大数据平台。目前,我们也正在尝试引入新的容器技术,把应用拆成一个一个容器化应用。”范济安表示。
中国联通对大数据的探索源自于2010年中国联通数据大集中策略的提出。2009年,中国联通3G业务正式商用,提出“统一品牌、统一业务、统一包装、统一资费、统一终端政策、统一服务标准”的“六个统一”策略。这意味着中国联通要走一条数据大集中的路线。
然而,数据大集中将使得中国联通面临着不少挑战,分别是大用户量下的集中系统的处理能力,如何快速实现对市场变化需求的响应,支撑业务运营的可靠性,与个性化业务的支持能力以及集中环境下的运维体系。
为此,2010年,中国联通开始着手大集中的数据中心建设。范济安表示,中国联通大数据应用分为两大类,对内和对外。对外应用,即数据变现,联通将行业区分为金融行业、旅游行业、交通行业等进行精准营销,比如针对金融行业开展征信信用评估,针对旅游行业提供位置服务。对内,即服务于上网记录查询与分析。
“我们并不热衷于数据的出售。一方面,我们还没有技术手段来控制数据的二次扩散和使用;另一方面,也不适合数据价值的持久化发展。出于以上原因,我们更希望用其他的形式,比如实现云与数据的结合,为用户提供云数据服务,从而实现数据变现。”范济安表示。
本报记者 逄丹
……
关注读览天下微信,
100万篇深度好文,
等你来看……