积木盒子:大数据成败取决于商业逻辑
- 来源:IT经理世界 smarty:if $article.tag?>
- 关键字:积木盒子,大数据 smarty:/if?>
- 发布时间:2015-09-24 08:02
“企业要发挥数据价值,不在于有多大的数据量,而在于能否围绕企业的商业逻辑建立自己的数据仓库。”
2015 年是中国经济结构彻底转型的一年,未来几年,经济将从过去主要依靠国有企业、大企业的模式向更倾向于小微企业、万众创新的方向转化,这将带动创业资本分散化
“数据如何使用是百家争鸣的,但一定与各企业自身运营的商业逻辑紧密相关。”积木盒子金融大数据研究中心首席科学家张良贵说,“有些企业有数据但做不起来,是因为自身商业逻辑不够。”
好逻辑才能用好大数据
观察积木盒子的成长演变,大数据在企业不同发展阶段有着不同的应用。积木盒子的前身 “企乐汇”是做中小企业场外尽调的。那时,它们自己研发了一套软件“76汇”系统,做尽调数据的线上化和展现。之后,积木盒子上线零售纯信用信贷产品,大数据团队先是创建了10多个P2P平台运营健康度监测指标;然后做投资人偏好分析,服务于运营团队的定向营销和精准服务。
现在,积木盒子拿到了征信牌照,征信是所有信贷产品的基础。大数据团队正在实现丰富维度的企业画像和个人画像,进行授信评判和风控界定。目前,积木盒子的个人画像和企业画像的维度各达到六七百个。
张良贵认为,企业要发挥数据价值,不在于有多大的数据量,而在于能否围绕企业的商业逻辑建立自己的数据仓库。数据仓库的建立有三要素:场景、工具和数据源。其中,场景一定是企业商业模式的核心,它决定企业使用数据的维度、逻辑和建模思维。
以积木盒子为例,它的商业核心是风险控制,因此会收集与风控相关的所有维度的数据。工具涵盖数据清洗、调度和可视化。企业要根据商业逻辑确定什么样的工具是适用的。积木盒子的数据清洗和调度选择了开源工具,没有使用现成工具包,原因是风控,特别是个人风控数据维度多、复杂度高,还处于摸索阶段。但积木盒子的可视化工具选择了国内厂商永洪的商业产品,因为产品符合报表所见即所得、数据拖取过来就能展现、实时更新等需求。在场景与工具都确定后,企业就能有目标地在一定范围、一定时间点上去获取数据。这就保障了整个数据仓库的建立是需求驱动的,而不是泛泛地做大数据。
从长远战略看,积木盒子不仅把投资人和融资人撮合到一起,它要建立财富管理的体验生态圈。张良贵举例说,马云在购物体验上逐渐形成了封闭的生态圈,而中国30年改革开放积累的财富已经提出面向个体、垂直体验的财富管理生态圈。生态圈根据人的不同自然生命阶段,如求学、结婚、育子、养老等为人们提供更好的财富管理体验,它将是互联网金融中高级别的体验,需要支付、信用识别手段支撑。
现在,支付手段已打下良好基础,焦点将是征信的实现。积木盒子正在做大数据征信。
线下线上数据怎么融合
大数据征信和传统银行征信不同。传统银行通常面对资质优良的客户,以背书方式,而不是数据方式驱动。相比之下,积木盒子的征信对象更多元化,有小微企业和各种人群。这些人群需要多维度、多空间数据,进行多维校验。它的特点是弱相关,与银行的强相关不同。
不过,线上大数据征信所开展的数据分析与挖掘是与线下业务方法匹配的,不是凭空想象的。张良贵团队正通过线下风控模式驯化线上风控模型。积木盒子有30多家线下门店,主要分布于东南沿海和融资活跃的大西南市场,这部分客户群大都不上网,没有网购和论坛行为。线下门店通过纸面获取数据进行贷款审批。目前审批过了几万笔贷款,但这些贷款案例仅占门店总审批量的5%。积木盒子正对线下全部数据进行整理、汇集,把这些非结构化数据转化成结构化、数字化数据。由于这些数据是人工审核的,质量比较高,它们用来驯化线上的自动化模型。
与此同时,积木盒子的线上自动化审批产品,如“读秒”也已上线几个月。用户在线填写10多个问题,积木盒子再结合用户银行消费记录、网购记录、通话记录和与第三方芝麻信用分的合作,在5到10分钟之内就可判断是否放贷。目前,线上放贷额度低于线下,为5000元到1万元,线下额度则在三五十万元。
张良贵说,他们并不急于把线上风控技术推出来,因为他们正在积累不同类型客户群的违约数据,刻画风险特征。现在,这部分数据趋于零,还需要校验。
虽然目前线上线下审批是并行的,但都进入积木盒子信贷决策仓库中,到一定阶段将会融合。融合之后,大数据的威力就彰显出来了。例如,在现实生活中,很多中小企业背后是同一控制人。通常一个隐形控制人控制着三五家企业。以前,线下尽调人员会调查A、B、C三家企业的基本信息。而在线上平台中,通过对企业名称、法人、高管信息、工商注册数据、关联关系等多维度的比对,后台能分析出A企业和B企业同时被张三控制。如果这两家企业不存在关联关系,理论上A企业可以授信500万元;一旦判断出这个关联关系,A企业和B企业总体授信额度不会超过500万元。
就征信而言,传统征信模式的特点是线下材料、拿来主义、垂直罗列,数据维度简单,也不做二次处理和挖掘。现在,积木盒子的大数据分析将进行二次挖掘和延伸,包括大量弱相关分析。
互联网不是玩法创新
现在,“互联网+”风潮很热,但张良贵强调,互联网金融不是玩法创新,而是利用大数据等技术手段,提高效率,降低犯错误的成本。
张良贵看到,目前大家谈论大数据更多的是在数据资源的占领上,但他认为,未来,数据资源一定是开放、共享的。最近国务院通过了《关于促进大数据发展的行动纲要》,国家层面将出面建成数据高速公路,而之后体现真功夫的,一定是在数据运用创新上,利用市场机制把数据变活,服务于国民经济,这是大数据万亿元市场的真正体现。
“我们现在只做了一小步而已。一旦第三方数据源变得完善,我们的技术就可以放量,按照场景去变现。”张良贵说。不久之后,积木盒子的基金、保险等产品会陆续上线,这些单一产品线与个人生命周期数据在时机成熟时会聚集、组装、咬合,形成全新体验。
张良贵预计,5年后的市场状况将发生质的改变。目前,第三方资金机构、征信机构、医疗机构正在不同领域对人进行“刻画”。5年后,这些刻画和积累将达到一定成熟度。他认为,更为关键的是,2015年是中国经济结构彻底转型的一年,未来几年,经济将从过去主要依靠国有企业、大企业的模式向更倾向于小微企业、万众创新的方向转化,这将带动创业资本分散化。那时,资金将真正串联人们生命周期的财富周期。
“这个混沌期中将出现好机会,那一定是数据驱动的。”他说。
文/赵艳秋
