大数据征信时代来临

  • 来源:时代金融
  • 关键字:大数据,征信时代,互联网技术
  • 发布时间:2015-09-14 09:44

  近年来,随着互联网技术的发展,大数据越来越受到关注,其应用逐步渗透至多个行业,开启了全新的数据时代。数据是征信业务开展的基础资料,征信活动主要是围绕数据进行采集、整理、保存、加工,并最终向信息使用者提供。大数据不仅为征信业发展提供了极为丰富的数据信息资源,也改变了征信产品设计和生产理念,成为了未来征信业发展最重要的基石。如今,即将发放的个人征信牌照,加速了这个趋势的到来。互联网公司背景的征信机构更是将大数据征信作为抓手,希望利用电商、社交、金融交易等广泛的数据来源,开启“大数据征信”的崭新时代。

  弥补传统征信数据不足的缺陷

  从1992年到2006年,在央行的主导下,中国逐渐建立起全国统一的企业和个人征信系统。它基本覆盖所有征信机构、覆盖了每一个有信用活动的企业和个人。目前,征信系统已经成为我国重要的金融基础设施。但是,央行个人征信中心在数据的覆盖面上也有不足之处。目前个人征信中心的数据,主要是放贷数据,对于那些没有贷款记录的人,征信中心并没有数据。有媒体采访银行负责信贷业务的相关人员,他们深知银行支持小微的难处。由于没有可用的数据和技术,首次放贷只能采取线下尽职调查的方法,但是这种方法成本太高,不具有商业可持续性。即便如此,也没有办法确定客户还款的概率。

  大数据征信弥补了央行个人征信中心在数据覆盖面上不足的问题,从这个角度上说,很多互联网征信机构也可以被定位为央行征信中心的有益补充,同时也优化了征信市场的格局。随着征信机构市场化运营机制的确立,将会有更多信息资源优势的企业借助互联网、大数据等信息技术的创新进步,从征信业薄弱环节切入,通过服务创新或产品创新打破原有的征信市场格局。一是电商企业将组建征信机构。以阿里巴巴为例,其利用淘宝、天猫、支付宝平台上的行为数据和信用情况,建立成了涵盖数十万企业的数据库,具备了开展网络征信服务的基础和实力。二是金融机构建立征信机构。例如平安集团拟整合网贷信息、银行信贷信息、车辆违章信息等,建立金融数据挖掘中介机构。三是新型征信机构应运而生。一些大数据公司依靠技术手段,以电子商务、社交网络为平台,采集信息,提供信用信息服务,可能成为新型的征信机构。

  大数据征信也拓展了征信数据来源。大数据使征信数据来源呈现多元化、多层化和非结构化的特点,更加全面和真实地反映信息主体的信用情况。征信机构从在政府部门、金融机构等实体机构中采集信息,转向从互联网等虚拟世界中获取信息。在数据采集的广度和深度上,征信数据量将激增,采集包括证券数据、保险数据、商业信用数据、消费交易数据和公共事业缴费数据等,全面地覆盖与信息主体相关的各项因素。

  另外,征信机构通过采用不同的数据来源,不同的数据处理方式,针对不同的客户,开发出不同的产品,满足不同层次客户的市场需求,最终有利于实现征信业的差异化竞争。例如,金融机构对征信服务的需求将从单个借款主体的信用报告,扩展到运用信用信息拓展网络影响和金融服务渠道。P2P网络借贷、电商金融等业态需要借助信用信息共享防范风险,降低交易成本。

  技术是大数据征信的核心

  在互联网时代,数据即是信用,信用即是财富。大数据征信将会把个人的全部社会行为映射到一纸信用报告上,而此信用报告又将影响到信用主体的生活。可以设想,一个人可以凭借信用报告上漂亮的分数而顺利地求职、找对象、贷款买房、出国旅游,也有可能因为信用报告上一个小小的污点而求职无门、贷款被拒、处处碰壁。信用报告将会成为每个社会人的一张“信用身份证”。人们不禁会问,互联网公司出具的信用报告真的“可信”吗?“数据越多,‘噪音’越多,就越容易失真,这是很大的挑战”,一位征信专家如是说。从世界经验看,个人有效征信数据90%产生在信贷领域,90%使用也是在信贷领域。对社交数据的信贷应用目前在全球范围内都是很前沿的探索,如何对海量的个人信息去伪存真,真实判断一个人的信用程度,这对互联网公司掌握的数据挖掘和分析技术是一个很大的挑战。

  因此,虽然各界对于中国个人征信领域的广阔前景抱有高度的共识,各家机构也跃跃欲试,但面对海量的数据,技术能力才是各家机构决胜的关键。各家在人才、技术和资本上的比拼已经展开。

  据资料显示,芝麻信用130多人的团队中,数据和技术团队占比超过三分之二。目前,其团队主要由数据科学家、国外征信公司华人精英和本土培养的数据技术和风险管理人才等三部分构成。

  芝麻信用管理有限公司总经理胡滔认为,芝麻信用最为核心的能力在于三点:一是具有充分的数据源;二是在数据源完善的情况下的建模能力,即在海量的数据中利用算法找到核心变量、揭示规律的本领。前两点可以归纳为大数据的能力;三是云计算的能力。因为云计算一方面提供了更为强大、灵活、可拓展的计算能力。另一方面,又使得芝麻信用能够在云端更便利地与合作机构交互。

  未来,各家征信机构的数据来源都将更加丰富。特别是一些线下采集的、来自政府等机构的数据将陆续接入。以芝麻信用为例,目前,其除了有阿里系数据、个人身份特征数据、合作伙伴数据之外,还在支付宝9.0版本中,新增了用户上传信用资料的功能。根据芝麻信用的说法,目前选择向芝麻信用上传身份证、财产证明等的用户已经超过了200万。

  而由拉卡拉发起设立的考拉征信则希望通过采用引入股东的方式,获取股东所留存的数据,并成为征信领域中类似“银联”这样的机构。有平安背景的前海征信在数据来源上,则有来自平安系内部、合作伙伴、用户上传和外部网络公开获取的数据。

  数据之上还要有算法。面对如此庞大的数据,如果没有算法,数据就可能是废料。对于征信机构来说,传统和主流的算法是逻辑回归,而前沿的方法则包括决策树、随机森林、神经网络等。运行算法要有强大的数据处理和计算能力作为保证。很多的数据交叉比对,就是靠机器和数据跑出来的。比如,要考察一个有家庭是否有责任感、又同时经常爱心捐助人的信用水平,就要靠这两个因子进行组合验证运算,而更多的情况下,变量不止两两组合,这就要求更复杂的运算。

  但征信的过程还不止于此。对于众多的大数据征信机构来说,在此基础上,其还要经历一个与各个合作伙伴一起的数据共创,只有这样,才能更好地运用数据,并从数据中获得知识、寻找行业规律。

  有业界人士将大数据的来源比喻成矿石,挖掘数据就像从矿石中提炼金属元素(比如金或者铜),在这个过程中需要云计算所提供的大数据分析能力,但在这个过程结束之后,得到的东西仍然还不是最终产品。如果想要用数据指导实践的话,还需要靠各个公司的业务模型将其落地,就好比将矿山中提炼出的金属最终变成合金,最后的一步还是要看各个机构的看家本领。广发银行信用卡中心决策管理总经理龙雨表示,银行内部都会有一套比较严谨的评级机制,外部的征信可能变成银行内部评分的变量或者决策的节点,银行不会单纯因为一个人外部评分高就作出信贷决策,但外部的评级会增加银行考察客户的维度,为信贷决策提供重要的参考。

  隐私泄漏的风险

  民营机构涉水个人征信是否会出现隐私泄漏,成为当前最为引人关注的焦点。目前,我国尚无专门的个人隐私权保护法,对于哪些数据涉及个人隐私权需要保护,缺乏明确的法律规定。《征信业管理条例》仅规定了征信机构不得采集个人收入、存款、有价证券、不动产信息等。但在大数据时代,互联网征信公司采集的支付宝转账记录、余额宝金额、理财通个人资产等信息是否属于个人隐私及如何保护,尚无定论。通过这些信息,互联网征信机构完全可以生成对个人收入、存款情况的大致评估,这些“衍生”信息又该如何保护,也仍处于无法可依的状态。保护信息安全,防范个人隐私泄漏,将成为民营征信机构涉足互联网征信领域必须面对和亟待解决的问题。

  央行征信中心副主任王晓蕾在2015年上海新金融峰会上表示,从整个中国来讲,一方面,从信息来源、数据加工处理方式还是对外服务范围来讲,征信突破了最传统、最狭义的征信范畴。另一方面,个人数据保护的问题也非常迫切。在可见的未来,数据将是每一个个人和机构最有价值的资产。然而,对于这个资产的归属和定性却仍然存在着模糊的地方。甚至包括在多大程度上能够使用这个数据,仍然存在着模糊地带。

  近期阿里云发布的《数据保护倡议书》提供了一个看待问题的视角,《倡议书》写道,任何运行在云计算平台上的开发者、公司、政府、社会机构的数据,所有权绝对属于客户,客户可以自由安全地使用、分享、交换、转移、删除这些数据。也就是说,数据的最终所有权是属于用户的。

  央行征信中心副主任王晓蕾建议,应当把个人和其所产生的数据分割开来。当个人所产生的数据不和他本人“挂钩”的时候,这个数据就成为了整个社会的资源和财富。但是,如果要把个人产生的数据跟本人“挂钩”的时候,则一定要尊重他本人的意愿,这就是所谓“同意原则”。

  中国银行资深研究员王永利撰文指出,巨量的信息中也有“废料”,无论个人还是机构信息,涉及的地域、领域越广,“废料”也就可能越多。倘若每家民间征信机构各自为营地处理信息,很可能出现最终产品不符合经济、社会总体发展的情况。因而,成立并完备国家级征信信息中心这一机构的重要性再次凸显。王永利建议国家从统筹整个社会信息的角度出发,尽快建立起统一的公民身份信息采集标准,避免各机构数据在后期加工时遭遇技术瓶颈。并且,应该在此前提下构建出公民身份的认证和信用体系。

  芝麻信用总经理胡滔则希望监管能在保护用户隐私和提高数据使用效率上做出调合。一方面要避免大数据的泛滥所导致的对个人隐私的破坏,另一方面也不能过度强调保护隐私而让数据成为“孤岛”。

  加强立法和适度监管

  目前,我国的征信市场发展还很不完善,与国外发达国家相比还有很大的差距。民营征信机构的加入,将给我国征信市场注入巨大的生机和活力。但是,也必须清醒地看到,民营机构做征信,我们没有成熟的经验可循,必须在探索中前进。尤其是在当前个人信息保护和相关监管机制尚不明确的情况下,民营征信机构在发展的过程中必然会面临诸如个人隐私保护、信息安全管理、同业竞争、末位淘汰等诸多问题。

  我国有关征信业的法律法规的规制对象主要是传统金融领域,《征信业管理条例》及其配套制度初步构建了我国征信业的法律法规框架,但是《征信业管理条例》是否满足大数据时代征信业务的规则要求,尚未得到市场验证。目前,缺少对大数据时代征信活动的规范,如有关大数据采集、整理、保存、加工和处理的制度要求。因此,还需要进一步细化和完善征信业务规则,以更好促进大数据时代征信市场的发展。

  另外在个人征信发展最成熟的美国,关于个人征信行业的法律有17部,而我国目前仅有两部相关条例,没有关于个人隐私保护的专门法律。因此,国家应加快《征信业管理条例》相关配套制度的建设,加快个人隐私保护立法进程。

  征信业监管技术和水平需改进。大数据时代给征信业发展带来深刻影响,同时也对征信业监管提出了更高的要求:适度监管、不过分干预、不阻碍。互联网时代对征信业监管的一个重要原则应当是在保护消费者权益和隐私的前提下,为征信机构采集更多有价值的信息创造有利的发展环境,实现商业与个人利益的平衡。要适应大数据时代的征信监管需求,征信监管水平要能跟上大数据征信的发展水平,监管政策要符合大数据的基本规律,监管人员要具有适应大数据的知识和能力。在行业自律监管方面,我国行业监管尚未发育成熟,行业标准尚未统一,行业规范以及行业职业道德等内容亟需完善。

关注读览天下微信, 100万篇深度好文, 等你来看……