ZestFinance颠覆传统信用评估体系

  • 来源:证券市场周刊
  • 关键字:ZestFinance,信用评估体系,互联网金融
  • 发布时间:2014-02-15 08:32

  通过对海量数据的分析和处理,ZestFinance对传统信用评估体系有了颠覆性的改变,其大数据模型导致贷款批准更有效率,同时风险控制则进一步改善。

  互联网金融已经成为最热的概念之一,我要分享的案例是美国最近的一个互联网金融公司:ZestFinance,如果翻译过来的话应该叫泽斯塔金融公司,它是一个关于颠覆式的信用评估体系的故事。

  在此之前,我想用一个当时并不是很得志的棒球评论员的一段话来作为开局,比尔·詹姆斯是一个痴迷于棒球,而且非常痴迷于棒球的各种数据的分析员,他编纂并自费出版了一本书,《1985年棒球摘要》。在这本书中,他说数字并不应该仅仅是数字,数字其实可以像小说、戏剧和诗歌一样,数字在人类历史中诉说的并不只是干巴巴的数字本身,背后讲述的是性格、心理、历史、力量、优雅、荣耀、牺牲、勇气、沮丧、连贯一致、运气不济、雄心壮志与成功失败。

  我们平均每个人每天大约要做3000个左右的决策,当然绝大部分都是非常小的决策,只有个别的是比较重大的决策。在很多的决策过程中,我们的决策质量是直接受到经验和直觉的限制,从而越多的经验和直觉往往有可能会导致最差的决策。这也就是思维的局限性和思维的盲点。

  关于思维的盲点,美国的畅销书作家迈克尔·刘易斯根据当时奥克兰的一支棒球队的一个真实故事写了一本书《Money ball》(《点球成金》),讲述财力有限的小棒球队如何颠覆实力雄厚的大棒球队。刘易斯对比了两种决策的思路,一是根据经验判断,二是根据数字。这本书后来被改编成同名电影,其中非常有意思的一幕就是关于依靠直觉与经验来进行决策会导致什么样的后果。在这一幕中,几个富有经验的球探和球队经理在讨论一个球员人选。

  一个球探说,“他不错,有天赋……而且长得也不错。”

  一个满头白发,戴着助听器的老人虚弱地附和道,“他击打动作不错,球一被碰到就一下子弹出去老远。”

  另一个球探也附和说,“击打声很大。”

  有一个球探打断了对话,说,“他女朋友真丑。”

  会议的负责人说,“那是什么意思?”

  那个人似乎很肯定地说,“女朋友丑说明没自信啊!”

  开了一会玩笑之后,一个一直没说话的球探说,“这个人有很大的气场。我的意思是,他还没上传呢,对手就已经提前感受到了他的气势。”

  从这一幕中可以发现,即使是一群非常有经验、有直觉的资深职业球探,当他们进行决策的时候,事实上也面临非常多的所谓的思维的局限性和路径依赖。决策的质量遇到这种路径依赖和思维局限性所干扰的时候,会受到很大的影响。

  ZestFinance的故事虽然与棒球无关,但同样与数字密切相关。ZestFinance本质上也是一个关于数字的故事,它针对的痛点是发薪日贷款,由此而建立了完全有别于传统信用评估体系的信用模型。

  发薪日贷款

  有64%的美国人的现金账户里只有不到1000美元的现金,即救急现金不足1000美元,有超过3000万的美国人每年要依赖个人过桥贷款,也就是说,3000万美国人等不到下一次发工资就必须有一个救急贷款。让我们再来看另一组数据,在美国每10万人平均有3家星巴克、4.3家麦当劳,而与之相对应每10万人平均有超过10家的所谓发薪日贷款机构。从数字就能看出,发薪日贷款实际上是一个非常大的行业,也是一个痛点非常多的行业。

  发薪日贷款针对特定的人群,这是一个低收入人群,其中年收入低于2万美元的占到大约一半,而且其中大多数人没有任何的信用记录,甚至有一部分人是连名字、身份都不存在的,也没有任何的信用分数,这批人根本和常规的贷款机构没有任何的关联。

  与之对应的,针对这类人群的高风险贷款的利率就会特别的高,在不同的州,年化利率高达400%、500%以上。也就是说,如果将这种小额的、短期的贷款转化成年化利率来看的话,其实质就是高利贷。这直接导致了很多依赖发薪日贷款这种途径的贷款人背上了沉重的枷锁,一旦他选择了发薪日贷款,他可能会陷得越来越深。前几年英国有一个案例,有个小伙子当时通过这种发薪日贷款借了150英镑,由于极高的年度利率,最终这150英镑变成了1万英镑,这个人可能永远也还不起这个钱了。

  ZestFinance就是针对这个行业的这种具体的痛点,实际上走的是一条颠覆传统信用评估体系的道路。ZestFinance的创始人Douglas Merrill,是一个很典型的嬉皮士,非常年轻,满身都是纹身。在创办ZestFinance之前,他曾担任谷歌的CIO(总信息师),在大数据的挖掘和应用方面积累了非常多的经验。同时,这个人虽然是名嬉皮士,但他有非常强的社会责任感。ZestFinance的创办,一方面是试图去建立一个新的信用评估体系;另一方面也是试图对这种收入的整体的分配不公或者说传统的贷款渠道的不公发起冲击。

  大数据基础上的信用评估

  ZestFinance的一个基本模型是通过大数据的挖掘和机器的智能学习,具体来说,一方面是利用海量的数据挖掘和处理;另一方面大量地、深度地挖掘社交媒体,同时极大地拓展贷款人的变量。

  美国的信用系统里,传统的信用分数所包含的贷款人的变量一般只有几十项,而ZestFinance的模型里包含的变量将近1万项,在7000-8000项以上。它搜寻极多、极边缘的变量,试图从中挖掘出一些有用的信息。

  非常有意思的是,在发薪日贷款行业,实际上有很多贷款人从官方定义上来说是不存在的。所以通过常规的信用分数,这批人是根本不会进入模型的。而通过社交媒体的挖掘,这批人能够进入ZestFinance的模型,而ZestFinance能够对这批人进行一个深度的挖掘。最后它通过机器智能学习,能够极大地缩短模型的反馈和改进的时间,这是它的一些根本特点。

  这个模型具体分为大概四到五步。第一步是去挖掘数以千计的不同的变量;第二步会寻找这些变量之间的一些关联性。接着,在关联性的基础上将这些变量重新绑定成一些比较大的变量,然后将这些大的变量放入不同的分立的数据模型来进行处理。每一个分立的数据模型给出一个分立的结论,再把这些分立的结论绑定,最终整合成一个自有的信用分数。所以这个信用分数是基于大量的海量数据、大量的社交网络的数据、大量的非结构化数据的一个处理。一方面它依赖结构化的数据,但是另一方面它导入了大量的非结构化的数据。

  常规的信用评估体系实际上是一个简单的线性回归,通过对一个贷款人的一些最重要的十几个方面或者几十个参数进行一个线性回归,就得出了一个常规的信用分数。而ZestFinance是通过对数以千计的变量及其关联性进行整理,在大数据挖掘的基础上最终形成一个独立的信用分数。

  ZestFinance的非结构化数据包括申请人的IP地址,因为IP地址可以映射出申请人来自哪个区域。申请人的家庭地址和工作地址都是ZestFinance对非结构化数据进行处理的一部分。非结构化数据还包括申请人的电子邮件所使用的用户名,因为电子邮件的用户名可以映射出这个申请人的一些行为或者反映出这个申请人的一些社会特征。更极端的,ZestFinance甚至在申请人填写申请表的时候跟踪填表的大小写习惯。申请人是否大量地使用大写,或者申请人是否能够正确地分清大小写都能够映射申请人的一些行为和心理特征。所以ZestFinance的模型都会考虑这些最细微的一些变量。

  从整个信用评估体系的发展历程来看,ZestFinance是对现有信用评估体系的颠覆。它在很多方面和谷歌、亚马逊,甚至奈飞(Netflix)公司在数据挖掘和机器智能学习方面所采用的方式是相通的。

  当ZestFinance对传统的信用评估体系有了一个颠覆性的改变之后,就带来了一个新的价值空间:这个模型对批准贷款更加有效率,事实上这个模型和常规的信用评估体系的模型相比,效率能够提高将近90%。同时,在风险控制方面也有极大的改进,ZestFinance的模型能够把相关贷款人的违约率降低将近50%。

  而ZestFinance的下一步行动是希望把其在这种发款日的贷款上的优势继续拓展到其他贷款领域,包括信用卡、汽车的贷款,甚至包括房屋的贷款。他们认为,如果采用他们的模型在房屋贷款上能够有120亿美元的空间,在其他几个领域也会有几十亿美元的空间。

  最后回到大数据的一个理论基础,牛津大学的维克托·迈尔-舍恩伯格教授在《大数据时代》一书中对大数据提出了三个观点,也就是关于大数据的三个总的趋势。第一,随着计算能力的增强,大数据的处理应该是总体大于样本,传统的抽样统计正在被总体数据分析所取代。也就是说,小数据时代的随机采样正在被全数据模式替代。第二,数据分析的精确性需求在下降,而数据的混杂性需求在不断上升,大数据的简单算法优于小数据的复杂算法。第三,大数据时代对关联度的追求大于对传统意义上的因果关系的追求。在大数据时代,我们让数据自己发出声音。这三个大数据趋势构成了包括ZestFinance在内的很多数据挖掘模型的基础,是关于数据挖掘方面需要遵循的三大原则。

  我们现在所处的年代还只是在一个大数据分析与应用的起始点,当前很多关注点还是在内部数据,还没有拓展到外部。未来我们的决策越来越多将会由数据来驱动,而不是由个人的直觉和经验来驱动。

  作者为中欧国际工商学院创业学教授

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: