硅谷越来越多的科技企业开始向金融圈进军。zestfinance就是其中之一。 这家公司打出的旗号是“将google算法带入征信领域”,其利用机器学习和大数据技术,创立了一套和传统模式相异的信用评分方式,其中应用的数据变量是传统模式的上百倍。 zestfinance创立于2010年,创始人道格拉斯?梅里尔(douglas merrill)是google的前信息总监兼工程副总裁,另一位来自金融圈的创始人肖恩?布德(shawn budde)曾在第一资本公司(capital one)负责信贷业务。 财新记者专访了zestfinance的创始人梅里尔,他认为,“zestfinance完全可以取代银行现在用的算法。” 然而,美国个人消费信用评估公司(fico)中国区总裁陈建表示,这不可能。在美国有1000多家当地信用局为消费者服务,基本隶属于三大征信公司。这三家征信公司分别拥有覆盖全美的数据库,包含超过1.7亿消费者的信用记录。在三大征信公司收集了海量个人征信数据后,还须经过复杂的模型计算才能形成征信产品。这三家征信公司目前使用的计算方法模型都来自同一家公司,即被称为“幕后大佬”的fico。 越来越多类似zestfinance的初创公司正在觊觎传统华尔街的地盘。而其势头如同多米诺骨牌,不断推向华尔街的要害。 数据变废为宝 在zestfinance的金沙app下载大厅官网上有这样一句话:“所有的数据都是信用数据。”这句话恰恰浓缩了zestfinance所做的工作——将成千上万的数据“变废为宝”,应用于信用评分。 这家公司在短短四年时间内,就先后获得了高达1.2亿美元的融资,其背后的出资人都是著名的it风投,包括flybridge、grp、lightspeed以及matrix等。 目前,美国绝大部分金融机构使用的信用评分都来自fico的模型算法。自上世纪60年代至今,在美国的征信体系中,fico的地位从未被撼动。 在美国,经过三大征信公司的整理和fico的计算评分,海量的征信数据就变成了一份份整齐美观的报告和325-900分值区间的评分,用户可以只买报告,也可以报告 评分打包购买。 中国科学院院士、北京大学教授鄂维南对财新记者表示,fico的评分模型的确首屈一指,但并非十全十美。fico信用评分参考的数据变量只有不到50个,因此很多人摸清了fico关注的变量后,就可以“模型套利”增加自己的信用评分,例如一个人可以每天反复在图书馆借书还书“刷信用”。 “针对fico的不足,zestfinance重新设计了一套信用评估模型。和fico的不到50条参考变量相比,zestfinance参考的数据变量多达上万条,并采用非线性化的、更前沿的技术来进行分析,从而防止‘模型套利’的现象,更精准地评估消费者信用风险。”鄂维南表示。 的确,zestfinance远远超出了fico 50条变量的界限。在这个位于洛杉矶的65人团队中,大多是数据科学家,他们开发了多个机器学习分析模型,而在这个模型中使用的数据变量多达上万条。上万条数据变量仅仅是原始信息数据,在这些数据基础上,模型可以得出超过7万个可以判断信贷行为的指标。而模型跑完这些指标仅需要不到3秒钟。 所谓机器学习,是让计算机模拟或实现人类的学习行为,以获取新的知识技能,在数据积累中不断自我完善,可谓是人工智能的核心。zestfinance的模型之一hilbert就是成功地将机器学习进行商业应用的案例,让机器承接7万个指标的数据分析工作,寻找逻辑关系,并不断自我改善,人类只需要根据结果进行一些逻辑分析和判断。 “多年来,美国金融机构都在用50条数据变量来决定是否给一个客户授信。问题在于,许多人并没有完整的信用记录,这导致在传统信贷中他们不断吃闭门羹,”梅里尔表示,“在zestfinance,我们分析上万条数据变量,借助更加广泛的数据,从而对客户的风险预判更加精确。” 数据的类型亦极其广泛:一个人的网页浏览历史、手机付费记录、超市购物清单都可成为重要的参考依据,甚至在用户填写信贷申请表时是使用大写字母还是小写字母,也可以成为数据变量。 “很多数据都可以服务于信贷,例如申请人在我们的网站上停留的时间,就可以反映他对申请贷款的谨慎程度和还款诚意。”梅里尔说。 鄂维南认为,信贷记录属于强变量,在强变量缺失的情况下,可参考多种弱变量,当这些弱变量组合起来,就可形成强变量,服务于信贷风控。“例如,孩子是一个家庭支出的源泉,那么如果能推测出借款人孩子的年龄,就能预测他的消费周期:婴儿有奶粉等固定开销、学生每到9月就要缴纳学费等。只要能避开他的主要支出,就可控制坏账。” 鄂维南表示,在中国,由于征信业历史较短,缺乏足够的信贷数据,就可以用许多弱变量数据来对一个人进行还款预测。目前,学界有许多人也在进行类似的课题研究。 对于这些“弱变量”的开发利用,陈建亦表示认同,“把数据的价值挖掘出来是不可避免的趋势,大数据发展会越来越日新月异。”但他表示,从互联网数据中挖掘价值,最早做的正是fico。“银行刷卡交易实时获得数据,通过分析进行风险识别,fico十几年前就发明了,现在90%以上发达市场的银行都在用fico这套系统。” 争锋fico 的确,在当前zestfinance和fico尚不能同日而语。fico占领着美国99%的信用评分市场和绝大部分发达国家的信用评分市场,而zestfinance目前仅服务过10万名美国人。 在中国,fico目前拥有80人的团队,已经和15家商业银行、30多家城商行和农商行建立了合作。zestfinance目前在美国以外的其他地区还没有开展业务,但梅里尔告诉财新记者,目前正与多个中国金融机构洽谈合作。 但从未来发展的空间而言,似乎新生事物总能赢得更多青睐。面对zestfinance等新型信用评分公司的诞生,美国主流媒体纷纷给予了报道——《经济学人》杂志写道:“zestfinance比传统评分方法让违约率下降了40%。”cnbc表示:“zestfinance让无账户人群不再被拒之门外。” 这一切声音,似乎都剑指fico。 梅里尔表示,zestfinance采用了和fico截然不同的技术。fico是基于20世纪50年代创造的“逻辑回归”模型,那时并无很多可供参考的数据变量。但随着互联网时代来临,数据开始爆发式增长,fico的评分方式并未改变。梅里尔这位曾经的google人,则将google算法引入了征信领域,走在了技术的前沿。“zestfinance完全可以取代银行现在用的算法。”梅里尔自信道。 对于外界的质疑,fico表示很冤枉。陈建表示,外界对fico其实缺乏了解。fico并非只有一种算法,而是有几百种算法。在美国仅注册的算法专利就多达近200个。在不同的数据场景下,使用的数据变量和数量都不同。 陈建认为,数据变量并非越多越好。 “fico信用评分的候选变量其实有1000多个,只是具体到每个评分中,只使用其中的几十个变量。”陈建表示,认为变量越多模型越好是幼稚的说法。从统计学角度,模型计算一方面要抓住本质规律,一方面要避免过度拟合。 “变量太多会造成过度拟合的问题。就好比做一双鞋子,与你的脚100%拟合,但别人都不能穿。fico不是给一个人做一双鞋,而是要给全社会使用。如果一些变量不是适用于每个人,就不适合放在模型中。”陈建说。 根据惠誉评级公司的研究结果,fico分数的影响力正在下降。现在美国各个银行都有自己的模型,他们会用自己的模型去跑征信原始数据,fico评分只是其中一个参考变量。例如美联银行(wachovia)对fico评分的参考比重已经下降为零。 对此,陈建认为只是个别现象。“就我了解,目前美国银行业99%的资产组合还是基于fico上,拿出1%来试验新的东西是可取的,但这并非主流。” 陈建表示,技术服务于产业,信用评分不是象牙塔里的空想,而是根基深入产业的积累。目前美国99%的银行都使用fico的评分系统,深厚的积累是其他公司难以比拟的。 陈建毫不掩饰他对fico的自信:“fico已经成为发达市场金融管理的肢体部分,不会有人想要卸掉自己原本的胳膊,换上一对高科技的塑料胳膊。” 为无账户人群服务 “金融包容”正在成为一个新兴词汇,它的含义是指让没有银行账户或信用记录不好的人群公平地享受金融服务。 万事达公司ceo ajay banga近日在一份关于金融包容的倡议书中表示,目前全球有25亿成年人没有享受过金融服务,其中大部分是妇女和年轻人,以及一些居住在乡村的人。在美国,目前有4400万人没有银行账户。“因此,金融包容需要在所有国家倡议,绝非仅仅发展中国家。” 梅里尔表示,zestfinance正是要为这些没有银行账户以及信用记录不好的人解决贷款问题。 “我最初的灵感来自我的小姨子。”梅里尔向财新记者追忆道,当时他的小姨子要贷款换一副汽车轮胎,然而银行因她没有足够信用记录而拒绝。“后来是我给她借了钱。如果我不借钱给她,她就只能去申请‘发薪日贷款’了。” 梅里尔提到的“发薪日贷款”是指在发薪日之前两周申请的小额个人贷款,借款人只需提供收入证明或政府救济证明,承诺在自己发薪水后即偿还贷款。如果到期无法还清贷款本金和利息,可以提出延期。然而,这种贷款的费率极高,每100美元收取15美元利息,年化利息高达400%。相比之下,信用卡的年化费率则只有12%-30%。 近年来,特别是在金融危机后,华尔街和美国监管层不断将目光投向“发薪日贷款”,认为这是高风险贷款,但屡禁不止。2014年6月5日,一批借款人向美国监管机构提起上诉,指出监管层将这些借款人列为“有声誉风险”的群体是不公平的。按照诉讼内容,美国超过80家主流银行都被监管层勒令中止和这些借款人的关系。 这些特殊借款人也引起了主流人群的同情。美国群众自发组织了团体,推进针对无账户人群的金融包容。 “zestfinance的使命就是给这些无银行账户或信用记录不好的借款人创造透明公正的信用评分。”梅里尔表示,通过成千上万的数据变量,每个人都可以拥有一份公正的信用评价。 此外,zestfinance还有另一个重要组成部分,即zestcash贷款平台。 zestcash类似一家小贷公司,它的主要业务是给那些没有银行账户或者信用记录不好的人提供小额贷款。zestcash的借款中有90%是为了采购生活必需品,比如修车和医疗保险。 梅里尔表示,zestfinance帮助信用记录不好的人贷款主要通过两种方式:一种是直接从zestcash对其发放贷款;一种是让使用zestfinance评分系统的金融机构,通过zestfinance的评分结果对其发放贷款。“迄今为止,我们已经帮助超过10万名没有银行账户或信用记录不好的美国人获得了贷款。” 值得一提的是,zestfinance并没有因为目标客户是“风险人群”而导致高坏账率。梅里尔表示,目前借助zestfinance获得的贷款比银行的“发薪日贷款”违约率低50%。“也就是说,在zestfinance算法的帮助下,‘发薪日贷款’可以节约一半的成本。” 竞争与风险 金融危机后,银行信贷更加谨慎,而硅谷的it男们则不断尝到金融这块蛋糕的甜头,包括prosper和lending club在内的p2p借贷平台应运而生,类似zestcash的小额信贷公司也风生水起,包括zebit、avantcredit、kreditech、demystdata在内的公司都看准了银行信贷这块短板。这类公司的共同特点是利用大数据做信用分析,并且大多拥有自己的网络信贷平台。 zebit创建的lending stream网络借贷平台,可以在4分钟内获得50-1500美元的半年期个人信用贷款。 avantcredit打出的标语是“从这里申请贷款不会影响你的fico信用分数”。该公司也是自建信用体系,针对不同人的评分,给出的利率也是不同的。 kreditech位于德国汉堡,两位自信的it男利用大数据分析手段评估借款人还钱的概率,他们不要求客户提供信用证明,15分钟内就能提供500欧元以内的小额贷款。和zestcash类似,kreditech希望用户提供尽可能多的信息,连用户的借贷申请是使用ipad发送还是用老式电脑发送、输入时出错的概率、使用取消键的频率等都考虑在内。 上述公司都获得了风投的青睐,例如kreditech2013年9月获得了900万美元a轮投资,avantcredit2013年8月获得2000万美元b轮投资。 陈建认为,此类创新型公司和传统的fico与银行信贷并不冲突,可以成为传统市场的补充。 当然,这类公司也并非可以为所欲为,也要受到美国监管的制约。其中,1975年通过的《平等信用机会法》(equal credit opportunity act)中规定,贷款必须发放给所有资信可靠的申请人,不论种族、宗教信仰、性别、婚姻状况、年龄和其他个人特征。然而,随着互联网大数据的井喷,这些信息都随着网络社交信息一起被纳入了zestfinance等公司的变量测算中。此外,由于所有的征信数据都必须经本人允许采集,因此这种海量采集数据的方式还会面临侵犯消费者隐私的风险。