大数据征信的“是与非”-大数据-技术-爱吧机器人网

洪偌馨

传统信用评估模型是根据一个人的借贷历史和还款表现，通过逻辑回归的方式来判断这个人的信用情况。而大数据征信的数据源则十分广泛，包括电子商务、社交网络和搜索行为等都产生了大量的数据。

大数据征信可以通过我们在互联网上留下的这些“足迹”清晰地描绘出一个人，但如何把控数据源的“量”与“度”，各家机构还在不断尝试。更重要的是，最终绘制出的人物“肖像”与个人信用究竟有多大的关联度，至今仍存有争议。

此前亦有接近监管部门人士对《第一财经日报》记者表示，个人征信牌照迟迟未能落地，其原因之一也在于监管部门对于大数据征信的商业化应用存有疑虑。尤其，以人脸识别为代表的关键技术的可靠性还有待进一步检验。

此外，“另一个更重要的症结在于行政化监管与商业化发展之间的矛盾。”该人士表示，现在个人征信市场的参与者越来越多，远不止申请牌照的八家机构，如果该市场要商业化发展，那么监管方式就要改进。

何为大数据征信

在FICO中国区总裁陈建看来，征信的本质就是采集和记录信用信息并在整理加工后提供给决策者，而如今，得益于大数据、云计算、人脸识别、深度算法等技术的进步，征信有了更广泛的意义和用途。

“只要对消费者的特征描绘和风险判断有显著作用的就可以叫征信。”陈建认为，现在一切信息皆可以成为信用数据，经过分析后用于证明一个人或企业的信用状况。因为数据覆盖广、维度多，因此形成了广义的征信，也就是大数据征信。

陈建表示，有价值的大数据具备几个因素：第一要覆盖面广，用户足够多，例如银联、电信的数据；第二维度要有效，能够有效转为结构化的数据，例如电商的数据；第三信息要稳定。

不过，对于这种日益崛起的征信新业态，今年7月在上海外滩举办的“2015上海新金融年会”上，央行征信中心副主任王晓蕾直截了当地提出了疑问，“我不知道你们说的‘征信’是什么”？

央行的征信系统是一个“放贷人之间的信息共享数据库”，主要采集的数据为身份信息、信贷信息、非金融负债信息三类，以及部分公共信息。因此，王晓蕾对于征信的基本定义为，“从放贷人那里采集借款人信息”。

而另一个“纠结”的概念在于，王晓蕾认为，放贷机构之“征信”是放贷机构基于内部信息的风险管理过程，而征信行业之“征信”是为放贷机构的风险管理提供外部信息支持的活动，征信机构应该是一个纯粹的独立第三方。

如果按照这个界定，我们现在所谈到的大数据征信跳脱了传统“征信”范畴内。不再局限于金融属性的信息，并且也打破了“采集者与信息产生没有任何关系”的独立第三方原则。

例如芝麻信用、前海征信、腾讯征信，一方面它们的数据来源目前还主要来自母公司阿里、平安、腾讯，而另一方面，它们的兄弟公司又涉足放贷业务，例如阿里小贷。

尽管有关大数据征信的定义和效用仍争议不断，但对于既无法接入央行征信系统又面临快速发展的互联网金融行业而言，利用大数据来帮助判定风险、开拓业务已是必然的选择。

从应用范围来看，目前大数据征信已从金融业务向生活服务蔓延。其中，最核心的两个价值就是：防范欺诈风险和信用风险。简单来说就是：既要证明“你是你”，还要描述出“你是什么样的人”。

如何证明“你是你”

无论是在传统金融领域，还是互联网金融领域，给客户做信用评估的前提是必须知道这个人就是他自己。所以，如何利用证明“你是你”是大数据征信首先要解决的问题。

尤其，随着越来越多的金融业务互联网化，“反欺诈”面临的挑战也日益增大。“身份认证”的重要性在各项监管文件中反复被强调，而各家机构也在不断探索如何利用新的技术在网上实现身份的核实。

其中，在指纹、虹膜、人脸识别等一系列生物识别技术中，人脸识别因技术的成熟度和准确率较高，以及其使用的便捷性而被进一步普及。包括腾讯征信、芝麻征信在内的多家个人征信机构都有组建自己的人脸识别技术团队。

此前，在腾讯征信的北京媒体沟通会上，为腾讯财付通、微众银行、腾讯征信等提供图像和模式识别技术支持的优图团队也向大家展示了“ 人脸识别 ”在“反欺诈”方面的应用，即如何证明“你是你”。

根据现场的演示，在上传身份证照片、自拍照片并与公安部的信息进行比对之后，“ 人脸识别 ”的另一关键步骤是活体检测，通过读取随机的数字串，分析声音和唇语等信息来防范有人用视频、照片等方式仿冒用户。

据了解，在今年国际权威的人脸识别数据库LFW上，腾讯优图团队在人脸验证测试中达到了99.65%的准确率。目前，微信的“ 人脸识别 ”技术已经在腾讯征信、微众银行、微证券开户等场景中开始试用。

尽管人脸识别的准确率已经达到较高水平，但该项技术的商业化应用才刚刚起步，它的有效性和安全性仍备受质疑。

优图团队研发总监黄飞跃也表示，该技术现在还不能说100%地成熟，而是适用于某些特定的应用环境中。其中，金融领域的身份核实条件较好，由于用户往往是为了通过验证所以比较配合。

芝麻信用首席科学家俞吴杰表示，整个的反欺诈产品从身份认证到信息验证再到网络关联，每一步的技术含量非常高。以身份认证为例，现在已有很多的途径，比如信息交叉比对、人脸识别技术、KBA问答认证等。

大数据征信的“是与非”