爱吧机器人网 » 技术 > 大数据 > 正文

大数据征信的“是与非”

 

洪偌馨

传统信用评估模型是根据一个人的借贷历史和还款表现,通过逻辑回归的方式来判断这个人的信用情况。而 大数据 征信的数据源则十分广泛,包括电子商务、社交网络和搜索行为等都产生了大量的数据。

大数据 征信可以通过我们在 互联网 上留下的这些“足迹”清晰地描绘出一个人,但如何把控数据源的“量”与“度”,各家机构还在不断尝试。更重要的是,最终绘制出的人物“肖像”与个人信用究竟有多大的关联度,至今仍存有争议。

此前亦有接近监管部门人士对《第一财经日报》记者表示,个人征信牌照迟迟未能落地,其原因之一也在于监管部门对于 大数据 征信的商业化应用存有疑虑。尤其,以 人脸识别 为代表的关键技术的可靠性还有待进一步检验。

此外,“另一个更重要的症结在于行政化监管与商业化发展之间的矛盾。”该人士表示,现在个人征信市场的参与者越来越多,远不止申请牌照的八家机构,如果该市场要商业化发展,那么监管方式就要改进。

何为 大数据 征信

在FICO中国区总裁陈建看来,征信的本质就是采集和记录信用信息并在整理加工后提供给决策者,而如今,得益于 大数据 、 云计算 、 人脸识别 、深度 算法 等技术的进步,征信有了更广泛的意义和用途。

“只要对消费者的特征描绘和风险判断有显著作用的就可以叫征信。”陈建认为,现在一切信息皆可以成为信用数据,经过分析后用于证明一个人或企业的信用状况。因为数据覆盖广、维度多,因此形成了广义的征信,也就是 大数据 征信。

陈建表示,有价值的 大数据 具备几个因素:第一要覆盖面广,用户足够多,例如银联、电信的数据;第二维度要有效,能够有效转为结构化的数据,例如电商的数据;第三信息要稳定。

不过,对于这种日益崛起的征信新业态,今年7月在上海外滩举办的“2015上海新金融年会”上,央行征信中心副主任王晓蕾直截了当地提出了疑问,“我不知道你们说的‘征信’是什么”?

央行的征信系统是一个“放贷人之间的信息共享数据库”,主要采集的数据为身份信息、信贷信息、非金融负债信息三类,以及部分公共信息。因此,王晓蕾对于征信的基本定义为,“从放贷人那里采集借款人信息”。

而另一个“纠结”的概念在于,王晓蕾认为,放贷机构之“征信”是放贷机构基于内部信息的风险管理过程,而征信行业之“征信”是为放贷机构的风险管理提供外部信息支持的活动,征信机构应该是一个纯粹的独立第三方。

如果按照这个界定,我们现在所谈到的 大数据 征信跳脱了传统“征信”范畴内。不再局限于金融属性的信息,并且也打破了“采集者与信息产生没有任何关系”的独立第三方原则。

例如芝麻信用、前海征信、腾讯征信,一方面它们的数据来源目前还主要来自母公司阿里、平安、腾讯,而另一方面,它们的兄弟公司又涉足放贷业务,例如阿里小贷。

尽管有关 大数据 征信的定义和效用仍争议不断,但对于既无法接入央行征信系统又面临快速发展的 互联网 金融行业而言,利用 大数据 来帮助判定风险、开拓业务已是必然的选择。

从应用范围来看,目前 大数据 征信已从金融业务向生活服务蔓延。其中,最核心的两个价值就是:防范欺诈风险和信用风险。简单来说就是:既要证明“你是你”,还要描述出“你是什么样的人”。

如何证明“你是你”

无论是在传统金融领域,还是 互联网 金融领域,给客户做信用评估的前提是必须知道这个人就是他自己。所以,如何利用证明“你是你”是 大数据 征信首先要解决的问题。

尤其,随着越来越多的金融业务 互联网 化,“反欺诈”面临的挑战也日益增大。“身份认证”的重要性在各项监管文件中反复被强调,而各家机构也在不断探索如何利用新的技术在网上实现身份的核实。

其中,在指纹、虹膜、 人脸识别 等一系列生物识别技术中, 人脸识别 因技术的成熟度和准确率较高,以及其使用的便捷性而被进一步普及。包括腾讯征信、芝麻征信在内的多家个人征信机构都有组建自己的 人脸识别 技术团队。

此前,在腾讯征信的北京媒体沟通会上,为腾讯财付通、微众银行、腾讯征信等提供图像和 模式识别 技术支持的优图团队也向大家展示了“ 人脸识别 ”在“反欺诈”方面的应用,即如何证明“你是你”。

根据现场的演示,在上传身份证照片、自拍照片并与公安部的信息进行比对之后,“ 人脸识别 ”的另一关键步骤是活体检测,通过读取随机的数字串,分析声音和唇语等信息来防范有人用视频、照片等方式仿冒用户。

据了解,在今年国际权威的 人脸识别 数据库LFW上,腾讯优图团队在人脸验证测试中达到了99.65%的准确率。目前,微信的“ 人脸识别 ”技术已经在腾讯征信、微众银行、微证券开户等场景中开始试用。

尽管 人脸识别 的准确率已经达到较高水平,但该项技术的商业化应用才刚刚起步,它的有效性和 安全 性仍备受质疑。

优图团队研发总监黄飞跃也表示,该技术现在还不能说100%地成熟,而是适用于某些特定的应用环境中。其中,金融领域的身份核实条件较好,由于用户往往是为了通过验证所以比较配合。

芝麻信用首席科学家俞吴杰表示,整个的反欺诈产品从身份认证到信息验证再到网络关联,每一步的技术含量非常高。以身份认证为例,现在已有很多的途径,比如信息交叉比对、 人脸识别 技术、KBA问答认证等。

上一页12下一页

上一篇:大数据征信:政府数据该如何开放
下一篇:苹果关闭旗下数据分析公司Topsy
精选推荐
智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

本周栏目热点

做为一名大数据新手 应该通过这篇文章了解大数据

[2018-07-23]  一、大数据是什么?大数据,big data,《大数据》一书对大数据这么定义,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进 ...

BAT大数据野心:数据生产全链条浮现

[2016-07-12]   本报记者 周慧 北京报道导读以BAT为代表的中国 互联网 企业,在数据领域各有千秋,百度的搜索数据、阿里的电商数据、腾讯的社交数 ...

为什么说发展大数据是有道理的

[1970-01-01]   近日,习主席考察贵州时提到:贵州发展大数据确实有道理。那么为什么说发展大数据是有道理的?从历史的 ...

《时代周刊》:用形象化的老办法对付大数据

[1970-01-01]   《时代周刊》最新一期封面文章称,我们每天被数据海洋淹没,只有让冷冰冰的数据形象化,变成看得见摸得 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...