爱吧机器人网 » 技术 > 大数据 > 正文

大数据征信:芝麻信用如何破题

其他的金融机构,芝麻信用也在谨慎地尝试接入个别的P2P平台,但是目前接入的P2P数量并不太多,大概不到10家。

目前,芝麻信用与合作伙伴之间的合作都是免费的。其他更多的合作方式,胡滔表示,芝麻信用给每个行业都有定制的解决方案,将择时公布。

除了合作伙伴的数据之外,在支付宝9.0版本中,芝麻信用在“芝麻信用分”的下面,添加了一个“+”按钮,用户可以点击添加自己的相关信息,以获得更准确的信用评分。

怎么做 数据分析 ?

通过多种渠道汇集的数据,在芝麻信用分的评分当中,被分为五个维度:身份特质、履约能力、信用历史、人脉关系、行为偏好。芝麻信用首席信用数据科学家俞吴杰向媒体详细解释了每一项的具体含义。

身份特质是指在使用相关服务过程中留下的个人基本信息,包括从公安、学历学籍、工商、法院等公共部门获得的个人资料,未来还可能包括网络使用习惯等可以用于推测个人性格的数据。

履约能力包括享用各类信用服务并确保及时履约,例如租车是否按时归还,水电煤气是否按时交费等,还包括通过消费情况、消费稳定性、消费层次等等来判断用户未来履约有什么样的能力。

信用历史是指过往信用账户还款记录及信用账户历史。俞吴杰介绍,这些历史包括用户的在蚂蚁微贷、蚂蚁花呗等蚂蚁金服旗下服务的信用历史、用支付宝还款的历史,还包括用户在合作伙伴处产生的信用历史,“我们把信用历史看得非常重要。因为大量的研究已经表明,如果一个人有持续的好的借贷还款行为的话,他在其他各个场景当中都会有类似的延续、惯性。”

人脉关系是指好友的身份特征以及跟好友互动的程度。根据“物以类聚人以群分”的理论,通过转账关系、校友关系等作为评判个人信用的依据之一。俞吴杰解释,当我们在判断关系的时候,要看两个人之间联系的紧密程度如何,以及历史的一贯的行为表现是怎样的,这些都是通过一个一个的模型判断出来的,而每个模型在判断一个指标的时候,都会用到几十上百个变量。

行为偏好是指在购物、缴费、转账、理财等活动中的偏好及稳定性。“比如讲一个用户你是否经常做一些与家庭责任相关的、跟社会责任相关的事情,在你购物的行为当中能不能体现出这种特征,如果是的话可能对你的个人信用会有正向的作用。”俞吴杰解释。

这些维度的评价,如何与个人信用建立联系?

美国个人消费信用评估公司FICO的信用评分在美国的应用是最为广泛的,美国三大信用局都使用FICO的信用分。FICO信用分计算的基本原理是,把借款人过去的信用历史资料与数据库中的全体借款人的信用习惯相比较,检查借款人的发展趋势跟经常违约、随意透支、甚至申请破产等各种陷入财务困境的借款人的发展趋势是否相似。

俞吴杰告诉网易 科技 ,芝麻信用的 大数据 评分的原理是类似的。“传统的方法当中,每个变量与信用的关联比较强,可能有某个特征就是好的,没有某个特征就是坏的。 大数据 的场景下的很多关联不像传统的方法当中强,可能很多的特征都是弱关联,有关联但是彼此之间并不是很直接。但是当我们把很多个弱关联的特征联合在一起的时候就变成了一个非常强的预测变量,可以来判断这个人未来可能会守约还是违约。”

他举了个例子:“比如说要判断一个人的家庭责任感,购物中的哪些类目会体现出家庭责任感呢?没有一个类目能说完。但是如果研究很多不同的类目,比如说你是不是在购买跟生活相关的纸巾类的物品、或者购买婴儿类相关的物品、学习类书籍,当把这些不同的类目联合在一起去看的时候,当一个人有众多的弱变量都指向是一个行为特征,他就变成了一个组合起来的强特征。”

这需要对大量的数据进行处理。俞吴杰进一步说:“当我们要去处理那么多变量那么多弱特征的时候,技术以及需要投入的处理能力就需要非常强。”

他接着解释:“一方面,我们人平时思考到的那些东西,比如地址稳定性、手机号码稳定性和个人信用到底有没有关系,数据和 算法 可以帮我们去检验;另一方面,我们人想不到的维度,只要把足够的数据放进去,机器能够帮我们两两比对,不同的关联组合起来以后,就可以知道违约和守约的区分。”

这是一个不断调整、优化的过程,随着数据源的扩大、应用场景的不断丰富,实际检验效果会越来越清晰。同时,俞吴杰也指出:“实际上,很多时候也不需要掌握所有的信息才能对一个人做出最完整的、客观的评价,因为很多信息是具有代表性的,只要我们在足够有说服力的方面拿到核心的信息,就可以对一个人做出相对比较准确的判断。”

他介绍,目前比较前沿的一些 算法 ,如决策树、随机森林、支持向量机、 神经网络 等,芝麻信用都在研究尝试。

目前,芝麻信用分在实践中检验的结果,其产生的坏账率在合作伙伴可以接受的范围内,这也是让芝麻信用充满信心的原因。

芝麻信用整个团队有130人,其中2/3是数据和技术团队。胡滔介绍, 数据分析 团队是芝麻信用的核心。芝麻信用从国外引入了做征信模型做得最好的FICO的首席科学家,还有美国三大征信局之一艾可菲( Equifax) 专门做产品和业务的优秀华人。

胡滔对自己的团队充满信心:“他们在国外积累的经验,结合我们今天 大数据 和技术的优势,包括整个中国的市场,一定可以做出成绩。我经常也跟团队说,今天芝麻一小步就是中国一大步,因为我们做的每件事情在中国都是没有先例的。今天我们的征信才刚刚起步,美国是170年前起步的,我们的今天是他们的昨天,但是我们的明天可能是他们的后天。”

如何保护隐私?

此前,有业内人士告诉网易 科技 ,利用 大数据 进行信用评估,目前只对特定人群、特定服务有效,比如对年轻人进行小额消费贷款。

上一页123下一页

上一篇:用算法来判断性格更靠谱?
下一篇:个人征信机构静待发令枪响 业内:大数据并不便宜
精选推荐
从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...