拍拍贷首席数据官顾鸣:大数据和人工智能在拍拍贷的应用8月29日,上海国资大数据课题启动仪式暨数据资产技术及金融行业应用沙龙在华东理工大学隆重召开。 本文关键字: 人工智能 8月29日,上海国资大数据课题启动仪式暨数据资产技术及金融行业应用沙龙在华东理工大学隆重召开。本次沙龙在上海市国有资产监督管理委员会、上海市经济和信息化委员会、上海市科学技术委员会的指导下,由上海市国有资产信息中心、华东理工大学金融大数据研究中心、上海计算机软件技术开发中心联合主办,畅享网作为媒体支持,有逾200位专家、学者、企业代表等汇聚一堂,共同探讨国资大数据的应用发展。 本文为拍拍贷 首席数据官顾鸣所做的主题分享《大数据和人工智能在拍拍贷的应用》,由畅享网整理。 顾鸣:各位领导、各位专家、各位同学大家好!我是拍拍贷的首席数据官,很荣幸今天有机会过来跟大家分享,大数据和人工智能在拍拍贷的应用,我会讲下拍拍贷的互联网金融是如何做的,同时分享案例。 关于拍拍贷 拍拍贷成立于2007年,是中国第一家互联网网贷平台。拍拍贷定位为智慧与普惠的科技金融平台,以十年运营积累的亿级大数据为基石,用人工智能等先进科技工具为互联网金融赋能。通过在线智能决策、机器替代人工,拍拍贷专注小额消费金融领域,力求实现金融产品、风控、获客、服务的全面智慧化,以低成本、高效率的一站式解决方案,实现普惠的智慧金融。中国目前有10亿互联网人群,在其中有5亿有金融需求却没有被传统金融机构服务到的人群,这些人基本属于“信用白板”用户,如何用技术的方式去高效、低成本的解决这部分人群的金融需求,成为一个关键的因素。而很传奇的地方在于,拍拍贷的英文名字“ppdai”就隐含了解决方案,基于“D”(大数据),用“AI”(人工智能)的方式去实现陌生人之间的金融需求。 2014年我从美国回来,第一次看到这样的模式,被它震撼到了。可以想象一下,如果走在路上有人有乞丐向你要钱,大家可能都会给。但如果有人向你借1千元,要你把银行卡号、地址留下来,说等以后有钱还给你。这样的模式你会接受么?我肯定是不敢的。就算你接受一次,每一天每个月这种事做很多次,你敢么?这个模式对当时的我来说非常新颖,一方面是上面说的这点。第二方面,拍拍贷做的不仅仅是把钱借给路上向你借钱的人,而是在线上借钱给未谋面的人。我个人觉得这是非常有颠覆性的,非常有意思的金融创新。 大家可以通过我们网站上披露的公司业务相关数据看到,截止今年第二季度,拍拍贷二季度累计新增注册用户827万、相当于香港总人口1.1倍,二季度共实现723万笔借款交易、进一步实现小额分散,第二季度累计成交金额165亿、环比增长56.5%。我们2015年注册用户数量是2014年的5倍,2016年注册用户数量是2015年的3倍,2016年我们业务金额198亿元,这些数字足以说明我们的发展是非常快的。 拍拍贷与一般的互联网公司很不一样,因为我们做的是金融业务。金融并不是发展的越快越好,还需要在满足金融规则的情况下做事情,需要合规。同时也不是做的越多越好,因为实际上你借出去的每一笔钱对自己都是有影响的。 如何解决这个问题呢?拍拍贷用到了大数据以及AI技术。 如图是拍拍贷现在的AI布局,这里我简单介绍一下,底层是一些基础架构,上面一层是算法,再往上是领域能力,以及最终是应用场景。几个月前,腾讯的马化腾说过发展AI的四个要素:人才、计算能力、数据、场景。我当时听到很震撼,因为他把场景和数据放在最后。现在想想这确实有道理,因为人才和计算能力可以出钱买来,而且有很多公司可以对此标准化的提供给你,人才和计算服务是有价格的,可以买到。但是场景是可遇不可求的,你在的行业决定了你有什么场景。金融这个行业提供了非常多的被用到人工智能和大数据的场景。获取数据,对金融行业来说并不难。我们是一个金融平台,接触到资产端、资金端,我们在过程中可以搜集到海量的数据,有了数据和场景,才能把大数据玩起来,把AI用起来。 大数据风控 金融行业的核心是风控,如果风控出问题,作为金融公司的立足根本就没有了。我们花了最多的精力和资源放在大数据风控上。如图,数据的获取越往上越难,但越高等级的数据对于风控的作用越大。简单说就是,征信非常有用。比如,你在银行借5000块,你的征信显示你可以让别人有信心借给你,那么借款不会有太大问题。这样的征信对我们大多数用户来说难拿到,我们大多数没有。那么我们不得不从上往下看其他风控数据,就是所谓的大数据风控。 大数据风控的根本在于,你会看跟传统金融没关系的很多变量。这个风控数据的金字塔,从上往下数据量会越来越大,应用难度也越来越大。行为数据、社交数据都是海量的。非结构化的数据要么是图像,要么是文本,这些都是传统金融一般不会去看的。但对我们来说,这部分用户是没有征信的,所以这些非征信数据是我们风控的根本。获取这些数据后,我们会基于数据做模型,然后我们有一套模型打分系统,给每个用户得出我们对他风险的评估。基于这个评估做用户定价,我们认为比较优质的用户会让他可以多借一些,借款利率低一点,评估不那么好的用户会让他可借款少一点,利率高一点。我们评估认为实在不靠谱的用户就会拒绝他。 拍拍贷会将每一个用户每个标分成A、B、C、D、E、F、G、H八个评估等级。还有一点需要说一下,我们可能是中国唯一一家在网站上提供我们称之为裸标形式的P2P网站。我说的“裸”是指用户投资了一个标,如果这个借款人没有还钱,我们不会做保险或者赔付等行为。用户需要相信大树法则,如果在我们给予的分级情况下,用户投标时做到非常多的分散,是不可能亏钱的。投A标的投资人,他们的利率会低一些。投G、F标的投资人,他们需要准备好,有可能投10个标出去有5个收不回来。我们通过这样的方式进行调节。有了这个分级体系后,我们可以比较准确的对用户做评估,省下很多在评估方面消耗的精力,可以做其他工作。 社交关联反欺诈 另外我们会做一个基于关联人的评估。比如一个用户——不论是好用户还是“坏用户“(这里姑且这样称呼不还钱的借款人),他作为一个个体,发挥的影响是有限的。由于大树法则的作用,坏用户可以通过概率把他屏蔽掉。我们最怕的是以集团为单位,一个人拉几百人来骗钱——借款不还的。这种对我们的伤害最大,拍拍贷会花非常多的精力和资源把这些抓出来。这里的技术核心就是基于用户的关联人判断。大家可以想象六人定律,通过六个人的关系我能够连接到美国总统,所以用户的关系网数据是非常复杂的,TB级别的, 身份识别 身份识别。拍拍贷的业务都是在线上的,一部分核心问题就是要做验身。用户申请时的身份验证情况五花八门,有男的拿女性身份证来申请,或者小孩子拿他爸的身份证申请,这些我们都可以基于技术手段将他发现出来。另外我们的身份识别还包括自动文字识别。用户在平台借钱都会需要上传身份证,在很长一段时间身份证信息是需要靠人工录入的。这部分工作量太大,外包又会造成信息泄露,所以我们最终通过技术手段,实现了将身份证照片拉平,进行处理,把照片中的关键字抓取出来。这里最难的就是无论照片格式,还是拍摄质量、色调、倾斜角度是怎么样的,都可以自动进行处理将信息识别读取出来。 智能质检 质检是很重要的一件事。拍拍贷想做的不光是一家非常牛的有科技感的互联网公司,同时想做一家非常非常合规的金融公司。合规是什么意思,举个例子,催收的时候我们有一些话不能跟客户说,有一些话必须要跟客户说。我们每天会有几万通电话,这些电话要经过非常多的人,花非常多的精力质检。我们现在通过技术方式,可以走动把每天所有跟客户交互的语音,自动转换成文本,通过处理上下文的模型,找出哪些说的话是有问题的,哪些是没问题的,工作量大大降低。举个例子,原本200个人需要花两个礼拜做的事情,现在可以10个人简单做一下确认20分钟就能搞定。投诉和风控是对于我们公司来说最根本的问题,而这种技术的实现则是对我们效率的提高。 智能客服 智能客服,是我们自己开发的。我们相对于体量来说跟银行比不大,但从用户数来说是大于银行的水平。有一个用户借10万块钱和一个用户借2千块钱都会有问题来问你,对于客服的压力只会多不会少。跟用户通过交互的方式面对面,所以有非常多的难题。这点大家可以去尝试一下,你问我们的客服一个问题,后面回答你的基本上都是机器。你可以跟他聊天,调戏机器人。通过各种各样的一些技术手段把效率提高上去,把服务能够提高上去,我觉得这是真正意义上把我们跟大多数的平台区别化的地方。这其中大数据跟AI起到了关键的作用。现在P2P平台处在大浪淘沙的阶段,行业在进行洗牌和整合,很多不规范的公司逐渐被淘汰。对于我们拍拍贷来说,通过技术手段把金融做好,这就是我们的核心要做的事情,也是互联网金融需要解决的问题。 拍拍贷07年成立的,那时候人工智能还没有怎么出现。他们创始人就想到这些,他说我们是天注定需要用到数据和人工智能解决问题的。我们是拍拍贷,就是PP+DATA+AI。我就说到这里,谢谢大家! 责编:畅享精灵 ![]() 著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新文章
|