
当前位置:">首页 · 新
金融网 ·"
金融超市 · 正文
李彦宏说
数据秒杀一切算法,BAT的
金融大
数据如何运作?
2017-02-13 14:58 微信公众号:深几度 深几度 1
摘要
金融创新很大一部分原因在于大
数据和
金融之间的结合。纵观BAT、京东、小米、万达、平安这些把触角伸到互联网
金融领域的巨头,无一不是在大
数据层面上有所布局。大
数据和
金融相结合,几乎已经成为
金融领域的通用做法。
新年开工,李彦宏的内部信就在朋友圈中引发了一波刷屏。内部信中有一个点比较有意思,李彦宏说,“这样一个时代,是很明显的
金融创新的新时代” ,这充分表明
金融业务将是百度未来的四大方向之一。而他的一句“
数据秒杀一切算法”,更是从侧面透露了以大
数据为代表的人工智能技术将成为百度
金融的必杀技。
金融创新很大一部分原因在于大
数据和
金融之间的结合。纵观BAT、京东、小米、万达、平安这些把触角伸到互联网
金融领域的巨头,无一不是在大
数据层面上有所布局。大
数据和
金融相结合,几乎已经成为
金融领域的通用做法。
金融数据都像是煤矿,价值含量、挖掘成本更重要
谈
数据必须先谈
数据的完整度和价值含量。就像煤矿一样,大
数据中的价值含量、挖掘成本比数量更为重要。非结构化
数据,就像是有杂质的煤矿,无法直接使用。大
数据还需要进行脱敏、提纯、结构化,才能变成可以被直接运用于商业层面的有价值的信息。
金融数据作为专业度要求更高的
数据尤为如此。对于BAT三家而言,布局其实都比较完整。2015年年底的时候,阿里集团透露,在阿里
数据平台事业部的服务器上,攒下了超过100PB已处理过的
数据。
BAT三家公司,
数据体积相差不会太多, 三家几乎都有LBS、
交易、社交等一系列不同维度
数据,只是能力有所区别。比如说,百度有地图、贴吧、糯米、外卖、Uber、携程、去哪儿;阿里有高德、微博、口碑、支付宝、飞猪、优酷等;而腾讯有微信、QQ、京东、新美大等。
三家
数据核心优势可以如此简单划分——

百度:基于搜索而诞生的公共
数据、需求
数据。百度的优势在于
数据最全面,
数据样本比较复杂,
数据的广度和多样性上比较强,拥有核心技术和
数据矿山,而且是一座富矿;
阿里:基于淘宝天猫业务而诞生的电商
数据、信用
数据。阿里的核心业务在电子商务上,
数据比较聚集,更容易做分析。这种
数据类型的优势在于,更容易变现,挖掘出商业价值;
腾讯:基于微信、QQ诞生的社交
数据、关系
数据,以及游戏
数据,相对较杂。不过,容易分析人们的生活和行为,从里面挖掘出商业、健康等领域的信息;
大
数据领域有这样一种说法——所有的
数据都是
风险数据。而拍拍贷
风险副总裁顾鸣博士之前提出过一个金字塔结构图。

在这张图中,征信
数据位于金字塔的顶端。往下走是消费
数据、运营商
数据、社交
数据、行为
数据以及其他
数据。越是靠近金字塔的顶部,大
数据在
风控领域的应用就会越直接,获取
数据的难度随之增加,覆盖率当然会降低;相反,越是靠近金字塔的底部,大
数据在
风控方面的应用难度就越大,但是
数据的数量和覆盖率都会变大。
把BAT三家套入这个金字塔结构中就会发现。阿里的
数据离变现几乎只有一步之遥。阿里以电商-支付-信用为三级跳板,针对性很强,
数据价值纯度高,
金融数据的整合上做的也比较完善,缺点是覆盖面还是不够。不过,这些年来不断收购、入股优酷、微博、高德等一系列企业,阿里
数据维度其实也在越来越丰富,也在不断往金字塔的底层下探。
腾讯有社交、行为
数据,这些
数据不能直接运用,但获取的信息会更丰富。而腾讯目前的大
数据策略是先将产品补全,产品后台
数据打通,形成稳定生态圈。本阶段先利用大
数据挖掘改进自己的产品。后期有成熟的模式合适的产品,则利用自家的社交及关系
数据时,开展对大
数据的进一步挖掘。
虽说有人认为百度和腾讯很多
数据是非结构化
数据,在
风控上的运用难度较大,很难直接商业化。不过,这些
数据恰恰是金字塔最底层的
数据。在普惠
金融的环境下,互联网全域大
数据带来的价值不可忽略。
特别是百度的
数据最为全面、完善,覆盖面最广。互联网环境下,每个人都会在网上留下痕迹。因此,位于底层的互联网行为
数据覆盖面最广,维度最多样,对破解我国数亿成年人尤其是草根群体的信用空白难题帮助最大。
表面上看这些
数据大多数和
金融无关,但如果挖掘得当,能够通过建立模型,给用户勾勒出比较准确的画像。让那些看似与
风险不太相关的
数据在互联网
金融风控的场景中体现价值。事实上,百度自然语言识别和深度学习的技术上在三家中也是最强,可以做出基于7个维度28个行业,细分10万+个标签描述用户的属性,加上在
数据算法上能力突出,优势非常明显。
值得注意的是,百度还结合更多外部
数据,如运营商
数据、政府部门公开
数据、线上/线下
交易数据等,一方面填补现有征信人群的空白,另一方面对业界已有
数据进行有效补充,扩大征信范围。
四个角度告诉你,
金融大
数据到底用在了哪些地方
因为
数据维度越丰富,对用户粗颗粒的画像就会越了解。某一个画像的用户到底喜欢什么,都可以一清二楚地了解到。企业也能够面对做很多有针对性的营销。
尤其是在
金融领域,企业对大
数据掌握越全面,所能涉及到的业务也会越丰富。BAT
数据最丰富,在
金融业务领域横亘支付、贷款、理财、保险、
证券、
银行、征信、
基金、众筹等各个领域。而小米、京东、万达等企业因为体量、
数据等相对而言优势不大,则会在这9个领域中缺失某些领域的布局。
BAT在9个领域的布局,其实都是以大
数据为核心串联在一起的。无论是征信、
风控、消费
金融、财富管理都或多或少运用到了大
数据。

1、大
数据征信:在个人征信领域,目前是
金融行业面临的最大问题。基于用户在互联网上的消费行为、社交行为、搜索行为等产生的海量
数据,其价值并未被充分挖掘,个人征信在大
数据的采集和信息挖掘上面仍有很大的想象空间。阿里的芝麻信用在其中算是最会玩的。芝麻信用几乎打通了用户的身份特质,行为偏好,人脉关系,信用历史,履约能力等各类信息。这恰恰是因为接入了电商、支付、社交等各类
数据维度。
2、大
数据风控:大
数据风控目前应该是前沿技术在
金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的
金融科技应用,大
数据风控目前已经在业界逐步普及。目前,美国基本上都用三大征信局的信息,最传统的评分基本上都是用FICO来做的。各家平台会尝试着用机器学习、神经网络等大
数据处理方法。
国内
市场对于大
数据风控的尝试还是比较积极。特别是大公司,可以将移动互联网的行为和贷款申请人联系到一起展开大
数据风控。百度在
风控层面上的进展还是比较突出,百度安全每天要处理数十亿网民搜索请求,保护数亿用户的终端安全,保护十万网站的安全,因此积累了大量的
数据。
一个很具体的案例就是,通过海量互联网行为
数据,比如监测相关设备ID在哪些借贷网站上进行注册、同一设备是否下载多个借贷App,可以实时发现
多头贷款的征兆,把
风险控制到最低。
3、大
数据消费
金融:消费
金融对大
数据的依赖是天然形成的。比如说消费贷、工薪贷、学生贷,这些消费型的
金融贷款很依赖对用户的了解。所以必须对用户画像进行分析提炼,通过相关模型展开
风险评估,并根据模型及
数据从多维度为用户描绘一个立体化的画像。
百度
金融的优势在于,通过基于大
数据和人工智能技术为基础的合作商户管理平台,为合作商户提供涵盖营销和
金融服务的全面管理方案,降低获客成本,解决细分行业的微小需求。一方面可以降低
风险,另一方面也能提升
金融的安全度。
在大
数据消费
金融的领域中,腾讯和阿里的优势很大程度上是在渠道层面上的。正如前文所说的,阿里以电商-支付-信用为三级跳板,针对性很强支付宝接入消费
金融产品之后会有较强的渠道作用。而在去年12月,腾讯的“微粒贷”已经接入到了微信支付当中。在消费
金融的发展速度上,腾讯速度也不差。
4、大
数据财富管理:财富管理是近些年来在我国
金融服务业中出现的一个新业务。主要为客户提供长期的投顾服务,实现客户资产的优化配置。这方面业务在传统
金融机构中存在的比较多。不过因为技术能力不足,大
数据财富管理在传统
金融机构中相对弱势。
财富管理在互联网公司的业务中也非常流行。蚂蚁金服一开始最为简单的财富管理方式就是余额宝,后来逐渐演化成经过大
数据计算智能推荐给用户的各种标准化的“宝宝”理财产品。百度
金融相对来说更进一步,是依托“百度大脑”通过互联网人工智能、大
数据分析等手段,精准识别和刻画用户,提供专业的“千人千面”的定制化财富管理服务。
金融大
数据的孪生兄弟
金融云是地基,未来更具看点
大
数据和云计算永远都是相伴相随的一对孪生兄弟。
金融大
数据核心工作包括三方面,即获取
数据、建立模型、模型在实践中优化、迭代。而对于
金融大
数据而言,
金融云才是它的地基。
打个不恰当的比方,前文中说大
数据是煤矿,而
金融云其实就是矿井。矿井的安全行、可靠性决定了挖煤的效率和结果。
金融云把底层技术很多问题都解决了。大量
金融模型都是
金融云所引入的,如客户模型、产品模型、账务模型等。同时
金融云关注
金融本身的严谨性和周密性、安全性的考虑。
2016年7月,“腾讯云+未来”峰会上,腾讯云和腾讯
金融云都已成为最重点部署的业务。同年9月,百度世界大会
金融科技分论坛上,百度
金融云正式向业界开放。据时任百度
金融研发负责人沈抖表示,百度
金融云将通过人工智能、安全防护、智能获客、大
数据风控、IT系统、支付等六大技术能力给合作伙伴赋能。10月,阿里云栖大会上,阿里
金融云负责人则是提出将会和生态合作伙伴、服务联盟为
金融行业量身定制推出云增强服务。
大
数据必须要跑在云端,而
金融大
数据更需要和业内其他企业展开
数据、支付、业务等一系列的合作。
金融云对可用性、安全性的要求严格,比如说对一个高度可控可信的云安全体系而言,基础环境安全、
风控与审计、
数据安全三者缺一不可。而
金融云在未来的竞争中将发挥越来越重要的作用。