由于征信业务围绕数据展开,大数据与征信之间有着天然的联系。 随着全球商业组织清楚地意识到基于数据的决策和运营可以为企业和消费者带来巨大的利润,并深刻理解数据和分析对其享受产品服务和个人身份保护的重要性,基于个人的大数据消费者及其分析市场的规模在不断扩大。 国内市场化征信的推出,让大数据征信(或征信大数据)成为热门话题。 据说,没有大数据的包装,资本市场不会感兴趣。 据权威互联网咨询机构IDC估计,2014年全球对大数据及其分析的投资超过520亿美元,2014-2014年复合增长率将达到15%。 大数据技术投资持续增长的基本原因包括以下几个方面:海量数据的不断产生; IT技术和分析能力的发展使得数据处理速度更快、效率更高,能够为企业决策和运营提供新的见解。 看法; 不同行业和地区对大数据分析和决策服务的需求越来越强烈。
6月25日,全球第三大个人征信机构环联()在纽约证券交易所正式挂牌上市。 根据其招股书,也是一家大数据公司。 由于资本市场普遍乐观,开盘当天交易以13%的日涨幅收盘。 其中,高盛、摩根大通、美银美林和德意志银行是环联上市的发行人。 目前的市值估计为 45 亿美元。 本文将以为例,分析大数据在全球个人征信机构的应用,为系统认识大数据征信提供一个视角。
征信机构最基本的作用是将分散在不同征信机构的局部信息碎片化处理整合成具有完整视图效果的全局信息,从中挖掘风险信息,帮助解决交易过程中信息不完整的问题,以及降低风险,降低交易成本,帮助商业组织更有效地做出决策。 而大数据技术有助于将更分散、更碎片化、更底层的数据处理成更完整的全局信息,更有效地减少这种信息不对称。 本文所讨论的大数据技术,并不局限于大数据的存储和处理,也不局限于当下流行的大数据风险评估。 它是对信用大数据系统处理和分析的相关技术的介绍。
类比传统的加工制造业,征信机构可以理解为数据工厂,其基本业务流程包括数据采集(数据可以理解为原材料,数据采集可以理解为采购、采集原材料)、数据加工(相当于对原材料进行粗加工,排序一致性,剔除不符合质量要求的原材料,粗加工成基本成分),数据分析与挖掘(对原材料进行深加工,按照一定的产品型号,海量产线生产)和数据服务(产品质检、包装、提供给用户终端)。 大数据时代,大数据技术为征信发展提供了新的图景。 如图1所示,大数据技术可以嵌入到信用信息的整个业务流程中,并可以根据大数据服务的需要不断更新。 探索新的大数据来源。 此外,征信大数据处理过程中的每一个环节都必须兼顾数据质量、数据安全、消费者隐私保护和监管合规等方面的要求。
图1 征信大数据应用流程
大数据的获取:来自不同领域的分布式数据源越来越多
大数据为征信活动提供了新的视角。 基于海量、多样、交叉互补的数据,征信机构可以及时、全面地获取信用主体信息。 多年的运营使其能够构建信息丰富且独特的数据源。 目前拥有30P数据,包括财务数据、信用数据、另类数据(数据,包括电信预付费、电子商务、社交网络、心理数据等)、身份数据、破产数据、抵押品数据、法院判决数据、保险从近90,000个数据源中提取的政策数据、汽车数据等数据在全球拥有超过10亿消费者,自2010年以来以超过25%的速度扩张。的大数据资产如图2所示,主要包括四个方面:
图2 环联征信大数据来源
传统信用数据:最基础的数据资产是信用数据库,基本涵盖了全美所有信用活跃(信用交易)人群的姓名、地址、现有信用关系、偿债时间表等。 数据库中的信息由数以千计的授信机构和数据提供商自愿提供。 传统的征信数据库支撑着的基础征信业务。
另类信用数据:另类信用数据是指消费信用数据以外的与信用交易相关的数据,在没有消费信用数据的情况下,可以作为消费信用描述和信用评价的手段,或者作为增强信用的一种方式评估。 租赁付款和公用事业付款等替代信贷渠道扩大了传统信贷数据库的范围。 例如, 拥有巴西最大的替代数据库,包括数百个数据库和邮政编码(包含 1.9 亿个人和 2900 万公司的数据),例如来自巴西联邦税务局的税务记录信息。
消费者公共记录: 从法院、政府机构和其他公共记录中获取数据,例如诉讼、抵押、判决、破产、专业执照、房地产、车辆所有权、其他资产、违规驾驶、犯罪记录和联系信息。 例如,印度的 可以访问来自国家选举登记处(7.5 亿条记录)、国家身份证数据库(超过 5 亿条记录)的信息。 2013 年 12 月,收购 TLO 的资产(该公司开发使用公共记录数据进行个人身份识别、欺诈保护和债务追回的数据产品)。 2014 年 11 月, 收购了德国公司 DHI(交通违规和刑事审判数据提供商)。 在南非,收购了一个交通设备数据库(包括超过1800万条车辆记录和SVIN,是南非最全面的车辆数据库)。 在国内央行个人征信体系中,替代征信数据和消费者的公开记录统称为非银行征信数据。
专有数据库: 使用复杂的算法生成自己的专有数据库 ( ),对数据进行提炼和标准化。 这些数据有别于其他竞争对手,包括司机违章记录、医疗资质信息、业务数据和租金交付信息等信息。
上述信用数据库受到定期监控、更新和审查。 通过每月更新大约 36 亿条记录来保持数据最新。 理论上,可以收集与消费者个人经济行为相关的数据,但环联在选取这些大数据时,至少要满足以下标准:(1)合规性,满足征信机构监管要求(包括信息安全( 2)数据是活数据,可以及时更新; (3)数据是可靠数据(Trust data),从可靠、可信的数据源获取; (4)必须保证数据质量,保证数据可以正常使用此外,征信机构的数据或信息在被商业机构使用时,往往需要与当地的大数据进一步融合,才能更好地发挥作用。
大数据处理:强大的匹配连接能力和下一代技术
征信数据规模变大、更新速度加快、类型复杂。 需要有不同于传统工具的新技术和新方法来完成数据处理和分析任务。
基础大数据技术:拥有庞大复杂的大数据资产,需要配套的大数据处理技术作为支撑。 自主研发了基础征信大数据技术,为应用和解决方案更新的快速实施提供了灵活性。 已经使用了Ab(大数据处理软件平台技术)、(开源分布式系统的基础设施,适合处理大量数据)、(IBM的基于数据仓库的分析技术)、Hadar等一些大数据分析和可视化技术来处理海量数据(30PB)、分散的数据源(90,000 个数据源)和不同数据格式(4,000 多种数据格式)。 的大数据技术可以处理、组织和分析跨多个操作系统、数据库和文件类型的海量数据,同时处理快速变化的结构化和非结构化数据,每天处理数十亿和数千万笔交易。 兆米的数据交换。 的大数据技术提供了高度的适应性、高效率和客户定制。 对于的解决方案,通过一些专业技术(如图形化开发和业务规则环境),可以很容易地与客户的工作流程集成。
增强数据匹配和连接能力:大数据时代,征信数据来源更加多样化,需要强大的数据匹配和连接技术来提升数据的价值,使对消费者的描述更加完整和准确。 实现大数据商业价值的关键技术之一是将不同来源的不同类型的数据进行匹配、连接和集成,如图3所示:首先在多个数据源中找到信息对应的消费者,然后进行匹配对消费者Item的具体信息,可能存在冗余信息的Item进行合并裁剪,得到消费者全面统一的视图。
图3 征信大数据匹配技术原理
的数据匹配技术可以整合多个数据源,连接多个信息,生成新的数据集,更好地评估风险和进行数据挖掘。 例如, 的 TLOxp 解决方案利用数据匹配功能(来自不同数据源)识别和调查不同人员、资产、地点和企业之间的关系,提供尽职调查、威胁评估、身份验证、欺诈预防和检测解决方案。 在巴西,使用数据匹配技术连接了巴西联邦税务局(税务记录信息)等数百个公共数据库和邮政编码。 在印度, 可以从征信机构 信用数据库包括超过2亿个人消费者和超过1000万个商业实体的信息。
下一代技术:正在投资研发以大数据为特征的下一代征信技术。 它希望通过下一代技术的变革,继续为企业和消费者提供服务,增加数据吞吐量,提高数据匹配能力。 更高的适应性和更低的运营成本征信机构,更高的效率,更快的市场响应,如数据归档、数据清洗、数据存储速度提升10倍,非IT人员可自行完成。 大大缩短新产品的生产周期。
新技术探索:近日,环联与南非某高科技公司共同筹建南非国家声纹数据库,开发声纹识别技术,用于消费者身份识别和反欺诈。 据说这种基于声纹的身份验证技术比传统的基于知识(也称为钱包外)的消费者身份验证方法效率高 80%。 对生物识别技术的前沿探索还处于早期研发阶段。
大数据挖掘与分析:挖掘潜在信息与模式,释放大数据价值
征信征信机构早期的信用数据挖掘外包给了Fair Isaac(简称FICO),最成功的案例是FICO信用评分。 随着数据分析技术的完善和普及,等多家征信机构开始组建自己的分析师团队,开发自己的评分产品。 但由于历史和传统原因,征信机构继续与FICO合作,为商业机构提供信用评分服务。
理论上,随着大数据的积累,更多的信息可以提供更好的风险评估; 实践中,随着平台的多样化和商业模式的多样化,商业实体之间的关联风险和商业机会的复杂性不断增加。 大数据技术能够在消费者或信贷产品(组合)层面实现风险计量和管理,使信贷审批和定价更加精准。 图4为《经济学人》对大数据在金融风险中应用的调查,其中大数据在预防信用卡诈骗和降低违约率方面效果最好。 利用大数据分析技术解决来自多个信息渠道的复杂海量信息处理问题,提高风险模型的预测能力和稳定性,以及实时响应速度,帮助客户及时做出信用和风险管理决策。 决定。
图4 四大数据在金融分析中的应用效果考察(来自《经济学人》)
为充分释放征信大数据的价值,环联在技术、工具和人力资源上进行投入,开发复杂灵活的分析决策能力。
开发新的分析技术: 的分析师使用下一代技术和数据匹配功能实时读取和分析来自不同数据源的数据。 通常,分析师可以利用自助服务数据接口在一天内生成用于模型开发、模型验证和客户分析的数据样本。 分析师配备了不同的建模和分析工具箱(例如可视化和机器学习)。 例如, 的团队可以在 的解决方案中为新的贷款组合建模。 大数据分析技术的工具只需要不到1天的时间,而传统工具和技术的开发时间需要4到5周。
分析团队:大数据时代,信贷行业的发展涉及到海量数据的存储、加工、加工、分析,需要大量的经济学、数学、计算机等高级综合专业人才。 拥有经验丰富的分析师团队(一般为资深专业人士或博士),具有丰富的行业经验和对消费信贷数据的深入了解。
分析工具研发:数据分析工具是信用数据挖掘分析的通用基础软件组件。 开发的分析工具包括基本预测模型和评分、消费者细分、业务基准、欺诈建模和运营优化等,以满足特定客户的需求。
大数据服务:丰富多样的数据产品,个性化的征信服务,更好的客户体验
征信大数据为更多领域提供更多信息服务成为可能,大数据的交叉融合拓宽了征信产品和服务的广度和深度。 通过提供全面的数据、高级分析和决策能力帮助客户提高效率、管理风险、降低成本和增加收入。 大数据让环联征信产品更丰富、更多元、更及时、更动态,兼顾不同客户群体的细分需求,提供更个性化、更优质客户体验的征信服务。 大数据带来比传统征信机构更广泛的服务范围:的服务行业正逐渐从金融服务转向保险、汽车、医疗、电信、零售、租金审查、消费者和执法等和社会领域。 在每个领域, 都帮助客户及时做出有关信用和风险管理的决策。
基于专项数据资源和分析决策服务,环联近期开发的征信大数据产品和服务示例如下:
金融机构征信产品:基于消费信贷大数据,为机构客户提供某个时间窗口内某个消费者的风险变化趋势,有别于传统征信报告仅提供当月时点数据。 该产品基于30个月的时间序列数据,说明客户风险随时间变化的速度和严重程度,更精准地细分风险。
保险公司征信产品:整合至少三年的司机违章记录等大数据,高效识别司机违章可能性,以独特的视角审视司机风险,降低保险公司成本。
面向商业机构的营销产品:基于自身的大数据,利用O2O(互联网数据和数据库数据)匹配技术,帮助机构用户从1.35亿美国消费者网络中识别潜在客户,展示其个人信息和测量效果增加可能性寻找目标客户。
面向商业机构用户的决策分析产品-Edge:是一种软件即服务产品,允许商业机构客户在与消费者交互时识别和验证消费者用户,并解释数据和预测模型的结果,根据 客户定义消费者用户标准,以促进实时和自动化的决策制定。
概括
尽管工业界和学术界对大数据的定义不同,但无论采用哪种定义,等全球征信机构都是典型的大数据公司:拥有典型的大数据(30P数据量,每年以25%的速度增长,超过10亿条信用记录); 丰富的数据类型(超过90,000个数据源,超过4,000种数据格式); 数据更新速度快(每月近36亿条记录); 最重要 最重要的是,的信用数据蕴含着巨大的价值、丰富的消费者消费模式和信用信息,可用于信用信息服务、市场营销、决策分析,为消费者自身提供信用管理服务。 环联大数据技术的应用是一个综合过程,是一个从数据采集、数据处理、数据分析挖掘到服务的综合过程。 随着业务的发展,未来环联征信大数据的增长主要从两个维度延伸:海外征信业务的发展将增加消费者数量; 数据来源的不断扩大将迅速增加消费者的信用描述,如图五所示。
图 5征信机构数据趋势
目前,环联的大数据以结构化数据为主,基本不涉及社交网络、微博、论坛、上网行为数据等非结构化数据。 相关的,另一个重要原因是世界本质上是结构化的,风险和业务信息主要隐藏在结构化数据中。 因此,本文认为,信用大数据的研发应首先解决结构化大数据的处理和分析问题,挖掘出主要风险和业务信息。 虽然与国内流行的大数据征信相比略显保守,但由于其深厚的数据资产和征信技术积累,环联对大数据技术的应用整体上是一个自然而然的过程。 根据数据征信关联,会逐步扩展,未来已经开始发展与征信相关的大数据,比如以声纹为代表的生物特征识别。
虽然大数据技术给全球个人征信机构带来了诸多变化,如数据量的增加、数据类型的增加、处理技术的提升、分析能力的深化、服务范围的扩大以及征信产品的丰富,但并没有给这些征信机构的业务带来颠覆性的变化,商业模式也没有改变。 主要业务内容仍然是从基础信用信息服务、市场营销、决策分析到消费信用管理和反欺诈服务。 然而,正如数据技术的每一次突破都会给征信机构带来更多的创新和颠覆,比如数据库技术、数据挖掘技术等,未来大数据技术将不仅仅延伸到以为代表的全球个人征信机构广度和深度。征信服务,未来可能会带来一些商业模式的变化。 (来源:中国征信)
广为宣传
我们长期关注第三方征信行业的发展与研究,传递征信行业最新动态,代办征信牌照,提供企业征信取证咨询服务,个人征信许可申请。
合作交流
电话:
三玖有卡 是国内权威的金融财经门户网站,提供专业的贷款问答、信用卡知识、网贷口子、手机租赁等专题文章;致力于提供专业的贷款知识及信用卡提额攻略;每天更新热门贷款口子、网贷口子、信用租机、网络贷款平台等小额贷款产品最新资讯,轻松满足你的借贷需求。
原创文章,作者:三玖有卡,凡注明 “原创”之作品,未经三玖有卡书面授权,任何单位、组织和个人均不得转载、摘编或者采取任何方式使用上述作品。如已获书面授权,转载时请注明出处:https://999u.cn/256243.html