查看原文
其他

研究 | 区块链技术在我国市场化个人征信中的应用初探

张晶,李育冬 源点credit 2022-03-29

区块链去中心化、数据公开透明、不可篡改、可追溯、隐私保护等特性与个人征信行业具有天然的契合性。


分析我国市场化个人征信中存在的问题,研究区块链技术在个人征信中的应用优势,设计一个基于区块链技术的个人征信平台架构,并对区块链技术在个人征信中的发展方向和应用前景进行探究,以期促进我国市场化个人征信的发展。



一、背景和现状


随着改革开放的不断向前推进,我国社会信用体系建设取得了卓越的成就,已建成全球规模最大的征信系统,成为我国重要的金融基础设施。截至2019年底,央行个人征信系统已收录10.2亿自然人的信用信息,接入机构达3737家,个人信用报告已成为名副其实的“经济身份证”。


央行征信系统的主要数据来源是商业银行、农村信用社等传统金融机构。移动互联网和大数据技术的飞速发展使得互联网平台上积累了大量与个人信用相关的替代数据,如互联网金融数据、电商交易数据、共享经济业务数据等。


随着我国个人征信市场化进程的加速,2018年5月百行征信在央行的监管和指导下正式成立,成为我国唯一一家获得个人征信牌照的市场化机构。


百行征信的成立填补了个人征信在互联网领域的空白,与央行征信系统形成错位发展、功能互补的“政府+市场”双轮驱动的个人征信体系,对我国普惠金融的实施和社会信用体系建设将产生深远的影响。


然而,在百行征信的业务开展过程中,在数据共享、数据安全、数据质量、个人信息保护等方面还面临着诸多挑战。随着区块链技术在全球范围内的快速布局和发展,区块链已上升为国家战略层面的核心技术,越来越多的主流金融机构开始布局和探索区块链技术在金融领域的应用。


习近平总书记强调要发挥区块链在促进数据共享、优化业务流程、降低运营成本、提升协同效率、建设可信体系等方面的作用,利用区块链技术促进城市间在信息、资金、人才、征信等方面更大规模的互联互通。阿里、腾讯、百度金融、京东数科等金融科技巨头先后成立了区块链实验室,致力于区块链技术的研发和专利申请;中国互联网金融协会也成立了区块链研究工作组,围绕区块链在金融领域的应用展开研究。


根据工信部发布的《区块链数据格式规范》中的定义,区块链是一种在对等网络环境下,通过透明和可信规则,构建不可伪造、不可篡改和可追溯的块链式数据结构,实现和管理事务处理的模式。简而言之,区块链是集成了分布式存储、点对点传输、信息加密、共识机制等多种计算机技术构建的一种新型信任机制,它通过数学原理而非第三方中介来创造信任,是一种利用“共信力”打造“公信力”的模式。



区块链上存储的数据质量高、安全性和可靠性强、不易篡改,天然适用于个人征信的应用场景。区块链技术在个人征信领域的应用是近年来学术界研究的热点问题。


经济学家巴曙松提出区块链不可篡改、可追溯、隐私保护等特性使其成为化解共享征信领域难题的一剂良方。


琚春华等应用区块链技术设计了一个多源数据共享框架,在此基础上应用人工智能、数据挖掘、智能合约等方法建立了多源异构数据融合的大数据征信平台。


塔琳等建立了一个基于区块链的跨平台征信数据共享模型,并探讨了其作用机理和应用场景在行业应用方面,LinkEye进行了区块链技术与征信结合的初步尝试,开发出一套基于区块链技术的征信共享联盟链解决方案,在联盟成员之间实现了个人信贷黑名单的共享。


联盟成员只要支付一定的代币(Token),即可获取联盟链上任何一家金融机构的黑名单脱敏数据。自上线以来,已有13家互联网金融机构加入LinkEye联盟链,如快惠金服、钱袋宝等。


但总的来说,区块链作为一项前沿技术,在个人征信领域的应用尚处于探索阶段,在理论基础 方面较为薄弱,在行业中的应用还远不成熟,未来仍需要大量的技术投入和应用实践来验证其效果。


二、我国市场化个人征信存在的痛点问题


(一)数据共享难度大百行征信成立的初衷,是打造一个各大民营机构的信用数据大熔炉,从而打破个人征信市场的数据孤岛,从战略层面上进行统筹协调。


在股东的选择上,百行征信可谓深谋远虑,8家参股机构均为个人征信领域的龙头企业,在信用数据方面各有所长。股东合作对于百行征信高效地形成优质服务能力可谓至关重要。


截至2019年底,百行征信收录信息主体数达1.4亿人,仍无法和腾讯、阿里等互联网巨头10亿级别的用户数量相提并论。百行征信希望从8家参股机构获得个人信息和信用数据,但截至目前,除股权投资之外,绝大多数参股机构并未对百行征信进行信贷数据共享。


究其原因,数据是这些机构的核心利益所在,收集、处理和存储数据付出了相当可观的时间和经济成本,在数据产权保护制度不够明确的情况下,对外共享数据可能造成商业信息泄露,给公司带来巨大的利益损失。


此外,数据共享涉及个人信息保护问题,对用户信息的传播受到有关政策法规的限制。鉴于百行征信定位为市场化机构而非政府机构,在未经信息主体明确授权的情况下,其他市场化机构 没有权力把数据分享给另一家市场化机构。


(二)缺乏有效的市场激励机制征信数据是一项具有价值的无形资产,但如何确定其所有权和衡量其市场价值,目前仍无定论。


百行征信的8家参股机构中,芝麻信用、腾讯信用、前海征信的数据体系最为丰富,分别涵盖了阿里、腾讯、平安旗下海量的互联网用户数据。


然而8家机构在股权结构上却是平均分配,导致互联网巨头共享数据的动机不强烈。百行征信目前的数据接入机构中,P2P平台和网络小贷占大多数,这些小型机构本身数据规模有限,通过数据共享可以获得更大规模的信用数据。而对于互联网巨头来说,数据共享更大程度上意味着把自己的数据提供给其他机构,这显然不是一个对等的交换。如此形成的数据孤岛严重阻碍个人征信业的健康发展,不利于社会信用体系的建设和升级。

 

(三)数据整合难度大央行征信中心的数据来源主要是商业银行、农村信用社等传统金融机构,数据质量较好、规范化程度高;而百行征信的数据源是以大量、分散的互联网数据为主

 

截至2019年底,百行征信已与909家机构签订信息共享协议,这些机构涵盖网络小贷、P2P平台、消费金融、汽车金融、互联网银行等众多领域,其业务、客户群和信息系统各不相同,业务水平参差不齐,接入数据普遍存在格式不统一、接入成本高、整合难度大等问题。对于征信业务来说,数据质量比数据规模更为重要。

 

若不对数据质量进行严格把关,将会对风控管理的效果造成很大程度的负面影响。尽管合作机构在接入数据之前需完成数据报送测试以确保接入数据的准确性,然而目前我国尚未出台统一的个人征信信息采集标准,百行征信的数据报送标准也并未明确对外披露。

 

(四)个人信息保护形势严峻随着互联网和大数据技术的迅猛发展,个人信息保护已成为世界范围内广受关注的焦点问题。

 

欧盟《通用数据保护条例》(GeneralDataProtectionRegulation,GDPR)已于2018年5月正式生效,它对个人数据处理过程中信息主体享有的各项权利以及数据控制者所承担的义务做了详尽的说明。

 

在适当借鉴GDPR的基础上,我国《个人信息保护法》《数据安全法》等法律法规将会于2020年出台,为个人征信业的规范化发展创造良好的法律环境。征信数据涉及大量敏感、机密的个人信息,信息泄露将造成恶劣的社会影响甚至严重的法律后果。

 

当前我国信用服务领域的个人信息保护形势不容乐观,2019年内多家大数据风控公司(包括考拉征信、敬庸科技、魔蝎科技、新颜科技、聚信立等)因存在利用网络爬虫非法爬取、使用和出售个人数据的行为,涉嫌侵犯公民个人信息罪接连被警方查处。

 

一些网贷类App利用默认勾选的隐私条款获得授权甚至强制授权,超范围收集个人基本信息、交易记录、通讯录、通话记录、位置信息等,成为“套路贷”的帮凶,导致电话骚扰、爆通讯录等暴力催收现象的猖獗,严重侵害公民的合法权益。

 


三、区块链技术在个人征信中的应用优势



区块链并非一项新技术,是多种计算机技术的集大成者,具备去中心化、数据公开透明、安全可信、准匿名性、可拓展性等特点,与个人征信行业具有天然的契合性。运用区块链技术可以有针对性地解决市场化个人征信中的诸多痛点问题。

 

(一)实现数据的分布式存储区块链采用点对点(P2P)模式来组织所有的网络节点,如图1所示。

 

P2P网络(Peer-to-PeerNetworking)又称对等网络,它没有中央服务器这样的中心化节点,而是使用分布式存储技术,将数据存储在多个节点中,各节点之间地位平等。

 

在进行信息传输时,节点将信息广播在区块链网络中,收到信息的其他节点均存储该信息。可见,区块链在本质上是一个去中心化的分布式数据库,数据由区块链系统中的所有节点共同存储,每个节点均保存一份完整副本。

 

 

图1P2P网络模式结构图


利用区块链的这一特点,可以实现征信数据的分布式存储和数据共享。

 

具体来说:


首先,将海量征信数据分布式地存储在多台服务器上,可以有效地利用网络中大量、分散的存储和计算资源,后期无需再花费成本对不同节点的数据进行整合,实现了征信数据的海量存储和高性能计算。

 

其次,每个节点都保存一份副本,意味着区块链中所有的交易信息都是全网见证、公开透明的,有助于推动不同机构之间的数据共享,打破征信领域的数据孤岛,减少信息不对称造成的障碍。

 

再次,P2P模式在系统安全性和可靠性方面更为优越,由于不存在中心化节点,即使其中一个节点发生故障,也不影响整个区块链系统的正常运转,且节点之间无需经过中心化节点就可以直接传输数据,降低了信息泄露的风险。

 

最后,P2P模式具有良好的可扩展性,数据服务商作为节点可以随时自由地加入或离开网络。

 

需要说明的是,在个人征信领域,中心化的征信机构不可或缺。因此将区块链技术应用于征信领域时,纯分布式结构是不合适的,其可控性较差,应当采用混合式结构,将集中式与分布式相结合。混合式网络中存在多个超级节点形成分布式网络,每个超级节点又与多个普通节点组成局部的集中式网络,超级节点保存普通节点的索引信息,如IP地址、端口、节点资源等。

 

(二)确保数据的不可篡改和可追溯在区块链中,数据按块链式的数据结构进行存储。

 

每个区块可以分为区块头和区块体两部分,区块按照时间先后顺序创建而成并连接成链(如图2所示)。

 

区块头记录了版本信息、区块高度、区块标识、父哈希、Merkle树根、区块时间戳、难度系数和区块随机数(Nonce)等控制信息。

 

其中,区块标识是区块的标识符;父哈希是前一个区块的哈希值,用于链接到前一个区块。区块体包含了此区块中所有具体的事务数据,按Merkle树的数据结构进行存储。

 

图2块链式数据结构示意图


哈希算法是区块链的核心技术之一,它是一类加密算法的统称。通过哈希算法可以将区块中任意长度的交易信息映射成一串由数字和字母组成的、固定长度的哈希值(类似于乱码),从而隐藏了具体信息,且具有单向性,无法反推和解密。区块之间通过父哈希连接成链,可以一直追溯到第一个区块。

 

一旦篡改了某一区块的交易数据,则必须同时修改后续所有区块的父哈希,这几乎不可能实现。区块链不可篡改的特性确保了数据的高度一致性和真实性,使其成为天然的“信任机器”。

 

在区块链中,区块时间戳记录了每个区块的生成时间,事务时间戳记录了每一条业务数据的录入时间。时间戳证明了区块链中的先后顺序,使得任何一条数据的来源都可追溯,进一步增加了篡改数据的难度,为征信数据提供更加公正、可信、全面的保护。

 

(三)加强身份验证和个人信息保护非对称加密算法在区块链中发挥着重要作用,它利用密钥对中的公钥和私钥分别对数据进行加密和解密。

 

区块链中每个节点都拥有唯一的一对密钥:账户公钥和账户私钥。公钥是可公开的,表示节点的身份;私钥是不公开的,表示对信息的控制权。利用非对称加密算法进行数据传输的过程如图3所示。

 

事务操作的发起方A和接收方B各自有一对公钥和私钥,并保管自己的私钥,将公钥告诉对方。发起方A在发送信息时,用接收方B的公钥将信息加密,信息以密文的形式在网络上传输,接收方B收到信息后,用自己的私钥解密信息。

 


图3非对称加密算法的数据传输过程


区块链的非对称加密算法可以实现征信业务中的用户身份验证和个人信息保护。各节点保存各自的私钥,利用私钥对归属于自己的数据进行解密。


私钥不在网络上传输,大大降低了信息泄露的风险。在信息传输过程中,除被授权的接收方之外,其他收到信息的节点几乎没有破解信息的可能,从而确保了数据的安全性。


(四)建立基于数学算法的新型信任机制共识机制是区块链的最核心技术。



区块链的P2P模式决定了全网的交易数据由所有节点共同存储,但如何确保各节点写入数据的真实性和可靠性,如何应对信息传输过程可能发生的损坏、丢失或延时,如何确定某项数据资产的产生者和所有者,在数据共享时如何进行节点之间的利益分配,这些问题都可以通过共识机制来解决。

 

共识机制是运用数学算法使各节点在区块信息、权益分配等方面达成一致的规则。在共识机制的作用下,只有当数据的真实性和正确性被网络中绝大多数节点所认可时,数据才被允许写入区块中,从而保证了区块链中数据存储的准确性和一致性。

 

区块链的共识机制有助于实现“去信任化”,即通过数学算法来解决信任问题,在各节点之间无需相互信任的前提下形成新型的信用机制。同时,通过共识机制能够确定数据的所有权问题,更好地激励合作机构参与数据共享。

 

(五)实现自动化和公平化的激励智能合约是部署在区块链上的可自动运行的计算机程序,一旦满足条件即可触发自动执行。

 

智能合约通常在以太坊虚拟机(EVM)环境下运行,确保了运行环境的有效隔离。利用智能合约,区块链系统可以构建分布式应用(DecentralizedApplication,DApp),并通过云平台向业务层提供BaaS服务(BlockchainasaService),从而提升区块链应用的可扩展性,实现区块链服务的个性化应用。

 

智能合约有助于构建自动化和公平化的激励机制。数据服务商作为节点将信用数据上传至区块链系统,当其他节点查询和获取该数据时,利用智能合约自动触发对数据所有者的激励,从而鼓励各节点积极更新和共享数据。

 

该方式依据数据的使用频率对数据进行定价,数据被查询的频率越高,数据的价值就越大,使征信数据真正成为一项产权清晰、价值明确的资产。

 

四、基于区块链技术的个人征信平台设计


目前我国个人征信市场的格局是以征信机构(主要是百行征信)为中心,其他数据服务商(包括互联网金融从业机构、消费金融从业机构、共享经济平台企业等)均按照一定的标准将数据接入征信机构。

 

这种体系结构的中心化程度很高,征信机构作为中心化节点面临着很大的数据整合压力,且对于数据服务商缺乏有效的激励机制,不利于征信数据共享和数据安全管理。

 

区块链技术的进步为我国市场化个人征信的改革和发展带来新的思路,结合区块链技术的基本原理,可以设计出如图4所示的个人征信平台架构,该架构自下而上分为数据层、网络层、共识层、合约层和应用层五个层次。

 


图4基于区块链技术的个人征信平台架构


(一)数据层


市场化个人征信主要针对互联网领域开展征信业务,其数据源具有多源、多样、多域的特点,涵盖互联网金融、消费金融、电商台、社交网络等多个领域的业务数据,如表1所示。


表1市场化个人征信的主要数据来源


在某区块被创建的一段时间内,每一条征信业务数据被记录在区块体中Merkle树的叶节点上,两两配对向上进行哈希运算,直到区块头的Merkle树根(如图2所示)。反之,通过Merkle树根就可以追溯到每一笔交易详情。

 

利用哈希算法可以将任意一条征信业务数据压缩成哈希值,其中SHA-256算法最为常用,它可以将任意长度的交易数据转换成一串由64个数字或字母组成的哈希值,从而保障底层数据的安全性。

 

(二)网络层

 

根据个人征信的业务范围,应采用联盟链模式,征信机构和数据服务商作为区块链的参与者,在中国互金协会的监管下,经过授权之后加入与退出区块链网络,组成利益相关的联盟,共同维护区块链的健康运转。

 

在个人征信领域,中心化的征信机构是必不可少的。为了确保个人征信业务的可控性,在网络结构方面,应当采用混合式P2P网络模式,如图5所示。

 

混合式P2P网络中,征信机构和数据服务商作为超级节点组成分布式网络,每个超级节点则与若干个普通节点(信息主体)组成局部的集中式网络。混合式P2P结构灵活,且实施难度较小,因此在实际应用中比较常见。

 


图5混合式P2P网络结构图


在信息传输过程中,信息主体作为普通节点,先将个人信息授权给它上级的超级节点。数据不需要全局共享,只有超级节点具有读写和交易数据的权限,征信数据在超级节点之间传输。非对称加密算法可以确保信息传输过程中的安全性,其原理如图6所示。

 

信息主体C向其上级的数据服务商B授权个人信息时,利用B的公钥加密信息,只有被授权的数据服务商B能用其私钥解密该信息,其他数据服务商则无法获取用户C的个人信息。数据服务商B向征信机构A传输信贷数据时,利用A的公钥加密信息,即可对征信机构A实现数据共享。在信息传输过程中,数据服务商B和征信机构A的私钥均不在网络上暴露,从而降低了信息泄露风险。

 


图6非对称加密应用于征信业务示意图


(三)共识层

 

区块链技术运用数学原理来创造节点之间的信任,通过共识算法来保证数据的一致性和确定数据的权属。

 

工作量证明(ProofofWork,PoW)是公有链中的经典共识算法,而联盟链中大多采用拜占庭容错算法(PracticalByzantineFaultTolerance,PBFT)和权益证明(ProofofStake,PoS)。

 

PBFT的基本思想是,当某节点收到另一节点上传的信息后,对于是否将该信息写入区块中并不立即做出判断,而是将该信息再转发给其他节点,与其他节点交换意见,做出一致性判断。当联盟链中2/3的节点都同意存储该信息时,即可达成共识,将该信息存储进区块中,从而确保了区块链中信息存储的一致性。

 

PoS的基本思想是,当各节点向区块链网络传输信息时,信息不会立即被写入区块中,而是作为未确认的信息存入候选区块。所有节点进行权益比拼,拥有权益最多的账户获得记账权,将候选区块向全网广播,经其他节点验证通过后,将新区块连接至区块链中。在PoS算法的作用下,数据服务商拥有的权益(如代币、数据资产等)越丰富,其获得新区块记账权的可能性就越大。

 

(四)合约层


为引导数据服务商积极参与数据共享,需要将经济因素纳入区块链技术体系中,设计合理的分配规则,对贡献数据资源多的节点给予更多奖励,并惩罚不遵守规则的节点。利用智能合约,可以将激励规则以计算机程序的形式编写出来,在满足一定条件的情况下自动执行,对数据服务商实现自动化和公平化的激励。

 

智能合约通常用面向合约的编程语言Solidity编写,在以太坊虚拟机(EVM)环境下运行,EVM编译器编译完成后,即可通过以太坊客户端上传至区块链网络。智能合约的执行无需中介和人工参与,节省了时间和成本,计算效率和准确性更高,且一经自动执行就无法逆转,使得交易的安全性更好。

 

(五)应用层


区块链的应用层可以通过分布式应用(DApp)和应用程序接口(API)实现良好的可扩展性。个人征信领域的各种产品和服务,如身份认证、信用评分、用户画像、反欺诈服务等,皆可作为DApp封装在区块链的应用层,服务于多元化的征信应用场景。

 

信用服务机构可以通过API接口快速开发出各种区块链应用,灵活地将自己的应用程序接入区块链中,实现信用服务的复用,扩展征信产品的应用范围,提升信用服务资源的利用率。

 

五、小结与展望


区块链并非一项新技术,而是P2P网络、信息加密、共识机制、智能合约等计算机技术的组合。区块链具备去中心化、分布式存储、数据公开透明、不可篡改、可追溯、准匿名性、可扩展性等特点,将其应用于个人征信领域具有广阔的发展前景。

 

区块链的P2P网络结构可以实现海量征信数据的分布式存储,且系统安全性、可靠性和可扩展性更好;块链式数据结构、哈希算法和时间戳可以确保征信数据的不可篡改和可追溯,提升征信数据的质量;非对称加密算法有助于加强征信业务中的用户身份验证和个人信息保护,提升数据安全水平;共识机制通过数学算法而非第三方中介来创造信任,可以解决数据权属问题,保证数据存储的一致性;智能合约可以构建自动化和公平化的激励机制,引导数据服务商积极参与数据共享。从发展趋势来看,区块链未来可能成为市场化个人征信领域的一个重要技术方向。

 

区块链在个人征信领域的应用目前尚处于探索阶段,面临着诸多问题和挑战。区块链技术本身仍处于发展的初级阶段,存在很多技术瓶颈,如共识机制的选择标准、智能合约的安全性、交易数据的隐私保护等,且技术研发难度较大,需要投入大量的时间和经济成本。此外,区块链去中心化的特性增加了金融监管的难度,对金融监管的针对性形成了更高的挑战。这些问题都有待于在后续的研究中进一步探讨。

 

源点注:本文作者 张晶、李育冬。




欢迎点个在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存