查看原文
其他

《金融监管研究》论文精编 | 一种新的银行信用风险识别方法:SVM-KNN组合模型

《金融监管研究》 金融监管研究 2024-05-28

者:申晴,张连增

单位南开大学金融学院

来源:《金融监管研究》2020年第7期

原文标题:一种新的银行信用风险识别方法:SVM-KNN组合模型




研究背景

2019年以来,包商银行事件引起学界和业界的广泛关注,有关商业银行的信用风险管理问题也再次引发热议。自2008年全球金融危机以来,商业银行风险管理,特别是信用风险管理越来越受到重视;但经济全球化及创新型金融衍生品的不断涌现带来的复杂性,也使商业银行识别和防范信用风险的难度越来越大。

在此背景下,使用科学的信用风险模型检测、度量、分析并管理信用风险,对商业银行自身的运营发展乃至整个社会经济的良性发展,都具有积极的促进作用。目前,国际上应用较多的现代信用风险模型主要有:KMV公司的KMV模型、JP摩根的信用度量模型(Creditmetrics Model)、麦肯锡公司的宏观模拟模型(Credit Portfolio View)、瑞士信贷银行的高级信用风险模型(Cridetrisk+)与死亡率模型(MortalityRates Model)等。这些现代信用风险度量模型,在金融市场高度发达的国家已经得到广泛应用,但在我国商业银行信用风险管理中的应用效果并不理想。一方面,由于我国金融市场起步较晚、体制不够完善,导致上市企业资产价值并不能够完全反映到股票市值上,影响了上述模型在应用中的准确性;另一方面,由于上述大部分模型需要大量的样本数据作为支撑,而我国银行系统近年来尽管加大了数据研究的力度,但仍存在征信数据总体数量较少、历史数据缺失、部分数据统计方法不规范以及数据可靠性相对较差等不足。如何构建适合我国商业银行实际情况的信用风险模型,一直是业界和学界重点讨论的话题。




创新点

我国商业银行在信用风险识别过程中难以直接使用国际上通用的现代信用风险模型,本文对适合我国国情的信用风险度量模型进行了探索。SVM模型只有在样本数量相当的情况下,才具有较高的分类精度;反之,如果样本数据不平衡,其分类精度就较差,特别是进行二元分类时,对于最优超平面附近的未知样本,分类准确率并不很理想。相对而言,K最近邻判别法(K-NearestNeighbor,KNN)在进行高维样本多分类处理时具有一定的优势。考虑到我国金融风险相关数据指标具有历史数据量少、非线性、高维度等特点,SVM模型和KNN模型在处理此类数据时具有较好的分类精度,并且SVM-KNN组合模型已在计算机、交通等领域取得较好的应用效果。本文尝试构建一种基于SVM模型和KNN模型的SVM-KNN组合模型,用于我国商业银行信用风险识别。




研究发现

本文实证结果表明:SVM模型、KNN模型和SVM-KNN组合模型三个模型在商业银行信用风险分类中的效果差异明显。其中,SVM模型、KNN模型的分类准确率均为80%,低于SVM-KNN组合模型的87.5%,即整体上SVM-KNN组合模型的分类效果明显优于SVM模型和KNN模型,其余分类效果指标值也在一定程度上解释了这一结果。首先,SVM-KNN组合模型的查全率为87.8%,稍微低于另外两个模型,说明该模型判定的正常企业占全部正常企业的比重略低于另外两个模型。同时,SVM-KNN组合模型的第一误差率稍微高于另外两个模型的第一误差率,但SVM-KNN组合模型的第一误差率属于合理范围内。再者,SVM-KNN组合模型的查准率为96.7%,远远高于另外两个模型的查准率,说明用该模型判定的正常企业中真正的正常企业所占的比重较大。另外,SVM-KNN组合模型的第二误差率低于其他两个模型。在商业银行的实际信贷过程中,模型分类结果的第二类错误比第一类错误给银行带来的风险和造成的损失更大。因此,第一误差率和第二误差率都在合理的范围内,应优先选择第二误差率较低的模型。

综上,SVM-KNN组合模型的分类效果优于单独使用SVM模型和KNN模型,该组合模型提升和改进了SVM模型和KNN模型单独在商业银行信用风险识别中的应用效果。




启示与政策建议

准确地评估企业客户的信用水平,对信用水平较好的优质企业客户进行放贷,降低潜在的信用风险,不仅是银行信用风险管理的重要内容,而且对改善银行的经营状况也具有重要的促进作用。本文提出的SVM-KNN组合模型,在一定程度上可以很好地解决银行信用风险的识别问题。根据以上研究内容与结论,本文提出以下几点建议:

第一、应用科学的贷前风险管理模型,加强授信准入管理。据了解,目前仍有不少银行在实际的贷前风险评估和审批过程中,评审人仅凭经验和信贷担保情况进行贷款项目的评审,这样很难精准、科学地判断企业的实际信用风险情况,不利于管理和防范信用风险。因此,建议根据本文提出的组合模型或者其他信用评估模型,在贷款决策前对可能引起信用风险的因素进行定性和定量分析,加强授信准入管理,为贷款决策提供依据。

第二、继续完善和健全我国银行征信系统和企业数据库系统。国际上通用的现代信用风险模型以及本文提及的组合模型,在实际的应用中都需要大量的数据作为支撑。近年来我国银行系统加大了对数据研究的力度,取得了不错的成绩,但仍存在征信等相关数据总体上数量较少和部分数据统计不规范等问题。因此,建议相关部门应继续健全和规范我国银行征信系统和企业数据库系统,使我国商业银行进行信用风险分析时所需要的财务数据和非财务数据更加完整且规范。这对提高银行的信用风险管理水平,具有积极的促进作用。

第三、加强金融和科技的融合,优化银行风险管理体系。本文提出的组合模型是机器学习算法在银行信用风险识别领域应用的探索。在当前形势下,将人工智能、深度学习以及大数据相结合,并应用于信用风险识别是一种趋势。这会使信用风险识别更加简便、更加科学,但也需要一个不断深入学习与探索的过程。鉴于此,建议银行深化计算机科学技术在金融领域的应用,构建专业的信贷风险管理系统,实现金融与科技的深度融合。


本文为精编版,仅代表作者个人学术思考,全文详见《金融监管研究》2020年第7期。


——相关链接——

商业银行大型集团客户信用风险压力测试:基于蒙特卡洛模拟方法

商业银行信贷资产证券化信用风险研究——基于修正的KMV模型

信用风险的成因解构、定量测算与防控机制

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存