211292910_基于Choquet模糊积分SVM_集成的企业信用评估模型

211292910_基于Choquet模糊积分SVM_集成的企业信用评估模型


2024年4月13日发(作者:)

2023年第5期

总第292期

征信

CREDITREFERENCE

No.52023

SerialNo.292

【理论研究】

基于Choquet模糊积分SVM集成的

企业信用评估模型

张目

1

,许素娟

1,2

(1.贵州财经大学大数据应用与经济学院,贵州贵阳550025;

2.贵州财经大学贵州科技创新创业投资研究院,贵州贵阳550025)

摘要:针对Bagging算法下基于模糊积分的SVM集成方法在企业信用评估应用中存在的不足,提出一种基于改进

模糊密度-Choquet模糊积分SVM集成的企业信用评估模型。该模型借鉴Boosting算法“注重”错分样本的基本思

想,考虑SVM基分类器的总体错分程度,重新定义SVM基分类器的模糊密度,实现对模糊密度的改进;在此基础

上,采用Choquet模糊积分作为SVM基分类器的结合方法,从而将基于Choquet模糊积分的SVM集成方法引入到企

业信用评估中。实证结果表明,与传统方法相比,该模型的预测准确率更高,第一类错误率和第二类错误率更低;

精确率、召回率、F1值和Macro-F1值等分类性能指标也明显占优,说明了该模型的可行性和有效性。

关键词:企业信用评估;改进模糊密度;Choquet模糊积分;支持向量机;集成学习;Bagging算法

中图分类号:F830.5;TP391文献标识码:A文章编号:1674-747X(2023)05-0024-07

引言

企业信用评估是指对可能引起信用风险的因素

进行定性分析、定量计算,以测量企业的违约概率,

为贷款决策提供依据。基于分类视角,企业信用评

估方法先后出现了多元判别分析法、Logistic模型、

Probit模型等多元统计分析方法,以及专家系统、人

工神经网络、支持向量机等人工智能方法

[1]

。多元

统计分析方法在处理非线性数据时效果不佳;而专家

系统面临知识获取的瓶颈和推理方式的限制,人工神

经网络则存在“黑箱性”问题,且易陷入过拟合

[1]

。支

持向量机(SupportVectorMachines,SVM)是在统计

学习理论基础上发展起来的通用学习方法,既有严

格的理论基础,又能较好地解决小样本、非线性、高

维数和局部极小点等实际问题,已表现出很多优于

已有方法的性能

[2-3]

,并逐渐成为企业信用评估的重

要方法

[4-5]

集成学习(EnsembleLearning)能够训练多个学

习器并将它们结合起来解决一个问题,在实践中获得

了巨大成功

[6]

。对于分类问题,集成学习可以将多个

弱分类器结合成一个强分类器,因此,在单一SVM的

基础上相应发展了SVM集成方法。目前,SVM集成

方法在企业信用评估中的应用主要包括Bagging算法

和Boosting算法两个方面。在Bagging算法下,SVM

基分类器的结合方法大多采用投票法,其中,软投票

法成为投票法的研究趋势。然而,在软投票法的已有

应用研究中,选用的模糊积分存在局限性,计算的模

糊密度缺乏全局性。有鉴于此,本文在Bagging算法

下,借鉴Boosting算法“注重”错分样本的基本思想,

考虑SVM基分类器的总体错分程度,重新定义SVM

基分类器的模糊密度;并将基于Choquet模糊积分的

SVM集成方法引入到企业信用评估中,从而为提高

收稿日期:2023-01-28

基金项目:国家自然科学基金地区项目(71861003)

作者简介:张目(1968—),男,贵州贵阳人,教授,博士,博士生导师,主要研究方向为信用风险管理、数字金融;许素娟(1999—),

女,重庆黔江人,硕士研究生,主要研究方向为信用风险管理、数字金融。

·24·

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

企业信用评估的准确性提供新的思路。

一、相关研究

在企业信用评估领域,SVM集成方法的应用主

要包括两个方面:(1)Bagging算法的应用。吴冲等

考虑子SVM的输出重要性,建立了模糊积分SVM集

成的企业信用风险评估模型

[7]

,并将其推广至五级

分类

[8]

。胡莲等将模糊积分SVM集成应用于供应链

金融信用风险评估

[9]

。夏晗采用模糊积分SVM回归

集成构建了小微企业信用风险度评估模型

[10]

Wang等基于Bagging和随机子空间提出了一种新的

(2)Boosting算法的应用。李丽等将基于AdaBoost算

SVM混合集成方法,并应用于企业信用风险评估

[11]

法的SVM集成分类器应用于企业集团信用风险评

[12]

。胡莲提出一种AdaBoost集成SVM分类器并

应用于供应链金融信用风险评估

[13]

。Liu等通过

AdaBoosting算法集成基于改进的粒子群优化算法

的SVM分类器,提高了供应链金融信用风险评估的

SVM集成模型,实现了欠采样技术与AdaBoost集成

险预测的等级失衡问题

[15]

综观已有文献,由于Bagging算法鲁棒性强,且

不易出现过拟合现象,因而获得了更多的应用。在

Bagging算法下,SVM基分类器的结合方法成为研究

的重点,其中,从多数投票法、加权投票法向软投票

法发展成为投票法的研究趋势。在软投票法中,已

有研究大都采用Sugeno模糊积分作为SVM基分类器

的结合方法

[7-10]

样本的权重,以提升分类器的性能

[6]

。因此,本文借

鉴Boosting算法“注重”错分样本的基本思想,考虑

SVM基分类器的总体错分程度,重新定义SVM基分

类器的模糊密度。

二、改进模糊密度与企业信用评估模型构建

(一)相关定义

(X)是X的幂集,集函数g:P(X)→[0,1]满足以下两

定义1:设X={x

1

,x

2

,…,x

n

}为有限非空集合,P

个条件:(1)g()=0,g(X)=1;(2)K∈P(X),T∈P(X),

K⊆T,则g(K)≤g(T)。称g是P(X)上的一个模糊测

[21]

定义2:对于所有的A,B∈P(X),且A∩B=,

λ∈[-1,+∞),若模糊测度g满足如下条件:

g(A∪B)=g(A)+g(B)+λg(A)g(B)

[21-22]

模糊密度。若X={x

1

,x

2

,…,x

n

}为有限非空集合,且x

i

的模糊密度函数为g(x

)则λ-模糊测度具有如下性

i

[21-22]

1

n

g(X)=g({x

1

,x

2

,…,x

n

})=

(1+λg

i

-1

λ

i=1

对于只有一个元素x

i

的子集合,称g

i

=g({x}为

i

(1)

则称g为λ-模糊测度,通常模糊测度不具有可加

准确性

[14]

。Yao等提出了一种具有人工不平衡率的

方法的有效结合,解决了供应链环境下企业信用风

[]

(2)

当g(X)=1时,上式可以简化为

[21-22]

λ+1=

(1+λg

i

i=1

n

(3)

定义3:设h:X→[0,1]为X上的一个可测函数,

则h在集合X上关于模糊测度g的Choquet模糊积分

值为

[17]

H=

(x)g(K)=

[h(x

(i)

)-h(x

(i-1)

)]g(X

(i)

)(4)

X

h

i=1

n

,但Sugeno模糊积分存在突出主要因

素的作用而完全忽视其他因素的影响的局限性

[16]

同时,已有研究在计算SVM基分类器的模糊密度时

大都仅考虑SVM基分类器对某一类样本的错误判

别数,缺乏全局性

[7-10]

具有较强的信息融合能力

[17]

。已有研究表明,在多

[18]

,Choquet模糊积分作为SVM基分类器的结合方

法已成功应用于高校社会服务绩效评价、上市公司

财务危机预测等领域

[19-20]

。因此,本文选用Choquet

模糊积分作为SVM基分类器的结合方法。此外,

Boosting算法根据弱分类器的总体错误率不断调整

Choquet模糊积分能够综合考虑各种影响因素,

其中,(i)为按照h(x

(1)

)≤h(x

(2)

)≤…≤h(x

(n)

)排序后

的下标,X

(i)

={x

(i)

,x

(i+1)

,…,x

(n)

},h(x

(0)

)=0。

(二)改进的SVM基分类器模糊密度计算方法

学习器的多样性,提高了集成学习的泛化能力

[23]

。设

Bagging算法通过重新抽选子训练集丰富了基

分类器融合中Choquet模糊积分优于Sugeno模糊积

原始训练样本集有N个样本,使用Bootstraping自助

采样方法从原始训练样本集中随机抽取M个样本

(M<N)组成1个子训练集,共进行n轮抽取,得到n

个子训练集:S

1

,S

2

,…,S

n

。对于类别数为k的分类

问题,运用n个子训练集,训练生成n个SVM基分类

器:SVM

1

,SVM

2

,…,SVM

n

。设SVM

i

对子训练集S(

i

i=1,

·25·

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

2,…,n)中样本进行分类后所得到的混淆矩阵为:

n

i

11

n

i

21

n

i

12

n

i

22

n

i

1k

n

i

2k

(5)

行分类后得到2×2混淆矩阵;根据式(6)和式(7)计

算SVM

i

对类别y=+1的模糊密度g

t

+

和SVM

i

对类别

y=-1的模糊密度g

t

-

步骤3:计算λ

+

和λ

-

的近似值。

将SVM

i

对类别y=+1的模糊密度g

t

+

代入式(3),

通过试算求解出λ

+

的近似值。同理可得λ

-

的近

似值。

步骤4:计算测试样本x的后验概率。

对于1个新的测试样本x,采用Platt提出的方

法,通过一个sigmoid函数近似计算SVM判别的测试

样本x属于类别y=+1的后验概率,计算公式如下

[23]

Pr(y=+1│x)≈P

A,

(=

B

f)

1

1+exp(Af+B)

(8)

……

n

i

k1

n

i

k2

(s,t=1,2,…,k)。

其中n

i

st

表示第s类样本被SVM

i

判别为第t类的数量

基于式(5)所示的混淆矩阵,借鉴Boosting算法

“注重”错分样本的基本思想,考虑SVM基分类器的

总体错分程度,采用SVM

i

对第s类样本的正确判别

数与SVM

i

对所有类别样本的错误判别数之比,定义

SVM

i

对类别s的支持度,见定义4;进一步考虑SVM

i

在n个SVM基分类器中的相对重要性,采用SVM

i

类别s的支持度占n个SVM基分类器对类别s的支

持度之和的比重,定义SVM

i

对类别s的相对重要程

度(即模糊密度),见定义5。根据定义4和定义5,可

以计算得出SVM

i

对类别s的模糊密度g

s

i

定义4:设n

i

st

为第s类样本被SVM

i

判别为第t类

的数量(s,t=1,2,…,k),其中n

i

ss

为第s类样本被SVM

i

判别为第s类的数量,若

n

i

ss

sup(SVM

i

,s)=

kk

i

s=1

t=1,t≠s

n

st

则称sup(SVM

i

,s)为SVM

i

对类别s的支持度。

SVM

n

,sup(SVM

i

,s)为SVM(2,…,n)对类别s的

i

i=1,

支持度,若

sup(SVM

i

,s)

g=

n

i=1

sup(SVM

i

,s)

s

i

n

i

kk

其中,SVM决策函数f=f(x)。令每一个f

j

为(fx)

j

的一

个估计,x

j

∈R

m

,i=1,2,…,l。最佳参数设置z

*

=(A

*

B

*

)可以通过求解一个正则化的最大似然问题来确

[24]

运用式(8)计算得出SVM

i

判别的测试样本x属

于类别y=+1的后验概率Pr(y=+1│x)

i

。同理可得

SVM

i

判别的测试样本x属于类别y=-1的后验概率

Pr(y=-1│x)

i

(6)

步骤5:确定测试样本x的最终所属类别。

将Pr(y=+1│x)

(2,…,n)按从小到大重新排

i

i=1,

定义5:设有n个SVM基分类器:SVM

1

,SVM

2

,…,

++

序,得到Pr(y=+1│x)和相应的SVM

及g

;根据λ

+

(i)i)i)

+

的近似值和g

,利用式(2)计算得出λ

+

-模糊测度

i)

+

g(K

+

),其中K

+

∈{SVM

};将Pr(y=+1│x)和g(K

+

)代

i)(i)

(7)

入式(4),计算得出测试样本x属于类别y=+1的后验

++

概率的Choquet模糊积分值H([0,1])。同理计

x

H

x

则称g

s

i

为SVM

i

对类别s的相对重要程度(即模糊密

度)。其中g

s

i

∈[0,1],且∑

i=1

g

s

i

=1。

(三)企业信用评估模型构建

对于训练样本标签为y∈{+1,-1}的企业信用

评估问题,在Bagging算法下,构建基于改进模糊密

度-Choquet模糊积分SVM集成的企业信用评估模

型,具体步骤如下:

步骤1:训练生成SVM基分类器。

采用Bootstraping自助采样方法由原始训练样

本集随机生成n个子训练集;运用n个子训练集,训

练生成n个SVM基分类器。

步骤2:计算SVM基分类器的模糊密度。

利用SVM

i

对子训练集S(2,…,n)中样本进

i

i=1,

·26·

n

算可得测试样本x属于类别y=-1的后验概率的

-

Choquet模糊积分值H

x

(H

x

-

∈[0,1])。若H

x

+

>H

x

-

,则

测试样本x的最终所属类别为y=+1;若H

x

+

<H

x

-

,则测

试样本x的最终所属类别为y=-1;特别地,若H

x

+

=H

x

-

则测试样本x的最终所属类别不确定。

三、实证分析

(一)指标体系与样本数据

在已有研究基础上

[24-25]

,从盈利能力、偿债能

力、营运能力、成长能力和创新能力等5个维度选取

28个指标作为科技板块上市公司的信用评估初始

指标。然后,选取沪、深股市中的200家科技板块上

市公司作为实验样本,样本区间设定为2021年1月

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

1日至2021年12月31日,原始数据来源于RESSET

数据库。200家样本企业涉及新型材料、互联网、公

共安全、BAT、智能产业、新科技、制造2025、新模式

等8个行业。其中,有100家为“非ST”企业,其财务

状况良好,违约的可能性较小,信用风险较低,这类

企业称之为“正常企业”(y=+1);其余100家为“ST或

*ST”企业,其财务状况较差,违约的可能性较大,信

用风险较高,这类企业称之为“违约企业”(y=-1)。

最后,运用Python软件对28个初始指标进行卡方分

箱,再进行WoE(WeightofEvidence)编码,并计算

各个初始指标的信息价值(InformationValue,IV),

以衡量各个初始指标的预测能力

[26]

。剔除IV<0.02

的初始指标,最终筛选出12个指标组成科技板块上

市公司信用评估指标体系,如表1所示。

表1

一级指标

盈利能力

科技板块上市公司信用评估指标体系

二级指标

营业利润率

销售净利率

流动比率

偿债能力速动比率

净资产负债率

营运能力

流动资产周转率

存货周转率

每股收益增长率

成长能力营业利润增长率

净利润增长率

创新能力

研发投入占营业收入比例

申请专利数量

0.0503

0.0503

0.0671

0.0864

0.0864

0.1383

0.0326

0.1534

0.1031

0.1031

0.4436

0.1330

IV值

在保持两类样本数量相当的前提下,使用

Bootstraping自助采样方法从训练样本集中随机抽取

60%的样本企业(84家)组成1个子训练集(正常企

业和违约企业各42家),共进行10轮抽取,得到10

个子训练集:S

1

,S

2

,…,S

10

。对于类别数为2的分类问

题,运用10个子训练集,训练生成10个SVM基分类

器:SVM

1

,SVM

2

,…,SVM

10

。其中,内积核函数及参数

优化方法与单一SVM相同。此外,子测试集与单一

SVM中的测试样本集相同。

步骤2:计算SVM基分类器的模糊密度。

利用SVM

i

对子训练集S(2,…,10)中样本

i

i=1,

进行分类后得到10个2×2混淆矩阵,如表2所示。

表2

观测

SVM

1

SVM

2

SVM

3

SVM

4

SVM

5

+1

-1

+1

-1

+1

-1

+1

-1

+1

-1

+1

36

34

41

40

40

1

1

1

1

2

SVM基分类器的混淆矩阵

预测

-1

40

41

41

41

41

2

2

1

8

6

观测

SVM

6

SVM

7

SVM

8

SVM

9

SVM

10

+1

-1

+1

-1

+1

-1

+1

-1

+1

-1

+1

40

38

40

39

37

3

3

5

0

2

预测

-1

40

42

37

39

39

5

3

2

4

2

由表2,运用式(6)计算得出SVM

i

对类别y=+1

的支持度sup(SVM

i

,+)和SVM

i

对类别y=-1的支持度

SVM

i

对类别y=+1的模糊密度g

i

+

和SVM

i

对类别y=-1

的模糊密度g

i

-

,结果见表3。

表3

SVM

1

SVM

2

SVM

3

SVM

4

SVM

5

SVM

6

SVM

7

SVM

8

SVM

10

SVM

9

SVM

i

SVM基分类器的模糊密度

0.0490

0.0412

0.2234

0.1453

0.1453

0.1090

0.1035

0.0623

0.0708

0.0504

g

i

+

sup(SVM

i

,-)

5.0000

4.5556

20.5000

13.6667

13.6667

10.0000

10.5000

5.2857

6.5000

4.8750

0.0529

0.0482

0.2168

0.1445

0.1445

0.1058

0.1111

0.0559

0.0687

0.0516

g

i

-

sup(SVM

i

,+)

4.5000

3.7778

20.5000

13.3333

13.3333

10.0000

9.5000

5.7143

6.5000

4.6250

sup(SVM

i

,-),如表3所示。运用式(7)计算得出

(二)实证结果与分析

1.单一SVM

将实验样本集划分为训练样本集和测试样本

集。在保持两类样本数量相当的前提下随机抽取

70%的样本企业(140家)作为训练样本(正常企业和

违约企业各70家),用于构造单一SVM模型,其余

30%的样本企业(60家)作为测试样本(正常企业和

违约企业各30家),用于检验单一SVM模型的泛化

能力。使用MatlabLibsvm工具箱来实现单一SVM

模型对实验样本的两类分类。其中,选择径向基函

数(RBF)作为单一SVM模型的内积核函数,δ

2

和C

等参数由MatlabLibsvm工具箱自动优化生成。

集成与比较

步骤1:训练生成SVM基分类器。

步骤3:计算λ

+

和λ

-

的近似值。

由表3,将SVM

i

对类别y=+1的模糊密度g

i

+

代入

式(3),通过试算求解出λ

+

的近似值为-0.01。同理

·27·

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

可得λ的近似值亦为-0.01。

-

步骤4:计算测试样本x的后验概率。

以测试样本先进数通(300541)为例,令其为x,

运用式(8)计算得出SVM

i

判别的测试样本x属于类

别y=+1的后验概率Pr(y=+1│x)

i

和SVM

i

判别的测

试样本x属于类别y=-1的后验概率Pr(y=-1│x)

i

果见表4。同理计算可得其余测试样本的后验概率。

表4

SVM

1

SVM

2

SVM

3

SVM

4

SVM

5

SVM

6

SVM

7

SVM

8

SVM

10

SVM

9

SVM

i

测试样本x的后验概率

Pr(y=+1│x)

i

0.1678

0.1421

0.0803

0.2006

0.1243

0.0027

0.0962

0.1122

0.6968

0.0619

Pr(y=-1│x)

i

0.8322

0.8579

0.9197

0.7994

0.8757

0.9973

0.9038

0.8878

0.3032

0.9381

0.9257+(0.0803-0.0619)×0.7816+(0.0962-0.0803)×

0.7329+(0.1122-0.0962)×0.6920+(0.1243-0.1122)×

0.5475+(0.1421-0.1243)×0.4855+(0.1678-0.1421)×

0.3824+(0.2006-0.1678)×0.1593+(0.6968-0.2006)×

0.1090=0.1799

同理可得测试样本x属于类别y=-1的后验概率

H

x

-

=(0.3032-0.0000)×1.0000+(0.7994-0.3032)×

的Choquet模糊积分值H

x

-

0.8908+(0.8322-0.7994)×0.8396+(0.8579-0.8322)×

0.6242+(0.8757-0.8579)×0.5137+(0.8878-0.8757)×

0.4580+(0.9038-0.8878)×0.3140+(0.9197-0.9038)×

0.2659+(0.9381-0.9197)×0.2131+(0.9973-0.9381)×

0.0687=0.8201

由于H

x

+

<H

x

-

,则测试样本x的最终所属类别为

y=-1。同理计算可得其余测试样本的最终所属

类别。

综上所述,本文模型的分类结果见表6。同

时,为便于比较,还将单一SVM(模型1)、传统模糊

密度-Sugeno模糊积分SVM集成(模型2)、改进模

糊密度-Sugeno模糊积分SVM集成(模型3)的分类

结果也列入表6中。其中,第一类错误是指将“违

约企业”误判为“正常企业”,第二类错误是指将

“正常企业”误判为“违约企业”。

从表6可以看出,模型3在训练样本集和测试样

本集中的预测准确率(Accuracy)分别达到93.5252%

和85%,高于模型2;在训练样本集和测试样本集中

的第一类错误率与模型2相同,第二类错误率则低

0.0687

0.2131

0.2659

0.3140

0.4580

0.5137

0.6242

0.8396

g(K

-

步骤5:确定测试样本x的最终所属类别。

以测试样本先进数通(300541)为例,令其为x,将

表4中的Pr(y=+1│x)

(2,…,10)按从小到大重新排

i

i=1,

++

序,得到Pr(y=+1│x)和相应的SVM

及g

;同理可得

(i)i)i)

--

Pr(y=-1│x)

和相应的SVM

及g。

(i)i)(i)

+

根据步骤3得出的λ

+

的近似值和g

,利用式(2)

i)

计算得出λ

+

-模糊测度g(K

+

);同理可得λ

-

-模糊测度

g(K

-

),计算结果见表5。

表5

K

+

{6}

{6,10}

{6,10,3}

{6,10,3,7}

{6,10,3,7,8}

{6,10,3,7,8,5}

{6,10,3,7,8,5,2}

{6,10,3,7,8,5,2,1}

测试样本x的λ-模糊测度

0.1090

0.1593

0.3824

0.4855

0.5475

0.6920

0.7329

0.7816

g(K

+

K

-

{9}

{9,4}

{9,4,1}

{9,4,1,2}

{9,4,1,2,5}

{9,4,1,2,5,8}

{9,4,1,2,5,8,7}

{9,4,1,2,5,8,7,3}

于模型2;说明了改进模糊密度的有效性。本文模

型在训练样本集和测试样本集中的预测准确率分别

达到94.9640%和86.6667%,均高于模型3;在训练

样本集和测试样本集中的第一类错误率均低于模

型3,第二类错误率与模型3相同;说明了Choquet模

糊积分SVM集成的有效性。总体来看,本文模型的

预测准确率高于其他三种模型,第一类错误率和第

二类错误率低于其他三种模型。

本文还进一步考察了本文模型和其他三种模型

的分类性能指标:精确率(Precision)、召回率(Recall)、

F1值(F1-Measure)和Macro-F1值,计算结果见表7。

从表7可以看出,模型3在训练样本集和测试样

{6,10,3,7,8,5,2,1,4,9}

1.0000

{9,4,1,2,5,8,7,3,10,6}

1.0000

注:{}中为SVM基分类器的下标。

{6,10,3,7,8,5,2,1,4}

0.9257

{9,4,1,2,5,8,7,3,10}

0.8908

将Pr(y=+1│x)和表5中的g(K

+

)代入式(4),计

(i)

算得出测试样本x属于类别y=+1的后验概率的

+

Choquet模糊积分值H

x

:本集中的Macro-F1值分别为0.9353和0.85,均高于

模型2;在训练样本集和测试样本集中对类别y=+1

·28·

H

x

+

=(0.0027-0.0000)×1.0000+(0.0619-0.0027)×

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

和类别y=-1的精确率、召回率和F1值总体优于模

型2;印证了改进模糊密度的有效性。本文模型在

训练样本集和测试样本集中的Macro-F1值分别为

0.9496和0.8667,均高于模型3;在训练样本集和测

表6

模型类型

模型1

模型2

模型3

本文模型

样本集

训练样本集

测试样本集

训练样本集

测试样本集

训练样本集

测试样本集

训练样本集

测试样本集

准确率

试样本集中对类别y=+1和类别y=-1的精确率、召

回率和F1值总体优于模型3;印证了Choquet模糊积

分SVM集成的有效性。总体来看,本文模型的分类

性能明显优于其他三种模型。

单一SVM与SVM集成的分类结果

7.1428%(5/70)

5.7971%(4/69)

5.7971%(4/69)

2.8986%(2/69)

第一类错误率

15.7143%(11/70)

13.3333%(4/30)

12.8571%(9/70)

16.6667%(5/30)

13.3333%(4/30)

13.3333%(4/30)

7.1428%(5/70)

7.1428%(5/70)

第二类错误率

88.5714%(124/140)

90.6475%(126/139)

93.5252%(130/139)

94.9640%(132/139)

86.6667%(52/60)

85.0000%(51/60)

83.3333%(50/60)

81.6667%(49/60)23.3333%(7/30)

16.6667%(5/30)

16.6667%(5/30)

13.3333%(4/30)

注:(1)表中括号内为样本个数之比;(2)10个子训练集均未抽取到y=-1的训练样本莱宝高科(002106),因此,10个子训练集

覆盖了69个“违约企业”。

表7

模型

类型

单一SVM与SVM集成的分类性能指标

样本集

训练

样本集

测试

样本集

训练

样本集

测试

样本集

训练

样本集

测试

样本集

训练

样本集

测试

样本集

精确率召回率

F1值

Macro-

F1值

0.8855

0.8162

0.9064

0.8333

0.9353

0.8500

0.9496

0.8667

本文的贡献在于:改进了SVM基分类器的模糊密度,

进而将基于Choquet模糊积分的SVM集成方法引入

到企业信用评估中。未来研究方向:(1)如何将本文

模型从企业信用评估的两类分类问题推广至多类分

类问题值得进一步研究;(2)λ-模糊测度只能表示各

SVM基分类器间的某一类交互作用,削弱了模糊测

模型中有待于今后进一步研究。

参考文献:

[1]张目,李伟.战略性新兴产业企业信用风险评价体系研究

[M].北京:科学出版社,2018:3-52.

[2]张学工.关于统计学习理论与支持向量机[J].自动化学

报,2000(1):32-41.

[3]VapnikV.统计学习理论的本质[M].张学工,译.北京:清

华大学出版社,2000:15-67.

[4]GohRY,Lee…Scoring:AReviewonSupport

VectorMachinesandMetaheuristicApproaches[J].Advances

[5]申晴,张连增.一种新的银行信用风险识别方法:

[6]周志华.集成学习:基础与算法[M].北京:电子工业出版

社,2020:21-77.

[7]吴冲,郭英见,夏晗.基于模糊积分支持向量机集成的商业

银行信用风险评估模型研究[J].运筹与管理,2009(2):

[8]吴冲,夏晗.基于五级分类支持向量机集成的商业银行信

用风险评估模型研究[J].预测,2009(4):57-61.

115-119.

SVM-KNN组合模型[J].金融监管研究,2020(7):23-37.

inOperationsResearch,2019,19(2):1-30.

y=+10.92190.84290.8806

y=-10.85530.92860.8904

y=+10.78790.86670.8254

y=-10.85190.76670.8070

y=+10.93850.87140.9037

y=-10.87840.94200.9091

y=+10.83330.83330.8333

y=-10.83330.83330.8333

y=+10.94200.92860.9353

y=-10.92860.94200.9353

y=+10.83870.86670.8525

y=-10.86210.83330.8475

y=+10.97010.92860.9489

y=-10.93060.97100.9504

y=+10.86670.86670.8667

y=-10.86670.86670.8667

模型1

度的表现能力,如何将k-可加模糊测度引入到本文

模型2

模型3

本文

模型

四、总结与展望

本文模型借鉴Boosting算法“注重”错分样本的

基本思想,考虑SVM基分类器的总体错分程度,重新

定义了SVM基分类器的模糊密度,能够更全面反映

SVM基分类器对某一类样本的相对重要程度;采用

Choquet模糊积分作为SVM基分类器的结合方法,从

而将基于Choquet模糊积分的SVM集成方法引入到

企业信用评估中,克服了Sugeno模糊积分的局限。

实证分析结果说明了本文模型的可行性和有效性。

·29·

Copyright©博看网. All Rights Reserved.

【理论研究】张目,许素娟基于Choquet模糊积分SVM集成的企业信用评估模型

[9]胡莲,胡波.模糊积分SVM集成的供应链金融信用风险评

估研究[J].物流技术,2014(9):362-364.

[10]夏晗.基于支持向量机回归集成的小微企业信用风险度

评估模型研究[J].征信,2019(4):21-27.

[11]WangG,dEnsembleApproachforEnterprise

CreditRiskAssessmentBasedonSupportVectorMachine[J].

ExpertSystemswithApplications,2012,39(5):5325-

[12]李丽,周宗放.企业集团信用风险评估SVM集成分类器

的构建与应用[J].技术经济,2013(11):65-70.

[13]胡莲.AdaBoost集成SVM的供应链金融信用风险评估

[J].征信,2014(11):19-22.

[14]LiuY,ChainFinanceCreditRisk

AssessmentUsingSupportVectorMachine–basedEnsemble

ImprovedwithNoiseElimination[J].InternationalJournal

[15]YaoG,HuXJ,EnsembleFeature

SelectionMethodbyIntegratingMultipleRanking

InformationCombinedwithanSVMEnsembleModelfor

EnterpriseCreditRiskPredictionintheSupplyChain[J].

[16]管涛,冯博琴.Choquet模糊积分的粗糙性及信息融合

[J].西安交通大学学报,2004(12):1251-1255.

[17]MurofushiT,rpretationofFuzzy

MeasuresandtheChoquetIntegralasanIntegralwith

RespecttoaFuzzyMeasure[J].FuzzySetsandSystems,

ExpertSystemswithApplications,2022,20(3):52-58.

ofDistributedSensorNetworks,2020,16(1):20-27.

5331.

[18]姜学东.多分类器融合中常用模糊积分的比较[D].保定:

河北大学,2010.

[19]倪渊,林健.基于Choquet模糊积分SVM集成及其实证研

究[J].工业工程,2012(2):66-70.

[20]LiXH,WangFQ,tVectorMachine

EnsembleBasedonChoquetIntegralforFinancialDistress

Prediction[J].InternationalJournalofPatternRecognition

[21]ofFuzzyIntegralsandItsApplication

[D].Tokyo:TokyoInstituteofTechnology,1974.

[22]哈明虎,吴从炘.模糊测度与模糊积分理论[M].北京:科

学出版社,1998:23-89.

[23]ilisticOutputsforSupportVectorMachines

andComparisonstoRegularizedLikelihoodMethods[A].

SmolaA,BartlettP,SchölkopfB,SchuurmansD.

MITPress,1999:61-74.

AdvancesinLargeMarginClassifiers[M].Cambridge:

[24]郑秀君.互联网金融背景下科技型中小企业信用评级实

证研究[J].征信,2015(9):54-58.

[25]蒋然,杨哲,封笑笑.科技型企业的信贷评价体系优化研

究:基于GA-BP神经网络模型[J].征信,2016(5):79-84.

[26]陈战勇.珠联璧合:基于机器学习的网络借贷信用评分卡

模型研究[J].武汉金融,2020(3):42-50.

andArtificialIntelligence,2015,29(4):17-26.

1989,29(2):201-227.

(责任编辑:姚文)

EnterpriseCreditEvaluationModelBasedonChoquetFuzzy

IntegralSVMIntegration

ZhangMu

1

,XuSujuan

1,2

(ofBigDataApplicationandEconomics,GuizhouUniversityofFinanceandEconomics,

Guiyang550025,Guizhou,China;uInstitutionforTechnologyInnovation&Entrepreneurship

Investment,Guiyang550025,Guizhou,China)

algorithmintheapplicationofenterprisecreditassessment,thispaperproposesanenterprisecreditevaluation

Abstract:InviewoftheshortcomingsofSVMintegrationmethodbasedonfuzzyintegralunderBagging

modeelcandrawonthebasic

Onthisbasis,theChoquetfuzzyintegralisusedasthecombinationmethodofSVMbasedclassifier,soasto

ssificationperformanceindicatorssuchasaccuracy

rate,recallrate,F1valueandMacro-F1valuearealsoobviouslysuperior,whichshowsthefeasibilityand

effectivenessofthemodel.

·30·

machines;integrationlearning;Baggingalgorithm

ideaofBoostingalgorithm,which"paysattentionto"misclassificationsamples,considertheoverallmisclassification

degreeofSVMbaseclassifier,andredefinethefuzzydensityofSVMbaseclassifiertoimprovethefuzzydensity.

introducetheSVMintegrationmet

empiricalresultsshowthat,comparedwiththosetraditionalmethods,thepredictionaccuracyofthemodelishigher,

Keywords:enterprisecreditassessment;improvedfuzzydensity;Choquetfuzzyintegral;supportvector

Copyright©博看网. All Rights Reserved.


发布者:admin,转转请注明出处:http://www.yc00.com/web/1712941802a2152364.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信