信用风险的预测方法、装置、设备和介质与流程

allin2024-10-16  33



1.本公开涉及大数据技术领域,具体涉及一种信用风险的预测方法、装置、设备和介质。


背景技术:

2.目前,对于信用风险的大数据分析通常是将每个客户的信息作为一个样本,运用机器学习方法对这些客户进行分类,得到每个客户的信用风险等级。但对于拥有千万级别以上客户数据的银行来说,在每增加一个新客户或增加一项新信息时,机器需要对全部数据进行重新计算和分类,这将会产生巨大的计算量,耗时且耗资源。


技术实现要素:

3.鉴于上述问题,本公开提供了一种信用风险的预测方法、装置、设备、介质和程序产品。
4.根据本公开的第一个方面,提供了一种信用风险的预测方法,包括以下步骤:
5.获取客户对获取个人信息的授权;
6.在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,所述n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数;
7.对所述n个客户的个人信息进行量化,得到个人信息矩阵,其中,所述个人信息矩阵为n行n列的矩阵,所述个人信息矩阵的每一行表示一个客户的经量化的个人信息;
8.针对所述个人信息矩阵,利用谱聚类方法计算与所述个人信息矩阵对应的图拉普拉斯矩阵,其中,所述图拉普拉斯矩阵为n行n列的矩阵;
9.采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,其中,所述特征矩阵为n行b列的矩阵,b为正整数且1≤b<n;
10.基于所述特征矩阵,采用聚类方法对所述n个客户进行分类;以及
11.根据分类后的n个客户,预测所述n个客户的信用风险。
12.根据本公开实施例中的预测方法,通过使用局部最优块共轭梯度法可快速搜索最佳的梯度方向,对每个客户的n个信息项进行降维,进而迅速得到图拉普拉斯矩阵的特征空间,计算速度快、占用内存小,大大降低了神经网络的计算量和训练速度。
13.根据一些示例性的实施例,所述采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,具体包括:
14.采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致;以及
15.根据确定出的搜索方向,确定与所述图拉普拉斯矩阵对应的特征矩阵。
16.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,具体包括:
17.基于所述图拉普拉斯矩阵,得到中间矩阵,其中,所述中间矩阵为n行b列的矩阵;
18.计算所述中间矩阵的特征值和特征向量;以及
19.根据所述中间矩阵的特征向量,生成第一子矩阵,其中,所述第一子矩阵中每一列的向量表示搜索方向,所述第一子矩阵中每一列的向量表示的搜索方向分别与待确定的特征矩阵中每一列的向量的方向对应,所述第一子矩阵为n行b列的矩阵。
20.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
21.根据所述中间矩阵的特征值和特征向量以及所述第一子矩阵,生成第二子矩阵,所述第二子矩阵为n行b列的矩阵;
22.其中,所述第二子矩阵中每一列的向量表示所述图拉普拉斯矩阵与所述第一子矩阵之间的残差向量。
23.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
24.根据所述中间矩阵的特征向量、所述第一子矩阵以及所述第二子矩阵,生成第三子矩阵,所述第三子矩阵为n行b列的矩阵;
25.其中,所述第一子矩阵、所述第二子矩阵和所述第三子矩阵构成表示搜索子空间的搜索矩阵。
26.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
27.根据所述中间矩阵的特征向量以及所述搜索矩阵,采用迭代方法更新所述第一子矩阵,
28.其中,在迭代过程中,根据前次迭代过程中的所述中间矩阵的特征向量以及前次迭代过程中的所述搜索矩阵,更新所述第一子矩阵,以生成当次迭代过程中的第一子矩阵。
29.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
30.在迭代过程中,根据当次迭代过程中的所述中间矩阵的特征值和特征向量以及当次迭代过程中的所述第一子矩阵,更新所述第二子矩阵,以生成当次迭代过程中的第二子矩阵。
31.根据一些示例性的实施例,所述第三子矩阵中每一列的向量表示相邻两次迭代过程中所述搜索子空间的基之间的差。
32.根据一些示例性的实施例,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
33.在迭代过程中,根据前次迭代过程中的所述中间矩阵的特征向量以及前次迭代过程中的第一子矩阵和第二子矩阵,更新所述第三子矩阵,以生成当次迭代过程中的第三子矩阵。
34.根据一些示例性的实施例,所述根据确定出的搜索方向,确定与所述图拉普拉斯矩阵对应的特征矩阵,具体包括:
35.在迭代过程中,当更新后的所述第二子矩阵中第i列的向量满足第一规定条件时,将更新后的所述第一子矩阵中第i列的向量确定为所述特征矩阵的一列,其中,i为正整数
且1≤i<b。
36.根据一些示例性的实施例,所述更新后的所述第二子矩阵中第i列的向量满足第一规定条件包括:
37.更新后的所述第二子矩阵中第i列的向量的范数小于规定的阈值。
38.根据一些示例性的实施例,所述基于所述图拉普拉斯矩阵,得到中间矩阵,具体包括:
39.基于所述图拉普拉斯矩阵、所述搜索矩阵和所述搜索矩阵的转置矩阵,生成所述中间矩阵。
40.根据一些示例性的实施例,所述迭代过程中首次使用的第一子矩阵为n行b列的随机矩阵。
41.根据一些示例性的实施例,所述方法还包括:当所述n个客户中至少一个客户的至少一个信息项发生变化时,更新所述特征矩阵;和/或,
42.在获取第n+1个客户的个人信息后,更新所述特征矩阵。
43.根据一些示例性的实施例,在更新所述特征矩阵的过程中,迭代过程中首次使用的第一子矩阵为更新前的特征矩阵。
44.本公开的第二方面提供了一种信用风险的预测装置,包括:
45.客户授权获取模块,用于获取客户对获取个人信息的授权;
46.个人信息获取模块,用于:在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,所述n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数;
47.个人信息矩阵获取模块,用于:对所述n个客户的个人信息进行量化,得到个人信息矩阵,其中,所述个人信息矩阵为n行n列的矩阵,所述个人信息矩阵的每一行表示一个客户的经量化的个人信息;
48.图拉普拉斯矩阵计算模块,用于:针对所述个人信息矩阵,利用谱聚类方法计算与所述个人信息矩阵对应的图拉普拉斯矩阵,其中,所述图拉普拉斯矩阵为n行n列的矩阵;
49.特征矩阵获取模块,用于:采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,其中,所述特征矩阵为n行b列的矩阵,b为正整数且1≤b<n;
50.分类模块,用于:基于所述特征矩阵,采用聚类方法对所述n个客户进行分类;以及
51.信用风险预测模块,用于:根据分类后的n个客户,预测所述n个客户的信用风险。
52.本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述的方法。
53.本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述的方法。
54.本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法。
附图说明
55.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
56.图1示意性示出了根据本公开实施例的信用风险的预测方法的应用场景图;
57.图2示意性示出了根据本公开实施例的信用风险的预测方法的流程图;
58.图3示意性示出了根据本公开实施例的利用局部最优块共轭梯度法对图拉普拉斯矩阵降维的流程图;
59.图4示意性示出了根据本公开实施例的信用风险的预测装置的结构框图;以及
60.图5示意性示出了根据本公开实施例的适于实现信用风险的预测方法的电子设备的方框图。
具体实施方式
61.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
62.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
63.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
64.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
65.目前,各大银行预测客户的信用风险通常是采用人工评判或机器预测实现的,人工分类带有主观因素影响较大,难以形成客观的评价标准,而对于应用机器学习来分类预测,通常是将每个客户的信息作为一个样本,然后利用svm(support vector machine,支持向量机)、神经网络或决策树等算法得到每个客户的信用风险等级。
66.但对于拥有千万级别以上客户数据的银行来说,在每增加一个新客户或增加一个新的信息项时,机器需要对全部数据进行重新计算和分类,这将会产生巨大的计算量,耗时且耗资源,且可能对变化的数据无法及时做出反应。
67.由于人工判断较为主观,因此本技术所提供的预测方法是在机器学习上改进的。在客户的多个信息项中,存在很多无关信息或不重要的信息,干扰信用风险的评估结果,还会增加没必要的计算负担,本技术是对这些信息进行有效的规避,以快速找到有用的信息项,进而对金融客户或企业的信用进行分类。与现有技术中降维不同的是,本技术使用了局部最优块共轭梯度法对图拉普拉斯矩阵进行降维,可以迅速逼近图拉普拉斯矩阵的特征空
间,因此本技术的预测方法具备占用内存少、计算快速的优点。
68.为了便于理解本技术的技术方案,下述将对本技术涉及到的技术术语进行介绍。
69.谱聚类算法:一种非监督机器学习方法,谱聚类算法是建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。
70.降维:是谱聚类算法中的关键步骤,在本技术中可以对输入的资料数据进行缩减,从而减少计算量。例如,数据量由n
×
n个下降到了n
×
b个,其中的b一定小于n。
71.特征向量与特征值:矩阵的特征向量是矩阵理论上的重要概念之一,线性变换的特征向量是一个非简并的向量,其方向在该变换下不变,该向量在此变换下缩放的比例成为其的特征值。从数学上看,如果向量v与变换a满足av=λv,则称向量v是变换a的一个特征向量,λ是相应的特征值。
72.特征空间:特征向量所在的空间,每一个特征对应特征空间中的唯一坐标。
73.下述将参照附图来描述本技术的实施例。但应当理解的是,这些描述只是示例型的,而并非要限制本技术的公开范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以及提供对本技术实施例的全面解释。然而,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆。
74.需要注意的是,在本技术的技术方案中,所涉及的客户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
75.图1示意性示出了根据本公开实施例的信用风险的预测方法的应用场景图。
76.如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
77.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
78.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
79.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
80.需要说明的是,本公开实施例所提供的信用风险的预测方法一般可以由服务器105执行。相应地,本公开实施例所提供的信用风险的预测装置一般可以设置于服务器105中。本公开实施例所提供的信用风险的预测方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信用风险的预测装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
81.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需
要,可以具有任意数目的终端设备、网络和服务器。
82.图2示意性示出了根据本公开实施例的信用风险的预测方法的流程图。
83.如图2所示,该实施例的预测方法包括操作s110~操作s170。
84.在操作s110,获取客户对获取个人信息的授权。
85.在本公开的实施例中,在获取客户的信息之前,都需要获得客户的同意或授权。例如,在操作s120之前,可以通知客户,向客户发出获取其个人信息以及相关联的其他信息的请求。在客户同意或授权可以获取个人信息的情况下,执行操作s120。
86.在操作s120,在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数。
87.在对客户进行信用风险预测之前,需要得到该客户相关的个人信息,也就是俗称的客户资料。从客户资料中,通常可以得知该客户的客户经营能力、盈利能力、偿债能力、发展能力、客户素质以及信用状态等的信息,根据这些相关信息,评判客户的信用。
88.获取客户的个人信息渠道可以是多样化的,例如,在具体示例中,可包括以下文字段:“某公司,2015年成立,营业额,每股收益,净利润增长率,履约情况,
……”
。从上述资料信息中可以得知征机构属性、运营情况的相关信息。在一些实例中,可以对上述资料信息做进一步地拓展,例如,机构的信息可以包括:企业登记补充信息、企业登记变更信息、股东登记信息、单位参保情况信息、企业法人、企业财务数据、企业纳税信息、企业纳税登记信息、企业公积金缴存信息等;其它信息例如:机构名称、企业营业收入、企业基础信息等。
89.在获得客户的个人信息后,将个人信息整理成n个信息项,即每个客户都对应n个信息项。但由于n个信息项中,可能存在部分信息项是相关联的,例如公司或个人收益高的,纳税也会相应增长,收益信息和纳税额度这两个信息项是一定呈正比存在的,因此可以将相关的信息项进行合并,从而达到降维的目的。本技术涉及到降维,因此在此操作中,获取到的信息项n为大于等于2的整数。
90.可以理解的是,多个信息项之间呈负比存在,也是同样可以做合并降维处理的。
91.在操作s130,对n个客户的个人信息进行量化,得到个人信息矩阵,其中,个人信息矩阵为n行n列的矩阵,个人信息矩阵的每一行表示一个客户的经量化的个人信息。
92.在降维之前,对n个客户的个人信息进行数学上的信息处理。
93.具体的处理方法可针对信息项中的具体内容做调整,例如,对于盈利能力(净利润、毛利率等)用简单的数字表示,再例如,履约情况用违约次数表示,或用违约次数与占信贷总次数的比例表示。
94.利用量化后的客户资料可用元素x
ij
表示,其中的i表示为第i个客户,j表示第i个客户的第j个信息项。因此i和j均可以表示为无向图中的节点。
95.在操作s140,针对个人信息矩阵,利用谱聚类方法计算与个人信息矩阵对应的图拉普拉斯矩阵,其中,图拉普拉斯矩阵为n行n列的矩阵。
96.在计算图拉普拉斯时,需要先利用量化后的个人信息生成邻接矩阵w。邻接矩阵是图的矩阵表示,借助他可以方便的存储图的结构,用线性代数的方法研究图的问题。本技术中的为对n个客户的求解,因此邻接矩阵w为n*n的矩阵,即,邻接矩阵w为n*n维度的矩阵,其中,矩阵元素是操作s130中得到的x
ij
元素,表示为边(i,j)的权重,如果两个节点之间没有
边连接,则在邻接矩阵中对应的元素为0。具体是通过k邻近法,利用knn算法遍历所有的样本点,只保留每个样本最近的k个点作为近邻,即只有和样本距离最近的k个点之间的w
ij
>0,其余均设定为0。
97.计算公式如下:
[0098][0099][0100]
上式中,xi为第i行的数据,即第i个客户的个人信息,xj为第j行的数据,即第j个客户的个人信息。
[0101]
可以理解为,(1)式代表只要xi在xj的k邻近集合中,就保留w
ij
;(2)式代表xi和xj的两个点必须相互在对方的k邻近集合中,才能保留w
ij

[0102]
对于w
ij
的计算,可以使用欧式距离度量任意两点(xi和xj)之间的距离。在预设函数过程中,常用的有多项式核函数、高斯核函数和sigmoid核函数。
[0103]
作为本技术的一个具体实施例,采用最常用的高斯核函数进行计算。
[0104][0105]
通过上述方法在得到邻接矩阵w后,进一步地计算对角矩阵d,即度矩阵。
[0106]
由于本技术属于无向图,对于无向图来说,节点的加权度是与该节点相关的所有边的权重值和。无向图的邻接矩阵w的节点i的加权度为邻接矩阵第i行元素之和。
[0107]
根据邻近矩阵w计算相应的对角矩阵d,公式为:
[0108][0109]
最终得到对角矩阵d为:
[0110][0111]
根据无向图中的n个节点(n个客户),邻接矩阵为w,对角矩阵为d,可以在邻接矩阵w和对角矩阵d的基础上定义图拉普拉斯矩阵,即,图拉普拉斯矩阵a被定义为对角矩阵d与邻接矩阵w之差:
[0112]
a=d-w
[0113]
在操作s150,采用局部最优块共轭梯度法对图拉普拉斯矩阵进行降维,得到与图拉普拉斯矩阵对应的特征矩阵,其中,特征矩阵为n行b列的矩阵,b为正整数且1≤b<n。
[0114]
求得的图拉普拉斯矩阵a为n*n维的矩阵,在此操作中,通过采用局部最优块共轭梯度法对图拉普拉斯矩阵进行降维,即从n*n维的图拉普拉斯矩阵,变为n*b维的特征矩阵。
[0115]
局部最优块共轭梯度法可探索最佳梯度方向,使得在机器训练和使用过程中,可以迅速逼近图拉普拉斯a的特征空间。
[0116]
在操作s160,基于特征矩阵,采用聚类方法对n个客户进行分类。
[0117]
对于n*b维的特征矩阵q,利用每一行的数据作为样本,采用k-means将客户分类。需要明确的是,特征矩阵q为n行b列的矩阵,此操作是将客户n中,每个客户对应的经过降维后的个人信息b作为样本,进行分类。
[0118]
在本公开的实施例中,在使用如上所述的降维方法得到n*b维的特征矩阵后,利用每一行的数据作为样本对客户进行分类,本公开的实施例不局限于上述的k-means聚类方法,还可以使用训练神经网络或决策树(包括经典决策树方法与随机森林等派生方法),将全部客户分类。
[0119]
需要注意的是,在实际应用中,根据经验表明,最后得到的b列应该与对客户进行分类后的类别的个数相同,否则误差会变大。即,若要把客户分为7类,则特征矩阵q中就应该有n*7的数据,即求图拉普拉斯a的7个特征向量,降维后的特征矩阵q是n行7列的矩阵。
[0120]
在操作s170,根据分类后的n个客户,预测n个客户的信用风险。
[0121]
将每个类别设置为不同的信用等级,也就是可将n个客户划分为b个类别,对应了b个信用风险。
[0122]
在一个具体实施例中,在执行完操作s160对客户分类完成后,调取所有客户的履约情况,以分类的组为单位,加和每组中客户的履约情况,然后根据得到的值进行排序。分数最高的,即一个组内履约情况最好的,可以对应设置为一级,第二高的对应设置为二级,以此类推。
[0123]
根据本公开实施例中的预测方法,通过使用局部最优块共轭梯度法可快速搜索最佳的梯度方向,对每个客户的n个信息项进行降维,进而迅速得到图拉普拉斯矩阵的特征空间,计算速度快、占用内存小,大大降低了神经网络的计算量和训练速度。
[0124]
图3示意性示出了根据本公开实施例的利用局部最优块共轭梯度法对图拉普拉斯矩阵降维的流程图。
[0125]
如图3所示,该实施例的降维过程包括操作s210~操作s220。
[0126]
在操作s210,采用迭代方法确定搜索方向,使得搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致。
[0127]
对于操作s210,首先,基于图拉普拉斯矩阵,得到中间矩阵,其中,中间矩阵为n行b列的矩阵。
[0128]
可以理解为,从图拉普拉斯矩阵a从n*n的维度,变为中间矩阵b中n*b的维度,即实现降维。
[0129]
在此步骤中的机器学习过程中,会涉及到求偏微分方程的解问题。在实际运用中,通过有限元方法可以简化求解的过程,得到近似的微积分方程的解。
[0130]
然后,计算中间矩阵的特征值和特征向量。
[0131]
最后,根据中间矩阵的特征向量,生成第一子矩阵,其中,第一子矩阵中每一列的向量表示搜索方向,第一子矩阵中每一列的向量表示的搜索方向分别与待确定的特征矩阵中每一列的向量的方向对应,第一子矩阵为n行b列的矩阵。
[0132]
本技术针对上述求解过程运用的算法是rayleigh-ritz method(瑞利-里茨法),
是直接从泛函数触发,找到可以最小化它的函数的过程。
[0133]
示例型的,rayleigh-ritz算法的应用方式可以为以下过程:
[0134]
输入:a∈r
n*n
,矩阵;
[0135]
s∈r
n*b
,矩阵,(0≤b<n);
[0136]
输出:θ:b阶对角矩阵
[0137]
y:b阶矩阵
[0138]
rr:
[0139]
计算矩阵b=s
t
as
[0140]
求b的全部特征向量y1,y2,...,yb与全部特征值θ1,θ2,...,θb[0141]
令y=[y
1 y2…
yb],
[0142]
其中,矩阵b为中间矩阵,输入的矩阵a为图拉普拉斯矩阵,s为搜索矩阵,输出的矩阵θ为特征值矩阵,输出的y为特征向量,rr是rayleigh-ritz的缩写,它表示rayleigh-ritz算法。
[0143]
上述算法可以解释为,在s∈r
n*b
中计算一个正交基数,逼近与b个特征向量对应的特征空间(b为想得到的类别个数,在操作s160和s170中有具体解释),计算中间矩阵b,并求解中间矩阵b的特征向量y和特征值θ。
[0144]
在计算中间矩阵b时,基于图拉普拉斯矩阵、搜索矩阵和搜索矩阵的转置矩阵,生成中间矩阵,即,b=s
t
as。
[0145]
下述将利用rayleigh-ritz算法求得的特征值θ和特征向量y对图拉普拉斯矩阵进行降维。
[0146]
根据中间矩阵的特征值和特征向量以及第一子矩阵,生成第二子矩阵,第二子矩阵为n行b列的矩阵;其中,第二子矩阵中每一列的向量表示图拉普拉斯矩阵与第一子矩阵之间的残差向量。
[0147]
根据中间矩阵b、特征向量y以及特征值θ求解第二子矩阵r0,残差向量表征想要达到的精确度。
[0148]
此过程中,可以再次使用rayleigh-ritz,利用
[0149]
rr(y,θ)=rr(a,x0)
[0150]
其中的x0为随机矩阵,x0为n行b列的矩阵,即x0∈r
n*b
,然后通过
[0151]
r0=ax
0-x0θ0[0152]
求得第二子矩阵r0,第二子矩阵r0可以理解为搜索子空间残差的方向。
[0153]
需要注意的是,在迭代过程中首次使用的第一子矩阵为n行b列的随机矩阵,即第一子矩阵为x0。
[0154]
根据中间矩阵的特征向量、第一子矩阵以及第二子矩阵,生成第三子矩阵,第三子矩阵为n行b列的矩阵;其中,第一子矩阵、第二子矩阵和第三子矩阵构成表示搜索子空间的搜索矩阵。
[0155]
根据中间矩阵的特征向量y、第一子矩阵x0和第二子矩阵r0求解第三子矩阵p0,最后第一子矩阵x0、第二子矩阵r0和第三子矩阵p0构成表示搜索子空间的搜索矩阵s0,即可以
表示为
[0156]
s0=[x0,r0,p0]
[0157]
根据中间矩阵的特征向量以及搜索矩阵,采用迭代方法更新第一子矩阵,其中,在迭代过程中,根据前次迭代过程中的中间矩阵的特征向量以及前次迭代过程中的搜索矩阵,更新第一子矩阵,以生成当次迭代过程中的第一子矩阵。
[0158]
在迭代过程中,根据当次迭代过程中的中间矩阵的特征值和特征向量以及当次迭代过程中的第一子矩阵,更新第二子矩阵,以生成当次迭代过程中的第二子矩阵。
[0159]
在迭代过程中,根据前次迭代过程中的中间矩阵的特征向量以及前次迭代过程中的第一子矩阵和第二子矩阵,更新第三子矩阵,以生成当次迭代过程中的第三子矩阵。
[0160]
在计算机领域,k可以用来表示迭代次数,通常在下角标注明。在迭代过程中,每经历一次迭代过程,中间矩阵的特征向量、第一子矩阵、第二子矩阵值和第三子矩阵在原有下角标的基础上的+1,基于中间矩阵的特征向量、第一子矩阵、第二子矩阵值和第三子矩阵的关系,迭代过程可以表示为:
[0161]
x
k+1
=skyk[0162]
p
k+1
=[0,rk,pk]yk[0163]rk+1
=ax
k+1-x
k+1
θ
k+1
[0164]
k=k+1
[0165]
进一步地,其中,第三子矩阵中每一列的向量表示相邻两次迭代过程中搜索子空间的基之间的差。
[0166]
在操作s220,根据确定出的搜索方向,确定与图拉普拉斯矩阵对应的特征矩阵。
[0167]
对于操作s220,在迭代过程中,当更新后的第二子矩阵中第i列的向量满足第一规定条件时,将更新后的第一子矩阵中第i列的向量确定为特征矩阵的一列,其中,i为正整数且1≤i<b。
[0168]
进一步地,更新后的第二子矩阵中第i列的向量满足第一规定条件包括:更新后的第二子矩阵中第i列的向量的范数小于规定的阈值。
[0169]
例如,在本公开的实施例中,可以按照如下迭代过程确定特征矩阵q。
[0170]
(1)生成随机矩阵x0∈r
n*b
,(0≤b<n);
[0171]
(2)使用rayleigh-ritz算法计算特征向量和特征值:ritz算法计算特征向量和特征值:
[0172]
(3)给出迭代初始值:r0:=ax
0-x
0 θ0,k:=0,q:=[],p0:=[];
[0173]
(4)当特征矩阵q的列数小于b时,执行如下迭代过程:
[0174]
让q与rk规范正交化;
[0175]
令sk:=[xk,rk,pk],
[0176]
x
k+1
:=skyk;
[0177]
p
k+1
:=[0,rk,pk]yk;
[0178]rk+1
:=ax
k+1-x
k+1 θk
+1

[0179]
k:=k+1;
[0180]
如果矩阵r
k+1
某些列的范数小于规定的阈值ε,将x
k+1
中对应的列放进特征矩阵q中;把x
k+1
中对应的列置为随机向量,然后:x0:=x
k+1
,k:=0,执行上述迭代过程,直至特征
矩阵q的列数等于b。
[0181]
根据本技术的一个实施例,该预测方法还包括:当n个客户中至少一个客户的至少一个信息项发生变化时,更新特征矩阵;和/或,在获取第n+1个客户的个人信息后,更新特征矩阵。
[0182]
在每增加一个新信息项、变动其中一个客户的信息项对应的字段值以及添加一个新客户时,必然伴随着图拉普拉斯矩阵的更新,进而特征矩阵也会得到更新。
[0183]
在一个实施例中,在更新特征矩阵的过程中,迭代过程中首次使用的第一子矩阵为更新前的特征矩阵。
[0184]
对于现有技术中的每增加一个新信息项、变动其中一个客户的信息项对应的字段值以及添加一个新客户时,需要重新对所有的数据进行计算的情况。
[0185]
考虑到即使添加新的信息项或增加一个新客户,各类特征值变化不大,新计算得到的特征空间与原有的特征空间必然接近,因此可以迅速得到新的特征空间。通过上述理念,本技术的预测方法是在原有的特征矩阵上进行计算的,在客户的信息发生变动时,可以在现有的图拉普拉斯矩阵的特征空间上建立新的图拉普拉斯矩阵的特征空间,即在操作s150中的x0=0直接替换为令x0=q。
[0186]
在一次试验中,第二次计算的速度可比第一次计算快数百倍到数千倍。可以断定,用本技术的预测方法可以减少机器计算量,进而节约资源,减少计算时间。
[0187]
基于上述信用风险的预测方法,本公开还提供了信用风险的预测装置。以下将结合图4对该装置进行详细描述。图4示意性示出了根据本公开实施例的预测装置的结构框图。
[0188]
如图4所示,该实施例的预测装置800包括客户授权获取模块810、个人信息获取模块820、个人信息矩阵获取模块830、图拉普拉斯矩阵计算模块840、特征矩阵获取模块850、分类模块860和信用风险预测模块870。
[0189]
客户授权获取模块810用于获取客户对获取个人信息的授权。在一个实施例中,客户授权获取模块810可以用于执行前文描述的操作s110,在此不再赘述。
[0190]
个人信息获取模块820用于:在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数。在一个实施例中,个人信息获取模块820可以用于执行前文描述的操作s120,在此不再赘述。
[0191]
个人信息矩阵获取模块830用于:对n个客户的个人信息进行量化,得到个人信息矩阵,其中,个人信息矩阵为n行n列的矩阵,个人信息矩阵的每一行表示一个客户的经量化的个人信息。在一个实施例中,个人信息矩阵获取模块可以用于执行前文描述的操作s130,在此不再赘述。
[0192]
图拉普拉斯矩阵计算模块840用于:针对个人信息矩阵,利用谱聚类方法计算与个人信息矩阵对应的图拉普拉斯矩阵,其中,图拉普拉斯矩阵为n行n列的矩阵。在一个实施例中,图拉普拉斯矩阵计算模块可以用于执行前文描述的操作s140,在此不再赘述。
[0193]
特征矩阵获取模块850用于:采用局部最优块共轭梯度法对图拉普拉斯矩阵进行降维,得到与图拉普拉斯矩阵对应的特征矩阵,其中,特征矩阵为n行b列的矩阵,b为正整数且1≤b<n。在一个实施例中,特征矩阵获取模块可以用于执行前文描述的操作s150,在此
不再赘述。
[0194]
分类模块860用于:基于特征矩阵,采用聚类方法对n个客户进行分类。在一个实施例中,分类模块可以用于执行前文描述的操作s160,在此不再赘述。
[0195]
信用风险预测模块870用于:根据分类后的n个客户,预测n个客户的信用风险。在一个实施例中,信用风险预测模块830可以用于执行前文描述的操作s170,在此不再赘述。
[0196]
根据本公开实施例中的预测装置,可以执行上述的预测方法,通过使用局部最优块共轭梯度法可快速搜索最佳的梯度方向,对每个客户的n个信息项进行降维,进而迅速得到图拉普拉斯矩阵的特征空间,计算速度快、占用内存小,大大降低了神经网络的计算量和训练速度。
[0197]
根据本公开的实施例,客户授权获取模块810、个人信息获取模块820、个人信息矩阵获取模块830、图拉普拉斯矩阵计算模块840、特征矩阵获取模块850、分类模块860和信用风险预测模块870中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,客户授权获取模块810、个人信息获取模块820、个人信息矩阵获取模块830、图拉普拉斯矩阵计算模块840、特征矩阵获取模块850、分类模块860和信用风险预测模块870中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任伺其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,客户授权获取模块810、个人信息获取模块820、个人信息矩阵获取模块830、图拉普拉斯矩阵计算模块840、特征矩阵获取模块850、分类模块860和信用风险预测模块870中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0198]
图5示意性示出了根据本公开实施例的适于实现信用风险的预测方法的电子设备的方框图。
[0199]
如图5所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0200]
在ram 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、rom 902以及ram 903通过总线904彼此相连。处理器901通过执行rom 902和/或ram 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 902和ram 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0201]
根据本公开的实施例,电子设备900还可以包括输入/输出(i/o)接口905,输入/输出(i/o)接口905也连接至总线904。电子设备900还可以包括连接至i/o接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示
器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
[0202]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0203]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 902和/或ram 903和/或rom 902和ram 903以外的一个或多个存储器。
[0204]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的信用风险预测方法。
[0205]
在该计算机程序被处理器901执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0206]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分909被下载和安装,和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任伺适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0207]
在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0208]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c++,python,“c”语言或类似的程序设计语言。程序代码可以完全地在客户计算设备上执行、部分地在客户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到客户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0209]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0210]
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0211]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

技术特征:
1.一种信用风险的预测方法,其特征在于,包括以下步骤:获取客户对获取个人信息的授权;在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,所述n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数;对所述n个客户的个人信息进行量化,得到个人信息矩阵,其中,所述个人信息矩阵为n行n列的矩阵,所述个人信息矩阵的每一行表示一个客户的经量化的个人信息;针对所述个人信息矩阵,利用谱聚类方法计算与所述个人信息矩阵对应的图拉普拉斯矩阵,其中,所述图拉普拉斯矩阵为n行n列的矩阵;采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,其中,所述特征矩阵为n行b列的矩阵,b为正整数且1≤b<n;基于所述特征矩阵,采用聚类方法对所述n个客户进行分类;以及根据分类后的n个客户,预测所述n个客户的信用风险。2.根据权利要求1所述的方法,其特征在于,所述采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,具体包括:采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致;以及根据确定出的搜索方向,确定与所述图拉普拉斯矩阵对应的特征矩阵。3.根据权利要求2所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,具体包括:基于所述图拉普拉斯矩阵,得到中间矩阵,其中,所述中间矩阵为n行b列的矩阵;计算所述中间矩阵的特征值和特征向量;以及根据所述中间矩阵的特征向量,生成第一子矩阵,其中,所述第一子矩阵中每一列的向量表示搜索方向,所述第一子矩阵中每一列的向量表示的搜索方向分别与待确定的特征矩阵中每一列的向量的方向对应,所述第一子矩阵为n行b列的矩阵。4.根据权利要求3所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:根据所述中间矩阵的特征值和特征向量以及所述第一子矩阵,生成第二子矩阵,所述第二子矩阵为n行b列的矩阵;其中,所述第二子矩阵中每一列的向量表示所述图拉普拉斯矩阵与所述第一子矩阵之间的残差向量。5.根据权利要求4所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:根据所述中间矩阵的特征向量、所述第一子矩阵以及所述第二子矩阵,生成第三子矩阵,所述第三子矩阵为n行b列的矩阵;其中,所述第一子矩阵、所述第二子矩阵和所述第三子矩阵构成表示搜索子空间的搜索矩阵。6.根据权利要求2-5中任一项所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:
根据所述中间矩阵的特征向量以及所述搜索矩阵,采用迭代方法更新所述第一子矩阵,其中,在迭代过程中,根据前次迭代过程中的所述中间矩阵的特征向量以及前次迭代过程中的所述搜索矩阵,更新所述第一子矩阵,以生成当次迭代过程中的第一子矩阵。7.根据权利要求6所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:在迭代过程中,根据当次迭代过程中的所述中间矩阵的特征值和特征向量以及当次迭代过程中的所述第一子矩阵,更新所述第二子矩阵,以生成当次迭代过程中的第二子矩阵。8.根据权利要求7所述的方法,其特征在于,所述第三子矩阵中每一列的向量表示相邻两次迭代过程中所述搜索子空间的基之间的差。9.根据权利要求8所述的方法,其特征在于,所述采用迭代方法确定搜索方向,使得所述搜索方向逐渐与待确定的特征矩阵中每一列的向量的方向一致,还具体包括:在迭代过程中,根据前次迭代过程中的所述中间矩阵的特征向量以及前次迭代过程中的第一子矩阵和第二子矩阵,更新所述第三子矩阵,以生成当次迭代过程中的第三子矩阵。10.根据权利要求9所述的方法,其特征在于,所述根据确定出的搜索方向,确定与所述图拉普拉斯矩阵对应的特征矩阵,具体包括:在迭代过程中,当更新后的所述第二子矩阵中第i列的向量满足第一规定条件时,将更新后的所述第一子矩阵中第i列的向量确定为所述特征矩阵的一列,其中,i为正整数且1≤i<b。11.根据权利要求10所述的方法,其特征在于,所述更新后的所述第二子矩阵中第i列的向量满足第一规定条件包括:更新后的所述第二子矩阵中第i列的向量的范数小于规定的阈值。12.根据权利要求3所述的方法,其特征在于,所述基于所述图拉普拉斯矩阵,得到中间矩阵,具体包括:基于所述图拉普拉斯矩阵、所述搜索矩阵和所述搜索矩阵的转置矩阵,生成所述中间矩阵。13.根据权利要求6所述的方法,其特征在于,所述迭代过程中首次使用的第一子矩阵为n行b列的随机矩阵。14.根据权利要求13所述的方法,其特征在于,所述方法还包括:当所述n个客户中至少一个客户的至少一个信息项发生变化时,更新所述特征矩阵;和/或,在获取第n+1个客户的个人信息后,更新所述特征矩阵。15.根据权利要求14所述的方法,其特征在于,在更新所述特征矩阵的过程中,迭代过程中首次使用的第一子矩阵为更新前的特征矩阵。16.一种信用风险的预测装置,其特征在于,包括:客户授权获取模块,用于获取客户对获取个人信息的授权;个人信息获取模块,用于:在得到客户对获取个人信息的授权的情况下,获取n个客户的个人信息,其中,每一个客户的个人信息包括n个信息项,所述n个信息项均与信用风险相关,n为大于等于1的整数,n为大于等于2的整数;个人信息矩阵获取模块,用于:对所述n个客户的个人信息进行量化,得到个人信息矩
阵,其中,所述个人信息矩阵为n行n列的矩阵,所述个人信息矩阵的每一行表示一个客户的经量化的个人信息;图拉普拉斯矩阵计算模块,用于:针对所述个人信息矩阵,利用谱聚类方法计算与所述个人信息矩阵对应的图拉普拉斯矩阵,其中,所述图拉普拉斯矩阵为n行n列的矩阵;特征矩阵获取模块,用于:采用局部最优块共轭梯度法对所述图拉普拉斯矩阵进行降维,得到与所述图拉普拉斯矩阵对应的特征矩阵,其中,所述特征矩阵为n行b列的矩阵,b为正整数且1≤b<n;分类模块,用于:基于所述特征矩阵,采用聚类方法对所述n个客户进行分类;以及信用风险预测模块,用于:根据分类后的n个客户,预测所述n个客户的信用风险。17.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~15中任一项所述的方法。18.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~15中任一项所述的方法。19.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~15中任一项所述的方法。

技术总结
本公开提供了一种信用风险的预测方法,可用于大数据技术领域。该方法包括:获取n个客户的个人信息,其中,每一个客户的个人信息包括N个信息项;对n个客户的个人信息进行量化,得到个人信息矩阵;针对个人信息矩阵,利用谱聚类方法计算与个人信息矩阵对应的图拉普拉斯矩阵;采用局部最优块共轭梯度法对图拉普拉斯矩阵进行降维,得到与图拉普拉斯矩阵对应的特征矩阵;基于特征矩阵,采用聚类方法对n个客户进行分类;以及根据分类后的n个客户,预测n个客户的信用风险。根据本公开实施例中的预测方法,通过局部最优块共轭梯度法可迅速得到图拉普拉斯矩阵的特征空间,计算速度快、占用内存小。小。小。


技术研发人员:乔媛 朱道彬 闫冬梅 汪婕
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2022.04.29
技术公布日:2022/7/4
转载请注明原文地址: https://www.8miu.com/read-17070.html

最新回复(0)