Copula系列(一)-什么是Copula函数

admin•2025-09-17 09:18:07•网站建设•阅读51

2024年1月7日发(作者：)

最近在学习过程中学习了Copula函数，在看了一些资料的基础上总结成了本文，希望对后面了解该知识的同学有所帮助。本文读者要已知概率分布，边缘分布，联合概率分布这几个概率论概念。我们为什么要引入Copula函数？当边缘分布（marginal

probability distribution）不同的随机变量（random variable），互相之间并不独立的时候，此时对于联合分布的建模会变得十分困难。此时，在已知多个已知边缘分布的随机变量下，Copula函数则是一个非常好的工具来对其相关性进行建模。什么是Copula函数？copula这个单词来自于拉丁语，意思是“连接”。最早是由Sklar在1959年提出的，即Sklar定理：以二元为例，若 H(x,y) 是一个具有连续边缘分布的

F(x) 与 G(y) 的二元联合分布函数，那么存在唯一的Copula函数 C ，使得

H(x,y)=C(F(x),G(y)) 。反之，如果 C 是一个copula函数，而 F 和 G 是两个任意的概率分布函数，那么由上式定义的 H 函数一定是一个联合分布函数，且对应的边缘分布刚好就是 F 和 G 。Sklars theorem : Any multivariate joint distribution

can be written in terms of univariate marginal distribution functions and a

copula which describes the dependence structure between the two

认为，对于N个随机变量的联合分布，可以将其分解为这N个变量各自的边缘分布和一个Copula函数，从而将变量的随机性和耦合性分离开来。其中，随机变量各自的随机性由边缘分布进行描述，随机变量之间的耦合特性由Copula函数进行描述。换句话说，一个联合分布关于相关性的性质，完全由其Copula函数决定。如果已知 H ， F 和 G ，则Copula函数可以表达为：C(u,v)=H(F^{-1}(u),G^{-1}(v))这里 F^{-1}(u) 代表 F(u) 的反函数，或者叫CDF的逆变换、逆累积分布函数。Copula理论的数学表达假设 X_1,X_2,...,X_N 是 N 个随机变量，它们各自的边缘分布分别为 F_1(x_1), F_2(x_2),...,F_N(x_N) ，它们的联合分布为

H(x_1,x_2,...,x_N) ，则存在一个将边缘分布和联合分布“连接”起来的函数

C(cdot) ，使得：H(x_1,x_2,...,x_N)=C(F_1(x_1),F_2(x_2),...,F_N(x_N))而根据边缘分布的CDF的逆变换，即 x_i=F_i^{-1}(u_i)(i=1,2,...,N) ，则可以得到Copula函数的表达形式：C(u_1,u_2,...,u_N)=H[F^{-1}(u_1),F_2^{-1}(u_2),...,F_N(x_N)]补充知识：概率积分变换（Probability Integral

transform）在概率论中，概率积分变换(也称为均匀的普适性)是指将任意给定连续分布的随机变量的数据值转换成具有标准均匀分布的随机变量的结果。简单解释一下概率积分变换[1]：如果 X_1 和 X_2 都是随机变量（Random Variables，RV），而

U_1 、 U_2 分别是二者的累计概率分布函数，即 U_1=F(X_1)，U_2=F(X_2)那么：U_1

和 U_2 都服从均匀分布， U_1sim Uniform(0,1)，U_2sim Uniform(0,1)简要的数学证明如下：F_u(u)=P(Ule u)=P(F(x)le u)=P(F^{-1}(F(x))le F^{-1}(u))=P(xle F^{-1}(u))=F(F^{-1}(u))=u换句话说，任何边际分布的CDF值都均匀分布在区间[0,1]上。如果从任意分布中随机抽取，那么抽取该分布的最大值(U=1)的概率与抽取可能的最小值(U=0)或中值(U= 5)的概率相同。而copula实际上是它所建模的随机变量的CDFs的联合分布。补充知识：概率积分变换的图象说明[2]首先我们可以生成均匀分布的随机变量 x ：%matplotlib inlineimport seaborn as

snsfrom scipy import statsimport as pltx = m(,

1).rvs(10000)ot(x, kde=False, norm_hist=True);

下面，我们想要转化这些样本使他们变成正态分布。那么，我们只需要以 x为CDF值，对正态分布求逆即可，即 F(x_{trans})=x,F^{-1}(x)=x_{trans} 。scipy库中有ppf方法可以满足需求。(q, loc=0, scale=1)：Percent point

function (inverse of cdf — percentiles).x_trans =

().ppf(x)ot(x_trans);

如果我们将 x 和 x_{trans} 的分布画在一张图中，就可以直观的看出逆CDF函数的样子。h = lot(x, x_trans,

stat_func=None)_axis_labels('original', 'transformed', fontsize=16);

同理，我们也可以基于 Beta 分布或者 Gumbel 分布来得到类似的图像，这种概率积分变换的本质是相同的。beta = (a=10, b=3)x_trans =

(x)h = lot(x, x_trans,

stat_func=None)_axis_labels('orignal', 'transformed (beta)',

fontsize=16);g("",dpi=300) # save fig filegumbel

= _l()x_trans = (x)h = lot(x,

x_trans, stat_func=None)_axis_labels('original', 'transformed

(Gumbel)', fontsize=16);g("",dpi=300) # save

fig file

而我们如果想要从一个任意的分布到均匀分布(0,1)，那么我们只需要进行一次CDF就可以了。这里我将 x_{trans} 再做一次转化，即：x_trans_trans =

(x_trans)h = lot(x_trans, x_trans_trans,

stat_func=None)_axis_labels('original', 'transformed',

fontsize=16);g("",dpi=300) # save fig file

Copula函数的形式copula函数非常多，以二元为例，只需要满足下面3个条件的函数即为Copula函数：1、定义域为 [0,1]times[0,1] ，值域为 [0,1] ，即

C:[0,1]times[0,1]rightarrow[0,1]2、

C[u,0]=C(0,v)=0,C(u,1)=C(1,u)=u,C(v,1)=C(1,v)=v3、 0le frac{partial

C(u,v)}{partial u}le1,0le frac{partial C(u,v)}{partial v}le1 ，或

C(u_{2},v_{2})-C(u_{2},v_{1})-C(u_{1},v_{2})+C(u_{1},v_{1})geq 0 ，对于任意的 0leq u_{1}leq u_{2}leq 1和0leq v_{1}leq v_{2}leq 1在研究中使用最多的 Copula 函数主要有阿基米德 Copula 函数簇和椭圆 Copula 函数簇(Nelsen

1999[4])两大类。椭圆 Copula 函数簇椭圆 Copula 函数簇有t Copula函数、Gaussian Copula函数等，两者均有对称的尾部相关性，在中心区域差别不大，差别主要体现在尾部的厚度。这类copula函数，同时通过已知的多元分布来计算出来的。最为人所知的就是多元正态分布的copula，即高斯copula。Gaussian copula：高斯

copula是a distribution over the unit cube [0,1]^{d} 。它是从多元正态分布

R^d 通过概率积分变换得到的。对于一个给定的协方差矩阵（correlation matrix）

Rin [-1,1]^{dtimes d} ，基于参数矩阵R的高斯Copula可以表达成：C_{R}^{text{Gauss}}(u)=Phi _{R}left(Phi ^{-1}(u_{1}),dots ,Phi ^{-1}(u_{d})right)其中， Phi ^{-1} 是标准正态分布的逆累积分布函数， Phi

_{R} 为多元正态分布的联合累积分布函数，它的均值向量为0.，协方差矩阵为 R 。阿基米德 Copula 函数簇阿基米德 Copula 函数簇的分布函数定义首先由Genest和Mackay在1986年给出，这一类函数有着统一的函数表达形式：C(u_1,u_2,...,u_N)=varphi^{-1}(varphi(u_1)+varphi(u_2)+...+varphi(u_N))如果用wiki加上参数的表示法，则为[4]：C(u_1,u_2,...,u_N;theta)=varphi^{-1}(varphi(u_1;theta)+varphi(u_2;theta)+...+varphi(u_N;theta))其中，函数 varphi(cdot) 称为阿基米德Copula函数的生成元（或者叫生成函数，generator function），生成元需要满足：条件1：

varphi:[0,1]timesThetarightarrow[0,infty) 是一个连续，严格减函数和凸函数，且 varphi(1)=0 （ varphi(1;theta)=0 ）。条件2： varphi^{-1}(t;theta)=begin{cases}varphi^{-1}(t;theta) text{if} 0le t le

varphi(0;theta) 0 quad qquad text{if} varphi(0;theta)le t

le inftyend{cases} ，并且要求 varphi^{-1} 在 [0,infty) 是N维单调的，即：(-1)^kvarphi^{-1,(k)}(t;theta)ge 0 ，对任意的 0le t le 1 ，

k=0,1,...,d-2 成立且 (-1)^{d-2}varphi^{-1,(d-2)}(t;theta) 是一个非增凸函数。条件2，对于二元来说，即需要满足对任意的 0le t le 1 ，有 varphi^{-1,'}(t)<0,varphi^{-1,''}(t)>0根据不同的生成元函数能够得到不同的阿基米德Copula函数，常见有：Frank Copula、Clayton Copula 及 Gumbel Copula。Gumbel

Copula函数对上尾部的厚尾特性比较敏感，对下尾部的厚尾特性不敏感，因此适合于对上尾部厚尾特性明显而下尾部厚尾特性不明显的耦合结构建模；Clayton Copula 函数适合于对下尾部厚尾特性明显而上尾部厚尾特性不明显的耦合结构建模；FrankCopula 的密度分布呈“U”字形，适合于描述具有对称厚尾结构变量的耦合关系。以上五种Copula 函数的二元分布函数表达式，二元copula函数和生成元如下：

更多阿基米德函数Copula函数，可以参考Nelsen，An introduction to copulas一书中Table 4.1。一个简单的高斯Copula例子[2]数学讲太多了让人烦躁。我们构建一个简单的例子，来看如何利用概率积分变换来认识高斯copula。首先从二元正态分布中生成样本：mvnorm = ariate_normal(mean=[0, 0], cov=[[1.,

0.5], [0.5, 1.]])# Generate random samples from multivariate normal with

correlation .5x = (100000)h = lot(x[:, 0], x[:, 1],

kind='kde', stat_func=None);_axis_labels('X1', 'X2', fontsize=16);

通过给 X_1 ， X_2 的CDF进行采样，我们可以将其转化成均匀分布。norm =

()x_unif = (x)h = lot(x_unif[:, 0], x_unif[:,

1], kind='hex', stat_func=None)_axis_labels('Y1', 'Y2',

fontsize=16);g("") # save fig file

现在，我们在上面的基础上（构建的高斯Copula函数），把边缘分布换成Beta分布和Gumbel分布：m1 = _l()m2 = (a=10, b=2)x1_trans =

(x_unif[:, 0])x2_trans = (x_unif[:, 1])h =

lot(x1_trans, x2_trans, kind='kde', xlim=(-6, 2), ylim=(.6, 1.0),

stat_func=None);_axis_labels('X1_trans', 'X1_trans',

fontsize=16);g("") # save fig file

那如果没有二者的耦合关系，这个图是怎样的呢？

两张图对比一下，还是很容易看出区别的吧！这就是我们使用copula函数内在的方法了，其核心还是通过均匀分布。应用领域Copula函数主要应用在哪里呢？该工具最初是用在金融衍生品领域，该函数建模作为衍生品风险度量的工作进行使用。在2008年金融危机中，这个工具被人广发的提及，认为当时采用的高斯copula没有能够完整度量衍生品连带之间的风险，从而导致一系列的违约，进而引发次贷危机、经济危机。也有人事后写了“‘The Formula That Killed Wall Street’: The Gaussian

Copula and Modelling Practices in Investment Banking”（杀死华尔街的公式：高斯copula和在投行的建模应用）的文章来介绍这个工具和现实社会经济的关系，包括很有名的电影《大空头》（The big short），也有这段的描写。不过我觉得，这种工具显然是能够看到其建模的缺陷之处，把引发金融危机的原因归结为一个工具显然是一个甩锅行为啦，危机绝大多数还是人为。说回工具本身，除了金融领域，现在很

多研究概率分布的领域都在使用copula，例如电力系统领域研究风电、光伏等间歇性能源，也在使用这种方法进行建模。

发布者：admin，转转请注明出处：http://www.yc00.com/web/1704581972a1358850.html

函数分布边缘概率联合

admin

网站建设
filter 过滤方法
filter 过滤方法
admin
2024-7-5
850
建站资讯
sqlserver 的时间方法
sqlserver 的时间方法
admin
2024-7-17
1020
网站建设
r语言counts函数
r语言counts函数
admin
2024-8-28
2630
建站资讯
hive的爆炸函数
hive的爆炸函数
admin
2024-8-29
1430
网站建设
Windows常用系统函数
注：百度OpenService函数时发现的，转过来记录下，还比较常用的全面的系统函数。1.窗口信息 MS为我们提供了打开特定桌面和枚举桌面窗口的函数。 hDeskOpen
admin
8月前
270
网站建设
python open函数在windows下的的路径的三种正确表达方式
with open(D:myprojectpythona1234.txt) as f:print(f.readlines()) with open(D:myprojectpythona1234.txt) as f:pri
admin
6月前
520
网站建设
windows客户端开发--通过ShellExecute函数打开浏览器
在我们的客户端中常常会有一些link，点击后希望通过浏览器导航到该链接。我们是通过ShellExecute函数来实现的。 ShellExecute的功能是运行一个外部程序（或者是打开一个已注册的文件、打开一个目录、打印一个文件等等），
admin
5月前
380
网站建设
static修饰的函数只能在本文件中调用，其他文件想调用怎么办？
一句话总结：static修饰的变量和函数是有可见范围的，一般情况下不要越限处理。利用可在本文件调用的属性，另加一个函数fun，fun调用该static
admin
5月前
480
网站建设
EasyNVR无插件H5HLSm3u8直播解决方案中Windows系统服务启动错误问题的修复：EasyNVR_Service 服务因函数不正确。服务特定错误而停止。
最近在做某地市移动公司景观直播的项目时，遇到一个问题，当我们部署EasyNVR为系统服务后，居然出现了无法启动服务的现象，表面上看&#xff0c
admin
5月前
420
网站建设
60、边缘计算与能力导向架构：深入解析
边缘计算与能力导向架构：深入解析1 边缘计算的基础与定义边缘计算是一个快速发展的领域，它将计算资源推向数据生成的源头，使得计算更贴近物理世界。与云计算不同，边缘计算强调在上下文中进行计算，以提供即时响应和高效处理。边缘计算不仅涵盖了
admin
1月前
230
网站建设
JavaScript中的立即执行函数表达式（Immediately Invoked Function Expression, IIFE）
聚沙成塔·每天进步一点点本文回顾⭐ 专栏简介JavaScript中的立即执行函数表达式（Immediately Invoked Function Expression, IIFE）1. 引言2.
admin
1月前
320
网站建设
Dynamic Potential-Based Reward Shaping将势能塑形奖励函数拓展为F(s,t,s‘,t‘)
摘要基于势能的奖励塑形可以显著降低学习最优策略所需的时间，并且在多agent系统中，可以显著提高最终联合策略的性能。已经证明，它不会改变一个agent单独学习的最优策略或
admin
1月前
270
网站建设
RFdiffusion get_potential_gradients函数解读
get_potential_gradients是Denoise类中一个方法。get_potential_gradients方法的目的是计算每个 Cα 原子的势能梯度，用于指导扩散更新。这些梯度可以提供物理或几何约束，使扩散生成的坐标更加合理
admin
1月前
180
网站建设
计算机视觉图像处理基础系列：滤波、边缘检测与形态学操作
计算机视觉图像处理基础系列：滤波、边缘检测与形态学操作一、前言二、滤波：图像的精细化处理 2.1 滤波基础概念 2.1.1 滤波的本质 2.1.2 图像噪声来源与类型 2.2 线性滤波 2.2.1 均值滤波 2.2.2 高斯
admin
1月前
190
网站建设
Javascript自执行函数 (Immediately-Invoked Function Expression)
1. Javascript编译器在遇到function这个关键字时，默认认为它是function声明，而不是表达式。2. 在已声明的function后面加括号，即可调用它。
admin
1月前
240
网站建设
ROS2：spin() spin_some()函数
ROS1 ros::spin()和ros::spinOnce()函数关于ros消息发布器和订阅器的教程： http:wiki.rosROSTutorialsWritingPublisherSubscribe
admin
1月前
260
网站建设
实现Python接入coze平台api小函数
1. 代码展示不占用大家的时间，所以先把代码附上了，接下来我会简单讲解下，复制完代码后需要进行怎样的修改。 import requestsimport json# 调
admin
1月前
150
网站建设
STM32踩坑：UCOSIII下串口中断服务中使用OSIntEnter函数使程序卡死解决方案
UCOSIII下串口中断服务中使用OSIntEnter函数使程序卡死解决方案本文侧重于 STM32 标准库，HAL 库可以借鉴，因为该项目是基于标准库做的（因为涉及到保密问题
admin
1月前
210
网站建设
R语言使用kruskal.test函数执行稳健方差分析（Kruskal–Wallis检验）、检验各个分组的中位数是否显著不同（whether group medians are significant
R语言使用kruskal.test函数执行稳健方差分析（Kruskal–Wallis检验）、检验各个分组的中位数是否显著不同（whether group medians are significantly different）目录 R语
admin
1月前
150
网站建设
移动硬盘分区打不开，显示函数不正确
某天移动硬盘突然打不开文件了，显示函数不正确，以为硬盘被我硬插拔弄坏了。如果你的是装在硬盘壳里的，没有装在电脑里，可以打开硬盘壳看看&#xff
admin
1月前
260

发表回复

评论列表（0条）

暂无评论

Copula系列(一)-什么是Copula函数

发表回复

评论列表（0条）

联系我们

400-800-8888

Copula系列(一)-什么是Copula函数

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888