典型相关分析(典型相关分析解决什么问题)

http://www.itjxue.com  2023-01-28 04:11  来源:未知  点击次数: 

对应分析和典型相关性分析的适用范围

简单相关系数(即普通回归方法)描述两组变量的相关关系的缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。典型相关是简单相关、多重相关的推广。典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。

1936年,Hotelling提出典型相关分析。考虑两组变量的线性组合, 并研究它们之间的相关系数p(u,v).在所有的线性组合中, 找一对相关系数最大的线性组合, 用这个组合的单相关系数来表示两组变量的相关性, 叫做两组变量的典型相关系数, 而这两个线性组合叫做一对典型变量。在两组多变量的情形下, 需要用若干对典型变量才能完全反映出它们之间的相关性。下一步, 再在两组变量的与u1,v1不相关的线性组合中, 找一对相关系数最大的线性组合, 它就是第二对典型变量, 而且p(u2,v2)就是第二个典型相关系数。这样下去, 可以得到若干对典型变量, 从而提取出两组变量间的全部信息。

典型相关分析的相关应用

典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析。 例如,为了研究扩张性财政政策实施以后对宏观经济发展的影响,就需要考察有关财政政策的一系列指标如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税率降低率等与经济发展的一系列指标如国内生产总值增长率、就业增长率、物价上涨率等两组变量之间的相关程度。

又如,为了研究宏观经济走势与股票市场走势之间的关系,就需要考察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长率等与各种反映股票市场状况的指标如股票价格指数、股票市场融资金额等两组变量之间的相关关系。再如,工厂要考察所使用的原料的质量对所生产的产品的质量的影响,就需要对所生产产品的各种质量指标与所使用的原料的各种质量指标之间的相关关系进行测度。

又如,在分析评估某种经济投入与产出系统时,研究投入和产出情况之间的联系时,投入情况面可以从人力、物力等多个方面反映,产出情况也可以从产值、利税等方面反映。

再如在分析影响居民消费因素时,我们可以将劳动者报酬、家庭经营收入、转移性收入等变量构成反映居民收入的变量组,而将食品支出、医疗保健支出、交通和通讯支出等变量构成反映居民支出情况的变量组,然后通过研究两变量组之间关系来分析影响居民消费因素情况。

典型相关分析  先将较多变量转化为少数几个典型变量,再通过其间的典型相关系数来综合描述两组多元随机变量之间关系的统计方法。设x是p元随机变量,y是q元随机变量,如何描述它们之间的相关程度?当然可逐一计算x的p个分量和y的q个分量之间的相关系数(p×q个), 但这样既繁琐又不能反映事物的本质。如果运用典型相关分析,其基本程序是,从两组变量各自的线性函数中各抽取一个组成一对,它们应是相关系数达到最大值的一对,称为第1对典型变量,类似地还可以求出第2对、第3对、……,这些成对变量之间互不相关,各对典型变量的相关系数称为典型相关系数。所得到的典型相关系数的数目不超过原两组变量中任何一组变量的数目。

典型相关分析有助于综合地描述两组变量之间的典型的相关关系。其条件是,两组变量都是连续变量,其资料都必须服从多元正态分布。

以上几种多元分析方法各有优点和局限性。每一种方法都有它特定的假设、条件和数据要求,例如正态性、线性和同方差等。因此在应用多元分析方法时,应在研究计划阶段确定理论框架,以决定收集何种数据、怎样收集和如何分析数据资料。

对应分析和典型相关分析哪个简单

典型相关分析简单。对应分析和典型相关分析相比,典型相关分析内容简单,易懂,因此典型相关分析简单,典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。

协方差矩阵和相关阵的典型相关分析的区别和联系

联系:协方差矩阵和相关矩阵都属于统计学与概率论范畴。

区别:

一、应用不同

1、协方差矩阵:协方差矩阵可用来表示多维随机变量的概率密度,从而可通过协方差矩阵达到对多维随机变量的研究。

2、相关矩阵:相关矩阵主要用于收缩范围,利用P/P矩阵进行分析。

二、性质不同

1、协方差矩阵:cov(X,Y)=cov(Y,X)?;cov(AX+b,Y)=Acov(X,Y),其中A是矩阵,b是向量。

2、相关矩阵:相关矩阵的对角元素是1。相关矩阵是对称矩阵。

三、特点不同

1、协方差矩阵:为对称非负定矩阵。

2、相关矩阵:矩阵各列间的相关系数构成的

参考资料来源:

百度百科-相关矩阵

百度百科-协方差矩阵

典型相关分析的系数求法

(一)总体典型变量与典型相关系数由上一节的数学描述我们知道,典型相关分析希望寻求 a 和 b 使得 ρ 达到最大,但是由于随机变量乘以常数时不改变它们的相关系数,为了防止不必要的结果重复出现,最好的限制是令 Var U 1 和 Var V 1。

于是,我们的问题就转化为,在约束条件为 Var U 1和 Var V 1 下,寻找非零常数向量 a 和 b 使得相关系数Corr U V a ′ ∑ 12 b 达到最大。 根据数学分析中条件极值的求法,引入拉格朗日(Lagrange)乘数,问题则转化为,求 λ ν φ a b a ′ ∑ 12 b 2 a′∑ 11 a 1 2 b′∑ 11 b 1 的极大值点,其中 λ ν 是拉格朗日乘数。

由极值的必要条件,需求 φ 对 a 和 b 的偏导数,并令其等于零,得到的极值条件为: φ a ∑12 b λ ∑11 a 0 φ ∑ a ν ∑ b 0 b 21 22 将分别以 a ′ 和 b ′ 左乘上式,得 a ′ ∑12 b λa ′∑11 a λ b′ ∑ 21 a νb′∑22 b ν又因为 a ′ ∑12 b′ b ′ ∑ 12 a, 故 λ ν a′ ∑ 12 bρ , 说明, λ 的值就是线性组合 U 和 V 之间的相关系数。

因此上述方程可写成: λ ∑11 a ∑12 b 0 ∑ 21 a λ ∑22 b 0 为求解方程,先以 ∑ ∑12 1 22 左乘以上述第二式,并将第一式代入,得 ∑ 12 ∑ 1 ∑ 21 λ2 ∑11 a 0 22 同理,将 ∑ ∑ 21 1 11 左乘以上述第一式,并将第二式代入,得 ∑ 21 ∑ 111 ∑ 12 λ2 ∑22 b 0 将上边两式分别左乘以 ∑ 1 11 和 ∑ 1 22 ,得 ∑ 1 11 ∑ ∑ ∑ 12 1 22 21 λ2 a0 ∑1 ∑ 21 ∑ 11 ∑ 12 λ2 b 0 22 1 令 A ∑ ∑ ∑ ∑ 1 11 12 1 22 21 B ∑ ∑ ∑ ∑ 1 22 21 1 11 12 则得 Aa λ a 2 Bb λ2 b 说明, λ 既是矩阵 A ,同时也是矩阵 B 的特征值,同时也表明,相应的 a 与 b 分别是 2特征值 λ 的特征向量。 2 而且,根据证明,矩阵 A 和 B 的特征值还具有以下的性质:

(1)矩阵 A 和 B 有相同的非零特征值,且相等的非零特征值的数目就等于 p 。

(2)矩阵 A 和 B 的特征值非负。

(3)矩阵 A 和 B 的全部特征值均在 0 和 1 之间。 根据前边,我们知道,λ ν a ′ ∑12 b ρ ,所以 λ 为其典型变量 U 和 V 之间的简单相关系数。 又由于要求其相关系数达到最大按习惯考虑为正相关,所以取矩阵 A 或 B 的最大特征值λ1 的平方根 λ1 。

作为相关系数,同时由特征值λ1 所对应的两个特征向量 a 2 2 1 1 和b 有: U 1 a ′ 1 X 和 V1 b′ 1Y这就是所要选取的第一对线性组合,也即第一对典型变量,它们在所有的线性组合 U 和 V 中具有有最大的相关系数λ1 。 若求出矩阵 A 或 B 的 p 个非零特征根( p 是矩阵 ∑12 的秩,这里实际上 p q ) ,设为 λ1 ≥ λ2 ≥ L ≥ λ2 ≥ 0 2 2 p 1 2 相应的特征向量是与 a a L a k 和 b 1 b 2 L b k ,则可得 k 对线性组合: U 1 a11 X 1 a 21 X 2 L a p1 X p 2 2 2 U 2 a1 X 1 a 2 X 2 L a p X p M k k U p a1 X 1 a 2 X 2 L a pk X p 和 V1 b11Y1 b21Y2 L bq1Yq 2 2 2 V2 b1 Y1 b2 Y2 L bq Yq M k k V p b1 Y1 b2 Y2 L bqk Yq 它们的相关系数为 λ1 ≥ λ 2 ≥

(责任编辑:IT教学网)

更多

推荐Oracle文章