对称矩阵是线性代数中最"美好"的矩阵——它们有实特征值、正交特征向量,可以完美对角化。理解对称矩阵,是掌握主成分分析、优化理论、物理振动分析等众多领域的关键一步。
引言:对称性的力量
在数学和物理中,对称性往往预示着美好的性质。想想雪花的六重对称、蝴蝶翅膀的镜像对称——这些对称性不仅带来视觉上的美感,更蕴含着深刻的物理规律。线性代数中也不例外:对称矩阵拥有最优雅的性质。
想象你在分析一个物理系统的能量,或者在机器学习中优化一个目标函数。你会发现,这些问题最终都归结为对称矩阵的分析。为什么?因为:
- 能量总是用二次型表示:
- 协方差矩阵总是对称的:
- 海森矩阵(二阶导数)总是对称的:

生活类比:对称矩阵就像一面镜子——你从左边看到的和从右边看到的是一样的。这种"对称性"带来了巨大的数学便利:计算更简单、性质更优美、应用更广泛。
对称矩阵的基本性质
定义与直觉
矩阵
$$
A = A^T $$
即:
几何意义:对称矩阵对应的线性变换在某种意义上是"均匀"的——它沿着主轴方向拉伸或压缩,但不扭曲空间。就像你用两只手均匀地拉伸一块橡皮泥,而不是扭曲它。
生活案例:弹簧系统
想象两个质点通过三根弹簧连接。如果你推动第一个质点,它会通过弹簧影响第二个质点;反过来,第二个质点也会以相同的方式影响第一个。这种"相互作用的对称性"正是对称矩阵的本质。

例子:协方差矩阵
由于
对称矩阵的特殊性质
定理 1:对称矩阵的特征值都是实数。
这是一个非常重要的性质。一般矩阵的特征值可能是复数(比如旋转矩阵),但对称矩阵保证所有特征值都是实数。
证明:
设
$$
A = $$
取共轭转置:
由于
用
因为
定理 2:对称矩阵的不同特征值对应的特征向量相互正交。
证明:
设
$$
A_1 = _1 _1, A_2 = _2 _2 $$
计算
另一方面,利用
因此:
由于 
生活类比:想象一个足球场,你可以沿着球场长度方向跑(特征向量 1),也可以沿着宽度方向跑(特征向量 2)。这两个方向是垂直的,互不干扰——这就是特征向量的正交性。
谱定理( Spectral Theorem)
这是对称矩阵最重要的定理:
谱定理:任何实对称矩阵
$$
A = QQ^T $$
其中: -
意义: 1. 对称矩阵在其特征向量构成的正交基下,表现为简单的对角矩阵 2. 任何对称矩阵都可以看作是沿着正交方向的拉伸/压缩 3. 这是主成分分析( PCA)、谱聚类等算法的理论基础
生活类比:想象你要搬一个形状奇怪的家具通过一个门框。谱定理告诉你:只要找到家具的"主轴"方向,就可以简化问题——沿着这些方向,家具的尺寸是最简单的。

推论(谱分解):对称矩阵可以写成特征值和特征向量的外积和:
$$
A = _{i=1}^n _i _i _i^T $$
这称为谱分解( spectral decomposition)。
为什么叫"谱"? 在物理学中,光谱是将白光分解为不同颜色(频率)的过程。类似地,谱分解是将矩阵分解为不同"频率"(特征值)的过程。每个特征值对应一个"纯净"的方向(特征向量),就像每种颜色对应一个纯净的光波。
二次型
二次型的定义
二次型是关于变量
$$
f(x_1, , x_n) = {i=1}^n {j=1}^n a_{ij} x_i x_j $$
可以用矩阵形式表示:
$$
f() = ^T A $$
其中
生活案例:能量
在物理中,弹性势能是一个典型的二次型:
$$
E = kx^2 $$
对于两个自由度的系统:
$$
E = (k_1 x_1^2 + 2k_{12}x_1x_2 + k_2 x_2^2) $$
这就是二次型!其中
例子 1:二元二次型
$$
f(x, y) = 3x^2 + 4xy + 2y^2 $$
对应矩阵:
$$
A =$$
注意:交叉项系数 4 被平分为两个 2,这样才能保证矩阵对称。
验证:
二次型的几何意义
二次型
情况 1:
生活类比:这就像一个碗的形状——无论你从哪个方向走,都是向上的。小球放在碗底会稳定地停在那里。

情况 2:
生活类比:这像一个倒扣的碗——小球会从顶点滚落。
情况 3:
生活类比:这就像马鞍——沿着马背方向向上弯曲,沿着马肚方向向下弯曲。骑马时你坐在鞍点上,这个点既不是最高点也不是最低点。

情况 4:
二次型的标准化
目标:通过坐标变换,将二次型化为标准形式(只含平方项)。
主轴定理:对于二次型
步骤: 1. 求
详细例子:
考虑二次型
$$
A =$$
步骤 2:求特征值
特征值:
对于
得
得
$$
Q =$$
令
$$
f = 7y_1^2 + 3y_2^2 $$
这是标准形式!在新坐标系中,椭圆的方程变成了
二次型的分类
根据矩阵
| 特征值情况 | 二次型名称 | 标准形 | 几何形状 |
|---|---|---|---|
| 全正 | 正定二次型 | 椭球 | |
| 全负 | 负定二次型 | 向下椭球 | |
| 有正有负 | 不定二次型 | 鞍面 | |
| 非负,至少一个 0 | 半正定 | 部分 |
退化椭球 |
正定矩阵
定义与判定
对称矩阵
几何意义:二次型
相关概念: - 半正定( positive
semidefinite):
生活类比: - 正定:碗底——无论从哪个方向偏离原点,能量都增加 - 负定:山顶——无论从哪个方向偏离原点,能量都减少 - 不定:马鞍——某些方向增加,某些方向减少 - 半正定:有一个方向是平的谷底
判定正定的方法
有多种等价的判定方法:
方法 1:特征值判定法
由谱定理
其中
这个和
例子:
$$
A =$$
直觉: Sylvester 判据实际上是在逐步检查——先检查一维情况、再检查二维情况……每一步都要求"正能量"。
方法 3: Cholesky 分解判定法
A$ 可以 Cholesky 分解:
方法 4:能量判定法
在物理和工程中,正定矩阵对应正能量系统。如果
生活案例:建筑结构的稳定性
想象一座桥。工程师需要确保桥的刚度矩阵是正定的——这意味着任何外力作用下,桥都会产生正的弹性势能,而不是"塌陷"。如果刚度矩阵不正定,桥可能会在某个方向上失稳。
正定矩阵的性质
可逆:正定矩阵一定可逆(所有特征值
,行列式 )对角元为正:
(取 ,得 )行列式为正:
4. 逆矩阵也正定:如果 正定,则 也正定和的正定性:如果
正定,则 正定乘积的正定性:
不一定正定(除非 ),但 正定平方根存在:正定矩阵有唯一的正定平方根
主轴定理与应用
主轴定理
定理:对于二次型
其中: -
几何解释: - 原坐标系:二次曲面可能是倾斜的椭球 -
主轴坐标系:椭球的轴与坐标轴对齐 - 主轴长度由

应用 1:确定二次曲线/曲面的类型
问题:判断
解:
矩阵:$A =
(A - I) = (3-)^2 - 1 = 0$特 征 值 :
得 (都为正)结论:正定,表示椭圆
标准形:在主轴坐标系中,方程变为:
即:
这是标准椭圆方程,长轴
应用 2:瑞利商与优化
问题:求
解:使用拉格朗日乘数法:
即:
这正是特征值问题!
结论: - 最大值是最大特征值
这是瑞利商( Rayleigh quotient)的结果:
生活类比:想象一个椭球形的山。你站在山上,想知道从山顶出发,哪个方向最陡峭?答案是沿着椭球的短轴方向——这就是最大特征值对应的特征向量方向。
应用 3:协方差矩阵与主成分分析
在统计中,协方差矩阵
- 特征值:主成分的方差(数据在该方向上的分散程度)
- 特征向量:主成分方向(数据变化最大的方向)
主成分分析( PCA)就是对协方差矩阵进行谱分解!
生活案例:人脸识别
假设你有一组人脸图片,每张图片是
Cholesky 分解
定义
对于正定矩阵
$$
A = LL^T $$
其中
唯一性:如果
与谱分解的区别: - 谱分解:
Cholesky 分解计算更快(
直觉: Cholesky 分解就像是给正定矩阵"开平方"——就像
计算方法
对于
展开得:
一般公式(按行计算):
$$
l_{ii} =
l_{ij} = ( a_{ij} - {k=1}^{j-1} l{ik} l_{jk} ), i > j $$
详细例子:
计算
$$
l_{11} = = 2
l_{21} = = 1
l_{22} = = $$
所以
验证:
应用
1. 求解线性方程组
求解
步骤 1: Cholesky 分解
2. 判定正定性
如果 Cholesky 分解成功(不需要开负数的平方根),则
3. 生成正态分布随机数
生成
椭圆和双曲线的几何
二维情况
二次方程
| 判别式 | 矩阵特征 | 几何形状 |
|---|---|---|
| 正定或负定 | 椭圆 | |
| 不定 | 双曲线 | |
| 半定 | 抛物线/平行线 |
直觉:这就像判断一个碗是朝上的(椭圆)、马鞍形的(双曲线)、还是槽形的(抛物线)。
椭圆的几何性质
椭圆方程
- 半长轴:
(沿 方向) - 半短轴:
(沿 方向) - 焦点:
,其中 - 离心率:
( )
与矩阵的关系:
对于
生活案例:行星轨道
行星绕太阳的轨道是椭圆。太阳位于椭圆的一个焦点上。地球轨道的离心率约
双曲线的几何性质
双曲线方程
- 实轴:
(沿 方向) - 虚轴:
(沿 方向) - 焦点:
,其中 - 渐近线:
生活案例:超音速飞机
当飞机超音速飞行时,产生的音爆波前是圆锥面。这个圆锥与地面的交线是双曲线的一支。
三维情况
三维二次曲面更加丰富:
| 特征值符号 | 曲面类型 | 方程(标准形) |
|---|---|---|
| 椭球 | ||
| 单叶双曲面 | ||
| 双叶双曲面 | ||
| 椭圆柱面 | ||
| 双曲柱面 |
矩阵的平方根
定义
对于正定对称矩阵
$$
A^{1/2} A^{1/2} = A $$
存在性:正定对称矩阵的平方根存在且唯一(如果要求平方根也对称正定)。
计算方法
方法 1:谱分解法
$$
A = QQ^T A^{1/2} = Q^{1/2} Q^T $$
其中
方法 2: Cholesky 分解
如果
对称平方根:用谱分解得到的
应用:白化变换
在机器学习中,白化( whitening)是将相关数据变为不相关、方差为 1 的数据。
给定协方差矩阵
使得
为什么需要白化? 很多机器学习算法假设特征是独立的、同方差的。白化预处理可以满足这个假设,提高算法性能。
生活类比:想象你在分析学生的成绩数据,数学和物理成绩高度相关。白化就是找到一个新的坐标系,使得新坐标下的"成绩"彼此独立——这样更容易分析每个"能力"的独立贡献。
实际应用案例
应用 1:物理中的小振动
在经典力学中,多自由度系统在平衡点附近的振动可以用二次型描述。
动能:$T = ^T M
势能:
振动频率:由广义特征值问题
生活案例:乐器弦的振动
吉他弦的振动可以分解为多个"谐振模式",每个模式对应一个特征频率。基频决定音高,泛音决定音色。这些频率和模式就是刚度矩阵的特征值和特征向量!
应用 2:图像处理中的椭圆拟合
给定一组数据点,拟合最佳椭圆是计算机视觉中的常见任务。
方法:最小化残差平方和,得到二次曲线方程
$$
ax^2 + bxy + cy^2 + dx + ey + f = 0 $$
通过分析二次部分的矩阵
应用 3:机器学习中的正则化
在岭回归( Ridge Regression)中,目标函数是:
解为:
添加
直觉:原始的
应用 4:金融中的投资组合优化
Markowitz 投资组合理论中,最小化风险:
约束:
其中
直觉:
应用 5:信号处理中的协方差估计
在雷达、声纳等信号处理应用中,估计信号的协方差矩阵是关键步骤。由于协方差矩阵必须是正定的(至少半正定),实际估计时需要特殊处理:
- 使用收缩估计( shrinkage estimation)确保正定性
- 使用对数欧几里得度量( log-Euclidean metric)处理协方差矩阵空间
总结与展望
本章关键要点
- 对称矩阵的特殊性质:
- 特征值都是实数
- 特征向量相互正交
- 可以正交对角化
- 谱定理:
- 最重要的分解定理之一- 揭示了对称矩阵的本质结构
- 正定矩阵:
- 定义:
- 判定:特征值全正 / 主子式全正 / Cholesky 分解存在 - 意义:正能量、稳定系统、可逆性
- 定义:
- 二次型:
- 标准形:
- 分类:正定、负定、不定、半正定 - 几何:椭球、鞍面等二次曲面
- 标准形:
- 主轴定理:
- 找到二次曲面的主轴方向
- 应用于优化、物理、数据分析
- Cholesky 分解:
- 正定矩阵的快速分解- 数值稳定,计算高效
- 几何应用:
- 椭圆和双曲线的标准化
- 二次曲面的分类
概念关联图
1 | 对称矩阵 |
深入思考
为什么对称矩阵如此重要?
自然性:许多物理量天然是对称的(能量、协方差、度量张量)
数学美:对称性带来优美的性质(实特征值、正交特征向量)
计算效率:对称矩阵的算法更快、更稳定
普遍性:即使矩阵不对称,也常通过
等构造对称矩阵
下一章预告
《奇异值分解 SVD 》
- 任意矩阵(不一定对称)的"谱分解"
- SVD 是对称矩阵谱定理的推广
- 伪逆、最佳低秩逼近
- 应用:图像压缩、推荐系统、自然语言处理
SVD 被称为"线性代数的皇冠"——我们将看到为什么!
练习题
基础题
1. 判断下列矩阵是否对称、正定:
2. 对二次型 ,写出对应的矩阵 ,并判断其正定性。
3. 计算
4. 求矩阵
5. 判断二次曲线
进阶题
6. 证明:如果
7. 证明:如果
8. 对二次型
9. 证明 Sylvester 判据:
10. 证明:对称矩阵
11. 设
编程题
12. 实现 Cholesky 分解算法(不使用 numpy 内置函数):
1 | def cholesky(A): |
13. 用 Python
验证谱定理:对一个随机生成的对称矩阵,计算其谱分解,并验证
14. 实现二次型的可视化:给定二维对称矩阵,绘制其等高线图,标出特征向量(主轴)方向。
15. 实现 PCA 降维: - 生成一组二维相关数据 - 计算协方差矩阵 - 进行谱分解 - 可视化主成分方向 - 投影到第一主成分
16. 实现白化变换,并验证白化后数据的协方差矩阵接近单位矩阵。
应用题
17.
振动分析:两质点(质量各为
$$
K =$$ (a) 证明
18.
投资组合:两资产的协方差矩阵为
- 验证
正定 - 求最小方差投资组合(约束:权重和为 1)
- 求有效前沿( efficient frontier)上的几个点
19.
椭圆拟合:给定下列数据点,用最小二乘法拟合椭圆方程。
| x | 1 | 2 | 3 | 2 | 1 | 0 | -1 | 0 |
|---|---|---|---|---|---|---|---|---|
| y | 2 | 2 | 0 | -2 | -2 | -1 | 0 | 1 |
20.
图像压缩(预习 SVD):虽然 SVD
是下一章的内容,但协方差矩阵的特征分解已经可以用于简单的图像压缩。用 PCA
对一组人脸图像进行降维,只保留前
思考题
21. 为什么机器学习中的正则化项通常是
22. 为什么协方差矩阵一定是半正定的?什么时候它是正定的?
23. 如果矩阵
24. 半正定矩阵的 Cholesky 分解是否存在?如果存在,是否唯一?
25. 为什么说"对称矩阵是最好的矩阵"?从计算复杂度、数值稳定性、理论优美性三个角度分析。
练习题答案提示
第 1 题:(a) 对称,
第 6 题:设
第 11 题:
参考资料
- Strang, G. (2019). Introduction to Linear
Algebra. 5th ed. Chapter 6.
- 对称矩阵和正定性的经典讲解
- Horn, R. A., & Johnson, C. R. (2012).
Matrix Analysis. 2nd ed. Cambridge University Press.
- 深入的矩阵理论,包括正定性的各种判据
- Boyd, S., & Vandenberghe, L. (2004). Convex
Optimization. Cambridge University Press.
- 正定矩阵在优化中的应用
- Golub, G. H., & Van Loan, C. F. (2013).
Matrix Computations. 4th ed. Johns Hopkins University Press.
- Cholesky 分解等数值算法的权威参考
- 3Blue1Brown. Essence of Linear Algebra
series. YouTube.
特征值和二次型的优秀可视化讲解
本文是《线性代数的本质与应用》系列的第 8 章。
- 本文标题:线性代数(八)对称矩阵与二次型
- 本文作者:Chen Kai
- 创建时间:2019-02-12 10:00:00
- 本文链接:https://www.chenk.top/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0%EF%BC%88%E5%85%AB%EF%BC%89%E5%AF%B9%E7%A7%B0%E7%9F%A9%E9%98%B5%E4%B8%8E%E4%BA%8C%E6%AC%A1%E5%9E%8B/
- 版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!