n维向量内积:
m×n维矩阵内积:
向量(矩阵)夹角:
Cauchy-Schwartz inequality:,等号成立当且仅当向量x和y共线
Lp-范数:
p=1、2、∞时比较常用
L1-范数(绝对值和范数):
L2-范数(Euclidean范数):
L∞-范数(Chebyshev范数):
最后一个极限是数学分析的知识,可用夹逼法证明。
P-二次型范数:若P为正定矩阵,则
这是十分常用的范数,可以方便的表示很多量,椭圆也可以用它简洁的表示。
绝对值最大(maximum-absolute-value)范数:
与向量范数相似,对应为p取1、2、∞的情况。
定义:在范数a 和范数b
意义下,矩阵
的算子范数为
这种较为一般的定义往往是不常用的,这里举了几个最常用的例子,仍分别对应1、2、∞三种情况。
当a=b=1时,
最大列和(max-column-sum)范数:
推导:记第j列列和最大,则令为1,其余为0,易得此时取得最大值
当a=b=2时,
谱(spectral)范数:
推导:,等号成立当且仅当
为
对应的特征向量
当a=b=∞时,
最大行和(max-row-sum)范数:
推导:考虑X的第i行,若为负数,则取
为-1,否则取
为1,易得此时取得最大值
定义:在范数的意义下,元素
的对偶范数为
向量的对偶范数
从定义出发,我们可以得到不等式
根据Hölder's inequality,易得结论:当时,
范数和
范数互为对偶范数
范数和
范数互为对偶范数,
范数的对偶范数是其本身
矩阵的对偶范数
考虑矩阵在
范数下的对偶范数,有
这一步的证明还没有搞懂,暂时先略过
范数的四个性质: ①非负性 ②正定性 ③齐次性 ④满足三角不等式
范数的等价性(A.1.4):还未见其应用,故先略过
距离:两个元素差的范数
单位球:到原点距离不超过1的元素组成的集合
①关于原点对称 ②凸集 ③闭集、有界、有非空内点
数学分析课上讲过的两个概念,如果一个集合中的点均为其内点,则该集合为开集。如果一个集合的补集是开集,则称该集合为闭集。
上下确界可以理解为无限集上的最大值和最小值,根据确界存在定理,一个集合的上下确界必定存在。定义不再赘述。
函数,表示集合A到集合B的一个映射,其中函数f的定义域
。这里集合A和集合B通常是向量、矩阵组成的集合。
函数的连续性也是数学分析的基础内容,不多做赘述。
函数是闭的,当且仅当对于任意的
,它的sublevel set
是闭集。
该定义等价于函数f的epigraph是闭集。
若已知函数f的连续性,当符合下列情况时,函数f是闭函数:
①f的定义域是闭集
②f的定义域是开集,但函数f在定义域的边界点处,函数值趋于∞
函数不是闭函数,因为0是其定义域的边界点,而当x-->0时,f(x)-->0
函数的在x点的导数记作矩阵
,满足
函数在x点附近的一阶近似(first-order approximation)为
函数的导数
,是行向量,定义其梯度为
故其中,
例1:
二次函数,
,其中
其在x处的梯度为
例2:
对数函数,
微分法,记,则
其中,是矩阵
的第i个特征值。因为
趋近于0,所以
趋近于0,
对照一阶近似公式,
可得,,与公式
吻合
函数和函数
均可维,则其复合函数
,
可微,其在点x处的导数为
线性复合:函数,则函数g的梯度为
例1:
求导:
定义,则
例2:
求导:且
,其中
函数的二阶导数(Hessian matrix)记为
,其中
函数f在点x处的二阶近似为
例1:
求导:二次函数,其中
例2:
求导:对数函数,其中
记,
因为当A很小时,有
这里要注意,向量的二次形式可以写作二次型,而矩阵的二次形式可写作
单值函数的复合:函数,令函数
,则h的二阶导数
线性函数的复合:函数,令函数
,其中
,则g的二阶导数
以上两个公式可与单值函数的链式法则进行对比得出。
例:
求导:
定义,则
利用第一个公式,得,其中