凸优化笔记-基本概念
minimize f0(x)
subject to fi(x)≤bi,i=1,...,m
凸优化问题:
fi(αx+βy)≤αfi(x)+βfi(y), x,y∈Rn,α+β=1,α≥0,β≥0
所有的函数都是凸函数时这个规划问题成为凸优化问题。
最小二乘问题
无约束条件下
minimize∣∣Ax−b∣∣22
ATAx=ATb
x=(ATA)−1ATb
A∈Rk×n,k≥n
此处可以猜想一下,举例如k个点拟合一条直线。k个方程求解n个自变量。
带权的最小二乘
Σwi(aiTx−b)
regularization
Σi=1k(aiTx−bi)2+ρΣi=1nxi2
线性规划
切比雪夫近似问题
minimize maxi=1...k ∣aiTx−bi∣
与最小二乘不同,不使用平方而是使用极大值——一阶矩?1范数
不可微
转化为
minimize t
subject to aiTx−t≤bi,−aiTx−t≤−bi
内点法?
仿射
仿射集合:一个集合 C 在一个向量空间中被称为仿射集合,如果对于集合 CC 中的任意两个点 x 和 y,以及任意实数 α,其中 0≤α≤1,集合 CC 都包含点 (1−α)x+αy。
线性方程组的解集是一个仿射集合
Ax=b的解x1=x2
Ax1=b,Ax2=b
A(αx1+βx2)=A(αx1)+A(βx2)=(α+β)b=b
affine hull
1
| The set of all affine combinations of points in some set C ⊆ Rn is called the affine hull of C, and denoted aff C
|
在欧几里得空间 Rn 中,一个集合 C 的仿射包(affine hull)是指所有包含在集合 C 中的点的仿射组合的集合。换句话说,它是通过 C中任意有限个点 x1,x2,…,xk的所有可能的线性组合的集合。
仿射包的理解?
aff C={θ1x1+...+θnxn∣xk∈C,Σθi=1}
affine dimension
集合C的仿射维度定义为他的仿射包(?)
例:对单位圆上的点
{x∈R2∣x12+x22=1}
其仿射包是R2(单位圆上的点通过线性组合可以产生)
相对内部(relative interior)
relint C={x∈C∣B(x,r)∩affC⊆C for some r>0}
就是这些点的邻域与aff C的交集仍然在C中。
cl C relint C 为边界
三维空间中的正方形
C={x∈R3∣∣x1∣≤1,∣x2∣≤2,x3=0}
其仿射包是什么呢?是由平面上的点组成的所有线性组合,那么自然是整个平面。那么dimension应该是2
凸集
x1∈C,x2∈C,0≤θ≤1,θx1+(1−θ)x2∈C
则为凸集
仿射集都是凸集
凸组合:
θ1x1+θ2x2+...+θnxn,θi≥0
凸包:
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k,θ1+...+θk=1}
设 CC 是一个集合,那么 CC 的凸包 conv©conv© 是包含 CC 中所有点的最小凸集合。换句话说,conv©conv© 是包含 CC 的所有点的最小凸集合,且没有其他凸集合包含 CC 中的所有点。
线性组合、仿射组合与凸组合
对比一下,都是
θ1x1+...+θkxk
但是线性组合对θi无要求,仿射要求Σθi=1,凸组合要求Σθi=1,且θi≥0
条件越来越强。
minimize f0(x)
subject to fi(x)≤bi,i=1,...,m
凸优化问题:
fi(αx+βy)≤αfi(x)+βfi(y), x,y∈Rn,α+β=1,α≥0,β≥0
所有的函数都是凸函数时这个规划问题成为凸优化问题。
最小二乘问题
无约束条件下
minimize∣∣Ax−b∣∣22
ATAx=ATb
x=(ATA)−1ATb
A∈Rk×n,k≥n
此处可以猜想一下,举例如k个点拟合一条直线。k个方程求解n个自变量。
带权的最小二乘
Σwi(aiTx−b)
regularization
Σi=1k(aiTx−bi)2+ρΣi=1nxi2
线性规划
切比雪夫近似问题
minimize maxi=1...k ∣aiTx−bi∣
与最小二乘不同,不使用平方而是使用极大值——一阶矩?1范数
不可微
转化为
minimize t
subject to aiTx−t≤bi,−aiTx−t≤−bi
内点法?
仿射
仿射集合:一个集合 C 在一个向量空间中被称为仿射集合,如果对于集合 CC 中的任意两个点 x 和 y,以及任意实数 α,其中 0≤α≤1,集合 CC 都包含点 (1−α)x+αy。
线性方程组的解集是一个仿射集合
Ax=b的解x1=x2
Ax1=b,Ax2=b
A(αx1+βx2)=A(αx1)+A(βx2)=(α+β)b=b
affine hull
1
| The set of all affine combinations of points in some set C ⊆ Rn is called the affine hull of C, and denoted aff C
|
在欧几里得空间 Rn 中,一个集合 C 的仿射包(affine hull)是指所有包含在集合 C 中的点的仿射组合的集合。换句话说,它是通过 C中任意有限个点 x1,x2,…,xk的所有可能的线性组合的集合。
仿射包的理解?
aff C={θ1x1+...+θnxn∣xk∈C,Σθi=1}
affine dimension
集合C的仿射维度定义为他的仿射包(?)
例:对单位圆上的点
{x∈R2∣x12+x22=1}
其仿射包是R2(单位圆上的点通过线性组合可以产生)
相对内部(relative interior)
relint C={x∈C∣B(x,r)∩affC⊆C for some r>0}
就是这些点的邻域与aff C的交集仍然在C中。
cl C relint C 为边界
三维空间中的正方形
C={x∈R3∣∣x1∣≤1,∣x2∣≤2,x3=0}
其仿射包是什么呢?是由平面上的点组成的所有线性组合,那么自然是整个平面。那么dimension应该是2
凸集
x1∈C,x2∈C,0≤θ≤1,θx1+(1−θ)x2∈C
则为凸集
仿射集都是凸集
凸组合:
θ1x1+θ2x2+...+θnxn,θi≥0
凸包:
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k,θ1+...+θk=1}
设 CC 是一个集合,那么 CC 的凸包 conv©conv© 是包含 CC 中所有点的最小凸集合。换句话说,conv©conv© 是包含 CC 的所有点的最小凸集合,且没有其他凸集合包含 CC 中的所有点。
线性组合、仿射组合与凸组合
对比一下,都是
θ1x1+...+θkxk
但是线性组合对θi无要求,仿射要求Σθi=1,凸组合要求Σθi=1,且θi≥0
条件越来越强。
![20240716154814.png]()
锥集
对任意x∈C,都有θx∈C
锥的顶点在原点。
凸锥====== 又凸又锥(比如一个立在原点的在最粗的地方切开的洋葱头?)
θ1x1+...+θkxk,θi≥0
conic combination
锥组合
锥包
{θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k}
C的锥包是能包含C的最小的锥集
![20240717101836.png]()
超平面和半空间
超平面
aTx=b
半空间
{x∣aTx≥b}
椭球
ϵ={x∣(x−xc)TP−1(x−xc)≤1}
P是对称且正定的,对称轴的长度由特征值的根号给出λi
多面体
P={x∣Ax≼b,Cx=d}
A=⎣⎡a1T...amT⎦⎤,C=⎣⎡c1T...cpT⎦⎤
单纯形
n维单纯形有n+1个顶点,如1维线段,2维三角形,三维四面体
单位单纯形x⪰0,1Tx≤1 , n维度
概率单纯形x⪰0,1Tx=1, n-1维度
整半定锥
对称矩阵集合Sn={X∈Rn×n∣X=XT}
其维度为(n+1)n/2,可以想想有多少个独立的元素。
非负
S+n={X∈Rn×n∣X=XT,X⪰0}
正
S+n+={X∈Rn×n∣X=XT,X≻0}
convex set:都是
convex cone:S+n+不是,因为没有0
保凸性的操作
仿射变换、凸集的交集、求和、笛卡尔内积
设有线性矩阵不等式(LMI)
A(x)=x1A1+...+xnAn⪯B
其解集是convex的
仿射变换呢?
透视函数
降低维度 P:Rn+1→Rn
可以等效为一个小孔成像摄像机
接受平面位置在x3=−1
小孔在原点,被测物x1,x2,x3
则相点为−(x1/x3,x2/x3,1)
domP=Rn×R++
P(z,t)=z/t
如果domP中的C是凸点,他的像
P(C)={P(x)∣x∈C}
也是凸的
凸函数的条件
1阶判定条件
若f可微,当且仅当dom f凸,而且
f(y)≥f(x)+∇f(x)T(y−x)
![20240717185837.png]()
其几何意义为函数上的点永远比某一条切线上的点高(或重合)
(该形式为泰勒一阶展开)
2阶判定条件
∇f⪰0
-
Rn上的范数都是凸的(由范数的三角不等式得到)
∣∣u1∣∣+∣∣u2∣∣≥∣∣u1+u2∣∣
max(x)+max(y)>max(x+y)
f(x,y)=x2/y,y>0 ∇2f=[2/y−2x/y2−2x/y22x2/y3],det(∇2f)=y32∣∣y2−xy−xy2x2∣∣=y22∗(2x2y2−x2y2)>0
f(x)=log(exp(x1)+exp(x2)+...+exp(xn))
∂xi∂f=Σj=0j=nexp(xj)exp(xi)
z=(exp(x1),exp(x2),...,exp(xn)), Σj=0j=nexp(xj)=1Tz
求Hessian矩阵
∂xi∂xj∂2f=−(1Tz)2exp(xi)exp(xj),i=j
∂xi2∂2f=1Tzexp(xi)−(1Tz)2exp(xi)2
i=j时二阶导导前半部分可以组成一个对角阵列,后半部分和不等时的形式相同
∇2f=(1Tz)21((1Tz)diag(z)−zzT)
对任意v,有
vT∇2f v=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−vTzzTv)=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−(Σj=0j=nzjvj)2)
此处使用Cauchy-Schwarz不等式,ai=vizi,bi=zi,(aTa)(bTb)≥(aTb)2,可得上式不小于0。
Epigraph 外图
函数f的graph定义为
{(x,f(x))∣x∈dom f}
是Rn+1的子集
其epigraph为
epi f={(x,t)∣x∈dom f,f≤t}
(‘Epi’ means ‘above’ so epigraph means ‘above the graph’.)
亚图为
hypof={(x,t)∣x∈dom f,f≥t}
![20240718104117.png]()
这个图能建立凸集和凸函数的关系。当且仅当外图(epi f)是凸的时候函数是凸的。
当且仅当亚图(hypo f)是凸的时候函数是凹的
f(x,Y)=xTY−1x, dom f=Rn×S++n
epif={(x,Y,t)∣Y≻0,f(x,Y)≤t}
xTY−1x≤t
此处需要用到舒尔补(Schur complement)
M=[ACBD]
如果A可逆,则其舒尔补为D−CA−1B
代入有
M=[YxTxt]⪰0
锥集
对任意x∈C,都有θx∈C
锥的顶点在原点。
凸锥====== 又凸又锥(比如一个立在原点的在最粗的地方切开的洋葱头?)
θ1x1+...+θkxk,θi≥0
conic combination
锥组合
锥包
{θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k}
C的锥包是能包含C的最小的锥集
minimize f0(x)
subject to fi(x)≤bi,i=1,...,m
凸优化问题:
fi(αx+βy)≤αfi(x)+βfi(y), x,y∈Rn,α+β=1,α≥0,β≥0
所有的函数都是凸函数时这个规划问题成为凸优化问题。
最小二乘问题
无约束条件下
minimize∣∣Ax−b∣∣22
ATAx=ATb
x=(ATA)−1ATb
A∈Rk×n,k≥n
此处可以猜想一下,举例如k个点拟合一条直线。k个方程求解n个自变量。
带权的最小二乘
Σwi(aiTx−b)
regularization
Σi=1k(aiTx−bi)2+ρΣi=1nxi2
线性规划
切比雪夫近似问题
minimize maxi=1...k ∣aiTx−bi∣
与最小二乘不同,不使用平方而是使用极大值——一阶矩?1范数
不可微
转化为
minimize t
subject to aiTx−t≤bi,−aiTx−t≤−bi
内点法?
仿射
仿射集合:一个集合 C 在一个向量空间中被称为仿射集合,如果对于集合 CC 中的任意两个点 x 和 y,以及任意实数 α,其中 0≤α≤1,集合 CC 都包含点 (1−α)x+αy。
线性方程组的解集是一个仿射集合
Ax=b的解x1=x2
Ax1=b,Ax2=b
A(αx1+βx2)=A(αx1)+A(βx2)=(α+β)b=b
affine hull
1
| The set of all affine combinations of points in some set C ⊆ Rn is called the affine hull of C, and denoted aff C
|
在欧几里得空间 Rn 中,一个集合 C 的仿射包(affine hull)是指所有包含在集合 C 中的点的仿射组合的集合。换句话说,它是通过 C中任意有限个点 x1,x2,…,xk的所有可能的线性组合的集合。
仿射包的理解?
aff C={θ1x1+...+θnxn∣xk∈C,Σθi=1}
affine dimension
集合C的仿射维度定义为他的仿射包(?)
例:对单位圆上的点
{x∈R2∣x12+x22=1}
其仿射包是R2(单位圆上的点通过线性组合可以产生)
相对内部(relative interior)
relint C={x∈C∣B(x,r)∩affC⊆C for some r>0}
就是这些点的邻域与aff C的交集仍然在C中。
cl C relint C 为边界
三维空间中的正方形
C={x∈R3∣∣x1∣≤1,∣x2∣≤2,x3=0}
其仿射包是什么呢?是由平面上的点组成的所有线性组合,那么自然是整个平面。那么dimension应该是2
凸集
x1∈C,x2∈C,0≤θ≤1,θx1+(1−θ)x2∈C
则为凸集
仿射集都是凸集
凸组合:
θ1x1+θ2x2+...+θnxn,θi≥0
凸包:
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k,θ1+...+θk=1}
设 CC 是一个集合,那么 CC 的凸包 conv©conv© 是包含 CC 中所有点的最小凸集合。换句话说,conv©conv© 是包含 CC 的所有点的最小凸集合,且没有其他凸集合包含 CC 中的所有点。
线性组合、仿射组合与凸组合
对比一下,都是
θ1x1+...+θkxk
但是线性组合对θi无要求,仿射要求Σθi=1,凸组合要求Σθi=1,且θi≥0
条件越来越强。
![20240716154814.png]()
锥集
对任意x∈C,都有θx∈C
锥的顶点在原点。
凸锥====== 又凸又锥(比如一个立在原点的在最粗的地方切开的洋葱头?)
θ1x1+...+θkxk,θi≥0
conic combination
锥组合
锥包
{θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k}
C的锥包是能包含C的最小的锥集
![20240717101836.png]()
超平面和半空间
超平面
aTx=b
半空间
{x∣aTx≥b}
椭球
ϵ={x∣(x−xc)TP−1(x−xc)≤1}
P是对称且正定的,对称轴的长度由特征值的根号给出λi
多面体
P={x∣Ax≼b,Cx=d}
A=⎣⎡a1T...amT⎦⎤,C=⎣⎡c1T...cpT⎦⎤
单纯形
n维单纯形有n+1个顶点,如1维线段,2维三角形,三维四面体
单位单纯形x⪰0,1Tx≤1 , n维度
概率单纯形x⪰0,1Tx=1, n-1维度
整半定锥
对称矩阵集合Sn={X∈Rn×n∣X=XT}
其维度为(n+1)n/2,可以想想有多少个独立的元素。
非负
S+n={X∈Rn×n∣X=XT,X⪰0}
正
S+n+={X∈Rn×n∣X=XT,X≻0}
convex set:都是
convex cone:S+n+不是,因为没有0
保凸性的操作
仿射变换、凸集的交集、求和、笛卡尔内积
设有线性矩阵不等式(LMI)
A(x)=x1A1+...+xnAn⪯B
其解集是convex的
仿射变换呢?
透视函数
降低维度 P:Rn+1→Rn
可以等效为一个小孔成像摄像机
接受平面位置在x3=−1
小孔在原点,被测物x1,x2,x3
则相点为−(x1/x3,x2/x3,1)
domP=Rn×R++
P(z,t)=z/t
如果domP中的C是凸点,他的像
P(C)={P(x)∣x∈C}
也是凸的
凸函数的条件
1阶判定条件
若f可微,当且仅当dom f凸,而且
f(y)≥f(x)+∇f(x)T(y−x)
![20240717185837.png]()
其几何意义为函数上的点永远比某一条切线上的点高(或重合)
(该形式为泰勒一阶展开)
2阶判定条件
∇f⪰0
-
Rn上的范数都是凸的(由范数的三角不等式得到)
∣∣u1∣∣+∣∣u2∣∣≥∣∣u1+u2∣∣
max(x)+max(y)>max(x+y)
f(x,y)=x2/y,y>0 ∇2f=[2/y−2x/y2−2x/y22x2/y3],det(∇2f)=y32∣∣y2−xy−xy2x2∣∣=y22∗(2x2y2−x2y2)>0
f(x)=log(exp(x1)+exp(x2)+...+exp(xn))
∂xi∂f=Σj=0j=nexp(xj)exp(xi)
z=(exp(x1),exp(x2),...,exp(xn)), Σj=0j=nexp(xj)=1Tz
求Hessian矩阵
∂xi∂xj∂2f=−(1Tz)2exp(xi)exp(xj),i=j
∂xi2∂2f=1Tzexp(xi)−(1Tz)2exp(xi)2
i=j时二阶导导前半部分可以组成一个对角阵列,后半部分和不等时的形式相同
∇2f=(1Tz)21((1Tz)diag(z)−zzT)
对任意v,有
vT∇2f v=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−vTzzTv)=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−(Σj=0j=nzjvj)2)
此处使用Cauchy-Schwarz不等式,ai=vizi,bi=zi,(aTa)(bTb)≥(aTb)2,可得上式不小于0。
Epigraph 外图
函数f的graph定义为
{(x,f(x))∣x∈dom f}
是Rn+1的子集
其epigraph为
epi f={(x,t)∣x∈dom f,f≤t}
(‘Epi’ means ‘above’ so epigraph means ‘above the graph’.)
亚图为
hypof={(x,t)∣x∈dom f,f≥t}
![20240718104117.png]()
这个图能建立凸集和凸函数的关系。当且仅当外图(epi f)是凸的时候函数是凸的。
当且仅当亚图(hypo f)是凸的时候函数是凹的
f(x,Y)=xTY−1x, dom f=Rn×S++n
epif={(x,Y,t)∣Y≻0,f(x,Y)≤t}
xTY−1x≤t
此处需要用到舒尔补(Schur complement)
M=[ACBD]
如果A可逆,则其舒尔补为D−CA−1B
代入有
M=[YxTxt]⪰0
超平面和半空间
超平面
aTx=b
半空间
{x∣aTx≥b}
椭球
ϵ={x∣(x−xc)TP−1(x−xc)≤1}
P是对称且正定的,对称轴的长度由特征值的根号给出λi
多面体
P={x∣Ax≼b,Cx=d}
A=⎣⎡a1T...amT⎦⎤,C=⎣⎡c1T...cpT⎦⎤
单纯形
n维单纯形有n+1个顶点,如1维线段,2维三角形,三维四面体
单位单纯形x⪰0,1Tx≤1 , n维度
概率单纯形x⪰0,1Tx=1, n-1维度
整半定锥
对称矩阵集合Sn={X∈Rn×n∣X=XT}
其维度为(n+1)n/2,可以想想有多少个独立的元素。
非负
S+n={X∈Rn×n∣X=XT,X⪰0}
正
S+n+={X∈Rn×n∣X=XT,X≻0}
convex set:都是
convex cone:S+n+不是,因为没有0
保凸性的操作
仿射变换、凸集的交集、求和、笛卡尔内积
设有线性矩阵不等式(LMI)
A(x)=x1A1+...+xnAn⪯B
其解集是convex的
仿射变换呢?
透视函数
降低维度 P:Rn+1→Rn
可以等效为一个小孔成像摄像机
接受平面位置在x3=−1
小孔在原点,被测物x1,x2,x3
则相点为−(x1/x3,x2/x3,1)
domP=Rn×R++
P(z,t)=z/t
如果domP中的C是凸点,他的像
P(C)={P(x)∣x∈C}
也是凸的
凸函数的条件
1阶判定条件
若f可微,当且仅当dom f凸,而且
f(y)≥f(x)+∇f(x)T(y−x)
minimize f0(x)
subject to fi(x)≤bi,i=1,...,m
凸优化问题:
fi(αx+βy)≤αfi(x)+βfi(y), x,y∈Rn,α+β=1,α≥0,β≥0
所有的函数都是凸函数时这个规划问题成为凸优化问题。
最小二乘问题
无约束条件下
minimize∣∣Ax−b∣∣22
ATAx=ATb
x=(ATA)−1ATb
A∈Rk×n,k≥n
此处可以猜想一下,举例如k个点拟合一条直线。k个方程求解n个自变量。
带权的最小二乘
Σwi(aiTx−b)
regularization
Σi=1k(aiTx−bi)2+ρΣi=1nxi2
线性规划
切比雪夫近似问题
minimize maxi=1...k ∣aiTx−bi∣
与最小二乘不同,不使用平方而是使用极大值——一阶矩?1范数
不可微
转化为
minimize t
subject to aiTx−t≤bi,−aiTx−t≤−bi
内点法?
仿射
仿射集合:一个集合 C 在一个向量空间中被称为仿射集合,如果对于集合 CC 中的任意两个点 x 和 y,以及任意实数 α,其中 0≤α≤1,集合 CC 都包含点 (1−α)x+αy。
线性方程组的解集是一个仿射集合
Ax=b的解x1=x2
Ax1=b,Ax2=b
A(αx1+βx2)=A(αx1)+A(βx2)=(α+β)b=b
affine hull
1
| The set of all affine combinations of points in some set C ⊆ Rn is called the affine hull of C, and denoted aff C
|
在欧几里得空间 Rn 中,一个集合 C 的仿射包(affine hull)是指所有包含在集合 C 中的点的仿射组合的集合。换句话说,它是通过 C中任意有限个点 x1,x2,…,xk的所有可能的线性组合的集合。
仿射包的理解?
aff C={θ1x1+...+θnxn∣xk∈C,Σθi=1}
affine dimension
集合C的仿射维度定义为他的仿射包(?)
例:对单位圆上的点
{x∈R2∣x12+x22=1}
其仿射包是R2(单位圆上的点通过线性组合可以产生)
相对内部(relative interior)
relint C={x∈C∣B(x,r)∩affC⊆C for some r>0}
就是这些点的邻域与aff C的交集仍然在C中。
cl C relint C 为边界
三维空间中的正方形
C={x∈R3∣∣x1∣≤1,∣x2∣≤2,x3=0}
其仿射包是什么呢?是由平面上的点组成的所有线性组合,那么自然是整个平面。那么dimension应该是2
凸集
x1∈C,x2∈C,0≤θ≤1,θx1+(1−θ)x2∈C
则为凸集
仿射集都是凸集
凸组合:
θ1x1+θ2x2+...+θnxn,θi≥0
凸包:
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k,θ1+...+θk=1}
设 CC 是一个集合,那么 CC 的凸包 conv©conv© 是包含 CC 中所有点的最小凸集合。换句话说,conv©conv© 是包含 CC 的所有点的最小凸集合,且没有其他凸集合包含 CC 中的所有点。
线性组合、仿射组合与凸组合
对比一下,都是
θ1x1+...+θkxk
但是线性组合对θi无要求,仿射要求Σθi=1,凸组合要求Σθi=1,且θi≥0
条件越来越强。
![20240716154814.png]()
锥集
对任意x∈C,都有θx∈C
锥的顶点在原点。
凸锥====== 又凸又锥(比如一个立在原点的在最粗的地方切开的洋葱头?)
θ1x1+...+θkxk,θi≥0
conic combination
锥组合
锥包
{θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k}
C的锥包是能包含C的最小的锥集
![20240717101836.png]()
超平面和半空间
超平面
aTx=b
半空间
{x∣aTx≥b}
椭球
ϵ={x∣(x−xc)TP−1(x−xc)≤1}
P是对称且正定的,对称轴的长度由特征值的根号给出λi
多面体
P={x∣Ax≼b,Cx=d}
A=⎣⎡a1T...amT⎦⎤,C=⎣⎡c1T...cpT⎦⎤
单纯形
n维单纯形有n+1个顶点,如1维线段,2维三角形,三维四面体
单位单纯形x⪰0,1Tx≤1 , n维度
概率单纯形x⪰0,1Tx=1, n-1维度
整半定锥
对称矩阵集合Sn={X∈Rn×n∣X=XT}
其维度为(n+1)n/2,可以想想有多少个独立的元素。
非负
S+n={X∈Rn×n∣X=XT,X⪰0}
正
S+n+={X∈Rn×n∣X=XT,X≻0}
convex set:都是
convex cone:S+n+不是,因为没有0
保凸性的操作
仿射变换、凸集的交集、求和、笛卡尔内积
设有线性矩阵不等式(LMI)
A(x)=x1A1+...+xnAn⪯B
其解集是convex的
仿射变换呢?
透视函数
降低维度 P:Rn+1→Rn
可以等效为一个小孔成像摄像机
接受平面位置在x3=−1
小孔在原点,被测物x1,x2,x3
则相点为−(x1/x3,x2/x3,1)
domP=Rn×R++
P(z,t)=z/t
如果domP中的C是凸点,他的像
P(C)={P(x)∣x∈C}
也是凸的
凸函数的条件
1阶判定条件
若f可微,当且仅当dom f凸,而且
f(y)≥f(x)+∇f(x)T(y−x)
![20240717185837.png]()
其几何意义为函数上的点永远比某一条切线上的点高(或重合)
(该形式为泰勒一阶展开)
2阶判定条件
∇f⪰0
-
Rn上的范数都是凸的(由范数的三角不等式得到)
∣∣u1∣∣+∣∣u2∣∣≥∣∣u1+u2∣∣
max(x)+max(y)>max(x+y)
f(x,y)=x2/y,y>0 ∇2f=[2/y−2x/y2−2x/y22x2/y3],det(∇2f)=y32∣∣y2−xy−xy2x2∣∣=y22∗(2x2y2−x2y2)>0
f(x)=log(exp(x1)+exp(x2)+...+exp(xn))
∂xi∂f=Σj=0j=nexp(xj)exp(xi)
z=(exp(x1),exp(x2),...,exp(xn)), Σj=0j=nexp(xj)=1Tz
求Hessian矩阵
∂xi∂xj∂2f=−(1Tz)2exp(xi)exp(xj),i=j
∂xi2∂2f=1Tzexp(xi)−(1Tz)2exp(xi)2
i=j时二阶导导前半部分可以组成一个对角阵列,后半部分和不等时的形式相同
∇2f=(1Tz)21((1Tz)diag(z)−zzT)
对任意v,有
vT∇2f v=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−vTzzTv)=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−(Σj=0j=nzjvj)2)
此处使用Cauchy-Schwarz不等式,ai=vizi,bi=zi,(aTa)(bTb)≥(aTb)2,可得上式不小于0。
Epigraph 外图
函数f的graph定义为
{(x,f(x))∣x∈dom f}
是Rn+1的子集
其epigraph为
epi f={(x,t)∣x∈dom f,f≤t}
(‘Epi’ means ‘above’ so epigraph means ‘above the graph’.)
亚图为
hypof={(x,t)∣x∈dom f,f≥t}
![20240718104117.png]()
这个图能建立凸集和凸函数的关系。当且仅当外图(epi f)是凸的时候函数是凸的。
当且仅当亚图(hypo f)是凸的时候函数是凹的
f(x,Y)=xTY−1x, dom f=Rn×S++n
epif={(x,Y,t)∣Y≻0,f(x,Y)≤t}
xTY−1x≤t
此处需要用到舒尔补(Schur complement)
M=[ACBD]
如果A可逆,则其舒尔补为D−CA−1B
代入有
M=[YxTxt]⪰0
其几何意义为函数上的点永远比某一条切线上的点高(或重合)
(该形式为泰勒一阶展开)
2阶判定条件
∇f⪰0
-
Rn上的范数都是凸的(由范数的三角不等式得到)
∣∣u1∣∣+∣∣u2∣∣≥∣∣u1+u2∣∣
max(x)+max(y)>max(x+y)
f(x,y)=x2/y,y>0 ∇2f=[2/y−2x/y2−2x/y22x2/y3],det(∇2f)=y32∣∣y2−xy−xy2x2∣∣=y22∗(2x2y2−x2y2)>0
f(x)=log(exp(x1)+exp(x2)+...+exp(xn))
∂xi∂f=Σj=0j=nexp(xj)exp(xi)
z=(exp(x1),exp(x2),...,exp(xn)), Σj=0j=nexp(xj)=1Tz
求Hessian矩阵
∂xi∂xj∂2f=−(1Tz)2exp(xi)exp(xj),i=j
∂xi2∂2f=1Tzexp(xi)−(1Tz)2exp(xi)2
i=j时二阶导导前半部分可以组成一个对角阵列,后半部分和不等时的形式相同
∇2f=(1Tz)21((1Tz)diag(z)−zzT)
对任意v,有
vT∇2f v=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−vTzzTv)=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−(Σj=0j=nzjvj)2)
此处使用Cauchy-Schwarz不等式,ai=vizi,bi=zi,(aTa)(bTb)≥(aTb)2,可得上式不小于0。
Epigraph 外图
函数f的graph定义为
{(x,f(x))∣x∈dom f}
是Rn+1的子集
其epigraph为
epi f={(x,t)∣x∈dom f,f≤t}
(‘Epi’ means ‘above’ so epigraph means ‘above the graph’.)
亚图为
hypof={(x,t)∣x∈dom f,f≥t}
minimize f0(x)
subject to fi(x)≤bi,i=1,...,m
凸优化问题:
fi(αx+βy)≤αfi(x)+βfi(y), x,y∈Rn,α+β=1,α≥0,β≥0
所有的函数都是凸函数时这个规划问题成为凸优化问题。
最小二乘问题
无约束条件下
minimize∣∣Ax−b∣∣22
ATAx=ATb
x=(ATA)−1ATb
A∈Rk×n,k≥n
此处可以猜想一下,举例如k个点拟合一条直线。k个方程求解n个自变量。
带权的最小二乘
Σwi(aiTx−b)
regularization
Σi=1k(aiTx−bi)2+ρΣi=1nxi2
线性规划
切比雪夫近似问题
minimize maxi=1...k ∣aiTx−bi∣
与最小二乘不同,不使用平方而是使用极大值——一阶矩?1范数
不可微
转化为
minimize t
subject to aiTx−t≤bi,−aiTx−t≤−bi
内点法?
仿射
仿射集合:一个集合 C 在一个向量空间中被称为仿射集合,如果对于集合 CC 中的任意两个点 x 和 y,以及任意实数 α,其中 0≤α≤1,集合 CC 都包含点 (1−α)x+αy。
线性方程组的解集是一个仿射集合
Ax=b的解x1=x2
Ax1=b,Ax2=b
A(αx1+βx2)=A(αx1)+A(βx2)=(α+β)b=b
affine hull
1
| The set of all affine combinations of points in some set C ⊆ Rn is called the affine hull of C, and denoted aff C
|
在欧几里得空间 Rn 中,一个集合 C 的仿射包(affine hull)是指所有包含在集合 C 中的点的仿射组合的集合。换句话说,它是通过 C中任意有限个点 x1,x2,…,xk的所有可能的线性组合的集合。
仿射包的理解?
aff C={θ1x1+...+θnxn∣xk∈C,Σθi=1}
affine dimension
集合C的仿射维度定义为他的仿射包(?)
例:对单位圆上的点
{x∈R2∣x12+x22=1}
其仿射包是R2(单位圆上的点通过线性组合可以产生)
相对内部(relative interior)
relint C={x∈C∣B(x,r)∩affC⊆C for some r>0}
就是这些点的邻域与aff C的交集仍然在C中。
cl C relint C 为边界
三维空间中的正方形
C={x∈R3∣∣x1∣≤1,∣x2∣≤2,x3=0}
其仿射包是什么呢?是由平面上的点组成的所有线性组合,那么自然是整个平面。那么dimension应该是2
凸集
x1∈C,x2∈C,0≤θ≤1,θx1+(1−θ)x2∈C
则为凸集
仿射集都是凸集
凸组合:
θ1x1+θ2x2+...+θnxn,θi≥0
凸包:
convC={θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k,θ1+...+θk=1}
设 CC 是一个集合,那么 CC 的凸包 conv©conv© 是包含 CC 中所有点的最小凸集合。换句话说,conv©conv© 是包含 CC 的所有点的最小凸集合,且没有其他凸集合包含 CC 中的所有点。
线性组合、仿射组合与凸组合
对比一下,都是
θ1x1+...+θkxk
但是线性组合对θi无要求,仿射要求Σθi=1,凸组合要求Σθi=1,且θi≥0
条件越来越强。
![20240716154814.png]()
锥集
对任意x∈C,都有θx∈C
锥的顶点在原点。
凸锥====== 又凸又锥(比如一个立在原点的在最粗的地方切开的洋葱头?)
θ1x1+...+θkxk,θi≥0
conic combination
锥组合
锥包
{θ1x1+...+θkxk∣xi∈C,θi≥0,i=1,...,k}
C的锥包是能包含C的最小的锥集
![20240717101836.png]()
超平面和半空间
超平面
aTx=b
半空间
{x∣aTx≥b}
椭球
ϵ={x∣(x−xc)TP−1(x−xc)≤1}
P是对称且正定的,对称轴的长度由特征值的根号给出λi
多面体
P={x∣Ax≼b,Cx=d}
A=⎣⎡a1T...amT⎦⎤,C=⎣⎡c1T...cpT⎦⎤
单纯形
n维单纯形有n+1个顶点,如1维线段,2维三角形,三维四面体
单位单纯形x⪰0,1Tx≤1 , n维度
概率单纯形x⪰0,1Tx=1, n-1维度
整半定锥
对称矩阵集合Sn={X∈Rn×n∣X=XT}
其维度为(n+1)n/2,可以想想有多少个独立的元素。
非负
S+n={X∈Rn×n∣X=XT,X⪰0}
正
S+n+={X∈Rn×n∣X=XT,X≻0}
convex set:都是
convex cone:S+n+不是,因为没有0
保凸性的操作
仿射变换、凸集的交集、求和、笛卡尔内积
设有线性矩阵不等式(LMI)
A(x)=x1A1+...+xnAn⪯B
其解集是convex的
仿射变换呢?
透视函数
降低维度 P:Rn+1→Rn
可以等效为一个小孔成像摄像机
接受平面位置在x3=−1
小孔在原点,被测物x1,x2,x3
则相点为−(x1/x3,x2/x3,1)
domP=Rn×R++
P(z,t)=z/t
如果domP中的C是凸点,他的像
P(C)={P(x)∣x∈C}
也是凸的
凸函数的条件
1阶判定条件
若f可微,当且仅当dom f凸,而且
f(y)≥f(x)+∇f(x)T(y−x)
![20240717185837.png]()
其几何意义为函数上的点永远比某一条切线上的点高(或重合)
(该形式为泰勒一阶展开)
2阶判定条件
∇f⪰0
-
Rn上的范数都是凸的(由范数的三角不等式得到)
∣∣u1∣∣+∣∣u2∣∣≥∣∣u1+u2∣∣
max(x)+max(y)>max(x+y)
f(x,y)=x2/y,y>0 ∇2f=[2/y−2x/y2−2x/y22x2/y3],det(∇2f)=y32∣∣y2−xy−xy2x2∣∣=y22∗(2x2y2−x2y2)>0
f(x)=log(exp(x1)+exp(x2)+...+exp(xn))
∂xi∂f=Σj=0j=nexp(xj)exp(xi)
z=(exp(x1),exp(x2),...,exp(xn)), Σj=0j=nexp(xj)=1Tz
求Hessian矩阵
∂xi∂xj∂2f=−(1Tz)2exp(xi)exp(xj),i=j
∂xi2∂2f=1Tzexp(xi)−(1Tz)2exp(xi)2
i=j时二阶导导前半部分可以组成一个对角阵列,后半部分和不等时的形式相同
∇2f=(1Tz)21((1Tz)diag(z)−zzT)
对任意v,有
vT∇2f v=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−vTzzTv)=(1Tz)21(Σj=0j=nzjΣj=0j=nvj2zj−(Σj=0j=nzjvj)2)
此处使用Cauchy-Schwarz不等式,ai=vizi,bi=zi,(aTa)(bTb)≥(aTb)2,可得上式不小于0。
Epigraph 外图
函数f的graph定义为
{(x,f(x))∣x∈dom f}
是Rn+1的子集
其epigraph为
epi f={(x,t)∣x∈dom f,f≤t}
(‘Epi’ means ‘above’ so epigraph means ‘above the graph’.)
亚图为
hypof={(x,t)∣x∈dom f,f≥t}
![20240718104117.png]()
这个图能建立凸集和凸函数的关系。当且仅当外图(epi f)是凸的时候函数是凸的。
当且仅当亚图(hypo f)是凸的时候函数是凹的
f(x,Y)=xTY−1x, dom f=Rn×S++n
epif={(x,Y,t)∣Y≻0,f(x,Y)≤t}
xTY−1x≤t
此处需要用到舒尔补(Schur complement)
M=[ACBD]
如果A可逆,则其舒尔补为D−CA−1B
代入有
M=[YxTxt]⪰0
这个图能建立凸集和凸函数的关系。当且仅当外图(epi f)是凸的时候函数是凸的。
当且仅当亚图(hypo f)是凸的时候函数是凹的
f(x,Y)=xTY−1x, dom f=Rn×S++n
epif={(x,Y,t)∣Y≻0,f(x,Y)≤t}
xTY−1x≤t
此处需要用到舒尔补(Schur complement)
M=[ACBD]
如果A可逆,则其舒尔补为D−CA−1B
代入有
M=[YxTxt]⪰0