多元微积分笔记


写在前头:
为了更成体系的完成这份笔记,同时方便复习,笨咸鱼选择在考试周一并完成笔记的编辑(其实主要是我懒)。
由于众所周知的原因,wxf课上一些过于逆天的例子我就不放在上面了。

多元函数的例子

  • 多元函数:f(x1,x2,x3...xn),f:URnRf(x^1,x^2,x^3...x^n),f:U\subset \mathbb{R}^n\to \mathbb{R}
  • 多元函数举例:
    • 等高线:f:R2Rf:\mathbb{R}^2\to\mathbb{R},考虑时间f:R2×[0,+)Rf:\mathbb{R}^2\times [0,+\infty) \to\mathbb{R}
    • 单摆能量

    E(θ,θ˙)=12m(Lθ˙)2+mgLcosθ=C,E:S×RRE(\theta,\dot{\theta})=\frac{1}{2}m(L\dot\theta)^2+mgL\cos\theta=C,E:\mathbb{S}\times \mathbb{R}\to\mathbb{R}

    • 球坐标变换,圆环坐标变换
  • 如何研究多元函数:连续?极限?单调性?极值最值?

一般空间中的距离:距离,范数,内积

类比单变量函数中连续和极限的定义,我们需要度量两个点之间的距离。在数轴上,两个点之间的距离我们可以方便地使用绝对值|\cdot|。在二维或者一般的空间我们如何定义所谓的“距离”?

首先一个考虑空间内任意两个点A、B,类比一维情况,我们希望他们的距离是正的(正定性);其次,A到B的距离应该和B到A的距离相等(对称性);最后,这样的距离应该是“最优”的,即我不应该找到另一个点,使得我从A“绕路”去到B的距离要短于我直接“走到”B的距离(三角不等式)。即

我们称d(,):M×MRd(\cdot,\cdot):M\times M\to R为一个距离,当且仅当它满足
1.(正定性)d(A,B)0,d(A,B)=0A=Bd(A,B)\geq0,d(A,B)=0\Leftrightarrow A=B
2.(对称性)d(A,B)=d(B,A)d(A,B)=d(B,A)
3.(三角不等式)d(A,B)d(A,C)+d(B,C)d(A,B)\leq d(A,C)+d(B,C)

特别的我们希望这个距离在线性空间里是好的,我们希望它满足平移不变性

x,y,uRm,d(x,y)=d(x+u,y+u)\forall\mathbf{x},\mathbf{y},\mathbf{u}\in\mathbb{R}^m,d(\mathbf{x},\mathbf{y})=d(\mathbf{x}+\mathbf{u},\mathbf{y}+\mathbf{u})

线性空间中向量的长度RmR||\cdot||:\mathbb{R}^m\to\mathbb{R},即范数,满足:
1.x0,x=0x=0||\mathbf{x}||\geq0,||\mathbf{x}||=0\Leftrightarrow\mathbf{x}=0
2.λx=λx||\lambda\mathbf{x}||=|\lambda|||\mathbf{x}||
3.x+yx+y||\mathbf{x}+\mathbf{y}||\leq||\mathbf{x}||+||\mathbf{y}||

Rm\mathbb{R}^m上范数||\cdot||定义了一个平移不变的距离

d(x,y)=xyd(\mathbf{x},\mathbf{y})=||\mathbf{x}-\mathbf{y}||

  • 范数的坐标计算:

    x=k=1nxkek=(x1x2xn)\mathbf{x}=\sum_{k=1}^{n}x^{k}\mathbf{e}_k=\begin{pmatrix}x^1\\x^2\\\vdots\\x^n\end{pmatrix}

    x=k=1nxieik=1nxiek||\mathbf{x}||=||\sum_{k=1}^{n}x^{i}\mathbf{e}_i||\leq\sum_{k=1}^{n}|x^i|||\mathbf{e}_k||

    {maxixik=1nek=Mxmaxieik=1nxk=Mx1\leq\left\{\begin{aligned}\max_{i}|x^{i}|\sum_{k=1}^{n}||\mathbf{e}_k||=M||\mathbf{x}||_{\infty}\\\max_{i}||\mathbf{e}_{i}||\sum_{k=1}^{n}|x^{k}|=M||\mathbf{x}||_{1}\end{aligned}\right.

    其中,||\cdot||_{\infty}是无穷范数,p=(k=1nxip)1p(p1)||\cdot||_{p}=(\sum_{k=1}^{n}|x^{i}|^{p})^{\frac{1}{p}}(p\geq1)为p-范数。

Rm\mathbb{R}^{m}上的内积可以得到欧几里得范数x=<x,x>||\mathbf{x}||=\sqrt{<\mathbf{x},\mathbf{x}>},并非所有范数都可以由适当内积得到,一个范数可以由内积得到当且仅当它满足勾股定理:

x+y2+xy2=2x2+2y2||\mathbf{x}+\mathbf{y}||^2+||\mathbf{x}-\mathbf{y}||^2=2||\mathbf{x}||^2+2||\mathbf{y}||^2

由距离我们可以得到一些有关的拓扑概念:

  1. 开球:以x0V\mathbf{x}_0\in\mathbb{V}为中心,半径为r>0r>0的球,记为B(x0,r)={xV xx0<r}B(x_0,r)=\{\mathbf{x}\in \mathbb{V}|\space||\mathbf{x}-\mathbf{x}_0||<r\}
  2. 邻域、内点:称U\mathbb{U}x0\mathbf{x}_0的邻域,或者x0\mathbf{x}_0U\mathbb{U}的内点,当且仅当存在r>0r>0,使得B(x0,r)UB(x_0,r)\subset\mathbb{U}
  3. 开集:称UV\mathbb{U}\subset\mathbb{V}为开集,当且仅当任意xU\mathbf{x}\in\mathbb{U}均为U\mathbb{U}的内点。
  4. 聚点(极限点):称x0\mathbf{x}_0A\mathbb{A}是一个聚点(极限点),当且仅当δ>0,aA,s.t.0<ax<δ\forall\delta>0,\exists \mathbf{a}\in\mathbb{A}, s.t.0<||\mathbf{a}-\mathbf{x}||<\delta
  5. 闭集:包含它所有聚点的集合

多元函数极限和连续性

为了研究多元函数的微分,我们首先要研究多元函数的极限和连续性。在研究函数极限前,类似于数列极限,我们可以定义点列极限

已知定义了范数的线性空间(V,)(\mathbb{V},||\cdot||)V上点列xn\mathbb{V}上点列\mathbf{x}_n,则limnxn=xlimnxnx=0\lim_{n\to\infty}\mathbf{x}_n=\mathbf{x}\Leftrightarrow\lim_{n\to\infty}||\mathbf{x}_n-\mathbf{x}||=0

类比数列极限,我们可以类似定义一般空间内的Cauchy序列

在定义了点列极限后,就是多元函数极限和连续性:考察有限维线性空间(V,V),(W,W)(\mathbb{V},||\cdot||_{\mathbb{V}}),(\mathbb{W},||\cdot||_{\mathbb{W}})上线性映射f:AVWf:\mathbb{A}\subset\mathbb{V}\to\mathbb W

  • [函数极限] limxx0f(x)=L\lim_{\mathbf{x}\to\mathbf{x}_0}f(\mathbf{x})=\mathbf{L}x0\mathbf{x}_0为一个聚点(不是孤立的)且ϵ>0,δ>0\forall\epsilon>0,\exists\delta>0,使得xBV(x0,δ)\{x0}, f(x)f(x0)W<ϵ\forall\mathbf{x}\in B_{\mathbb{V}}(\mathbf{x}_0,\delta)\backslash\{\mathbf{x}_{0}\},\space ||f(\mathbf{x})-f(\mathbf{x}_0)||_{\mathbb{W}}<\epsilon
  • [连续性] x0A\mathbf{x}_0\in \mathbb{A}, ffx0\mathbf{x}_0处连续,当且仅当ϵ>0,δ>0\forall\epsilon>0,\exists\delta>0,使得xBV(x0,δ), f(x)f(x0)W<ϵ\forall\mathbf{x}\in B_{\mathbb{V}}(\mathbf{x}_0,\delta),\space ||f(\mathbf{x})-f(\mathbf{x}_0)||_{\mathbb{W}}<\epsilon

由定义可以注意到,函数极限是不考虑孤立点的情况的,而在连续性的考察中,孤立点必然是连续的。

  • [极限与连续性关系]x0\mathbf{x}_0为聚点,则ffx0\mathbf{x}_0处连续limxx0f(x)=f(x0)\Leftrightarrow\lim_{\mathbf{x}\to\mathbf{x}_0}f(\mathbf{x})=f(\mathbf{x}_0)limxx0f(x)=L\lim_{\mathbf{x}\to\mathbf{x}_0}f(\mathbf{x})=\mathbf{L}\Leftrightarrow函数

f~(x)={f(x),xx0L,x=x0\tilde{f}(\mathbf{x})=\left\{\begin{aligned}&f(\mathbf{x}),\mathbf{x}\neq\mathbf{x}_0\\&L,\mathbf{x}=\mathbf{x}_0\end{aligned}\right.

即用LL替代f(x0)f(\mathbf{x}_0)

主要结论:范数与极限
定理1:任何Cauchy列均收敛,有界点列必有收敛的点列

证明:首先证明在||\cdot||_{\infty}下结论成立:
xn+pixnixn+pxn    {xni}|x_{n+p}^{i}-x_{n}^{i}|\leq||\mathbf{x}_{n+p}-\mathbf{x}_{n}||_{\infty}\implies\{x_{n}^{i}\}是Cauchy列;
xnxk=1nxnkxk0||\mathbf{x}_{n}-\mathbf{x}||_{\infty}\leq\sum_{k=1}^{n}|x_{n}^{k}-x^{k}|\to0所以Cauchy列收敛;
xix|x^{i}|\leq||\mathbf{x}||_{\infty}{xi}\{x^i\}有界,按下标筛选子列;
要证明对于一般范数结论成立,则要用到定理2;若定理2成立,则可知空间内点列的收敛性与范数选取没有关系。这也很好直观理解:在度量方式良定义的情况> 下,点列的收敛是点列自身的特性,应该独立于你的度量方式。

定理2:任意范数与无穷范数等价,特别的,空间中任意两个范数等价

证明:即,xV,MR,s.t.1MxxMx\forall||\cdot||,\mathbf{x}\in\mathbb{V},\exists M\in\mathbb{R}, s.t.\frac{1}{M}||\mathbf{x}||_{\infty}\leq ||\mathbf{x}||\leq M||\mathbf{x}||_{\infty}
其中,

xM1x||\mathbf{x}||\leq M_1||\mathbf{x}||_{\infty}

是容易的(上面在定义无穷范数时已经证明了);
[反证]若对任意正整数nn,存在xn\mathbf{x}_n使得xn>nxn||\mathbf{x}_n||_{\infty}>n||\mathbf{x}_n||,考虑数列yn=xnxn    yn=1,yn<1n\mathbf{y}_n=\frac{\mathbf{x}_n}{||\mathbf{x}_n||_\infty}\implies||\mathbf{y}_n||_\infty=1,||\mathbf{y}_n||<\frac{1}{n}
yn\mathbf{y}_n在无穷范数下有收敛子列limkynky=0\lim_{k\to\infty}||\mathbf{y}_{n_{k}}-\mathbf{y}||_{\infty}=0

yynyny1||\mathbf{y}||_{\infty}\geq||\mathbf{y}_{n}||_{\infty}-||\mathbf{y}_n-\mathbf{y}||_{\infty}\to1

yyn+Myny0    y=0||\mathbf{y}||\leq||\mathbf{y}_n||+M||\mathbf{y}_n-\mathbf{y}||_{\infty}\to0\implies\mathbf{y}=\mathbf{0}

矛盾!证毕!

主要结论:连续性
对于有限线性空间V,W\mathbb{V},\mathbb{W}和连续映射f:VWf:\mathbb{V}\to\mathbb{W},有

  1. AV\mathbb{A}\subset\mathbb{V}道路连通集:对任意P,QAP,Q\in\mathbb{A}存在连续映射γ:[0,1]A\gamma:[0,1]\to\mathbb{A},满足:

γ(t)A,γ(0)=P,γ(1)=Q\gamma(t)\in\mathbb{A},\gamma(0)=P,\gamma(1)=Q

f(A)f(A)也为道路连通集
2. 若A\mathbb{A}为有界闭集,f(A)f(\mathbb{A})也为有界闭集,ffA\mathbb{A}上一致连续。

类比单元情况,连续闭区间必被连续函数映成连续闭区间,在闭区间上一致连续,且若W=R\mathbb{W}=\mathbb{R},函数在闭集上有最大值和最小值。

例:AV\mathbb{A}\subset\mathbb{V}是闭集,f:[a,b]×ARf:[a,b]\times\mathbb{A}\to\mathbb{R}连续,记g(y)=abf(x,y)dxg(\mathbf{y})=\int_{a}^{b}f(x,\mathbf{y})dx,则ggA\mathbb{A}上连续。

证明:取K=[a,b]×{yA yy0<1}\mathbb{K}=[a,b]\times\{\mathbf{y}\in\mathbb{A}|\space||\mathbf{y}-\mathbf{y}_0||<1\}为有界闭集,故一致连续:ϵ>0,δ>0,s.t.yy0<min1,δ,x[a,b],f(x,y)f(x,y0)<ϵ\forall\epsilon>0,\exists\delta>0,s.t.||\mathbf{y}-\mathbf{y}_0||<\min{1,\delta}, \forall x\in[a,b], |f(x,\mathbf{y})-f(x,\mathbf{y}_0)|<\epsilon
g(yy0)=ab(f(x,y)f(x,y0))dx=ε(ba)0\therefore|g(\mathbf{y}-\mathbf{y_0})|=|\int_{a}^{b}(f(x,\mathbf{y})-f(x,\mathbf{y_0}))dx|=\varepsilon(b-a)\to0证毕!

无穷小量、大小o
考虑下面这一极限的存在性:

lim(x,y)(0,0)xyx+y\lim_{(x,y)\to(0,0)}\frac{xy}{x+y}

沿y=txy=tx方向,xyx+y=tx2x+tx=t1+tx0\frac{xy}{x+y}=\frac{tx^2}{x+tx}=\frac{t}{1+t}x\to0
沿y=x+tx2y=-x+tx^2方向,xyx+y=x2+tx3tx21\frac{xy}{x+y}=\frac{-x^2+tx^3}{tx^2}\to-1
综上极限不存在。

这用到了若多元函数在某点极限存在,函数沿不同原相空间曲线经过该点的极限存在且相同

但类比单变量函数,上面极限类似似乎是一个o(x2)o(x)0\frac{o(x^2)}{o(x)}\to0形式,但是它的极限比不存在,说明在多元函数中,无穷小量、大小o是需要重新定义的。

  1. xa,f\mathbf{x}\to\mathbf{a},f为无穷小量:limxaf(x)=0\lim_{\mathbf{x}\to\mathbf{a}}f(\mathbf{x})=0.
  2. xa,f=O(g)\mathbf{x}\to\mathbf{a},f=O(g)M,s.t.xN˚(a,δ),f(x)Mg(x)\exists M, s.t. \forall \mathbf{x}\in\mathring{\mathcal{N}}(\mathbf{a},\delta),||f(\mathbf{x})||\leq M||g(\mathbf{x})||.
  3. xa,f=o(g)\mathbf{x}\to\mathbf{a},f=o(g)ϵ>0,δ>0,s.t.xN˚(a,δ),f(x)ϵg(x)\forall \epsilon>0,\exists\delta>0, s.t. \forall \mathbf{x}\in\mathring{\mathcal{N}}(\mathbf{a},\delta),||f(\mathbf{x})||\leq \epsilon||g(\mathbf{x})||.

因此我们可以得到连续和极限的简化表示:

  • 连续:f(x)=f(x0)+o(1),xx0f(\mathbf{x})=f(\mathbf{x}_0)+o(1),\mathbf{x}\to\mathbf{x}_0
  • 极限:f(x)L=o(1),xaf(\mathbf{x})-L=o(1),\mathbf{x}\to\mathbf{a}

函数极限的判断法:压缩不动点
在多元情况下,压缩不动点定理依然成立,即:
AV\mathbb{A}\subset\mathbb{V}为有界闭集,映射f:AVf:\mathbb{A}\to\mathbb{V}满足:
1.f(A)Af(\mathbb{A})\subset \mathbb{A};
2.0<λ<1,x,yA,f(x)f(y)λxy\exists0<\lambda<1,\forall\mathbf{x},\mathbf{y}\in\mathbb{A}||,f(\mathbf{x})-f(\mathbf{y})||\leq\lambda||\mathbf{x}-\mathbf{y}||
则称ff为一个压缩,在A\mathbb{A}上存在唯一的x\mathbf{x}^{*}使得f(x)=xf(\mathbf{x}^{*})=\mathbf{x}^{*}

fn(x)xλn1λf(x)x||f^{n}(\mathbf{x})-\mathbf{x}^{*}||\leq\frac{\lambda^{n}}{1-\lambda}||f(\mathbf{x})-\mathbf{x}||

其中fn=ffn1f^{n}=f\circ f^{n-1}

证明:

fn+p(x)fn(x)k=1pfn+k(x)fn+k1(x)||f^{n+p}(\mathbf{x})-f^{n}(\mathbf{x})||\leq\sum_{k=1}^{p}||f^{n+k}(\mathbf{x})-f^{n+k-1}(\mathbf{x})||

k=1pλn+kf(x)xλn1λf(x)x\leq\sum_{k=1}^{p}\lambda^{n+k}||f(\mathbf{x})-\mathbf{x}||\leq\frac{\lambda^{n}}{1-\lambda}||f(\mathbf{x})-\mathbf{x}||

nn\to\infty时,可知fn(x)f^{n}(\mathbf{x})为Cauchy序列,存在极限xA\mathbf{x}^{*}\in\mathbb{A}(闭集),上式中令pp\to\infty有:

fn(x)xλn1λf(x)x|f^{n}(\mathbf{x})-\mathbf{x}^{*}||\leq\frac{\lambda^{n}}{1-\lambda}||f(\mathbf{x})-\mathbf{x}||

下证极限x\mathbf{x}^{*}是唯一不动点:

f(x)xfn(x)x+fn(x)f(x)||f(\mathbf{x}^{*})-\mathbf{x}^{*}||\leq||f^{n}(\mathbf{x})-\mathbf{x}^{*}||+||f^{n}(\mathbf{x})-f(\mathbf{x}^{*})||

(λ+1)fn(x)x0\leq(\lambda+1)||f^{n}(\mathbf{x})-\mathbf{x}^{*}||\to0

故证得为不动点。若x\mathbf{x}^{**}也是不动点:

xx=fn(x)x0||\mathbf{x}^{**}-\mathbf{x}^{*}||=||f^{n}(\mathbf{x}^{**})-\mathbf{x}^{*}||\to0

故不动点是唯一的。

多元(映射)函数微分学

函数(映射)的微分得终极目标,是找到一个映射在某点附近得线性近似(在多元映射下一般是一个矩阵),即:

f(x)=f(x0)+L(xx0)+o(xx0),xx0f(\mathbf{x})=f(\mathbf{x}_0)+L(\mathbf{x}-\mathbf{x}_0)+o(||\mathbf{x}-\mathbf{x}_0||),\mathbf{x}\to\mathbf{x}_0

我们称Df(x0)=LDf(\mathbf{x}_0)=L为映射在此处的微分,在相空间为R\mathbb{R}时也写作df(x0)df(\mathbf{x}_0)

  • 例子:n重线性映射LnL_{n}

    DLn(a)(x)=DLn(a1+x1,,an+xn)=DL_{n}(\mathbf{a})(\mathbf{x})=DL_{n}(\mathbf{a}_1+\mathbf{x}_1,\cdots,\mathbf{a}_n+\mathbf{x}_n)=

    k=1nLn(a1,,xk,,an)\sum_{k=1}^{n}L_{n}(\mathbf{a_1},\cdots,\mathbf{x}_k,\cdots,\mathbf{a}_n)

类似单变量函数的可以得到链锁法则
在满足对应点处均可微的情况下:

D(gf)(a)=Dg(f(a))Df(a)D(g\circ f)(\mathbf{a})=Dg(f(\mathbf{a}))\cdot Df(\mathbf a)

由Riesz表示定理,内积空间V\mathbb{V}中的线性函数LL可以表示成内积的形式:

xV,b,L(x)=<b,x>\forall \mathbf{x}\in\mathbb{V},\exists\mathbf{b},L(\mathbf{x})=<\mathbf{b},\mathbf{x}>

L=Df(a)L=Df(a)时,记b=gradf(a)\mathbf{b}=\mathbf{grad}f(\mathbf{a})f(a)\nabla f(\mathbf{a})ffa\mathbf{a}处的梯度。

沿向量的导数和方向导数
线性空间V\mathbb{V}和空间上一非空开集A\mathbb{A},对aA,vV\mathbf{a}\in\mathbb{A},\mathbf{v}\in\mathbb{V}f:AWf:\mathbb{A}\to\mathbb{W}沿过a\mathbf{a}直线成为一个一元映射g(t)=f(a+tv)g(t)=f(\mathbf{a}+t\mathbf{v});若

g(0)=limt0f(a+tv)f(a)tg'(0)=\lim_{t\to0}\frac{f(\mathbf{a}+t\mathbf{v})-f(\mathbf{a})}{t}

存在,记g(0)g'(0)vf(a)\partial_{\mathbf{v}}f(\mathbf{a})fv(a)\frac{\partial f}{\partial\mathbf{v}}(\mathbf{a})ffa\mathbf{a}处沿v\mathbf{v}的导数;若v=1||\mathbf{v}||=1,则称为方向导数。当ffa\mathbf{a}处可微时,ff沿任意过a\mathbf{a}曲线γ:[0,1]A(γ(0)=a,γ(0)=v)\gamma:[0,1]\to A(\gamma(0)=\mathbf{a},\gamma'(0)=\mathbf{v})关于tt可导,由链锁法则:

ddtf(γ(t))t0=Df(a)v=f(a)v\frac{d}{dt}f(\gamma(t))|_{t\to0}=\mathrm{D}f(\mathbf{a})\mathbf{v}=\nabla f(\mathbf{a})\cdot\mathbf{v}

值得提一嘴的是:第一,不要混淆沿向量的导数方向导数,方向导数是在单位向量下的特殊情况;第二,这里多元函数实际上应该扩展为多元映射,在这种意义下,函数的微分是一个矩阵,导数是向量还是标量取决于映射的相空间,当相空间为R\mathbb{R},导数为标量。

在线性空间中引入基底e1,e2,,en\mathbf{e}_1,\mathbf{e}_2,\cdots,\mathbf{e}_n,则ff在某点沿基底向量的导数被称为偏导数
有如下结论:

Df(a)=(f1(a)fn(a))Df(\mathbf{a})=\begin{pmatrix}f_1(\mathbf{a})\cdots f_n(\mathbf{a})\end{pmatrix}

若选取的基底为单位正交基,则:

f(a)=(f1(a)f2(a)fn(a))\nabla f(\mathbf{a})=\begin{pmatrix}f_1(\mathbf{a})\\f_2(\mathbf{a})\\\vdots\\f_n(\mathbf{a})\end{pmatrix}

全微分公式

df=k=1nfxidxidf=\sum_{k=1}^{n}\frac{\partial f}{\partial x^{i}}dx^{i}

f((x1x2xn))=(y1y2yn)f(\begin{pmatrix}x^{1}\\x^{2}\\\vdots\\x^{n}\end{pmatrix})=\begin{pmatrix}y^1\\y^2\\\vdots\\y^n\end{pmatrix},则可以得到Jacobi矩阵

Df(x)=Jf(x)=(y1x1y1x2y1xny2x1y2xnynx1ynxn)Df(\mathbf{x})=Jf(\mathbf{x})=\begin{pmatrix}\frac{\partial y^1}{\partial x^1}&\frac{\partial y^1}{\partial x^2}&\cdots&\frac{\partial y^1}{\partial x^n}\\\frac{\partial y^2}{\partial x^1}&&&\frac{\partial y^2}{\partial x^n}\\\vdots&&&\vdots\\\frac{\partial y^{n}}{\partial x^{1}}&&\cdots&\frac{\partial y^{n}}{\partial x^{n}}\end{pmatrix}

偏导数、可微性和连续性
若函数所有一阶偏导数(共mm个)存在,且在邻域中至少m1m-1个偏导数存在且连续,则函数可微;
若函数关于一个自变量连续,关于其它m1m-1个自变量在邻域中有有界偏导数,则连续

高阶偏导
高阶偏导对于求导次序没有关系即

fσ1=fσ2f_{\sigma_1}=f_{\sigma_2}

偏微分方程的特征线法
求一维波动方程uttuxx=0u_{tt}-u_{xx}=0C2\mathcal{C}^2

uttuxx=0(tx)(t+x)u=0u_{tt}-u_{xx}=0\Leftrightarrow (\frac{\partial }{\partial t}-\frac{\partial}{\partial x})(\frac{\partial}{\partial t}+\frac{\partial}{\partial x})u=0

{vtvx=0ut+ux=v\Leftrightarrow\left\{\begin{aligned}v_{t}-v_{x}&=0\\u_{t}+u_{x}&=v\end{aligned}\right.

ddtv(t,x(t))=vt(t,x(t))+vx(t,(t))x(t)\frac{d}{dt}v(t,x(t))=v_{t}(t,x(t))+v_{x}(t,(t))x'(t)

x(t)=1x(t)=t+Cx'(t)=-1\Leftrightarrow x(t)=-t+C,

ddtv(t,t+C)=0\frac{d}{dt}v(t,-t+C)=0

vv沿x+t=Cx+t=C为常数(特征线)    \implies

v(t,x)=v(0,x+t)v(t,x)=v(0,x+t)

fC1,\forall f\in\mathcal{C}^{1},

ft(x+t)fx(x+t)=0f_{t}(x+t)-f_x(x+t)=0

vv的解为v(t,x)=f(x+t)v(t,x)=f(x+t),类似的u(t,x)=g(tx)u(t,x)=g(t-x)ut+ux=0u_{t}+u_{x}=0的解。
考方程ut+ux=f(x+t)u_{t}+u_{x}=f(x+t)沿特征线x=t+Cx=t+C方向

ddtu(t,t+C)=ut(t,t+C)+ux(t,t+C)=f(2t+C)\frac{d}{dt}u(t,t+C)=u_{t}(t,t+C)+u_{x}(t,t+C)=f(2t+C)

u(t,t+C)=u(0,C)+0tf(2s+C)dsu(t,t+C)=u(0,C)+\int_{0}^{t}f(2s+C)ds

u(t,x)=u(0,xt)+0tf(2s+xt)dsu(t,x)=u(0,x-t)+\int_{0}^{t}f(2s+x-t)ds

u(t,x)=h(xt)+12xtx+tf(τ)dτu(t,x)=h(x-t)+\frac{1}{2}\int_{x-t}^{x+t}f(\tau)d\tau

u(t,x)=F(xt)+G(x+t)u(t,x)=F(x-t)+G(x+t)

特征线法:对一阶偏微分方程

kAk(x)zxk=b(x)\sum_{k} A_{k}(\mathbf{x}) \frac{\partial z}{\partial x^{k}} = b(\mathbf{x})

构造曲线 x=x(t)\mathbf{x} = \mathbf{x}(t),使得 x(t)=A(x(t))\mathbf{x}'(t) = \mathbf{A}(\mathbf{x}(t))

于是,

kAk(x(t))zxk(x(t))=ddtz(x(t))\sum_{k} A_{k}(\mathbf{x}(t)) \frac{\partial z}{\partial x^{k}}(\mathbf{x}(t)) = \frac{\mathrm{d}}{\mathrm{d} t} z(\mathbf{x}(t))

从而,

z(x(t))=z(x0)+0tb(x(s))dsz(\mathbf{x}(t)) = z(\mathbf{x}_0) + \int_{0}^{t} b(\mathbf{x}(s)) \, \mathrm{d} s

在研究了导数后,我们就可以得到对函数进行线性近似的终极方法:Taylor展开

  • 带Lagrange余项的泰勒展开:

    f(x0+v)=f(x0)+k=1r11k!αi=kkfi=1n(xi)αi(x0)(v)f(\mathbf{x}_0+\mathbf{v})=f(\mathbf{x}_0)+\sum_{k=1}^{r-1}\frac{1}{k!}\sum_{\sum\alpha_{i}=k}\frac{\partial^k f}{\prod_{i=1}^{n}\partial (x^{i})^{\alpha_{i}}}(\mathbf{x_0})(\mathbf{v})

    +1r!αi=rkfi=1n(xi)αi(x0+ξ)(v),ξ(0,1)+\frac{1}{r!}\sum_{\sum\alpha_{i}=r}\frac{\partial^k f}{\prod_{i=1}^{n}\partial (x^{i})^{\alpha_{i}}}(\mathbf{x_0}+\xi)(\mathbf{v}),\xi\in(0,1)

  • Peano余项:o(vr1)o(||\mathbf{v}||^{r-1})

有了以上知识后,我们可以开始讨论多元函数的极值

首先我们注意到,对于一个函数ff和点x0\mathbf{x}_0,若df(x0)0df(\mathbf{x}_0)\neq0,则存在v\mathbf{v}使得:

ddtf(x0+tv)t=0=df(x0)v>0\frac{d}{dt}f(\mathbf{x}_0+t\mathbf{v})|_{t=0}=df(\mathbf{x}_0)\mathbf{v}>0

从而

f(x0tv)<f(x0)<f(x0+tv)f(\mathbf{x}_0-t\mathbf{v})<f(\mathbf{x}_0)<f(\mathbf{x}_0+t\mathbf{v})

从而x0\mathbf{x}_0不是函数的极值点。因此x0\mathbf{x}_0为极值点的一个必要条件是df(x0)=0df(\mathbf{x}_0)=0,我们称这样的点为函数的临界点。仅由一阶导数是无法确认极值的,参考一元情况,仅知道f(x0)=0f'(x_0)=0无法判断该点是极大值点还是极小值点;特别的,在多元函数的情况下,我们指出这不仅无法判断极大(小)值,甚至无法判断是否是极值点,因为可能出现马鞍形曲面。

类似于一元下的f(x)f''(x),我们知道f(x0)=0\nabla f(\mathbf{x}_0)=\mathbf{0},为了讨论极值点我们需要知道每个偏导的增减性,即

J(f)(x0)=J((fx1fx2fxn))(x0)=(2fxixj)n×n(x0)J(\nabla f)(\mathbf{x_0})=J(\begin{pmatrix}\frac{\partial f}{\partial x^1}\\\frac{\partial f}{\partial x^2}\\\vdots\\\frac{\partial f}{\partial x^n}\end{pmatrix})(\mathbf{x}_0)=(\frac{\partial^2 f}{\partial x^i\partial x^j})_{n\times n}(\mathbf{x}_0)

我们称(2fxixj)n×n(\frac{\partial^2 f}{\partial x^i\partial x^j})_{n\times n}为Hesse矩阵,或者Hessian,记做Hf(x0)H_{f}(\mathbf{x}_0)。考察ffx0\mathbf{x}_0附近的二阶泰勒展开:

f(x0+v)=f(x0)+121k,lni+j=2,0i,j22f(xk)i(xl)j(vk)i(vl)jf(\mathbf{x_0}+\mathbf{v})=f(\mathbf{x_0})+\frac{1}{2}\sum_{1\leq k,l\leq n}\sum_{i+j=2,0\leq i,j\leq 2}\frac{\partial^2 f}{(\partial x^{k})^i(\partial x^{l})^j}(v_{k})^{i}(v_{l})^{j}

=f(x0)+12vTHf(x0)v+o(v2)=f(\mathbf{x}_0)+\frac{1}{2}\mathbf{v}^{\mathbf{T}}H_{f}(\mathbf{x}_0)\mathbf{v}+o(||v||^2)

可知,ff的极值与HfH_{f}的正(负)定性有关,HfH_{f}正(负)定时,该点为函数的极小(大)值点;当既不正定也不负定时,则不为函数的极值点,为鞍形临界点

这一部分还有一个重要的定理是隐函数定理,我们在此不关注他的证明,而关注它的应用。

[隐函数定理]若Cr\mathcal{C}^{r}函数F:Rm×RnRF:\mathbb{R}^{m}\times\mathbb{R}^{n}\to\mathbb{R}满足F(x0,y0)=0F(\mathbf{x}_0,\mathbf{y}_0)=0Fy(x0,y0)F_{\mathbf{y}}(\mathbf{x}_0,\mathbf{y}_0)可逆,则在(x0,y0)(\mathbf{x}_0,\mathbf{y}_0)附近存在Cr\mathcal{C}^{r}映射gg满足

F(x,y)=0y=g(x)F(\mathbf{x},\mathbf{y})=0\Leftrightarrow \mathbf{y}=g(\mathbf{x})

从而,

0=JF(x,y(x))=Fx(x,y(x))+Fy(x,y(x))Jy(x)0=JF(\mathbf{x},\mathbf{y}(\mathbf{x}))=F_{\mathbf{x}}(\mathbf{x},\mathbf{y}(\mathbf{x}))+F_{\mathbf{y}}(\mathbf{x},\mathbf{y}(\mathbf{x}))J\mathbf y(\mathbf{x})

    Jy(x)=Fy1(x,y(x))Fx(x,y(x))\implies J\mathbf y(\mathbf{x})=F_{\mathbf{y}}^{-1}(\mathbf{x},\mathbf{y}(\mathbf{x}))F_{\mathbf{x}}(\mathbf{x},\mathbf{y}(\mathbf{x}))

[例] 证明下面矩阵方程存在唯一的C2\mathcal{C}^2的解满足X(0)=IX(0)=I,

X(t)2+tX(t)I=0X(t)^2+tX(t)-I=0

证明:考察函数F:M×RMF:\mathbb{M}\times\mathbb{R}\to \mathbb{M}满足F(X,t)=X2+tXIF(X,t)=X^2+tX-I,可知F(I,0)=0F(I,0)=0
FX(I,0)=2IF_{X}(I,0)=2I可逆,所以在(I,0)(I,0)附近存在唯一的XX满足X(0)=IX(0)=I

类似于我们学了一元微分后研究平面曲线,我们在学了多元微分后就可以开始研究空间中的曲线和曲面了。

我们定义Rm\mathbb{R}^{m}中的一条Cr\mathcal{C}^{r} 参数化曲线 为一个Cr\mathcal{C}^{r}映射x:(α,β)Rm\mathbf{x}:(\alpha,\beta)\to \mathbb{R}^{m},称x\mathbf{x}'为参数化曲线的速度向量。直观的理解是,我们在物理中知道一个质点在某时刻的位置和速度就可以求出质点的轨迹。在上述定义里,可以将原像空间看作时间轴,像空间为质点位置,映射的导数则为该点的速度。称参数化曲线是正则的x0\mathbf{x}'\neq0;称参数化曲线为一个路径(path),或者借助物理的概念,为一个运动

ΣRN\Sigma\in\mathbb{R}^{N}为一个 Cr\mathcal{C}^{r}曲面 ,如果对任意P0ΣP_0\in\Sigma,存在P0P_0的邻域U\mathbb{U}Rm\mathbb{R}^{m}上开集V\mathbb{V}Cr\mathcal{C}^{r}映射gg以及排列σ\sigma使得(x1,x2,...xN)UΣ(x^1,x^2,...x^N)\in \mathbb{U}\cap\Sigma当且仅当

(xσ(m+1),xσ(m+2),...,xσ(N))=g(xσ(1),xσ(2),...,xσ(m))(x^{\sigma(m+1)},x^{\sigma(m+2)},...,x^{\sigma(N)})=g(x^{\sigma(1)},x^{\sigma(2)},...,x^{\sigma(m)})

即曲面上点的坐标由其若干分量决定。记dimΣ=m\dim\Sigma=m,dimΣ=1\dim\Sigma=1时,称Σ\Sigma曲线。称aRa\in\mathbb{R}FC:URF\in\mathcal{C}^{\infty}:\mathbb{U}\to\mathbb{R}正则值,若F1(a)F^{-1}(a)非空且不包含临界点(这里的FF即可看做定义里的gg)。

xΣ,x(0)=P0\mathbf{x}\in\Sigma,\mathbf{x}(0)=P_0x(0)\mathbf{x}'(0)P0P_0处的切向量;过点P0P_0的所有切向量组成曲面在该点处切空间,记为TP0ΣT_{P_0}\SigmaP0+TP0ΣP_0+T_{P_0}\SigmaP0P_0处的切平面(切线,若dim=1\dim=1)。TP0ΣT_{P_0}\Sigma的一组基底为(xti)(\frac{\partial \mathbf{x}}{\partial t^{i}})。一阶泰勒展开式即为切平面方程。

若知道xΣ(g(x)=0)\mathbf{x}\in\Sigma(g(\mathbf{x})=0),求解有关F(x)F(\mathbf{x})的优化问题(如求最大值、最小值、极值),我们可以使用Lagrange乘子法,由于高中数学竞赛已经涉猎此部分内容,此处从略。

多元函数积分学

首先考虑这样一个积分abf(x,y)dx\int_{a}^{b}f(x,\mathbf{y})dx,成这样的积分为含参积分,其中y\mathbf{y}为参数。我们有如下结论:
fykf_{y^{k}}在定义域内连续则:

ykabf(x,y)dx=abfyk(x,y)dyk\frac{\partial}{\partial y^{k}}\int_{a}^{b}f(x,\mathbf{y})dx=\int_{a}^{b}f_{y^{k}}(x,\mathbf{y})dy^{k}

对于累次积分abαβf(x,y)dydx\int_{a}^{b}\int_{\alpha}^{\beta}f(x,y)dydx

abαβf(x,y)dydx=αβabf(x,y)dxdy\int_{a}^{b}\int_{\alpha}^{\beta}f(x,y)dydx=\int_{\alpha}^{\beta}\int_{a}^{b}f(x,y)dxdy

[例] 求积分01xaxblnxdx\int_{0}^{1}\frac{x^{a}-x^{b}}{\ln x}dx

法一,含参积分:
f(x,t)={xtxalnx,x00,x=0,F(t)=01f(x,t)dxf(x,t)=\left\{\begin{aligned}&\frac{x^{t}-x^{a}}{\ln x},x\neq 0\\&0,x=0\end{aligned}\right.,F(t)=\int_{0}^{1}f(x,t)dx则,

F(t)=01ft(x,t)dx=01xtdx=11+tF'(t)=\int_{0}^{1}f_{t}(x,t)dx=\int_{0}^{1}x^{t}dx=\frac{1}{1+t}

F(b)=F(a)+abF(x,t)dt=abdt1+t=ln1+b1+aF(b)=F(a)+\int_{a}^{b}F'(x,t)dt=\int_{a}^{b}\frac{dt}{1+t}=\ln\frac{1+b}{1+a}

法二,累次积分:

01xbxalnxdx=01abxtdtdx=ab01xtdxdt=ln1+b1+a\int_{0}^{1}\frac{x^{b}-x^{a}}{\ln x}dx=\int_{0}^{1}\int_{a}^{b}x^{t}dtdx=\int_{a}^{b}\int_{0}^{1}x^{t}dxdt=\ln\frac{1+b}{1+a}

当含参积分的一个界为ω\omega\infty或瑕点时,我们称其为广义含参积分,即

g(x)=aωf(t,x)dtg(\mathbf{x})=\int_{a}^{\omega}f(t,\mathbf{x})dt

我们需要考察的时g(x)g(\mathbf{x})存在性,一致收敛性,连续,可积性,广义可积性,可微性。以下仅列出结论,不给出具体证明。

  • 存在性:f(t,x)f(t,\mathbf{x})在任意有界区间上Riemman可积,且limbωabf(t,x)dt\lim_{b\to\omega}\int_{a}^{b}f(t,\mathbf{x})dt存在。
  • 一致收敛性:ϵ>0,U˚ϵ(ω,δ),x,bU˚\forall \epsilon>0,\exists \mathring{U}_{\epsilon}(\omega,\delta),\forall\mathbf{x},b\in\mathring{U}

    abf(t,x)dtg(x)<ϵ|\int_{a}^{b}f(t,\mathbf{x})dt-g(\mathbf{x})|<\epsilon

  • 连续性:xA\mathbf{x}\in A为开集或者闭集,则满足
    1. f(t,x)f(t,\mathbf{x})[a,ω]×A[a,\omega]\times A连续
    2. g(x)g(\mathbf{x})一致收敛
  • (广义)可积性:与上一条类似,不过时二元情况;广义积分时,函数连续,函数对于两个变量的广义积分一致收敛,且两种顺序的累次积分至少一个绝对收敛。
  • 可微性:被积函数和函数关于参数每个分量的偏导数连续,广义积分对每个参数,参数偏导数的广义积分关于参数一致收敛。