多元函数极值的一些求法
Some Methods of Finding Extremums of Multivariate Functions
DOI: 10.12677/PM.2022.127130, PDF, HTML, XML, 下载: 467  浏览: 1,189  国家自然科学基金支持
作者: 梁伟生, 徐佩瑾, 李光洁*:广东外语外贸大学数学与统计学院,广东 广州
关键词: 偏导数方向导数拉格朗日函数极值Partial Derivatives Directional Derivatives Lagrange Functions Extremums
摘要: 函数的极值是函数性态的一个重要特征。本文先利用偏导数给出了一个二元函数极值判定的充分条件。其次,先给出方向导数的定义然后展示了利用方向导数判定二元函数极值的两个充分条件。同时,本文也探讨了利用拉格朗日乘数法研究多元函数的极值。简而言之,本文利用偏导数、方向导数和拉格朗日乘数法总结了多元函数极值的一些求法,这为进一步研究多元函数的最值奠定了基础。
Abstract: The extremum of a function is an important characteristic of its properties. Firstly, a sufficient condition for extremums of a binary function is given by using partial derivatives. Secondly, the definition of the directional derivative is given, and then two sufficient conditions for extremums of binary functions by using directional derivative are presented. Meanwhile, the extremums of multivariate functions by using the Lagrange multiplier method are discussed. In short, some methods of finding extremums of multivariate functions by using partial derivatives, directional derivatives and the Lagrange multiplier method are summarized, which lay a foundation for further research on the maximum value of multivariate functions.
文章引用:梁伟生, 徐佩瑾, 李光洁. 多元函数极值的一些求法[J]. 理论数学, 2022, 12(7): 1189-1195. https://doi.org/10.12677/PM.2022.127130

1. 引言

函数的极值不仅是函数性态的重要特征,而且在实际中有着广泛的应用。多元函数的极值是一个经典且非常重要的问题。到目前为止,关于求函数极值的文献非常多。杨文杰和孙静利用二次型的正定性讨论了多元函数的极值问题 [1]。李安东通过研究多元微分与一元微分之间的关系,把多元函数的极值判定问题转化为二次型的正定或负定的判定问题,或转化为一阶方向导函数是否变号的问题;对条件极值,探究了适用于所有情况的降维求极值法 [2]。袁勇民综述了多元函数极值问题的解法 [3]。马烁和梁向给出一阶方向导数和二阶方向导数的定义及其与偏导数的关系,然后利用方向导数给出了判断二元函数在驻点或偏导数不存在的点处是否取得极值的两个充分条件 [4]。罗棋和朱珊珊探讨了多元函数和泛函数的条件极值问题,该论文用拉格朗日乘数法求解多元函数的条件极值,并将拉格朗日乘数法中的拉格朗日乘数变形为向量函数形式的拉格朗日乘子,进一步将拉格朗日乘数法推广到求解泛函数的条件极值问题 [5]。徐莉和周创也探讨了多元函数极值的求法 [6]。而本文利用偏导数、方向导数和拉格朗日函数总结了多元函数极值的一些求法,期望为学习者的进一步学习提供一定的帮助。

本文余下结构:第二部分探讨了利用偏导数求二元函数的极值;第三部分研究了利用方向导数求二元函数的极值;第四部分利用拉格朗日乘数法求多元函数的条件极值。

2. 利用偏导数求二元函数的极值

定理1 (二元函数极值必要条件) [7] 设 z = f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 存在偏导数,且 P 0 ( x 0 , y 0 ) f ( x , y ) 的极值点,则有

如果在点 P 0 ,函数f满足以上两式,那么点 P 0 是f的稳定点。此定理仅是一个必要条件,需注意的是稳定点并不都是函数的极值点。

定理2 (二元函数极值充分条件) [8] 如果在点 P 0 ( x 0 , y 0 ) 的某邻域 U ( P 0 ) 内,函数 z = f ( x , y ) 存在二阶连续偏导数,同时 P 0 为函数f的稳定点。那么当 H f ( P 0 ) 为负定矩阵的时,函数 z = f ( x , y ) 在点 P 0 可取得极大值;而当 H f ( P 0 ) 为正定矩阵的时,函数 z = f ( x , y ) 在点 P 0 可取得极小值。其中

H f ( P 0 ) = ( f x x ( P 0 ) f x y ( P 0 ) f y x ( P 0 ) f y y ( P 0 ) ) = ( f x x f x y f y x f y y ) P 0

z = f ( x , y ) 在点 P 0 的黑塞(Hesse)矩阵。根据该矩阵的性质规律,定理2可总结为以下形式:

若函数 z = f ( x , y ) 满足定理2中的条件且 P 0 z = f ( x , y ) 的稳定点,记

A = f x x ( x 0 , y 0 ) , B = f x y ( x 0 , y 0 ) , C = f y y ( x 0 , y 0 ) ,

i) 若 A C B 2 > 0 ,则 P 0 ( x 0 , y 0 ) f ( x , y ) 的极值点。

1) 当 A > 0 P 0 ( x 0 , y 0 ) f ( x , y ) 的极小值点;

2) 当 A < 0 P 0 ( x 0 , y 0 ) f ( x , y ) 的极大值点。

ii) 若 A C B 2 < 0 ,则 P 0 ( x 0 , y 0 ) 不为 f ( x , y ) 的极值点;

iii) 若 A C B 2 = 0 , 则 P 0 ( x 0 , y 0 ) 可能为 f ( x , y ) 的极值点,也可能不为 f ( x , y ) 的极值点。

例1求函数 u = x 3 + 3 x y 2 15 x 12 y 的极值。

解 解方程组 { u x = 0 u y = 0 ,即解 { 3 x 2 + 3 y 2 15 = 0 6 x y 12 = 0 ,可得四个驻点: ( 2 , 1 ) ( 2 , 1 ) ( 1 , 2 ) ( 1 , 2 )

进一步计算可得

2 u x 2 = 6 x , 2 u x y = 6 y , 2 u y 2 = 6 x .

根据定理2可得:

1) 矩阵 H ( 2 , 1 ) = [ 12 6 6 12 ] 是正定矩阵, ( 2 , 1 ) 是极小值点。

2) H ( 2 , 1 ) = [ 12 6 6 12 ] 是负定矩阵, ( 2 , 1 ) 是极大值点。

3) H ( 1 , 2 ) = [ 6 12 12 6 ] , H ( 1 , 2 ) = [ 6 12 12 6 ] 均是不定矩阵, ( 1 , 2 ) , ( 1 , 2 ) 均不是极值点。

例2 [9] 求函数 f ( x 1 , x 2 , x 3 ) = x 1 3 + x 2 2 + x 3 2 + 12 x 1 x 2 + 2 x 3 的极值。

解 计算可得

f x 1 = 3 x 1 2 + 12 x 2 , f x 2 = 2 x 2 + 12 x 1 , f x 3 = 2 x 3 + 2.

f x 1 = f x 2 = f x 3 = 0 ,得驻点: x 0 = ( 0 , 0 , 1 ) , x 1 = ( 24 , 144 , 1 ) 。又 f ( x 1 , x 2 , x 3 ) 关于 x 1 , x 2 x 3 的各

二阶导数是

2 f x 1 2 = 6 x 1 , 2 f x 1 x 2 = 12 , 2 f x 1 x 3 = 2 , 2 f x 2 2 = 2 , 2 f x 2 x 3 = 0 , 2 f x 3 2 = 2.

得矩阵

H ( x ) = [ 6 x 1 12 2 12 2 0 2 0 2 ] .

由定理2进一步可得:

1) 在点 x 0 处得矩阵 H ( x 0 ) = [ 0 12 2 12 2 0 2 0 2 ] 。因为 H ( x 0 ) 的顺序主子式 det H 1 = 0 det H 2 = [ 0 12 12 2 ] = 144 < 0 det H 3 = det H ( x 0 ) = 152 < 0 ,所以 H ( x 0 ) 不是正定矩阵,即 x 0 不是极值点;

2) 在点 x 1 处,有 H ( x 1 ) = [ 144 12 2 12 2 0 2 0 2 ] ,因为 H ( x 1 ) 的顺序主子式 det H 1 = 144 > 0 det H 2 = [ 144 12 12 2 ] = 144 > 0 det H 3 = det H ( x 1 ) = 28 > 0 ,所以 H ( x 1 ) 是正定矩阵, x 1 = ( 24 , 144 , 1 ) 为极小值点,极小值为

f ( x 1 ) = f ( 24 , 144 , 1 ) = 6913.

3. 利用方向导数求二元函数的极值 [4]

定理3 如果函数 f ( x , y ) 在点 P ( x , y ) 可微分,那么函数在该点沿任意一方向 l ( cos α , cos β ) 的方向都存在,且有

f l = f x cos α + f y cos β = ( f x , f y ) ( cos α , cos β ) T ,

此式被称为函数 f ( x , y ) 在点 P ( x , y ) 沿方向 l ( cos α , cos β ) 的方向导数。该式可用来求方向 l ( cos α , cos β ) 的方向导数。

定理4 若函数 f ( x , y ) 在点 P ( x , y ) 处二阶可微分,则在点 P ( x , y ) 沿方向 l ( cos α , cos β ) 的二阶方向导数存在,且有

2 f l 2 | ( x , y ) = 2 f x 2 cos 2 α + 2 f x y cos α cos β + 2 f y x cos β cos α + 2 f y 2 cos 2 β = ( cos α , cos β ) [ 2 f x 2 2 f x y 2 f y x 2 f y 2 ] ( cos α cos β ) .

定理5 设函数 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 的某个邻域内连续且可微,又 f x ( x 0 , y 0 ) = 0 f y ( x 0 , y 0 ) = 0 (在点 P 0 处的偏导数也可能不存在),在 P 0 ( x 0 , y 0 ) 的去心邻域内任取一点 P ( x , y ) ,令 l = P 0 P ,l表示从点 P 0 ( x 0 , y 0 ) 出发且经过 P ( x , y ) 的一条射线。

i) 若在 P 0 ( x 0 , y 0 ) 的去心邻域内 f l > 0 ,则 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处取得极小值;

ii) 若在 P 0 ( x 0 , y 0 ) 的去心邻域内 f l < 0 ,则 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处取得极大值;

iii) 若在 P 0 ( x 0 , y 0 ) 的去心邻域内 f l 变号,则 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处不取极值。

定理6 设函数 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 的某个邻域内存在二阶连续偏导数,且 f l | ( x 0 , y 0 ) = 0 2 f l 2 | ( x 0 , y 0 ) 0 ,对任意方向 l ( cos α , cos β ) ,有

i) 若 2 f l 2 | ( x 0 , y 0 ) > 0 ,则函数 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处取得极小值;

ii) 若 2 f l 2 | ( x 0 , y 0 ) < 0 ,则函数 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处取得极大值;

iii) 若 2 f l 2 | ( x 0 , y 0 ) 符号不定,则函数 f ( x , y ) 在点 P 0 ( x 0 , y 0 ) 处不取得极值。

例3 讨论函数 f ( x , y ) = x 3 + y 3 3 x y 在点 ( 1 , 1 ) 处的极值情况。

解 因为

f l = f x cos α + f y cos β = ( 3 x 2 3 y ) cos α + ( 3 y 2 3 x ) cos β ,

2 f l 2 | ( x , y ) = 2 f x 2 cos 2 α + 2 f x y cos α cos β + 2 f y x cos β cos α + 2 f y 2 cos 2 β = 6 x cos 2 α 3 cos α cos β 3 cos β cos α + 6 cos 2 β ,

所以对于任意方向 l ( cos α , cos β ) ,有

f l | ( 1 , 1 ) = 0 , 2 f l 2 | ( 1 , 1 ) = 6 ( 1 cos α cos β ) > 0.

故由定理6知函数 f ( x , y ) ( 1 , 1 ) 取得极小值。

4. 利用拉格朗日乘数法求条件极值 [10]

定理7 求函数 y = f φ k = 0 的条件约束下的极值问题。在区域D内f与 φ k ( x 1 , x 2 , , x n ) 存在连续的一阶偏导数。若雅可比矩阵

( φ 1 x 1 φ 1 x n φ m x 1 φ m x n ) P 0

的秩是m,且在D内的点 P 0 ( x 1 ( 0 ) , x 2 ( 0 ) , , x n ( 0 ) ) 为拉格朗日函数

L ( x 1 , x 2 , , x n , λ 1 , λ 2 , , λ m ) = f ( x 1 , x 2 , , x n ) + k = 1 m λ k φ k ( x 1 , x 2 , , x n ) ,

的极值点,那么存在m个常数 λ 1 ( 0 ) , λ 2 ( 0 ) , , λ m ( 0 ) ,使得 ( x 1 ( 0 ) , x 2 ( 0 ) , , x n ( 0 ) , λ 1 ( 0 ) , λ 2 ( 0 ) , , λ m ( 0 ) ) 是拉格朗日函数的稳定点,即 ( x 1 ( 0 ) , x 2 ( 0 ) , , x n ( 0 ) , λ 1 ( 0 ) , λ 2 ( 0 ) , , λ m ( 0 ) ) m + n 个方程

{ L x 1 = f x 1 + k = 1 m λ k φ k x 1 = 0 L x n = f x n + k = 1 m λ k φ k x n = 0 L λ 1 = φ 1 ( x 1 , x 2 , , x n ) = 0 L λ m = φ m ( x 1 , x 2 , , x n ) = 0

的解。

利用定理7可归纳求条件极值的步骤为:

i) 构造拉格朗日函数

L ( x 1 , x 2 , , x n , λ 1 , λ 2 , , λ m ) = f ( x 1 , x 2 , , x n ) + k = 1 m λ k φ k ( x 1 , x 2 , , x n ) ;

ii) 对构造的拉格朗日函数 L ( x 1 , x 2 , , x n , λ 1 , λ 2 , , λ m ) 关于 x 1 , , x n , λ 1 , , λ m 求偏导数,形成方程组

{ L x 1 = f x 1 + k = 1 m λ k φ k x 1 = 0 L x n = f x n + k = 1 m λ k φ k x n = 0 L λ 1 = φ 1 ( x 1 , x 2 , , x n ) = 0 L λ m = φ m ( x 1 , x 2 , , x n ) = 0

解出 x 1 , , x n , λ 1 , , λ m ,其中 ( x 1 , x 2 , , x n ) 就是在条件 φ k ( x 1 , x 2 , , x n ) = 0 下函数 f ( x 1 , , x n ) 的可能极值点。

例4 一个曲面 x 2 + y 2 = z 被平面 x + y + z = 1 所截的截口是一个椭圆。求所截的椭圆上的点到原点的最短和最长的距离。

解 设所截椭圆上的任意点 ( x , y , z ) 到原点的距离的平方 d 2 = f ( x , y , z ) = x 2 + y 2 + z 2 。令 L ( x , y , z , λ 1 , λ 2 ) = x 2 + y 2 + z 2 + λ 1 ( x 2 + y 2 z ) + λ 2 ( x + y + z 1 ) ,对 L ( x , y , z , λ 1 , λ 2 ) 关于 x , y , z , λ 1 , λ 2 求一阶偏导数,并令它们都等于0,有

{ L x = 2 x + 2 x λ 1 + λ 2 = 0 L y = 2 y + 2 y λ 1 + λ 2 = 0 L z = 2 z λ 1 + λ 2 = 0 L λ 1 = x 2 + y 2 z = 0 L λ 2 = x + y + z 1 = 0

解方程组可得: λ 1 = 3 ± 5 3 3 λ 2 = 7 ± 11 3 3 x = y = 1 ± 3 2 z = 2 ± 3 ,因为 x = y = 1 ± 3 2 z = 2 ± 3 是所设拉格朗日函数 L ( x , y , z , λ 1 , λ 2 ) 内的稳定点,所以要求的条件极值点一定在这几个点处取得。要求最大值和最小值,则将 x = y = 1 ± 3 2 , z = 2 ± 3 这些稳定点代入函数 f ( x , y , z ) 中得两个值为 9 ± 5 3 。即 9 5 3 是所截的椭圆上的点到原点的最短距离, 9 + 5 3 是所截的椭圆上的点到原点的

最长距离。

基金项目

国家自然科学基金项目(11901398)。

NOTES

*通讯作者。

参考文献

[1] 杨文杰, 孙静. 多元函数的极值问题[J]. 辽宁工学院学报, 2004, 24(1): 27-30.
[2] 李安东. 多元函数极值和条件极值的一般判定方法[J]. 皖西学院学报, 2006(2): 30-33.
[3] 袁勇民. 多元函数极值问题的解法综述[J]. 江苏教育学院学报(自然科学版), 2012, 28(6): 17-19.
[4] 马烁, 梁向. 基于方向导数的多元函数极值的判定[J]. 长江大学学报(自科版), 2016, 13(22): 64-67+7.
[5] 罗棋, 朱珊珊. 拉格朗日乘数法求解条件极值问题[J]. 商丘职业技术学院报, 2018, 17(4): 74-76+92.
[6] 徐莉, 周创. 多元函数极值问题的解法研究[J]. 大学, 2021(19): 145-148.
[7] 同济大学数学系, 编. 高等数学(下册) [M]. 第7版. 北京: 高等教育出版社, 2014.
[8] 华东师范大学数学系, 编. 数学分析下册(第四版)[M]. 北京: 高等教育出版社, 2010.
[9] 宋国际. 论正定矩阵在多元函数极值问题中的应用[J]. 河北旅游职业学院学报, 2010, 15(1): 58-60.
[10] 赵丽. 基础数学中最值问题的求法及应用[J]. 忻州师范学院学报, 2015, 31(5): 14-18+41.