Extremos relativos y absolutos (II)
[size=150][b][u][color=#1e84cc]Puntos críticos y extremos relativos en un caso particular.[/color][/u][/b][/size][br][br]Nada impide que lo hecho en la sección anterior en el estudio de los máximos y mínimos relativos de una función de una variable pueda hacerse con funciones de varias variables. Recordemos que el estudio se dividió en los siguientes pasos:[br][br]1. Hallar los puntos críticos.[br]2. Usar el desarrollo de Taylor alrededor de dichos puntos críticos para estudiar su naturaleza.[br][br]Para funciones de varias variables [math]f(x_{1},\ldots,x_{n})[/math], un punto [math]x_{0}=(x_{01},\ldots,x_{0n})[/math] es un punto crítico si [math]\nabla f(x_{0})=0[/math]. Es decir, un punto donde el gradiente se anula es un punto crítico.[br][br]Naturalmente, si una función [math]f(x_{1},\ldots,x_{n})[/math] tiene un máximo o un mínimo relativo en [math]x_{0}=(x_{01},\ldots,x_{0n})[/math] entonces dicho punto es un punto crítico. Para ver esto, note que, por ejemplo, si [math]f[/math] tiene un máximo en [math]x_{0}[/math] entonces la función de una variable [math]t\rightarrow f(x_{01}+t,x_{02},\ldots,x_{0n})[/math] también tiene un máximo relativo en [math]t=0[/math]. De allí que,[br][br][math][br]0=\frac{d f(x_{01}+t,x_{02},\ldots,x_{0n})}{dt}\bigg|_{t=0}=\frac{\partial f}{\partial x_{1}}(x_{0}).[br][/math][br][br]De igual manera para las otros coordenadas, [math]x_{2},\ldots,x_{n}[/math] tenemos,[br][br][math][br]\frac{\partial f}{\partial x_{i}}(x_{0})=0.[br][/math][br][br]Es decir, [math]\nabla f(x_{0})=0[/math]. [br][br]Por supuesto, no todo punto crítico es un máximo o un mínimo relativo. Por ejemplo la función [math]f(x,y)=xy[/math] tiene un punto crítico en [math](0,0)[/math] que no es ni un máximo ni un mínimo local ya que toma valores positivos y negativos, es decir por encima y debajo del valor de la función en [math](0,0)[/math] que es cero, en puntos arbitrariamente cercanos a [math](0,0)[/math]. Este caso en particular es conocido como un punto "silla" y se grafica debajo.
La ecución para los puntos críticos [math]\nabla f=0[/math] es en realidad un sistema [math]n[/math]-ecuaciones con [math]n[/math]-incógnitas [math]x_{1},\ldots,x_{n}[/math],[br][br][math][br]\left\{[br]\begin{align}[br]& \frac{\partial f(x_{1},\ldots,x_{n})}{\partial x_{1}}=0,\\[br]&\quad \vdots\\[br]& \frac{\partial f(x_{1},\ldots,x_{n})}{\partial x_{n}}=0.[br]\end{align}[br]\right.[br][/math][br][br]Nos concetramos de ahora en más en un ejemplo concreto, para dos variables. Consideremos entonces la función,[br][br][math][br]f(x,y)=x^{4}+y^{4}-4xy[br][/math][br][br]como función de [math]\mathbb{R}^{2}[/math] en [math]\mathbb{R}[/math].[br][br]Busquemos los puntos críticos. Debemos resolver el sistema,[br][br][math][br]\left\{[br]\begin{align}[br]& \frac{\partial f(x,y)}{\partial x}=4x^{3}-4y=0,\\[br]& \frac{\partial f(x,y)}{\partial y}=4y^{3}-4x=0.[br]\end{align}[br]\right.[br][/math][br][br]Despejando en la segunda ecuación obtenemos [math]x=y^{3}[/math], y sustituyendo en la primera ecuación deducimos [math]y^{9}=y[/math] que tiene como soluciónes [math]y=0,-1,1[/math]. De aquí que los puntos críticos son,[br][br][math][br](x,y)=(-1,-1),(0,0),\ {\rm y}\ (1,1).[br][/math][br][br]Analicemos la naturaleza del punto crítico [math](0,0)[/math]. Lo primero que hay que reconocer es que, ya que [math]f(x,y)[/math] es un polinomio de orden cuatro en potencias de [math]\Delta x=x-0[/math], y [math]\Delta y=y-0[/math], entonces debe ser igual al desarrollo de Taylor de orden cuatro de [math]f(x,y)[/math]. Adicionalmente, el polinomio de Taylor de orden dos es fácilmente identificable e igual a [math]P_{2}(x,y)=-4xy[/math]. Podemos por lo tanto escribir,[br][br][math][br]f(x,y)=P_{2}(x,y)+R_{2}(x,y)=-4xy+R_{2}(x,y),[br][/math][br][br]donde [math]R_{2}(x,y)[/math] es el resto, que es igual a [math]R_{2}(x,y)=x^{4}+y^{4}[/math].[br][br]El punto es que en este caso la forma del polinomio de orden dos, nos da suficiente información como para concluir que el punto crítico no es ni un máximo ni un mínimo relativo. Lo que debemos ver es que hay puntos [math](x,y)[/math] arbitrariamente cerca de [math](0,0)[/math] donde [math]f(x,y)[/math] es mayor que [math]f(0,0)=0[/math] y donde [math]f(x,y)[/math] es menor que [math]f(0,0)=0[/math], es decir puntos donde [math]f(x,y)[/math] es positiva y puntos donde es negativa. Restrinjamos entonces [math]f(x,y)[/math] a las rectas por el origen [math]x=y[/math] y [math]x=-y[/math]. Tenemos,[br][br][math][br]f(x,x)=-4x^{2}+R_{2}(x,x)=-4x^{2}(1-\frac{R_{2}(x,x)}{4x^{2}})\sim -4x^{2}<0,[br][/math][br][br]y,[br][br][math][br]f(x,-x)=+4x^{2}+R_{2}(x,-x)=+4x^{2}(1+\frac{R_{2}(x,-x)}{4x^{2}})\sim +4x^{2}>0,[br][/math][br][br]cuando [math]x\neq 0[/math] y [math]x\sim 0[/math]. [br][br]El gráfico de [math]f(x,x)[/math] y de [math]f(x,-x)[/math] para [math]x[/math] cerca de [math]0[/math] puede verse en la figura debajo. La naturaleza del punto crítico de tipo silla, similar al comportamiento del desarrollo a orden dos [math]P_{2}(x,y)=-4xy[/math] es evidente.
Analicemos ahora el punto crítico [math](1,1)[/math]. Escribiendo [math]x=(x-1)+1[/math] y [math]y=(y-1)+1[/math] tenemos,[br][br][math][br]f(x,y)=-2+6(x-1)^{2}-4(x-1)(y-1)+6(y-1)^{2}+4(x-1)^{3}+4(y-1)^{3}+(x-1)^{4}+(y-1)^{4}.[br][/math][br][br]Al igual que lo comentado anteriormente, [math]f(x,y)[/math] es igual a su desarrollo de Taylor a orden cuatro. También, podemos identificar el polinomio de Taylor de orden dos y el resto como,[br][br][math][br]f(x,y)= P_{2}(x,y)+R_{2}(x,y) = -2+6(x-1)^{2}-4(x-1)(y-1)+6(y-1)^{2} + R_{2}(x,y).[br][/math][br][br]donde el [math]-2[/math] que aparece en el miembro derecho es igual a [math]f(1,1)[/math].[br][br]La pregunta ahora es si podemos deducir la naturaleza del punto crítico [math](1,1)[/math] a partir de esta expresión de [math]P_{2}(x,y)[/math]. Para ello escribimos,[br][br][math][br]6(x-1)^{2}-4(x-1)(y-1)+6(y-1)^{2}=4(x-1)^{2}+4(y-1)^{2}+(x-y)^{2}=4\|(\Delta x,\Delta y)\|^{2}+(x-y)^{2}[br][/math][br][br]y por lo tanto,[br][br][math][br]f(x,y)=f(1,1)+4\|(\Delta x,\Delta y)\|^{2}+(x-y)^{2}+R_{2}(x,y).[br][/math][br][br]El término [math]4(x-1)^{2}+4(y-1)^{2}[/math] fue escrito como [math]4\|(\Delta x,\Delta y)\|^{2}[/math] ya que [math]\|(\Delta x,\Delta y)\|^{2}[/math] es fácilmente comparable con [math]R_{2}(x,y)[/math], de hecho sabemos que [math]R_{2}(x,y)[/math] es de menor orden que [math]\|(\Delta x,\Delta y)\|^{2}[/math]. Concretamente,[br][br][math][br]\frac{R_{2}(x,y)}{\|(\Delta x,\Delta y)\|^{2}}\sim 0,[br][/math][br][br]y por lo tanto,[br][br][math][br]4\|(\Delta x,\Delta y)\|^{2}+R_{2}(x,y)=4\|(\Delta x,\Delta y)\|^{2}(1+\frac{R_{2}(x,y)}{4\|(\Delta x,\Delta y)\|^{2}})\geq 0.[br][/math][br][br]Ahora, teniendo en cuenta que [math](x-y)^{2}\geq 0[/math] concluimos que,[br][br][math][br]f(x,y)\geq f(1,1)+4\|(\Delta x,\Delta y)\|^{2}+R_{2}(x,y)>f(1,1),[br][/math][br][br]cuando [math]\Delta x\sim 0[/math] y [math]\Delta y\sim 0[/math]. Es decir, que, al final de análisis concluimos que [math](1,1)[/math] es un mínimo local! [br][br]La función en el punto crítico [math](-1,-1)[/math] tiene el mismo comportamiento que en el punto crítico [math](1,1)[/math], ya que [math]f(x,y)=f(-x,-y)[/math] y tiene por lo tanto un mínimo local también.[br][br][b][color=#ff7700]Ejemplo.[/color][/b] En la figura debajo puede verse el gráfico de la función [math]f(x,y)[/math] así como los gráfico de los desarrollos de Taylor a orden dos en entornos rectangulares de tamaño [math]1[/math]x[math]1[/math] centrados en cada uno de los tres puntos críticos. Observe lo bien que se ajustan dichas gráficas a la gráfica de la función. Claramente el comportamiento de la función sobre el punto crítico es el mismo que el del correspondiente desarrollo de Taylor.
Todo el análisis anterior de los puntos críticos de la función [math]f(x,y)=x^{4}+y^{4}-4xy[/math] fue delicado, largo, y usando fuertemente las estructura algebraica de la función bajo análisis. Es esperable que análisis similares no puedan ser realizados siempre. Se impone entonces tener un tratamiento general, y disponer de algún teorema que nos dé información general sobre puntos críticos a partir de sus desarrollos de Taylor. [br][br]La pregunta entonces ahora es cómo se analizan los desarrollos de Taylor en los puntos críticos. En muchas circunstancias, el desarrollo de Taylor a orden dos sobre un punto crítico es suficiente para determinar la naturaleza del punto como sucedió en los casos anterior. En algunas situaciones sin embargo el análisis del desarrollo de Taylor a orden dos es insuficiente y se deben considerar términos de orden superior o hacer otro tipo de análisis. Agregaremos algunas palabras sobre esto luego de estudiar un teorema sobre lo que puede decirse del desarrollo de Taylor a orden dos para funciones de dos variables de acuerdo a su estructura.[br][br]Reescribimos el desarrollo de Taylor a orden dos como,[br][br][math][br]f(x,y) - f(x_{0},y_{0}) = \frac{1}{2}[br]\left([br]\begin{matrix}[br]\Delta x,\Delta y[br]\end{matrix}[br]\right)[br]\left(\begin{matrix}[br]\partial^{2}_{x}f(x_{0},y_{0}) & \partial_{xy}^{2} f(x_{0},y_{0})\\[br]\partial^{2}_{xy}f(x_{0},y_{0}) & \partial^{2}_{y} f(x_{0},y_{0})[br]\end{matrix}[br]\right)[br]\left([br]\begin{matrix}[br]\Delta x\\[br]\Delta y[br]\end{matrix}[br]\right)[br]+ R_{2}(x,y).[br][/math][br][br]Por supuesto que [math]\Delta x = x-x_{0}[/math], [math]\Delta y = y-y_{0}[/math].[br][br]La matriz simétrica,[br][br][math][br]H=\left(\begin{matrix}[br]\partial^{2}_{x}f(x_{0},y_{0}) & \partial_{xy}^{2} f(x_{0},y_{0})\\[br]\partial^{2}_{xy}f(x_{0},y_{0}) & \partial^{2}_{y} f(x_{0},y_{0})[br]\end{matrix}[br]\right)[br][/math][br][br]se llama [i]matriz Hessiana[/i].[br][br]En ciertos casos, dependiendo de la matriz Hessiana, puede garantizarse que el primer término del miembro derecho domina sobre el resto de orden dos [math]R_{k}(x,y)[/math].[br][br]El teorema que explica este hecho es el siguiente: [br][br][b][color=#980000]Teorema (clasificación de puntos críticos). [/color][/b][br][br][i][1] si los autovalores de la Hessiana son los dos positivos, entonces puede garantizarse que [math]f(x,y)-f(x_{0},y_{0})\geq 0[/math] si [math](x,y)[/math] está suficientemente cerca de [math](x_{0},y_{0})[/math], es decir que [math]f(x,y)[/math] tiene un mínimo local en [math](x_{0},y_{0})[/math].[br][br][2] si los autovalores de la Hessiana son los dos negativos, entonces puede garantizarse que [math]f(x,y)-f(x_{0},y_{0})\leq 0[/math] si [math](x,y)[/math] está suficientemente cerca de [math](x_{0},y_{0})[/math], es decir que [math]f(x,y)[/math] tiene un máximo local en [math](x_{0},y_{0})[/math].[br][br][3] si un autovalor de la Hessiana es positivo y el otro negativo entonces el punto crítico no es ni un máximo ni un mínimo local de la función. En este caso es un punto silla.[br][br][4] si uno de los autovalores de la Hessiana es cero, entonces no se puede extraer ninguna conclusión sobre la naturaleza del punto crítico solamente del desarrollo de Taylor a orden dos.[/i][br][br]El siguiente teorema explica cómo son los valores propios de una matriz simétrica, dependiendo de sus coeficientes. Recordemos antes el determinante de una matriz dos por dos:[br][br][math][br]{\rm det}[br]\left([br]\begin{matrix}[br]\alpha & \beta\\[br]\beta & \gamma[br]\end{matrix}[br]\right)[br]=\alpha\gamma-\beta^{2}[br][/math][br][br][b][color=#980000]Teorema.[/color] [/b][i]Sea,[br][br][math][br]H=[br]\left([br]\begin{matrix}[br]\alpha & \beta\\[br]\beta & \gamma[br]\end{matrix}[br]\right)[br][/math][br][br]una matriz simétrica dos por dos.[br][br][1] Si [math]{\rm det}H>0[/math] y [math]\alpha>0[/math] entonces [math]H[/math] tiene dos valores propios positivos.[br][br][2] Si [math]{\rm det}H>0[/math] y [math]\alpha<0[/math] entonces [math]H[/math] tiene dos valores propios negativos.[br][br][3] Si [math]{\rm det}H<0[/math] entonces [math]H[/math] tiene un valor propio positivo y uno negativo.[br][br][4] Si [math]{\rm det}H=0[/math] entonces al menos un valor propio es cero.[/i]