Extremwert


aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Datei:Extrema example de.svg
Minima und Maxima einer Funktion

In der Mathematik ist ein Extremwert (oder Extremum; Plural: Extrema) der Oberbegriff für ein lokales beziehungsweise globales Maximum oder Minimum. Ein lokales Maximum ist der Wert der Funktion an einer Stelle <math>x</math>, in deren Umgebung die Funktion keine größeren Werte annimmt. Die zugehörige Stelle <math>x</math> wird lokaler Maximierer/Minimierer oder Extremstelle (Maximalstelle/Minimalstelle) genannt, die Kombination aus Stelle und Wert Extrempunkt.

Ein globales Maximum wird auch absolutes Maximum genannt, für ein lokales Maximum wird auch der Begriff relatives Maximum gebraucht. Lokale und globale Minima sind analog definiert.

Die Lösung einer Extremwertaufgabe, für eine einfache Darstellung siehe Kurvendiskussion, nennt man die extremale Lösung.

Eindimensionaler Fall

Formale Definition

Es sei <math>U\subseteq\mathbb R</math> eine Teilmenge der reellen Zahlen (z. B. ein Intervall) und <math>f\colon U\to\mathbb R</math> eine Funktion.

<math>f</math> hat an der Stelle <math>x_0\in U</math>

  • ein lokales Minimum, wenn es ein Intervall <math>I=(a,b)</math> gibt, das <math>x_0</math> enthält, so dass <math>f(x_0)\leq f(x)</math> für alle <math>x\in I\cap U</math> gilt;
  • ein globales Minimum, wenn <math>f(x_0)\leq f(x)</math> für alle <math>x\in U</math> gilt;
  • ein lokales Maximum, wenn es ein Intervall <math>I=(a,b)</math> gibt, das <math>x_0</math> enthält, so dass <math>f(x_0)\geq f(x)</math> für alle <math>x\in I\cap U</math> gilt;
  • ein globales Maximum, wenn <math>f(x_0)\geq f(x)</math> für alle <math>x\in U</math> gilt.

Besitzt die Funktion an der Stelle <math>x_0</math> ein Maximum, so nennt man den Punkt <math>(x_0,f(x_0))</math> Hochpunkt, hat sie dort ein Minimum, so heißt der Punkt Tiefpunkt. Liegt entweder ein Hoch- oder ein Tiefpunkt vor, so spricht man von einem Extrempunkt.

Existenz von Extrema

Ist <math>f\colon[a,b]\to\mathbb R</math> eine stetige Funktion und <math>[a,b]</math> eine kompakte Menge, so nimmt <math>f</math> auf <math>[a,b]</math> sein globales Maximum und sein globales Minimum an. Diese können auch in den Randpunkten <math>a</math> oder <math>b</math> angenommen werden.

Diese Aussage folgt aus dem Satz von Heine-Borel, wird aber oft auch nach K. Weierstraß oder B. Bolzano benannt.

Bestimmung von Extremstellen differenzierbarer Funktionen

Es sei <math>U\subseteq\mathbb R</math> offen, und <math>f\colon U\to\mathbb R</math> eine differenzierbare Funktion.

Notwendiges Kriterium

Hat <math>f</math> an einer Stelle <math>x_0 \in U</math> ein lokales Extremum und ist dort differenzierbar, so ist dort die erste Ableitung gleich null:

<math>f'(x_0)=0\,</math>.

Hinreichende Kriterien

  • Ist <math>f</math> zweimal differenzierbar, und gilt neben <math>f'(x_0)=0\,</math> auch <math>f(x_0)\neq 0\,</math>, so hat <math>f</math> ein lokales Extremum. Ist <math>f(x_0)>0\,</math> und <math>f'(x_0)=0\,</math>, so handelt es sich um ein lokales Minimum, ist <math>f(x_0)<0\,</math> und <math>f'(x_0)=0\,</math>, um ein lokales Maximum.
  • Allgemeiner: <math>f</math> sei <math>(n+1)</math>-mal differenzierbar, und es gelte
<math>f'(x_0)=f(x_0)=\ldots=f^{(n)}(x_0)=0\,</math> und <math>f^{(n+1)}(x_0)\ne0.</math>
Dann gilt:
(1) Falls <math>n</math> ungerade ist und <math>f^{(n+1)}(x_0) < 0</math> (bzw. <math>f^{(n+1)}(x_0) > 0</math>), so hat <math>f</math> bei <math>x_0</math> ein relatives Maximum (bzw. Minimum).
(2) Falls <math>n</math> gerade ist, so hat <math>f</math> bei <math>x_0</math> kein lokales Extremum.
(Man vergleiche hierzu Funktionen der Form: <math>f(x)=x^n</math>, <math>n\in \mathbb N</math>.)
  • Hat die erste Ableitung einen Vorzeichenwechsel bei <math>x_0</math>, so liegt ein Extremum vor. Bei einem Vorzeichenwechsel von Plus nach Minus handelt es sich um ein Maximum, bei einem Vorzeichenwechsel von Minus nach Plus um ein Minimum.
  • Für stetige Funktionen auf Intervallen gilt: Zwischen zwei lokalen Minima einer Funktion liegt stets ein lokales Maximum, und zwischen zwei lokalen Maxima liegt stets ein lokales Minimum.
  • Für differenzierbare Funktionen auf Intervallen gilt: Gibt es zwei Stellen <math>a,b</math> mit <math>a<x_0<b</math>, so dass die erste Ableitung im Intervall <math>(a,b)</math> nur die Nullstelle <math>x_0</math> hat, und ist <math>f(a)>f(x_0)</math> sowie <math>f(b)>f(x_0)</math>, so hat <math>f</math> bei <math>x_0</math> ein lokales Minimum. Gilt die analoge Bedingung mit <math>f(a)<f(x_0)</math> und <math>f(b)<f(x_0)</math>, so hat <math>f</math> bei <math>x_0</math> ein lokales Maximum.

Es gibt allerdings auch Funktionen, für die keines dieser Kriterien weiterhilft.

Beispiele

  • <math>f(x)=x^2+3.</math> Die erste Ableitung <math>f'(x)=2x</math> hat nur bei <math>x_0=0</math> eine Nullstelle. Die zweite Ableitung <math>f(x)=2</math> ist dort positiv, also nimmt <math>f</math> bei 0 ein lokales Minimum an, nämlich <math>f(0)=3</math>.
  • <math>f(x)=x^4+3.</math> Die erste Ableitung <math>f'(x)=4x^3</math> hat nur bei <math>x_0=0</math> eine Nullstelle. Die zweite Ableitung <math>f(x)=12x^2</math> ist dort ebenfalls 0. Man kann nun auf verschiedene Arten fortfahren:
    • Auch die dritte Ableitung <math>f(x)=24x</math> ist dort 0. Die vierte Ableitung hingegen ist mit <math>f^{(4)}(x)=24</math> die erste höhere Ableitung, die nicht 0 ist. Da diese Ableitung einen positiven Wert hat und die vorherige Ableitung ungerade ist, gilt nach (1), dass die Funktion dort ein lokales Minimum besitzt.
    • Die erste Ableitung hat bei 0 einen Vorzeichenwechsel von Minus nach Plus, also hat <math>f</math> bei <math>x_0=0</math> ein lokales Minimum.
    • Es ist <math>f(-1)=f(1)=4>3=f(0)</math>, also hat <math>f</math> im Intervall <math>(-1,1)</math> ein lokales Minimum. Da die erste Ableitung in diesem Intervall nur die Nullstelle <math>x_0=0</math> hat, muss das lokale Minimum dort angenommen werden.
  • Die Funktion, die durch <math>f(x)=\mathrm e^{-1/x^2}\sin^2\frac1{x^2}</math> für <math>x\ne0</math> und durch <math>f(0)=0</math> definiert ist, hat die folgenden Eigenschaften:
    • Sie hat bei <math>x=0</math> ein globales Minimum.
    • Sie ist beliebig oft differenzierbar.
    • Alle Ableitungen bei <math>x=0</math> sind gleich 0.
    • Die erste Ableitung hat keinen Vorzeichenwechsel bei 0.
    • Auch die anderen beiden oben genannten Kriterien sind nicht anwendbar.

Anwendungsbeispiel

In der Praxis können Extremwert-Berechnungen zur Berechnung von größt- oder kleinstmöglichen Vorgaben verwendet werden, wie das folgende Beispiel zeigt (siehe auch Optimierungsproblem):

  • Wie muss eine rechteckige Fläche aussehen, die bei einem bestimmten Umfang eine maximale Fläche hat?

Lösungsweg:

Der Umfang <math> U </math> ist konstant, die Fläche <math> A </math> soll maximiert werden, <math> a </math> ist die Länge und <math> b </math> die Breite:

<math>

1)\qquad U=2(a+b) \Rightarrow b=\frac{U}{2}-a </math>

<math>

2)\qquad A=a\cdot b </math>

1) in 2) einsetzen und umformen

<math>

A(a)=-a^2+\frac{1}{2}Ua </math>

Ableitungsfunktionen bilden

<math> A'(a)=-2a+\frac{1}{2}U </math>
<math> A(a)=-2\qquad \Rightarrow </math> Hochpunkt der Funktion

Es gibt nur ein lokales Maximum, das in dem vorliegenden Beispiel (ohne Nachweis) zugleich auch das globale Maximum ist, da die zweite Ableitung unabhängig von der Variablen immer kleiner als Null ist.

Um einen Extremwert zu finden, muss die erste Ableitung gleich Null gesetzt werden (da diese die Steigung der ursprünglichen Funktion beschreibt und diese Steigung bei Extremwerten Null ist. Ist die zweite Ableitung der Funktion ungleich Null, so liegt ein Minimum oder Maximum vor).

<math>

A'(a)=-2a+\frac{1}{2}U=0\Rightarrow </math>

<math>

a=\frac{1}{4}U\ \Rightarrow\ U=4a </math>

Einsetzen in 1)

<math> 4a=2(a+b)\ \Rightarrow \ a = b</math>

Es folgt daraus, dass der größtmögliche Flächeninhalt eines Rechtecks bei vorgegebenen Umfang dann zu erzielen ist, wenn beide Seitenlängen gleich sind (was einem Quadrat entspricht). Umgekehrt lässt sich aber auch sagen, dass ein Rechteck mit vorgegebenem Flächeninhalt den geringsten Umfang aufweist, wenn sich

<math>

a:b=1:1 </math>

verhalten - also bei einem Quadrat!

Mehrdimensionaler Fall

Es sei <math>U\subseteq\mathbb R^n</math> und <math>f\colon U\to\mathbb R</math> eine Funktion. Weiterhin sei <math>x</math> ein innerer Punkt von <math>U</math>. Ein lokales Minimum/Maximum in <math>x</math> ist dann gegeben, wenn eine Umgebung um <math>x</math> existiert, in welcher kein Punkt einen kleineren bzw. größeren Funktionswert annimmt.

Analog zum eindimensionalen Fall ist das Verschwinden des Gradienten

<math>Df(x)=\operatorname{grad} f(x)</math>

eine notwendige Bedingung dafür, dass <math>f</math> im Punkt <math>x</math> ein Extremum annimmt. Hinreichend ist in diesem Fall die Definitheit der Hesse-Matrix <math>D^2f(x)</math>: ist sie positiv definit, liegt ein lokales Minimum vor; ist sie negativ definit, handelt es sich um ein lokales Maximum; ist sie indefinit, liegt kein Extrempunkt, sondern ein Sattelpunkt vor. Wenn sie nur semidefinit ist, ist keine Entscheidung anhand der Hesse-Matrix möglich.

Unendlichdimensionaler Fall

Definition

Der Begriff des Maximums und des Minimums überträgt sich direkt auf den unendlichdimensionalen Fall. Ist <math> X </math> ein Vektorraum und <math> D \subset X </math> eine Teilmenge dieses Vektorraumes sowie <math> f\colon D \to \R </math> ein Funktional. Dann hat <math>f</math> an der Stelle <math> \tilde x \in D</math>

  • ein (globales) Minimum, wenn <math> f(\tilde x) \leq f(x) </math> für alle <math> x \in D </math>.
  • ein (globales) Maximum, wenn <math> f(\tilde x) \geq f(x) </math> für alle <math> x \in D </math>.

Der Zusatz „globales“ wird meist weggelassen, wenn aus dem Zusammenhang klar ist, was gemeint ist. Ist <math> X </math> zusätzlich mit einer Topologie versehen, also ein topologischer Raum, dann hat <math>f</math> an der Stelle <math> \tilde x \in D</math>

  • ein lokales Minimum, wenn es eine Umgebung <math>U</math> von <math>\tilde x</math> gibt, so dass <math> f(\tilde x) \leq f(x) </math> für alle <math> x \in U \cap D</math> gilt.
  • ein lokales Maximum, wenn es eine Umgebung <math>U</math> von <math>\tilde x</math> gibt, so dass <math> f(\tilde x) \geq f(x) </math> für alle <math> x \in U \cap D</math> gilt.

Ein Punkt heißt ein (lokales) Extremum, wenn er ein (lokales) Minimum oder ein (lokales) Maximum ist. Jedes globale Minimum (Maximum) ist ein lokales Minimum (Maximum).

Existenz, Eindeutigkeit und Geometrie von Extrema

Existenz

Entsprechend den Existenzaussagen für reelle Funktionen gibt es auch Aussagen für die Existenz von Extremalstellen von Funktionalen. Ist <math> X </math> ein normierter Raum, so gilt:

Da diese Version für die Anwendung und Überprüfung oft unpraktisch ist, schwächt man dies ab zu der Aussage, dass jedes stetige quasikonvexe Funktional auf einer beschränkten, konvexen und abgeschlossenen Teilmenge eines reflexiven Banachraums ein Minimum annimmt. Diese Aussage gilt auch für alle konvexen Funktionale, da diese immer quasikonvex sind. Im Endlichdimensionalen kann auf die Konvexität der Teilmenge verzichtet werden.

Eindeutigkeit

Unter gewissen Umständen sind die Optimalpunkte sogar eindeutig bestimmt. Dazu gehört zum Beispiel die strikte Konvexität.

Geometrie

Schränkt man sich auf gewisse Klassen von Funktionalen ein, so kann man Aussagen über die Geometrie der Menge der Extremalpunkte treffen.

  • Ist das Funktional quasikonvex auf einer konvexen Menge, so ist die Menge der Minima konvex.
  • Ist das Funktional quasikonkav auf einer konvexen Menge, so ist die Menge der Maxima konvex.
  • Ist das Funktional konvex auf einer konvexen Menge, so ist jedes lokale Minimum ein globales Minimum.
  • Ist das Funktional konkav auf einer konvexen Menge, so ist jedes lokale Maximum ein globales Maximum.

Andere Extremwerte

Diskrete Optimierung

Bei diskreten Optimierungsproblemen ist der oben definierte Begriff des lokalen Extremums nicht geeignet, da in jedem Punkt ein lokales Extremum in diesem Sinne vorliegt. Für Extrema einer Funktion <math>f\colon D\to\mathbb R</math> wird von daher ein anderer Umgebungsbegriff verwendet: Man benutzt eine Nachbarschaftsfunktion <math>N</math>, die jedem Punkt die Menge seiner Nachbarn zuordnet,

<math>N\colon D\to\mathcal P(D);</math>

dabei steht <math>\mathcal P(D)</math> für die Potenzmenge von <math>D</math>.

<math>f</math> hat dann ein lokales Maximum in einem Punkt <math>x_0\in D</math>, wenn <math>f(x)\leq f(x_0)</math> für alle Nachbarn <math>x\in N(x_0)</math> gilt. Lokale Minima sind analog definiert.

Variationsrechnung

Extremwerte von Funktionen, deren Argumente selbst Funktionen sind, sind Gegenstand der Variationsrechnung.

Siehe auch

Weblinks

pt:Mínimo