- - - - - Diese Seite braucht webEQ! Klicken Sie auf das Logo. - - - - -
9.12. Verallgemeinerte Differenzierbarkeit


Methoden der linearen Algebra mit Begriffen aus der Analysis zu kombinieren, führt oft zu reichhaltigen, neuen Theorien. In diesem Abschnitt soll eine solche Kombination am Beispiel der Differenzierbarkeit vorgestellt werden. Die resultierende neue Theorie, die Distributionentheorie, wurde gegen Ende der 40er Jahre von Laurent Schwartz entwickelt.

Wir beschränken uns auf einige grundlegende Aspekte der Distributionentheorie, die bereits mit sparsamen Bedingungen entwickelt werden können. Die folgenden drei Punkte sind daher zu beachten:

Wir beginnen mit der Bereitstellung der für die Theorie notwendigen Grund- oder Testfunktionen. Dabei sei noch einmal an den Begriff "Träger einer Funktion" erinnert: supp g = {x Î R | g(x) ¹ 0}.

Definition:  Die Funktionen aus

C0 ¥ := C0 ¥(R ) := {g Î C ¥(R ) | es gibt ein Intervall [a,b] so dass supp g Ì [a,b]}

nennen wir Testfunktionen.
 

 
Beachte:

Eine C ¥-Funktion ist also nur dann eine Testfunktion, wenn sie außerhalb eines geschlossenen Intervalls nur den Wert 0 annimmt. Unter den gewöhnlichen C ¥-Funktionen findet man ein solches Verhalten eher nicht. Es müssen also Beispiele konstruiert werden.
Dabei spielt die Funktion  f : R  ® R  gegeben durch

 f(x) := { e - 1 x  ,&quad;falls&quad; x>0 0 ,&quad;falls&quad; x0

eine große Rolle.  f ist eine C ¥-Funktion, denn wir zeigen für alle  n Î N:

  f Î C n(R ) und mit geeigneten Konstanten a1,...a2n gilt:  f (n) (x)={ ( i=1 2n a i x i ) e - 1 x  ,&quad;falls&quad; x>0 0 ,&quad;falls&quad; x0 .

Dem Induktionsbeweis stellen wir zunächst eine Abschätzung voran, die während der Induktion benötigt wird:
Für  i Î N  und x > 0 erhält man aus  x i ċ e 1 x = n=0 x i n! x n > 1 (i+1)!x die Ungleichung:
 

e - 1 x x i = 1 x i e 1 x <(i+1)!x .            (+)

Nun zur Induktion selbst:

1.  Wir weisen die Differenzierbarkeit von  f  in jedem x Î R  nach und unterscheiden dazu drei Fälle:

·   x > 0: Hier ist  f  lokal identisch mit  e - 1 X , also differenzierbar nach Kettenregel. Mit a1 := 0, a2 := 1 ist:

  f '(x) = 1 x 2 e - 1 x =( i=1 2 a i x i ) e - 1 x .

2.  Sei jetzt  f n-mal differenzierbar und  f (n)(x) wie angegeben zu berechnen. Um nun die Differenzierbarkeit von  f (n) sicherzustellen, sind wieder die drei charakteristischen Fälle zu unterscheiden:

·   x > 0: Hier ist  f  (n) lokal identisch mit  ( i=1 2n a i X i ) e - 1 X , also differenzierbar nach Produkt- und Kettenregel.
  Die Ableitung errechnet man mit geeignet gewählten Konstanten a'i zu:
 
f (n+1) (x) = f (n) '(x) =( i=1 2n -iċ a i x i+1 ) e - 1 x +( i=1 2n a i x i ) 1 x 2 e - 1 x =( i=1 2n -iċ a i x i+1 ) e - 1 x +( i=1 2n a i x i+2 ) e - 1 x =( i=1 2(n+1) a ' i x i ) e - 1 x  .

Mit Hilfe dieser C ¥-Funktion  f  lassen sich nun leicht Beispiele von Testfunktionen herstellen.
  
Beispiel:  Für jedes r > 0 ist die Funktion  gr : R  ® R  gegeben durch

g r :=f( r 2 - X 2 )

eine Testfunktion mit supp gr Ì [-r,r].

Beweis:

Nach Kettenregel ist gr eine C ¥-Funktion. Ihr Träger ist eine Teilmenge von [-r,r], denn ist | x | > r, so ist r2 - x2 < 0, also:  f(r2 - x2) = 0.
  

Oft setzt man eine normierte Form der gerade konstruierten Testfunktion gr ein. Weil nämlich gr(x> 0 für alle x Î  ] -r,r [,
ist -r r g r &neq;0 . Die Funktion g r 0 := 1 -r r g r g r ist somit eine Testfunktion mit der besonderen Eigenschaft -r r g r 0 =1 .

Die folgenden Skizzen zeigen die Funktionen g1 und g1 0.
g1 g1 0

 

Ein weiteres Beispiel dokumentiert die hohe Flexibilität der Testfunktionen. Überdies sind die hier eingeführten Hut-Funktionen ein unentbehrliches Hilfsmittel bei der Entwicklung allgemeiner Integrale. Wir notieren zwei Varianten.
 
Beispiel: (Satz vom C ¥-Hut)
  1. Ist 0 < r < s, so gibt es eine Testfunktion  h Î C0 ¥ , mit
    • 0 £ h(x) £ 1   für alle x Î R
    • h(x) = 1  für | x | £ r
    • h(x) = 0  für | x | ³ s.
       
  2. Zu jedem abgeschlossenen Intervall [c,d] und jedem e > 0 gibt es eine Testfunktion  he Î C0 ¥ , mit
    • 0 £ he(x) £ 1   für alle x Î R
    • he(x) = 1  für x Î [c,d]
    • he(x) = 0  für x Ï ]c - e,d + e[.
    Jede Funktion dieser Art nennen wir einen C ¥-Hut für [c - e,d + e].

Beweis:

Zu 1.:  Wir setzen wieder die oben eingeführte C ¥-Funktion  f ein.
Für | x | > r ist  f(x2 - r2) > 0, für | x | < s ist  f(s2 - x2) > 0. Da stets  f(x) ³ 0, hat man für alle x:
 

f(x2 - r2) +  f(s2 - x2) > 0.

Die Funktion
h:= f( s 2 - X 2 ) f( X 2 - r 2 )+f( s 2 - X 2 )
ist daher eine C ¥-Funktion auf ganz R.. Sie besitzt offensichtlich die drei angegebenen Eigenschaften.

Zu 2.:  Wir gewinnen einen C ¥-Hut für [c - e,d + e] durch eine geeignete Verschiebung der gerade konstruierten Funktion h:
Setzt man

r := d-c 2
s := r + e,

so leistet die C ¥-Funktion   h ε :=h(X- c+d 2 ) das Gewünschte:

Ist x Î [c,d], so ist |x- c+d 2 |r ,&quad;d.h.&quad; h ε (x)=h(x- c+d 2 )=1 .
Liegt x außerhalb ]c - e,d + e[, so ist |x- c+d 2 |s ,&quad;also ist&quad; h ε (x)=h(x- c+d 2 )=0 .
 

 

Beliebige Funktionen nehmen definitionsgemäß außerhalb ihres Träger nur den Wert 0 an. Bei einer C0 ¥ -Funktion g gilt dieses Verhalten in geeigneten Bereichen sogar für alle Ableitungen g(n)! Die folgende Bemerkung führt dies präzise aus:
 
Bemerkung:  Es sei  g Î  C0 ¥  und [a,b] ein Intervall, das den Träger von g umfasst, also supp g Ì [a,b]. Dann gilt für alle n ³ 0:
  1. g(n)(x) = 0   für alle x < a.
    g
    (n)(x) = 0   für alle x > b.
     
  2. g(n)(a) = 0.
    g(n)(b) = 0.

Beweis:

Zu 1.:  In jedem Punkt x < a bzw. x > b ist g lokal identisch mit 0, stimmt hier also mit dem Ableitungsverhalten der Nullfunktion überein.

Zu 2.:  Als differenzierbare Funktion ist g(n) in a stetig. Mit g(n)(x) = 0 für alle x < a ist somit auch: g(n)(a) = 0.
Auf ähnliche Weise ergibt sich: g(n)(b) = 0.
 

 

Die folgende Definition vermischt nun Inhalte der Analysis mit algebraischen Aspekten.
 
Definition und Bemerkung:  C0 ¥  ist ein Untervektorraum von C ¥(R ). Den zugehörigen Dualraum, also den Vektorraum der Linearformen auf  C0 ¥  bezeichnen wir mit dem Symbol

D :=  C0 ¥ ' = {L : C0 ¥  ® R  | L ist linear}

Die Elemente von D nennen wir verallgemeinerte Funktionen oder Distributionen.

Beweis:  Wir weisen für C0 ¥ die drei kennzeichnenden Eigenschaften eines Unterraums nach:

  •  0 Î C ¥(R ) und supp 0 = Æ Ì [0,1].
     
  • Sind  g1, g2 Î C0 ¥ , so sind dies zwei C ¥-Funktionen, deren Träger jeweils in einem Intervall liegen, etwa supp g1 Ì [a1,b1], bzw. supp g2 Ì [a2,b2]. Dann ist auch g1 + g2 eine C ¥-Funktion. Für ihren Träger gilt:
     

    supp g1 + g2 Ì [a1,b1] È [a2,b2] Ì [min{a1,a2},max{b1,b2}].
     
  • Ist g Î C0 ¥  mit supp g Ì [a,b] und a Î R , so ist ag eine C ¥-Funktion deren Träger leer ist (falls a = 0) oder gleich supp g ist (falls a ¹ 0). In jedem Fall also hat man: supp ag Ì [a,b].

 
Beispiel:  Die Diracsche Deltaform da ist nach einem Beispiel in 9.10 eine Distribution.
  

Das nächste Beispiel stellt eine ganze Gruppe von Distributionen vor. Der Ausdruck verallgemeinerte Funktion hat hier seinen Ursprung.
  
Definition und Beispiel:  Ist  f : R  ® R  eine stetige Funktion, so ist durch die Festsetzung
L f (g):= a b fg ,    g Î C0 ¥  mit supp g Ì [a,b],

eine Distribution Lf  gegeben. Distributionen dieser Form nennen wir regulär.

Beweis:  Als stetige Funktion ist  fg integrierbar. Wir zeigen zunächst: Das Integral hängt von Wahl des Intervalls [a,b] nicht ab, Lf (g) ist also wohldefiniert.

Sei dazu [a',b'] ein weiteres Intervall mit supp g Ì [a',b']. Setzt man a* := min{a,a'} und b* := max{b,b'}, so ist
  

[a,b] , [a',b'] Ì [a*,b*].

Auf den (möglicherweise einpunktigen) Teilintervallen [a*,a] und [b,b*] ist g = 0, man hat also:
 

a* b* fg = a* a fg + a b fg + b b* fg = a b fg .

Dieselbe Überlegung für das Intervall [a',b'] führt zu  
 

a' b' fg = a* b* fg = a b fg .

 
Nun zur Linearität:

Sind  g1, g2 Î C0 ¥  mit supp g1 Ì [a1,b1], bzw. supp g2 Ì [a2,b2], so gilt mit a := min{a1,a2} und b := max{b1,b2}:
 

supp a1g1 + a2g2 Ì [a1,b1] È [a2,b2] Ì [a,b].

Und da, wie gerade gezeigt, das Integral nicht von der Wahl des Intervalls abhängt, kann man zur Berechnung das Intervall [a,b] heranziehen:
 
L f ( α 1 g 1 + α 2 g 2 )= a b f( α 1 g 1 + α 2 g 2 ) = α 1 a b f g 1 + α 2 a b f g 2 = α 1 L f ( g 1 )+ α 2 L f ( g 2 ) .

 
Beispiel:  
  1. Jede konstante Funktion  c :R  ® R  ist stetig, die zugehörige Distribution Lc also regulär. Dabei gilt offensichtlich: Lc = cL1.
  2. da ist nicht regulär.

Beweis:

Zu a.:  Für g Î C0 ¥  mit supp g Ì [a,b] hat man:
 

L c (g)= a b cg =c a b g =c L 1 (g) .

Zu b.:  Angenommen, es gibt eine stetige Funktion  f, so dass Lf  = da. Da  f auf jedem abgeschlossenen Intervall beschränkt ist, findet man ein r > 0, so dass
 

a-r a+r |f| &lt;1 .

Sei nun h ein C ¥-Hut für [a - r,a + r]. Die folgende Abschätzung liefert den gewünschten Widerspruch:
 

1= δ a (h)=| L f (h)|=| a-r a+r fh | a-r a+r |f|h a-r a+r |f| &lt;1 .
 

Die regulären Distributionen Lf  sind durch "ihr"  f eindeutig bestimmt.
 
Bemerkung:  Für zwei stetige Funktionen  f, h : R  ® R  gilt:
Lf  = Lh     Þ     f = h.

Beweis: Sei  a Î R  beliebig. Es reicht nun, eine Folge (gn) in C0 ¥  zu finden, so dass für jede stetige Funktion  f : R ® R  gilt:  Lf  (gn) ®  f(a). Dann nämlich kann man folgendermaßen argumentieren:

 f(a) = lim Lf (gn) = lim Lh(gn) = h(a).

Zur Konstruktion einer solchen Folge (gn) setzen wir die normierten Testfunktionen gr 0  aus dem ersten Beispiel ein. Da Integrale verschiebungsunabhängig sind, ist auch die Funktion

g n := g 1 n 0 (X-a)

eine normierte Testfunktion: a- 1 n a+ 1 n g n =1 .

Sei nun

  f(x*) = max{ f(x) |  x[a- 1 n ,a+ 1 n ] und  f(x*) = min{ f(x) |  x[a- 1 n ,a+ 1 n ] }
(beachte: stetige Funktionen nehmen auf abgeschlossenen Intervallen Maximum und Minimum an!). Da gn positiv ist, erhält man aus der Monotonie des Integrals die folgende Abschätzung:
 
f( x * )=f( x * ) a- 1 n a+ 1 n g n a- 1 n a+ 1 n f g n f(x*) a- 1 n a+ 1 n g n =f(x*) .

D.h. also:  f(x*) £ Lf (gn) £  f(x*). Nach Zwischenwertsatz gibt es daher ein  xn    ~    zwischen  x*  und  x*, so dass
 

Lf (gn) =  f( xn    ~  ).

Da nun offensichtlich  xn    ~   ®  a, folgt schließlich aus der Stetigkeit von  f :

Lf (gn) =  f( xn    ~  )  ®  f(a).

 

Reguläre Distributionen entstehen aus einer Funktion per Integration. Unser Integral, das Stammfunktionen-Integral, ermöglicht es, diesen Vorgang für jede stetige Funktion durchführen. Mit einem leistungsstärkeren Integralbegriff ließe sich allerdings eine größere Gruppe von Funktionen, die sog. lokal-integrierbaren Funktionen, zur Bildung regulärer Distributionen heranziehen.  

Die nachfolgenden Konstruktionen haben zum Ziel, wenigstens den Indikatorfunktionen von Intervallen reguläre Distributionen zuzuordnen. Dabei werden wir zwischen einem offenen und einem abgeschlossenen Intervall keinen Unterschied machen. Die Bezeichnung (c,d) stehe daher im Weiteren für irgendein Intervall, wie z.B. für [c,d[.

Definition:  Für ein festes  c Î R  setzen wir zur Abkürzung  b* := max{c,b}. Durch die Festsetzung
Lc(c,¥[(g)  :=  c b* g ,    g Î C0 ¥  mit supp g Ì [a,b],

ist eine Distribution Lc(c,¥[ = Lc[c,¥[ = Lc]c,¥[ gegeben.

Beweis:

Wir gehen wie bei der Einführung der Distribution Lf vor. Wie dort zeigen wir zunächst: Das Integral hängt nicht von der Wahl des Intervalls [a,b] ab. Sei dazu [a',b'] ein weiteres Intervall, das den Träger von g umfasst. O.E. sei etwa b £ b' und damit auch b* £ b'*. Folgt:

c b'* g = c b* g + b* b'* g = c b* g , denn  g(x) = 0  für alle x Î [b*,b'*].

Zur Linearität:

Sei  g1, g2 Î C0 ¥  mit supp g1 Ì [a1,b1], bzw. supp g2 Ì [a2,b2]. Mit a := min{a1,a2} und b := max{b1,b2} hat man wieder
 

supp a1g1 + a2g2 Ì [a1,b1] È [a2,b2] Ì [a,b],

und setzt bei der Integration das Intervall [a,b] ein:
 
Lc(c,¥[(a1g1 + a2g2)  =  c b* α 1 g 1 + α 2 g 2 = α 1 c b* g 1 + α 2 c b* g 2   =  a1Lc(c,¥[(g1) + a2Lc(c,¥[(g2).
 

Analog führt man für ein festes  d Î R  die Distribution Lc],d ) = Lc],d ] = Lc],d [ ein. Für ein beliebiges Intervall (c,d) setzen wir:
 

Lc(c,d) := Lc(c,¥[ - Lc(d,¥[.

 
Beispiel: 
  1. LH = Lc]0,¥[
     
  2. Lsign = Lc]0,¥[ - Lc],0 [


 

Wir verallgemeinern nun den Ableitungsbegriff. Die Regel der partiellen Integration liefert dabei einen entscheidenden Hinweis:
Für eine stetig differenzierbare Funktion  f  und eine Testfunktion g Î C0 ¥  mit supp g Ì [a,b] hat man nämlich:
 

L f' (g)= a b f'g =- a b fg' = L f (g')        (beachte: g(a) = g(b) = 0!).

Die Werte, die die reguläre Distribution Lf '  auf den Testfunktionen annimmt, lassen sich also bis auf das Vorzeichen ersetzen, durch die Werte, die Lf  auf den Ableitungen der Testfunktionen annimmt! Dieses Verhalten liegt der folgenden Definition zu Grunde:
 
Definition:  Für L Î D und n Î N setzen wir
 
L(n)(g) := (-1)nL(g(n)),    g Î C0 ¥ .

L(n) heißt die n-te Ableitung von L. Wie üblich schreiben wir L', L",... statt L(1), L(2),... und setzen zusätzlich L(0) = L.
 

 
Bemerkung:  L(n) Î D.

Beweis: Zunächst beachte man, dass mit g auch g(n) Î C0 ¥ , L(n) ist also wohldefiniert. Es bleibt also nur noch die Linearität von L(n) nachzuweisen:

L(n)(a1g1 + a2g2)   =  (-1)nL((a1g1 + a2g2)(n))
    =  (-1)nL(a1g1(n) + a2g2(n))
    =  a1(-1)nL(g1(n)) + a2(-1)nL(g2(n))
  =  a1L(n)(g1) + a2L(n)(g2).

 

Die Distributionenableitung setzt in geeigneter Weise die klassische Ableitung fort, es handelt sich also um einen verallgemeinerten Ableitungsbegriff:
    
Bemerkung:  Für  f Î C n(R ) gilt:

(Lf )(n) = Lf (n).

Beweis:  Sei g Î C0 ¥  mit supp g Ì [a,b]. Zunächst gilt nach einer Bemerkung zuvor: g( i )(a) =  g( i )(b) = 0 für alle i £ n - 1. Die partielle Integration kann also ohne Berücksichtigung der Randwerte ausgeführt werden:

( L f ) (n) (g)= (-1) n L f ( g (n) )= (-1) n a b f g (n) = a b f (n) g = L f (n) (g) .

Im Distributionensinn können jetzt aber auch Funktionen abgeleitet werden, die im klassischen Sinn nicht differenzierbar sind! Wir zeigen dies am Beispiel der Betrags- und der Heavisidefunktion.
 
Beispiel: 
  1. (L| X |)'Lsign.
  2. (LH)' = d 0.

Beweis: Sei g Î C0 ¥  mit supp g Ì [a,b]. Für b* := max{0,b} und a* := min{a,0} gilt zunächst: g(a*) = 0 = g(b*), und damit:

Zu a.:&quad; ( L |X| )'(g) =- L |X| (g') =- a b |X|g' =- a * 0 |X|g' - 0 b* |X|g' = a * 0 Xg' - 0 b* Xg' =- a * 0 g + 0 b* g = L sign (g)  .

Zu b.:&quad; ( L H )'(g) =- L H (g') =- 0 b* g' =-(g(b*)-g(0)) =g(0)= δ 0 (g)  .
 

Von den klassischen Ableitungsregeln lassen sich die Summen- und die Faktorregel bequem übertragen. Die anderen Regeln stehen überhaupt nicht zur Diskussion, denn für Distributionen sind weitere Rechenarten nicht definiert.
 
Bemerkung:  Für K,L Î D gilt:
  1. (K + L)' = K' + L'.
  2. (K - L)' = K' - L'.
  3. (a K)' = a K'.

Beweis: Sei g Î C0 ¥ beliebig.

Zu 1.: (K + L)' (g) = -(K + L) (g') = -K (g') - L (g') = K' (g) + L' (g).  2. zeigt man analog.

Zu 3.: (a K)' (g) = -(a K) (g') = -a K (g') = a (-K (g')) = a K' (g).
 

 


 9.11
9.13.