Sechs Vorträge über ausgewählte Gegenstände aus der
reinen Mathematik und mathematischen Physik

Henri Poincaré
1910



Mathematische Vorlesungen an der Universität Göttingen: IV

SECHS VORTRÄGE

ÜBER AUSGEWÄHLTE GEGENSTÄNDE

AUS DER REINEN MATHEMATIK

UND DER MATHEMATISCHEN PHYSIK


auf Einladung der Wolfskehl-Kommission der Königlichen Gesellschaft der Wissenschaften

gehalten zu Göttingen vom 22.–28. April 1909

von

HENRI POINCARÉ

Mitglied der Französischen Akademie

Professor an der Faculté des Sciences der Universität Paris


Mit 6 in den Text gedruckten Figuren

Leipzig und Berlin

Druck und Verlag von B. G. Teubner


1910

Préface

L’Université de Göttingen a bien voulu m’inviter à traiter devant un savant auditoire diverses questions d’Analyse pure, de Physique mathématique, d’Astronomie théorique et de Philosophie mathématique; les conférences que j’ai faites à cette occasion ont été recueillies par quelques étudiants qui ont eu la bonté de les rédiger en corrigeant les nombreuses offenses que j’avais faites à la grammaire allemande. Je leur en exprime ici toute ma reconnaissance.

Il convient également que je m’excuse auprès du public de la brièveté avec laquelle ces sujets sont traités. Je ne disposais pour exposer chacun d’eux que d’un temps très court, et je n’ai pu la plupart du temps que donner une idée générale des resultats, ainsi que des principes qui m’ont guidé dans les démonstrations, sans entrer dans les détails mêmes de ces démonstrations.

Inhaltsverzeichnis

Fünfter Vortrag. Über transfinite Zahlen.

Sechster Vortrag. La mécanique nouvelle.

Kapitel 1 Über die Fredholmschen Gleichungen

Die Integralgleichung

φ(x)=λabf(x,y)φ(y)𝑑y+ψ(x) (1)

wird bekanntlich aufgelöst durch die Integralgleichung derselben Art

φ(x)=ψ(x)+λabψ(y)G(x,y)𝑑y, (1a)

wobei

G(x,y)=N(x,y;λ|f)D(λ|f)

gesetzt ist. N und D sind, wie aus der Fredholmschen Theorie bekannt ist, zwei ganze transzendente Funktionen in bezug auf λ. Um ihre Entwicklung explizite hinschreiben zu können, bezeichne man, wie Fredholm, mit f(x1,x2,xny1,y2,yn) diejenige n-reihige Determinante, deren allgemeines Element f(xi,yk) ist. Setzt man dann

an=abababf(x1,x2,xnx1,x2,xn)𝑑x1𝑑xn,

so hat man

D(λ)=0(-λ)nn!an.

Diese Gleichung formen wir um, indem wir die durch „Iteration” aus f(x,y) entstehenden Kerne heranziehen. Setzen wir zunächst

f(xα,xβ)f(xβ,xγ)f(xλ,xμ)f(xμ,xα)=f(xα,xβ,xλ,xμ),

so ist klar, daß f(x1,x2,xnx1,x2,xn) die Form hat

±f(xα,xμ),

wie sofort aus der Entwicklung der Determinante hervorgeht. Sei nun

bk=ababf(xα,xμ)𝑑xα𝑑xμ,

wobei k die Anzahl der Integrationsvariabeln xα,xμ bedeutet, so können wir offenbar auch setzen

bk=abfk(x,x)𝑑x,

wenn unter

fk(x,y)=ababf(x,xα)f(xα,xβ)f(xλ,y)𝑑xα𝑑xλ

der “k-fach iterierte Kern” verstanden wird.

Wir haben den obigen Relationen zufolge jetzt

an=±bk.

Beachten wir nun, daß gewisse unter den in einem Produkt bk enthaltenen bk einander gleich werden können, daß ferner gewisse der Produkte bk selbst einander gleich sein werden, nämlich solche, die durch eine Permutation der xi auseinander entstehen, so ergibt eine kombinatorische Betrachtung für an einen Ausdruck von der Form

an=aα+bβ+cγ+=nn!aαbβcγa!b!c![(-1)α+1bα]a[(-1)β+1bβ]b[(-1)γ+1bγ]c

und also

D(λ)=a,b,c,1a!b!c!(-λαbαα)a(-λβbββ)b(-λγbγγ)c

d. h.

D(λ)=1e-λαbαα, (2)

also

logD(λ) =-λαbαα, (2a)
D(λ)D(λ) =-λα-1bα. (2b)

Den Zähler N(x,y;λ) der Funktion G(x,y;λ) kann man auf analoge Weise durch die Gleichung

N(x,y;λ)=D(λ)λhfh+1(x,y) (3)

definieren. Diese Gleichungen, welche sich übrigens schon bei Fredholm finden, sind nützlich als Ausgangspunkt für viele Betrachtungen, wie sich nun an einigen Beispielen zeigen wird.

Die Fredholmsche Methode ist unmittelbar gültig nur für solche Kerne f(x,y), die endlich bleiben. Wird der Kern an gewissen Stellen unendlich, so kann dennoch der Fall eintreten, daß ein iterierter Kern, etwa fn(x,y), endlich bleibt. Dann läßt sich die Integralgleichung mit dem iterierten Kerne nach Fredholm behandeln, und Fredholm zeigt, daß die ursprüngliche Integralgleichung (1) sich auf diese zurückführen läßt. Die Auflösung wird wieder durch eine Formel der Gestalt (1a) gegeben, nur ist jetzt

G=N1(x,y;λ)Dn(λ)

zu setzen, wobei

Dn(λ)=D(λn|fn)

und

N1(x,y;λ)=Dn(λ)λhfh+1(x,y)

ist. Dabei sind N1 und Dn wieder ganze transzendente Funktionen von λ; jedoch zeigt es sich, daß sie einen gemeinsamen Teiler besitzen; wir wollen zusehen, wie sich dies aus unseren Formeln (2) bis (3) ergibt und wie wir eine Bruchdarstellung der meromorphen Funktion G erhalten, bei der Nenner und Zähler ganze Funktionen ohne gemeinsamen Teiler sind.

Aus unserer Annahme über die iterierten Kerne folgt, daß die Koeffizienten bn, bn+1, endlich sind. Bilden wir nun in Anlehnung an Gleichung (2a) die Reihe

K(λ)=-λnbnn-λn+1bn+1n+1-,

so wird dieselbe konvergieren. Jetzt setzen wir

G(x,y;λ)=eKλhfh+1eK

und behaupten, in dieser Formel die gewünschte Darstellung zu haben.

Um dies zu beweisen, haben wir zu zeigen, daß eK und eKλh+1fh+1 ganze Funktionen sind.

Zu diesem Zwecke bilden wir dKdλ. Man berechnet leicht

-dK(λ)dλ=λn-1abN1(x,x)Dn(λ)𝑑x+k=1k=n-1λn+k-1abN1(x,y)Dnfk(x,y)𝑑x𝑑y.

Hieraus schließt man zunächst, daß dKdλ eine meromorphe Funktion von λ ist; denn sie besitzt höchstens Pole in den Nullstellen von Dn(λ), d. h. in den Stellen λ=αλi wo α eine n-te Einheitswurzel und λi ein Eigenwert des Kernes fn ist. Man kann nun zeigen, daß in diesen möglichen Unendlichkeitsstellen das Cauchysche Residuum von dKdλ gleich 1 oder 0 ist, je nachdem α=1 oder α1 genommen wird. Die hierzu gehörige Rechnung wollen wir jetzt nicht durchführen; man benutzt dabei den Umstand, daß das für λ=λk genommene Residuum von N1(x,y)Dn gleich φk(x)ψk(y) ist, wo φk, ψk, die zu λ=λk gehörigen Eigenfunktionen, den Gleichungen

abφk(x)fp(y,x)𝑑x =λk-pφk(y)
abψk(z)fp(z,y)𝑑z =λk-pψk(y)

genügen. Hieraus folgt, daß eK(λ) eine ganze transzendente Funktion ist, die nur an den Stellen λ=λi verschwindet.

Betrachtet man ebenso den Zähler von G, so sieht man zunächst, daß er eine meromorphe Funktion von λ wird, die höchstens an den Stellen λ=αλi unendlich werden kann. Die Betrachtung der Residuen zeigt jedoch, daß dies nicht geschieht, und somit, daß der Zähler eKλhfk+1 ebenfalls eine ganze transzendente Funktion ist. Damit ist die Reduktion des Fredholmschen Bruches geleistet.

Die Reihenentwicklung für Zähler und Nenner des Fredholmschen Bruches in dieser reduzierten Gestalt erhalten wir, indem wir auf die Bildungsweise von K(λ) zurückgehen; setzen wir den Nenner

eK(λ)=(-λ)nann!,

so haben wir

an=aα+bβ+cγ+=n±bαabβbbγc,

wobei zu setzen ist

bα=0 für α<n und bα=abfα(x,x)𝑑x für αn.

In analoger Weise wird der Zähler gebildet. Man muß also die Determinanten in der gewöhnlichen Weise entwickeln, aber diejenigen Glieder dieser Entwicklung wegwerfen, welche einen Faktor von der Form f(x1,x2,xk) mit weniger als n Veränderlichen enthalten.

Unsere Formeln (2), (2a), (3) sind auch in dem Falle von Nutzen, daß außer dem Kern f(x,y) auch alle iterierten Kerne unendlich werden und die Fredholmsche Methode also nun sicher versagt.
Seien etwa die Zahlen b1,b2,bn-1 unendlich, bn,bn+1, endlich. Man kann dann jedenfalls die Reihe K(λ) bilden, fragen, ob sie konvergiert, und untersuchen, ob eK(λ) wieder eine ganze Funktion darstellt. Unter der Voraussetzung, daß f(x,y) ein symmetrischer Kern ist, d. h.

f(x,y)=f(x,y),

ist mir dieser Nachweis gelungen. Ich benutze dabei die Relationen

bn=λi-n,

die für n>2 gelten müssen, da das Geschlecht der Funktion D(λ) einem Hadamardschen Satze zufolge kleiner als 2 ist.

Den Beweis mitzuteilen fehlt jetzt die Zeit.

Für den Zähler des Fredholmschen Bruches habe ich die Betrachtung nicht durchgeführt.

Noch einige Worte über die Integralgleichung 1. Art! Auf gewisse derartige Integralgleichungen kann man, wenn man sie zuvor auf Integralgleichungen der 2. Art zurückführt, die Fredholmsche Methode direkt anwenden. Es liege z. B. die Gleichung

-+φ(y)[eixy+λf(x,y)]dy=ψ(x)  (-<x<+) (1)

vor, in der ψ(x) die gegebene, φ(x) aber die gesuchte Funktion ist, während der Bestandteil f(x,y) des Kerns eine gegebene Funktion ist, die gewissen, weiter unten angegebenen beschränkenden Voraussetzungen unterworfen ist. Für die gesuchte Funktion φ(y) machen wir den Ansatz

φ(y)=-+Φ(z)e-izy𝑑z,

aus dem nach dem Fourierschen Integraltheorem, falls Φ(x) die Bedingungen für dessen Gültigkeit erfüllt, umgekehrt

2πΦ(x)=-+φ(y)eixy𝑑y

folgt. Danach verwandelt sich (1) in

2πΦ(x)+λ-+-+Φ(z)f(x,y)e-izy𝑑z𝑑y=ψ(x)

oder

2πΦ(x)+λ-+Φ(z)K(x,z)𝑑z=ψ(x),

wenn

K(x,z)=-+f(x,y)e-izy𝑑y (2)

gesetzt wird, und damit sind wir bereits bei einer Integralgleichung 2. Art angelangt. Der Kern (2) gestattet die Anwendung der Fredholmschen Methode z. B. dann, wenn f(x,y) und f(x,y)y gleichmäßig in x für y=± gegen 0 konvergieren und die Ungleichung

2fy2<M1+y2

statthat, in der M eine von x und y unabhängige Konstante bedeutet. Von ψ(x) genügt es etwa, anzunehmen, daß es nur endlichviele Maxima und Minima besitzt und im Intervall -+ absolut integrierbar ist.

Wir können dieselbe Methode auf eine Reihe

ψ(x)=(m)Am[eimx+λθm(x)]

anwenden; das Problem ist hier also, wenn ψ(x) und die Funktionen θm(x) gegeben sind, die Koeffizienten Am so zu berechnen, daß die hingeschriebene Entwicklung gültig ist. Handelte es sich soeben um eine Erweiterung des Fourierschen Integraltheorems, so haben wir es jetzt mit einer Verallgemeinerung der Fourierschen Reihe zu tun.

Setzen wir φ(z) in der Form

φ(z)=(m)Ameimz;2πAm=02πφ(z)e-imz𝑑z

an, so bekommen wir

ψ(x)=φ(x)+λ2π02πφ(z)(m)e-imzθm(x)dz.

Von der Reihe, welche hier als Kern fungiert, müssen wir voraussetzen, daß sie absolut und gleichmäßig konvergiert, d. h. wir müssen annehmen, daß

(m)|θm(x)| (3)

gleichmäßig konvergiert.

Setzen wir beispielsweise

λ=1,θm(x)=eiμmx-eimx,

so erhalten wir eine Entwicklung der Form

ψ(x)=(m)Ameiμmx.

Die Bedingung (3) ist erfüllt, wenn wir die absolute Konvergenz von

(m)(μm-m)

voraussetzen.

Endlich betrachten wir noch die Gleichung

02πφ(y)[eixy+λf(x,y)]dy=ψ(x),(-<x<+) (4)

welche sich von (1) dadurch unterscheidet, daß das Integral nicht in unendlichen, sondern in endlichen Grenzen zu nehmen ist. In diesem Fall darf ψ(x) nicht willkürlich gewählt werden: es muß, falls f(x,y) holomorph ist, sicher eine ganze transzendente Funktion sein, wenn die Gleichung (4) eine Auflösung besitzen soll. Dagegen dürfen die Werte ψ(m) dieser Funktion ψ für alle ganzen Zahlen m im wesentlichen willkürlich angenommen werden. Setze ich nämlich

φ(z)=(m)Ame-imz,wo2πAm=02πφ(y)eimy𝑑y ist,

so verwandelt sich (4), für x=m genommen, in

2πAm+λ(p)Ap02πe-ipyf(m,y)𝑑y=ψ(m).

Wir gelangen so zu einem System unendlich vieler linearer Gleichungen mit unendlich vielen Unbekannten, wie sie von Hill, H. v. Koch, Hilbert u. a. untersucht worden sind. Die Lösung dieses Systems ist, falls wir für die Reihe

(p,m)02πe-ipyf(m,y)𝑑y (5)

die Voraussetzung absoluter und gleichmäßiger Konvergenz machen, der Fredholmschen Lösung der Integralgleichungen durchaus analog und stellt sich wie diese als meromorphe Funktion des Parameters λ dar. Die gleichmäßige und absolute Konvergenz von (5) ist aber, wie sich durch partielle Integration ergibt, sichergestellt, falls die Summe

(m)f′′(m,z)

oder das Integral

-+f′′(x,z)𝑑x

absolut und gleichmäßig konvergiert.

Man sieht die Ähnlichkeit und den Unterschied der beiden Fälle (1) und (4) deutlich: je nachdem die Integrationsgrenzen unendlich oder endlich sind — oder auch, je nachdem der Kern in den Integrationsgrenzen keine oder eine genügend hohe Singularität aufweist —, darf man die „gegebene” Funktion im wesentlichen willkürlich wählen oder ihr nur eine zwar unendliche, jedoch diskrete Reihe von Funktionswerten vorschreiben. Es wäre wohl nicht ohne Interesse, den hier zur Geltung kommenden Unterschied mit Hilfe der Iteration der Kerne näher zu betrachten.

Kapitel 2 Anwendung der Theorie der Integralgleichungen auf die Flutbewegung des Meeres

Ich will heute über einige Anwendungen der Integralgleichungstheorie auf die Flutbewegung berichten, die ich im letzten Semester gelegentlich einer Vorlesung über diese Erscheinung gemacht habe.

Die Differentialgleichungen des Problems sind die folgenden:

a) k2x(h1φx)+k2(φxh2y-φyh2x)=ζ,b) gζ=-λ2φ+Π+W.} (1)

Wir stellen uns dabei vor, daß die Kugeloberfläche der Erde etwa durch stereographische Projektion konform auf die (x,y)-Ebene bezogen sei; dann bedeute k(x,y) das Ähnlichkeitsverhältnis der Abbildung zwischen Ebene und Kugel. Die Lösung des Flutproblems denken wir uns durch periodische Funktionen der Zeit t gegeben, und wir nehmen speziell an, daß unsere Gleichungen (1) einem einzigen periodischen Summanden von der Form Acos(λt+α) entsprechen, sodaß also λ in unseren Gleichungen die Schwingungsperiode bestimmt; es ist bequem, statt des Kosinus komplexe Exponentialgrößen einzuführen und also etwa anzunehmen, daß alle unsere Funktionen die Form

eiλtf(x,y)

haben; der reelle und imaginäre Teil dieser komplexen Lösungen stellt uns dann die physikalisch brauchbaren Lösungen dar.

φ(x,y) ist definiert durch

-λ2φ=V-p,

wo V das hydrostatische Potential, p der Druck ist.

Ist h die Tiefe des Meeres, so definieren wir

h1 =-hλ2-λ2+4ω2cos2ϑ,
h2 =-2ωicosϑλh1,(i=-1)

wo ϑ die Colatitude des zu (x,y) gehörigen Punktes der Erde, ω die Winkelgeschwindigkeit der Erde bedeutet. ζ(x,y) ist die Differenz zwischen der Dicke der mittleren und der gestörten Wasserschicht, d. h. ζ>0 entspricht der Ebbe, ζ<0 der Flut. g ist die Beschleunigung der Schwerkraft, W das Potential der Störungskräfte, Π ist das Potential, welches von der Anziehung der Wassermassen von der Dicke ζ herrührt. Ist z. B.

ζ =AnXn,
so wird
Π =4πAn2n+1Xn,

wo die Xn die Kugelfunktionen sind.

Die Einheiten sind so gewählt, daß die Dichte des Wassers gleich 1, der Radius der Erdkugel gleich 1 ist.

Die Größe Π kann man meistens vernachlässigen; tut man dies, so erhält man sofort für φ eine partielle Differentialgleichung 2. Ordnung. Um aus derselben φ zu bestimmen, muß man gewisse Grenzbedingungen vorschreiben. Wir unterscheiden da zwei Fälle:

1. Der Rand des Meeres ist eine vertikale Mauer; dann wird

φn+2ωiλcosϑφs=0,

wobei φn, φs die normale bzw. tangentiale Ableitung von φ ist.

2. Der Rand des Meeres ist nicht vertikal; dann ist dort

h=0,alsoh1=h2=0.

Die Grenzbedingung lautet hier, daß φ am Rande regulär und endlich bleiben soll.

Um auf diese Probleme die Methoden der Integralgleichungen anwenden zu können, erinnern wir uns zunächst der allgemeinen Überlegungen, wie sie Hilbert und Picard für Differentialgleichungen anstellen. Sei

D(u)=f(x,y)

eine partielle Differentialgleichung 2. Ordnung für u, die elliptischen Typus hat, so ist eine, gewisse Grenzbedingungen erfüllende, Lösung u darstellbar in der Form

u=fG𝑑σ,

wobei G(x,y;x,y) die zu diesen Randbedingungen gehörige Greensche Funktion des Differentialausdruckes D(u) ist; f ist f(x,y), dσ=dxdy, und das Integral ist über dasjenige Gebiet der (x,y)-Ebene zu erstrecken, für welches die Randwertaufgabe gestellt ist. Um die Greensche Funktion zu berechnen und so die Randwertaufgabe zu lösen, setze man

D(u)=D0(u)+D1(u),

wo

D1(u)=aux+buy+cu

ein linearer Differentialausdruck ist. Nehmen wir nun an, wir kennen die Greensche Funktion G0 von D0(u), so haben wir die Lösung von

D(φ)=f

in der Form

φ=G0(f-aφx-bφy-cφ)𝑑σ.

Schaffen wir hieraus durch partielle Integrationen die Ableitungen φx, φy heraus, so werden wir direkt auf eine Integralgleichung zweiter Art für φ geführt, die wir nach der Fredholmschen Methode behandeln können, wenn ihr Kern nicht zu stark singulär wird.

Bei unserem Probleme der Flutbewegung tritt nun gerade dieser Fall ein; der Kern wird so hoch unendlich, daß die Fredholmschen Methoden versagen; ich will Ihnen jedoch zeigen, in welcher Weise man diese Schwierigkeiten überwinden kann.

Betrachten wir erst den Fall der ersten Grenzbedingung

φn+Cφs=0,

wo C eine gegebene Funktion von x,y ist. Die Differentialgleichung, die sich bei Vernachlässigung von Π ergibt, hat die Form

AΔφ+D1=f,

und wir stehen daher vor der Aufgabe, die Gleichung

Δφ=F

mit unserer Randbedingung zu integrieren.

Diese Aufgabe ist äquivalent mit der, eine im Innern der Randkurve reguläre Potentialfunktion V, die am Rande die Bedingung Vn+CVs=0 erfüllt, als Potential einer einfachen Randbelegung zu finden. Bezeichnet s die Bogenlänge auf der Randkurve von einem festen Anfangspunkte bis zu einem Punkte P, s die bis zum Punkte P, so erhält man für V eine Integralgleichung; jedoch wird der Kern K(s,s) derselben für s=s von der ersten Ordnung unendlich, und es ist daher in dem Integrale

ABK(x,y)f(y)𝑑y

der sogenannte Cauchysche Hauptwert zu nehmen, der definiert ist als das arithmetische Mittel aus den beiden Werten, die das Integral erhält, wenn ich es in der komplexen y-Ebene unter Umgehung des Punktes y=x das eine mal auf einem Wege AMB oberhalb, das andere mal auf einem Wege AMB unterhalb der reellen Achse führe.

Anstatt die Methoden zu benutzen, die Kellogg zur Behandlung solcher unstetiger Kerne angibt, will ich einen andern Weg einschlagen. Wir betrachten neben der Operation

S(f(x))=K(x,y)f(y)𝑑y

die iterierte

S2(f(x))=K(x,z)K(z,y)f(y)𝑑z𝑑y,

bei der ebenfalls das Doppelintegral als Cauchyscher Hauptwert zu nehmen ist; dies soll folgendermaßen verstanden werden: wir betrachten für die Variable z die Wege AMB, AMB, für y die Wege APB, APB, die zueinander liegen mögen, wie in der Figur angedeutet ist. Dann bilden wir die 4 Integrale, die sich ergeben, wenn ich einen Weg für z mit einem für y kombiniere;

z: AMB, AMB, AMB, AMB
y: APB, APB, APB, APB,

und nehmen aus diesen 4 Integralen das arithmetische Mittel. Ziehen wir noch 2 Wege AQB, AQB wie in der Figur, so sehen wir, daß sich in der ersten Wegkombination der Weg AMB für z ersetzen läßt durch AQB+AMBQA, in der zweiten AMB durch AQB, in der dritten AMB durch AQB und in der vierten AMB durch AQB+AMBQA, sodaß wir jetzt die folgenden Wegkombinationen haben:

z y
AQB+AMBQA APB
AQB APB
AQB APB
AQB+AMBQA APB.

Führen wir jetzt die Integrale aus und wenden den Residuenkalkül auf die geschlossenen Wege an, so zeigt sich, daß unsere Operation S2(f(x)), die einer Integralgleichung 1. Art zugehört, übergeht in eine Operation, welche durch die linke Seite einer Integralgleichung 2. Art gegeben ist, deren Kern überall endlich bleibt; wenn wir zuerst die vier Kombinationen von den Wegen AQB und AQB mit den Wegen APB und APB nehmen, so bekommen wir ein doppeltes Integral, welches nicht unendlich werden kann, da auf diesen Wegen xy und yz. Betrachten wir jetzt die beiden Wegkombinationen AMBQA, APB und AMBQA, APB, oder AMBQA, APB und AQBMA,BPA, so ist leicht zu sehen, daß z eine geschlossene Kurve AMBQA oder AQBMA um y beschreibt, und daß gleichzeitig y eine geschlossene Kurve APBPA um x beschreibt. Wir dürfen also die Residuenmethode anwenden, und wir bekommen ein Glied, wo die unbekannte Funktion ohne Integralzeichen auftritt, wie in der linken Seite einer Integralgleichung zweiter Art. Indem wir so auf eine durchaus reguläre Integralgleichung 2. Art geführt werden, die der Fredholmschen Methode zugänglich ist, haben wir die Schwierigkeit bei unserem Problem überwunden.

Nur ein Punkt bedarf noch der Erläuterung: wenn x und y gleichzeitig in einen der Endpunkte A,B des Intervalles hineinfallen, so versagen zunächst die obigen Betrachtungen, und es scheint, als wären wir für diese Stellen der Endlichkeit unseres durch Iteration gewonnenen Kernes nicht sicher. Dieses Bedenken wird jedoch bei unserm Problem dadurch beseitigt, daß der Rand des Meeres, der das Integrationsintervall darstellt, geschlossen ist, woraus sich ergibt, daß die Punkte A,B keine Ausnahmestellung einnehmen können.

Durch diese Überlegungen ist also der Fall der vertikalen Meeresufer erledigt.

Wir betrachten den zweiten und schwierigeren Fall, daß das Ufer des Meeres keine vertikale Mauer ist. Dann ist am Rande

h=h1=h2=0.

Da die Glieder 2. Ordnung unserer Differentialgleichung für φ durch den Ausdruck

h1Δφ

gegeben sind, so ist die Randkurve jetzt eine singuläre Linie für die Differentialgleichung. Außerdem werden h1,h2 gemäß ihrer Definition für die durch die Gleichung

4ω2cos2ϑ=λ2

gegebene kritische geographische Breite ϑ unendlich. Um trotz dieser Singularitäten, welche das Unendlichwerden des Kerns K zur Folge haben, das Problem durchzuführen, bin ich gezwungen gewesen, das reelle Integrationsgebiet durch ein komplexes zu ersetzen, indem ich y in eine komplexe Veränderliche y+iz verwandle; x hingegen bleibt reell.

Wir deuten xyz als gewöhnliche rechtwinklige Koordinaten in einem dreidimensionalen Raum und zeichnen den Durchschnitt AB einer Ebene x=konst. mit dem in der (x,y)-Ebene gelegenen Meeresbecken. Entspricht C der kritischen geographischen Breite, so ist es nicht schwer, diese Singularität durch Ausweichen in das komplexe Gebiet zu umgehen. Wählen wir ferner irgend zwei Punkte D,E zwischen A und B und umgeben A, von D ausgehend und dorthin zurückkehrend, mit einer kleinen Kurve und verfahren entsprechend bei B — räumlich gesprochen: umgeben wir die Randkurve mit einem ringförmigen Futteral —, so stellen wir uns jetzt das Problem, unsere Differentialgleichung so zu integrieren, daß φ, wenn wir seine Wertänderung längs der den Punkt A umgebenden Kurve verfolgen, mit demselben Wert nach D zurückkehrt, mit dem es von dort ausging. Diese “veränderte” Grenzbedingung ist mit der ursprünglichen, welche verlangte, daß φ am Rande (im Punkte A) endlich bleibt und sich regulär verhält, äquivalent. Zwar sind die zu der neuen und der alten Grenzbedingung gehörigen Greenschen Funktionen G, G1 nicht identisch, wohl aber die den betreffenden Randbedingungen unterworfenen Lösungen von

D(u)=f. (1)

Hiervon überzeugen wir uns leichter im Falle nur einer Variablen y; dann ergeben die Gleichungen

u=G(y,y)f(y)𝑑y,u1=G1(y,y)f(y)𝑑y

durch Anwendung des Cauchyschen Integralsatzes, daß u-u1=0 ist.

Um jetzt das Problem (1) zu behandeln, ziehe ich die vorige Methode heran, die hier aber in zwei Stufen zur Anwendung kommt, da unsere veränderte Randbedingung für die Gleichung Δu=f unzulässig ist.11 1 Diese Randbedingung ist nicht von solcher Art, daß sie eine bestimmte Lösung von Δ(u)=f auszeichnet. Wir können setzen

D(u)=Δ(h1u)+D1(u)+D2(u);

dabei soll D1(u) nur die Glieder 1. Ordnung ux,uy,D2(u) aber nur u selbst enthalten. Indem wir

Δ(v)=f

unter der Randbedingung v=0 integrieren, erhalten wir für u=vh1 eine am Rande endliche und reguläre Funktion, für welche

Δ(h1u)D0(u)=f

ist. Darauf integrieren wir

D0(u)+D2(u)=f

unter Zugrundelegung der ursprünglichen Grenzbedingung nach der gewöhnlichen Methode. Der in der hierbei zu benutzenden Integralgleichung auftretende Kern ist zwar unendlich, aber von solcher Ordnung, daß sich die Singularität durch Iteration des Kerns beseitigen läßt: die partielle Integration, welche Glieder von einer zu hohen Ordnung des Unendlichwerdens einführen würde, bleibt uns an dieser Stelle erspart.

Das damit bewältigte Integrationsproblem ist aber der Integration von

D0(u)+D2(u)=f

unter der veränderten Grenzbedingung äquivalent, und infolgedessen können wir jetzt die zweite Stufe ersteigen und auch die Lösung von

D(u)(D0(u)+D2(u))+D1(u)=f

unter der veränderten Grenzbedingung bestimmen.


Wir haben bis jetzt das Glied Π als so klein vorausgesetzt, daß wir es ganz vernachlässigen durften. Heben wir diese Voraussetzung auf, so entstehen keine wesentlichen neuen Schwierigkeiten. Π ist ein von ζ erzeugtes Anziehungspotential; wir haben also

Π=ζdσr,

wenn dσ ein Flächenelement der Kugel, ζ den Wert der Funktion ζ im Schwerpunkt (x,y) dieses Flächenelementes, r aber die räumlich gemessene Entfernung der beiden Kugelpunkte (x,y); (x,y) bedeutet, und die Integration über die ganze Kugeloberfläche erstreckt wird. Wir können auch schreiben

Π=ζdxdyk2r.

Setzen wir dies in unsere Ausgangsgleichungen ein, von denen wir noch die erste mittels Aufstellung der zugehörigen Greenschen Funktion und unter Berücksichtigung der Randbedingung aus einer Differential- in eine Integralgleichung verwandeln, so erhalten wir zwei simultane Integralgleichungen für ζ und φ, die mit Hilfe der soeben erörterten Methoden aufgelöst werden können.

Kapitel 3 Anwendung der Integralgleichungen auf Hertzsche Wellen

Ich will heute über eine Anwendung der Integralgleichungen auf Hertzsche Wellen vortragen und insbesondere die äußerst merkwürdigen Beugungserscheinungen behandeln, welche bei der drahtlosen Telegraphie eine so wichtige Rolle spielen; ist es doch eine wunderbare Tatsache, daß die Krümmung der Erdoberfläche, welche eine Fortpflanzung des Lichtes verhindert, für die Ausbreitung der Hertzschen Wellen kein Hindernis darstellt, daß dieselben vielmehr auf der Erdoberfläche von Europa bis Amerika zu laufen vermögen. Der Umstand, daß die Hertzschen Wellen eine viel größere Länge haben als die Lichtwellen, kann allein diese Erscheinung noch nicht erklären. Eine solche Erklärung ergibt sich vielmehr erst durch Betrachtung der Differentialgleichungen des Problems.

Setzen wir die Lichtgeschwindigkeit gleich 1, und verstehen wir mit Maxwell

unter α, β, γ die Komponenten der magnetischen Kraft,
unter F, G, H die Komponenten des Vektorpotentiales,
unter f, g, h die Komponenten der elektrischen Verschiebung,
unter ψ das skalare Potential,
unter u, v, w die Komponenten des Konduktionsstromes,
unter ϱ die Dichte der Elektrizität,

so gelten die Gleichungen

α=Hy-Gx
4πf=-Ft-ψx,
4π(μ+ft)=γy-βz,
fx=fx+gy+hz=ϱ,
Fx+ψt=0,

und es folgt

4πμ =2Ft2-ΔF,
4πϱ =2ψt2-Δψ.

Wir betrachten nun eine gedämpfte synchrone Schwingung, indem wir annehmen, daß alle unsere Funktionen proportional sind mit der Exponentialgröße

eiωt.

Aus den so zustande kommenden komplexen Lösungen erhalten wir die physikalischen durch Trennung in reellen und imaginären Bestandteil. Der reelle Teil von ω gibt die Schwingungsperiode, der imaginäre die Dämpfung.

Aus unserem Ansatz folgt

Ft =iωF,
ψt =iωψ,

und man kann daher F und ψ als retardierte Potentiale darstellen wie folgt:

F =μe-iωrr𝑑τ,
ψ =ϱe-iωrr𝑑τ;

dτ ist das Raumelement im (x,y,z)-Raume, μ, ϱ die Werte von μ, ϱ im Punkte (x,y,z), r die Entfernung der Punkte (x,y,z) und (x,y,z).

In den meisten Problemen treten zwei verschiedene Medien auf, der freie Äther und die leitenden Körper; von den letzteren wollen wir annehmen, daß sie sich wie vollkommene Leiter verhalten, daß also in ihrem Innern das Feld verschwindet, die elektrischen Kraftlinien auf ihrer Oberfläche normal stehen, während die magnetischen in dieselbe hineinfallen; dem Umstande, daß Ladung und Strömung nur an der Oberfläche des Leiters vorhanden ist, wollen wir dadurch entsprechen, daß wir die obigen Ausdrücke für F und ψ modifizieren, indem wir an Stelle der Raumintegrale Oberflächenintegrale einführen. Wir schreiben

ψ =ϱ′′e-iωrr𝑑σ,
F =μ′′e-iωrr𝑑σ,

wo ϱ′′, μ′′ jetzt die Flächendichte der Ladung bzw. Strömung bedeuten und dσ das Flächenelement ist.

Wir unterscheiden gewöhnlich zwei leitende Körper, der eine soll der äußere, der andere der innere Leiter heißen; sie erzeugen das “äußere” resp. das “innere” Feld; das äußere Feld ist gegeben, das innere gesucht. So ist z. B., wenn wir das Problem des Empfanges elektrischer Wellen betrachten, der Sender der äußere, der Empfangsapparat der innere Leiter; beim Probleme der Beugung elektrischer Wellen ist der Erreger der äußere, die Erdkugel der innere Leiter; bei dem Probleme der Schwingungserzeugung haben wir kein äußeres Feld, der Erreger wird dann als innerer Leiter anzusehen sein.

Um nun zum Ansatz einer Integralgleichung zu gelangen, wollen wir unter den oben erklärten Funktionen nur die zum unbekannten inneren Felde gehörigen verstehen, sodaß z.B. die obigen Integrale nur über die Oberfläche des inneren Leiters zu erstrecken sind; beachten wir nun, daß die innere Normalkomponente des elektrischen Vektors am inneren Leiter unserer obigen Annahme zufolge verschwinden muß, so folgt, wenn l, m, n die Richtungskosinus der Normale bedeuten, aus unseren Ausgangs-Gleichungen:

4πf=ψn+iω(lF+mG+nH)=N,

wo N die Normalkomponente des äußeren Feldes, also eine bekannte Funktion ist.

Bezeichnen wir jetzt die Flächendichte statt mit ϱ′′ mit μ, so wird zufolge unseres Ausdruckes für ψ

ψn=2πμ+μn(e-iωrr)𝑑σ.

Benutzen wir ferner unseren Ausdruck für F und die entsprechenden für G und H, so hat man

iωlF=e-iωrriωlμ′′dσ.

Diesen Ausdruck kann man nun in gewissen Fällen durch partielle Integrationen auf die Form

-iωLμ𝑑σ

bringen, wobei L eine bekannte Funktion ist. So haben wir schließlich

2πμ+μ{n(e-iωrr)-iωL}𝑑σ=N,

und dies ist die Integralgleichung 2. Art für μ, auf die wir hinstrebten. Im allgemeinsten Falle bekommt man zwei Integralgleichungen mit zwei Unbekannten, welche z. B. μ und ν sein mögen, wo μ das oben definierte ist; wir setzen ν=dNdn, wo ddn die Ableitung in der Normalrichtung bezeichnet und N die Normalkomponente der magnetischen Kraft ist.

Die Funktion L läßt sich dann besonders einfach bilden, wenn der innere Leiter ein Rotationskörper ist und das äußere Feld Rotationssymmetrie besitzt. Ist s, s die Bogenlänge, gemessen vom Endpunkte der Rotationsachse auf einem Meridian bis zu den Punkten P, P, ist ferner ϑ der Winkel zwischen der Normale in P und der Meridiantangente in P, so wird L als Funktion von ϑ, s, s definiert durch die Differentialgleichung

Ls=e-iωrrcosϑ.

Das Problem des Empfanges elektrischer Wellen läßt sich auf Grund der obigen Integralgleichung 2. Art behandeln.

Wollen wir nur das Problem der Erzeugung elektrischer Wellen betrachten, so haben wir das äußere Feld gleich Null zu setzen, es wird also N=0, und wir haben eine homogene Integralgleichung vor uns; in ihr darf jedoch ω nicht mehr einen willkürlichen Parameterwert bedeuten, sondern ist eine zu bestimmende Zahl, die die Rolle der Eigenwerte spielt.

Ich schreibe unsere Integralgleichung in der Form

2πμ+Kμ𝑑σ=N

mit dem Kerne K; ich führe einen unbestimmten Parameter λ ein und betrachte die allgemeine Gleichung

2πμ+λKμ𝑑σ=N.

Das erste Glied hängt von zwei Unbestimmten λ und ω ab. Wenn man die gewöhnliche Fredholmsche Methode anwendet, so erhält man die Lösung unserer obigen Integralgleichung in Gestalt einer meromorphen Funktion von λ, deren Nenner eine ganze Funktion von λ ist. Man kann nun zeigen, daß dieser Nenner auch eine ganze Funktion von ω wird, sodaß also auch hier unsere ausgezeichneten Werte ω sich als Nullstellen einer ganzen transzendenten Funktion ergeben.

Wir wollen aber jetzt das größere Problem der Beugung ausführlicher behandeln.

Nehmen wir zu diesem Ende an, daß der innere Leiter eine Kugel, die Erdkugel, vom Radius ϱ ist und das äußere Feld (dessen normale Komponente N bedeutet) von einem punktförmigen Erreger S herrührt, dessen Entfernung D vom Mittelpunkt O der Erde nur sehr wenig größer ist als der Radius ϱ. Wir wählen die Richtung OS zur z-Achse und bezeichnen die Abweichung der Richtung OM, in der M einen variablen Punkt der Kugeloberfläche bedeutet, von OS mit φ. Die Bedeutung von ϑ, ξ, φ; r, r ist aus der Figur ersichtlich:

OM=OM=OM1 =ϱ,
OS =D,
SM =r,
SM =r.

Der Wert der normalen Ableitung N des äußeren Feldes berechnet sich im Punkte M, wie leicht zu sehen, nach der Formel

4πN=eiω(t-r)[iωrsinϑsinξ+(1r2+1iωr3)(sinϑsinξ+2cosϑcosξ)].

Da ω eine sehr große Zahl ist — denn die Länge der Hertzschen Wellen ist klein gegenüber dem Radius der Erde — genügt es meistens, in dieser Formel nur das erste Glied, das in der eckigen Klammer auftritt, beizubehalten.

Im vorhergehenden haben wir die Gleichung der Hertzsehen Wellen auf die Form

2πμ=μK𝑑σ+N

gebracht und haben gezeigt, wie der Kern K berechnet werden kann. Entwickeln wir jetzt N und K nach Kugelfunktionen oder vielmehr, da unser Problem die Symmetrie eines Rotationskörpers mit der Achse OS besitzt, nach Legendreschen Polynomen Pn, so gewinnen wir aus dieser Integralgleichung die elektrische Flächendichte μ gleichfalls unter der Form einer nach den Funktionen Pn fortschreitenden Reihe. Es gilt zunächst

N=KnPn;0πPnNsinφdφ=2Kn2n+1.

Kn ist von der Form

AnJn(ωϱ)ϱ2,

wo An eine nur von n, nicht aber von ϱ abhängige Zahl ist, und Jn eine mit der Besselschen verwandte Funktion bedeutet.

Wir verstehen nämlich unter Jn(x) die in der Umgebung von x=0 holomorphe Lösung der Gleichung

d2ydx2+y(1-n(n+1)x2)=0,

und In(x) sei dasjenige Integral derselben Gleichung, welches sich für große positive Werte von x angenähert wie e-ix verhält. Da Jn, In von einander unabhängig sind, können wir außerdem dafür sorgen, daß

InJn-JnIn=1

ist, wenn unter Jn, In die Ableitungen von Jn, In verstanden werden.

Die Lösung unserer Integralgleichung lautet jetzt

μ=AKnPn(cosφ)In(ωϱ)Jn(ωϱ).

Da aber auch der Ausdruck von Kn im Zähler Jn(ωϱ) als Faktor enthält, und sich infolgedessen dieser Term Jn(ωϱ) heraushebt, ist

In(ωϱ)=0

die für die Eigenschwingungen charakteristische Gleichung.

Um zu übersichtlichen Resultaten zu gelangen, benutzen wir angenäherte Formeln. Diese beruhen darauf, daß ω sehr groß, andererseits aber Dϱ-1 sehr klein ist. Wir stützen uns auf die folgende Näherungsformel

ηeiωθ𝑑x=ηeiθ2πωθ′′e±iπ4,

θ, η sind gegebene Funktionen von x, ω eine sehr große Zahl, θ′′ bedeutet die zweite Ableitung von θ, und auf der rechten Seite ist als Argument ein solcher Wert einzusetzen, für den θ ein Maximum oder Minimum besitzt; je nachdem der eine oder der andere Fall vorliegt, ist in dem Faktor e±iπ4 das Zeichen + oder das Zeichen - zu nehmen. Hat θ in dem Intervall, über welches zu integrieren ist, mehrere Maxima oder Minima, so ist der Ausdruck rechts durch eine Summe analog gebildeter Terme zu ersetzen.

Durch Anwendung dieser Formel bekommen wir für die Legendreschen Polynome Pn(cosφ) die folgenden, für große n gültigen angenäherten Ausdrücke:

Pn=22πnsinφcos(nφ+φ2-π4).

Aus ihnen folgt für die Kn, falls n<ωϱ,

Kn=2n+18rn[eiα+eiα]iωsinϑsinξDϱcosϑcosξsinϑωϱ.

Dabei ist

α =nφ-ωr+φ2-π2,
α =nφ-ωr+φ2,

gesetzt, und für ξ, ϑ, φ, φ, r, r sind die aus der Figur zu entnehmenden Werte einzusetzen, für welche

sinξ=nωϱ (ξ<π2)

wird. Die gleiche Näherungsformel gilt auch für n>ωϱ, falls in der eckigen Klammer eiα+eiα durch eiα oder eiα ersetzt wird; die Diskussion darüber, welches der beiden Glieder beizubehalten ist, will ich hier nicht geben.

Auch um InJn angenähert zu berechnen, müssen wir die beiden Fälle n<ωϱ und n>ωϱ unterscheiden. Im ersten Falle ist

InJn=eiα-α2cosα-α2,

im zweiten

InJn=12

zu setzen. Daraus ergibt sich, daß sowohl für n<ωϱ als auch für n>ωϱ und große n

KnInJn=n2reiαiωsinξ(sinϑ)32ϱDcosϑcosξ

gilt. In der Summe, durch welche wir μ dargestellt haben, geben demnach diejenigen Glieder, für welche nahezu n=μ ist, den Ausschlag. Für diese gilt näherungsweise

ξ=π2  und  r=2ϱD.

Da ferner wegen der Kleinheit von Dϱ-1 der Winkel φ immer nahezu =0 bleibt, variiert α als Funktion von n nur sehr wenig, wenn n auf die dem Werte n=ω benachbarten ganzen Zahlen beschränkt wird. Wir dürfen also, wenn wir noch die Längeneinheit so gewählt denken, daß ϱ=1 ist, schreiben

μ=Cωsinξ(sinϑ)32cosϑcosξ1sinψ(cosnψ+ψ2-π4).

Dabei ist μ der Wert der elektrischen Oberflächendichte im Punkte M1 (s. die Figur).11 1 Der Ausdruck von μ, kann auch auf eine einfachere Form zurückgeführt werden, nämlich μ=-i4πω2ϱ2D2n(n+1)(2n+1)In(ωD)In(ωϱ)Pn(cosφ) und diese Formel ist nicht eine angenäherte, sondern eine strenge.

Aus

sinξ=nω,sinϑ=nωD;cosξ=1-n2ω2,cosϑ=1-n2D2ω2

bekommen wir

sinξ(sinϑ)32cosϑcosξ=nω(nωD)32D(1+nω)(1+nDω)4ωω-n4ω(D-1)411+ω-nω(D-1)4,

sodaß in der Nähe von n=ω der linke Ausdruck von derselben Größenordnung ist wie

ω4D-141n-ω4.

Führen wir diese Annäherung in unsere Formel für μ ein und ersetzen
cos(nψ+ψ2-π4) zunächst durch ei(nψ+ψ2-π4), so kommen wir auf die Reihe

ω34ei(ψ2-π4)sinψD-14(n)einψn-ω4.

Schreiben wir

S=(n)einψn-ω,

so können wir

νν+1Se-iωψ𝑑ω (νganzzahlig)

als einen Mittelwert der Reihe S betrachten, und ich will S durch diesen Mittelwert ersetzen. Ein solches Verfahren ist gewiß berechtigt, wenn es uns nur daran liegt, die Größenordnung von S festzustellen, umsomehr als in Wirklicheit von einer Antenne nicht bloß Schwingungen einer einzigen Wellenlänge, sondern ein ganzes kontinuierliches Spektrum von Schwingungen ausgeht. Wir erhalten

νν+1Se-iωψ𝑑ω =(n)νν+1ei(n-ω)ψn-ω4𝑑ω
=--ωeiqψq4𝑑q,

und da ω sehr groß ist, wird dieses Integral mit -+eiqψq4𝑑q im wesentlichen übereinstimmen.

Auf ähnliche Weise zeigt man, daß der Mittelwert von

e-inψn-ω4

gegen den von S zu vernachlässigen ist. Damit gewinnen wir das Resultat, daß μ von der Größenordnung

ω34D-14

und also μN von der Größenordnung

1ω(D-1)4

ist. Die Beugung ist daher um so größer, je näher die Quelle S der Erdoberfläche gelegen ist und je länger die entsendeten Wellen sind. Auf diese Weise wird die zunächst staunenerregende Tatsache verständlich, daß es mit Hilfe der in der drahtlosen Telegraphie verwendeten Hertzschen Wellen gelingt, vom europäischen Kontinent z. B. bis nach Amerika zu telegraphieren.

Wenn man nicht den mittleren Wert der Reihe betrachten will, welcher von einem Integral dargestellt wird, sondern den wirklichen Wert dieser Reihe, so hat man eine Diskussion durchzuführen, welche auf einem wohlbekannten Abelschen Satz beruht, und deren Resultate etwas komplizierter, aber sonst ganz ähnlich den vorliegenden sind.

Note. Je me suis aperçu que les dernières conclusions doivent être modifiées. Les formules approchées dont j’ai fait usage ne sont plus vraies lorsque n est très voisin de ωϱ. Elles doivent être alors remplacées par d’autres, où figure une transcendante entière satisfaisant à l’équation différentielle

y′′=xy.

Mais les termes qui doivent être ainsi modifiés sont en petit nombre et j’avais cru d’abord que le résultat final n’en serait pas modifié. Un examen plus approfondi m’a montré qu’il n’en est rien. La somme des termes modifiés est comparable à celle des autres termes dont j’avais tenu compte et qui est donnée par la formule précédente; il en résulte une compensation presque complète de sorte que la valeur de μ donnée par les formules définitives est notablement plus petite que celle qui résulterait des formules précédentes.

Kapitel 4 Über die Reduktion der Abelschen Integrale und die Theorie der Fuchsschen Funktionen

Meine Herren! Ich habe die Absicht, Ihnen heute über die Reduktion der Abelschen Integrale im Zusammenhang mit der Theorie der automorphen und insbesondere der Fuchsschen Funktionen vorzutragen.

Ein System von Abelschen Funktionen von p Variabeln und 2p Perioden heißt reduzibel, wenn es sich auf ein System von q Variabeln und 2q Perioden (q<p) zurückführen läßt. Hierbei ist es von vornherein von Wichtigkeit, zwei Fälle zu unterscheiden:

Im ersten Falle soll es möglich sein, das System S Abelscher Funktionen von p Variabeln durch eine algebraische Kurve C vom Geschlechte p zu erzeugen. Ebenso soll das System S von q Variabeln aus der Theorie eines algebraischen Gebildes vom Geschlechte q entspringen.

Dieser unser erste Fall ist aber bekanntlich nicht der allgemeine; denn die Kurve C hängt nur von 3p-3 Konstanten ab, während die allgemeinen Abelschen Funktionen von p Variabeln p(p+1)2 Parameter enthalten. Dadurch ist der zweite der beiden Fälle gegeben, die wir unterscheiden. In diesem Falle nämlich soll mindestens eines der beiden Systeme S, S nicht aus der Theorie der algebraischen Gebilde entspringen.

In meinem heutigen Vortrag will ich mich durchaus auf den erstgenannten Fall beschränken. Aber auch dann muß ich noch zwei Fälle unterscheiden. Wir knüpfen nämlich unsere Betrachtungen an die beiden algebraischen Kurven C und C an. Im Falle der Reduzibilität besteht zwischen beiden eine algebraische Korrespondenz. Die Beschaffenheit derselben liegt der in Aussicht gestellten Fallunterscheidung zugrunde.

Der erste Fall ist der folgende. Vermöge der Korrespondenz ist jedem Punkte M von C ein und nur ein Punkt M von C zugeordnet, während umgekehrt jedem Punkte von C n Punkte von C entsprechen. Ich nenne dann n die charakteristische Zahl der Korrespondenz und sage, C ist eine vielfache Kurve von C.

Der eben genannte erste Fall ist aber nicht der allgemeine. Das ist vielmehr der nun folgende zweite. Hier nämlich besteht die Korrespondenz nicht zwischen einzelnen Punkten M und M, sondern zwischen Systemen von Punkten M1,,Mν von C mit den Koordinaten x1,y1;;xν,yν und M1,,Mν von C mit den Koordinaten x1,y1;;xνyν. Jedem System auf C soll dabei ein und nur ein System auf C entsprechen, während umgekehrt einem System auf C im allgemeinen mehrere Systeme auf C zugeordnet sind. Ich sage dann, C ist eine pseudovielfache Kurve von C.

Im erstgenannten Falle sind x und y rationale Funktionen von x und y, während im zweiten nur geschlossen werden kann, daß jede rationale und symmetrische Funktion der (x1y1,,xνyν) eine rationale Funktion der (x1y1,,xνyν) ist. Es ist leicht zu sehen, daß jede Kurve C, die eine vielfache von C ist, auch eine pseudovielfache der Kurve C ist. Umgekehrt aber habe ich mehrere Beispiele bilden können dafür, daß nicht jede pseudovielfache Kurve von C auch eine vielfache von C ist. Ich will jedoch hier nicht näher darauf eingehen, zumal da sich meine folgenden Darlegungen durchaus an den ersten Fall anschließen werden.

Im Falle der Reduzibilität unserer Integrale ist es möglich, ihre Periodentabelle auf eine besondere Normalform zu bringen. Die folgenden beiden Beispiele mögen eine Anschauung von der Beschaffenheit derselben geben.

1) q=1; p=3. Die Periodentabelle kann auf die folgende Form gebracht werden:

2iπ00h2iπα002iπ02iπαab002iπ0bc.

2) q=2; p=4. Die normierten Perioden sind hier:

2iπ000ab02iπα02iπ00bc2iπαβ0002iπ002iπαβab0002iπ2iπα0bc.

Die Zahlen α, β bedeuten in beiden Tabellen ganze rationale Zahlen.

Ich definiere nun noch eine zweite charakteristische Zahl κ. Sie gibt die Ordnung der Thetafunktion von q Variabeln an, in die eine Thetafunktion erster Ordnung von p Variabeln im Falle der Reduzibilität transformiert werden kann. Im ersten Beispiel ist κ=α, im zweiten κ=αβ. Die beiden charakteristischen Zahlen n und κ sind nun immer einander gleich. Ich habe zwei Beweise für diesen Satz gefunden, die ich jetzt in ihren Grundzügen auseinandersetzen will.

Erster Beweis. Seien M und M zwei Abelsche Integrale erster, zweiter oder dritter Gattung der Kurve C. Ich denke mir die zugehörige Riemannsche Fläche irgendwie längs 2p von einem Punkte ausgehenden nichtzerstückenden Rückkehrschnitten kanonisch aufgeschnitten. Dann mögen M und M die folgenden Perioden besitzen:

M :x1,x2,,x2p,
M :y1,y2,,y2p.

Ich muß nun eine charakteristische fundamentale Bilinearform definieren. Ich setze nämlich:

F(x,y)=M𝑑M

wo das Integral längs der ganzen Kontur der Zerschneidung erstreckt werden soll. Wenn x, y Normalperioden sind, so nimmt F(x,y) die folgende Form an:

F(x,y)=κ=1p(x2κ-1y2κ-x2κy2κ-1).

Nehme ich an, es sei M eines der reduziblen Integrale, dann drücken sich seine 2p Perioden ganzzahlig und linear durch nur 2q Perioden ω1,,ω2q aus. Ich habe also dann:

xκ=j=12qmκjωj (κ=1,2,,2p),

wo die mκ ganze rationale Zahlen bedeuten. Wenn nun M und M Integrale erster Gattung sind, dann ist bekanntlich

F(x,y)=0

Wenn man in diese Gleichung die Ausdrücke der x durch die ω einsetzt, so bekommt man eine bilineare Gleichung zwischen den y und ω, die in der folgenden Form geschrieben werden kann:

j=12qHjωj=0

Seien nun u1,,up p linear unabhängige Integrale erster Gattung von C. Dann können wir setzen:

U=μ1u1+μ2u2++μpupU=μ1u1+μ2u2++μpup

Die vorläufig noch unbestimmten Koeffizienten μ sollen nun so bestimmt werden, daß sie den 2q linearen Gleichungen:

Hj=0 (j=1,2,,2q)

genügen. Wenn man dann noch beachtet, daß diese 2q Gleichungen nicht linear unabhängig sind, sondern daß zwischen ihnen q Relationen

Hjωj=0

bestehen, so ist leicht zu erkennen, daß auch M1 reduzierbar ist, und daß, so wie M einer Schar von q reduziblen Integralen angehört, auch M ein Element einer (p-q)fach unendlichen linearen Schar von reduziblen Integralen ist. Doch dies nur nebenbei.

Ich bemerke nun, daß Hj eine lineare Funktion der yκ ist, sodaß ich schreiben kann:

Hj=i=12phijyi (j=1,2,,2q),

wo die hij ganze rationale Zahlen sind. Aus den miκ und den hiκ kann ich nun zwei Tabellen von je 2q Kolonnen und 2p Zeilen bilden. Aus beiden kann ich gewisse q-reihige Determinanten bilden. Ich bezeichne die der m mit D und die aus denselben Zeilen der h gebildete mit D. Dann setze ich

J=DD.

J ist nun in dem folgenden Sinne eine invariante Zahl: Sie bleibt ungeändert, wenn man irgendeines der Periodensysteme x oder ω durch ein äquivalentes ersetzt. Dabei heißen zwei Periodensysteme äquivalent, wenn sie sich ganzzahlig und linear durcheinander ausdrücken lassen. Man kann nun einerseits beweisen, daß

J=κ2,

andererseits aber, daß

J=n2.

Daraus kann man folgern, daß

κ=n.

Das ist der erste Beweis. Der nun folgende

Zweite Beweis ist wesentlich kürzer. Er beruht auf dem Vergleich der zu S und S gehörigen Bilinearformen F(x,y) und Φ(ω,ω). Man hat nämlich einerseits

F(x,y)=nΦ(ω,ω),

andererseits

F(x,y)=κΦ(ω,ω).

Daraus schließt man

κ=n.

Ich komme nun zum Zusammenhang der Reduktionstheorie mit der Theorie der Fuchsschen Funktionen.

Bekanntlich definiert jede algebraische Kurve C ein System von Fuchsschen Funktionen. Nun kann man die Tatsache, daß C ein Vielfaches von C ist, auch folgendermaßen ausdrücken. Es ist immer auf mannigfache Weise möglich, der Kurve C eine Grenzkreisgruppe G und C eine ebensolche Gruppe G zuzuordnen, sodaß G eine Untergruppe von G ist. Ist im besonderen C ein n-faches von C, dann ist G eine Untergruppe vom Index n von G. Man erhält daher einen Fundamentalbereich von G dadurch, daß man n geeignet gewählte Fundamentalbereiche von G, die durch die Operationen von G auseinander hervorgehen, aneinander lagert. Das Polygon P von G erscheint dann in n Polygone P(β) eingeteilt, die einem Polygon P von G im Sinne der nichteuklidischen Geometrie kongruent sind.

Ich bezeichne die Seiten des Polygons P mit γ(α) und die homologen Seiten von P(β) mit γ(α,β). Die Seiten γ(α,β) liegen entweder im Innern oder auf dem Rande von P. Ich nehme nun an, die Seite γ(α) gehe aus γ(α) vermöge einer Operation von G hervor. Wenn nun γ(α,β) auf dem Rande von P liegt, dann gibt es eine weitere Seite γ(α,β) auf diesem Rande, die mit γ(α,β) vermöge einer Operation von G konjugiert ist. Wenn jedoch γ(α,β) im Innern von P liegt, so existiert eine derartige von γ(α,β) verschiedene Seite nicht, sondern es fallen γ(α,β) und γ(α,β) zusammen und bilden die gemeinsame Seite von P(β) und P(β). Aber wie dem auch sei, jedenfalls entspricht jeder Seite γ(α) von P eine Permutation der n Ziffern 1, 2, , n.

Eine der eben durchgeführten ganz ähnliche Betrachtung können wir auch für die Ecken von P anstellen. So wie wir nämlich die Seiten in Paare zusammenfaßten, so können wir die Ecken in Zyklen einteilen, so daß die Ecken eines Zyklus auseinander durch die Operationen von G hervorgehen. Jedem solchen Zyklus kann wieder eine bestimmte Vertauschung der n Ziffern 1, 2, , n zugeordnet werden, die sich aus den den Seiten zugeordneten gewinnen läßt. Ich nehme nun an, es habe P 2N Seiten und Q Eckenzyklen. 2N und Q sollen die gleiche Bedeutung für P haben. Die einem Eckenzyklus von P entsprechende Permutation läßt sich in zyklische Permutationen zerlegen. Bei allen Eckenzyklen mögen dabei im ganzen λi zyklische Permutationen von gerade i Ziffern vorkommen. Dann bestehen die folgenden Relationen:

2p =N-Q+1,
2q =N-Q+1,
Q+2p-2 =n(Q+2q-2),
n(Q-Q) =2(p-1)-2n(q-1),
λi =Q,
iλi =nQ.

Die bisher gegebenen allgemeinen Betrachtungen setzen uns nun instand, eine Reihe schöner und wichtiger Sätze über die nichteuklidische Geometrie der Kreisbogenpolygone, sowie über die Geometrie der algebraischen Kurven abzuleiten. Ich will im folgenden einige Beispiele solcher Sätze anführen, ohne mich des näheren auf Beweise einzulassen, deren Grundzüge übrigens im vorstehenden enthalten sind.

1) p=3, q=2, n=2, m=m=4.

Mit m und m sind dabei die Ordnungen der Kurven C und C bezeichnet. C hat keinen Doppelpunkt, C hat einen Doppelpunkt. Von den 28 Doppeltangenten von C gehen sechs durch einen Punkt außerhalb der Kurve.

2) p=4, q=2, n=2, m=4, m=5.

C hat zwei Doppelpunkte, C nur einen. Setzt man die Differentiale der reduziblen Integrale erster Gattung gleich Null, so erhält man ein Kegelschnittbüschel, dessen vier Basispunkte von den beiden Doppelpunkten von C und zwei weiteren Punkten derselben Kurve gebildet werden. Sechs dieser Kegelschnitte berühren C doppelt. Derjenige derselben, der C in einem Basispunkte berührt, oskuliert daselbst.

3) p=2, q=1, n=2.

Die Kurve C ist ein Vielfaches von zwei verschiedenen Kurven C und C′′. Es existiert eine Fuchssche Gruppe G, zu der man sowohl ein erstes Polygon P1 konstruieren kann, das aus zwei Polygonen einer zu C gehörigen Gruppe G besteht, als auch ein zweites Polygon P2, das aus zwei Polygonen einer zu C′′ gehörigen Gruppe G′′ besteht. G ist also sowohl in G als in G′′ als Untergruppe vom Index 2 enthalten. Die nebenstehende schematische Figur möge zur Veranschaulichung der Verhältnisse dienen. Die beiden eben erwähnten Fundamentalbereiche P1 und P2 von G sind durch die Polygone mit den Ecken A bzw. C dargestellt. Jedes derselben zerfällt in zwei Sechsecke, die bzw. Fundamentalbereiche von G oder G′′ sind. Um die Äquivalenz von P1 und P2 besser hervortreten zu lassen, sind die Symmetriezentren der erwähnten Sechsecke mit den Seitenmitten verbunden, sodaß alle Polygone sich in leicht ersichtlicher Weise aus den so entstehenden Vierecken aufbauen.

Ich gehe nun zu den Sätzen aus der Geometrie der algebraischen Kurven über, die uns dieses Beispiel lehrt. Wenn ich auf C einen Punkt M markiere, so entsprechen diesem zwei Punkte Ma und Mb auf C. Jedem von diesen entspricht ein Punkt von C′′: Ma′′, Mb′′. Es entsprechen also im allgemeinen jedem Punkte von C zwei Punkte von C′′. Ebenso kann man schließen, daß im allgemeinen jedem Punkte von C′′ zwei Punkte von C entsprechen. Die Korrespondenz (C,C) hat aber zwei Verzweigungspunkte M1, M2. Jedem von ihnen entspricht also nur ein Punkt von C und also auch nur ein Punkt von C′′: M1′′, M2′′. Ebenso hat die Korrespondenz (C′′,C) zwei Verzweigungspunkte N1′′, N2′′. Jedem von ihnen ist nur ein Punkt von C zugeordnet: N1, N2. Wir können dann den ersten Satz, den wir anführen wollen, so aussprechen:

N1 und N2 einerseits und M1′′ und M2′′ andererseits fallen zusammen.

Ich gehe zum zweiten Satz über, der sich ergibt, wenn man C und C′′ als Kurven dritter Ordnung voraussetzt.

Ich kann in N1=N2 die Tangente an C ziehen. Ich verbinde ferner M1 und M2 durch eine Sekante. Diese beiden Geraden schneiden sich auf C. Ebenso kann ich in M1′′=M2′′ die Tangente an C′′ ziehen und mit der Sekante N1′′N2′′ zum Schnitt bringen. Der Schnittpunkt liegt auf C′′.

Diese wenigen Beispiele lassen zur Genüge erkennen, wie zahlreich die besonderen Fälle sind.

Kapitel 5 Über transfinite Zahlen

Meine Herren! Ich will heute über den Begriff der transfiniten Kardinalzahl vor Ihnen sprechen; und zwar will ich zunächst von einem scheinbaren Widerspruch reden, den dieser Begriff enthält. Dazu schicke ich folgendes voraus: meiner Ansicht nach ist ein Gegenstand nur dann denkbar, wenn er sich mit einer endlichen Anzahl von Worten definieren läßt. Einen Gegenstand, der in diesem Sinne endlich definierbar ist, will ich zur Abkürzung einfach “definierbar” nennen. Demnach ist also ein nicht definierbarer Gegenstand auch undenkbar. Desgleichen will ich ein Gesetz “aussagbar” nennen, wenn es in einer endlichen Anzahl von Worten ausgesagt werden kann.

Herr Richard hat nun bewiesen, daß die Gesamtheit der definierbaren Gegenstände abzählbar ist, d. h. daß die Kardinalzahl dieser Gesamtheit 0 ist. Der Beweis ist ganz einfach: sei α die Anzahl der Wörter des Wörterbuches, dann kann man mit n Wörtern höchstens αn Gegenstände definieren. Läßt man nun n über alle Grenzen wachsen, so sieht man, daß man nie über eine abzählbare Gesamtheit hinauskommt. Die Mächtigkeit der Menge der denkbaren Gegenstände wäre also 0. Herr Schoenflies hat gegen diesen Beweis eingewandt, daß man mit einer einzigen Definition mehrere, ja sogar unendlich viele Gegenstände definieren könne. Als Beispiel führt er die Definition der konstanten Funktionen an, deren es offenbar unendlich viele gibt. Dieser Einwand ist deshalb unzulässig, weil durch solche Definitionen gar nicht die einzelnen Gegenstände, sondern ihre Gesamtheit, in unserem Beispiel also die Menge der konstanten Funktionen definiert wird, und diese ist ein einziger Gegenstand. Der Einwand von Herrn Schoenflies ist also nicht stichhaltig.

Nun hat bekanntlich Cantor bewiesen, daß das Kontinuum nicht abzählbar ist; dies widerspricht dem Beweise von Richard. Es fragt sich also, welcher von beiden Beweisen richtig ist. Ich behaupte, sie sind beide richtig, und der Widerspruch ist nur ein scheinbarer. Zur Begründung dieser Behauptung will ich einen neuen Beweis für den Cantorschen Satz geben: Wir nehmen also an, es sei eine Strecke AB gegeben und ein Gesetz, durch welches jedem Punkte der Strecke eine ganze Zahl zugeordnet wird. Wir wollen der Einfachheit halber die Punkte durch die ihnen zugeordneten Zahlen bezeichnen. Wir teilen nun unsere Strecke durch zwei beliebige Punkte A1 und A2 in drei Teile, die wir als Unterstrecken 1. Stufe bezeichnen; diese teilen wir wieder in je drei Teile und erhalten Unterstrecken 2. Stufe; dieses Verfahren denken wir uns ins Unendliche fortgesetzt, wobei die Länge der Unterstrecken unter jede Grenze sinken soll. Der Punkt 1 gehört nun einer oder höchstens, wenn er mit A1 oder A2 zusammenfällt, zweien der Unterstrecken erster Stufe an, es gibt also sicher eine, der er nicht angehört. Auf dieser suchen wir den Punkt mit der niedrigsten Nummer, die nun mindestens 2 sein muß, auf. Unter den 3 Unterstrecken 2. Stufe, die zu derjenigen Strecke 1. Stufe gehören, auf der wir uns befinden, ist nun wieder mindestens eine, der der zuletzt betrachtete Punkt nicht angehört. Auf dieser setzen wir das Verfahren fort und erhalten so eine Folge von Strecken, die folgende Eigenschaften hat: jede von ihnen ist in allen vorhergehenden enthalten, und eine Strecke nter Stufe enthält keinen der Punkte 1 bis n-1. Aus der ersten Eigenschaft folgt, daß es mindestens einen Punkt geben muß, der ihnen allen gemeinsam ist; aus der zweiten Eigenschaft folgt aber, daß die Nummer dieses Punktes größer sein muß als jede endliche Zahl, d. h. es kann ihm keine Zahl zugeordnet werden.

Was haben wir nun zu diesem Beweise vorausgesetzt? Wir haben ein Gesetz vorausgesetzt, das jedem Punkte der Strecke eine ganze Zahl zuordnet. Dann konnten wir einen Punkt definieren, dem keine ganze Zahl zugeordnet ist. In dieser Hinsicht unterscheiden sich die verschiedenen Beweise dieses Satzes nicht. Dazu mußte aber das Gesetz zuerst feststehen. Nach Richard müßte anscheinend ein solches Gesetz existieren, aber Cantor hat das Gegenteil bewiesen. Wie kommen wir aus diesem Dilemma heraus? Fragen wir einmal nach der Bedeutung des Wortes “definierbar”. Wir nehmen die Tafel aller endlichen Sätze und streichen daraus alle diejenigen, die keinen Punkt definieren. Die Übrigbleibenden ordnen wir den ganzen Zahlen zu. Wenn wir jetzt die Durchmusterung der Tafel von neuem vornehmen, so wird es sich im allgemeinen zeigen, daß wir jetzt einige Sätze stehen lassen müssen, die wir vorher gestrichen haben. Denn die Sätze, in welchen man von dem Zuordnungsgesetz selbst sprach, hatten früher keine Bedeutung, da die Punkte den ganzen Zahlen noch nicht zugeordnet waren. Diese Sätze haben jetzt eine Bedeutung, und müssen in unserer Tafel bleiben. Würden wir jetzt ein neues Zuordnungsgesetz aufstellen, so würde sich dieselbe Schwierigkeit wiederholen und so ad infinitum. Hierin liegt aber die Lösung des scheinbaren Widerspruchs zwischen Cantor und Richard. Sei M0 die Menge der ganzen Zahlen, M1 die Menge der nach der ersten Durchmusterung der Tafel aller endlichen Sätze definierbaren Punkte unserer Strecke, G1 das Gesetz der Zuordnung zwischen beiden Mengen. Durch dieses Gesetz kommt eine neue Menge M2 von Punkten als definierbar hinzu. Zu M1+M2 gehört aber ein neues Gesetz G2, dadurch entsteht eine neue Menge M3 usw. Richards Beweis lehrt nun, daß, wo ich auch das Verfahren abbreche, immer ein Gesetz existiert, während Cantor beweist, daß das Verfahren beliebig weit fortgesetzt werden kann. Es besteht also kein Widerspruch zwischen beiden.

Der Schein eines solchen rührt daher, daß dem Zuordnungsgesetz von Richard eine Eigenschaft fehlt, die ich mit einem von den englischen Philosophen entlehnten Ausdruck als “prädikativ” bezeichne. (Bei Russell, dem ich das Wort entlehne, ist eine Definition zweier Begriffe A und A nicht prädikativ, wenn A in der Definition von A und umgekehrt vorkommt.) Ich verstehe darunter folgendes: Jedes Zuordnungsgesetz setzt eine bestimmte Klassifikation voraus. Ich nenne nun eine Zuordnung prädikativ, wenn die zugehörige Klassifikation prädikativ ist. Eine Klassifikation aber nenne ich prädikativ, wenn sie durch Einführung neuer Elemente nicht verändert wird. Dies ist aber bei der Richardschen nicht der Fall, vielmehr ändert die Einführung des Zuordnungsgesetzes die Einteilung der Sätze in solche, die eine Bedeutung haben, und solche, die keine haben. Was hier mit dem Wort “prädikativ” gemeint ist, läßt sich am besten an einem Beispiel illustrieren: wenn ich eine Menge von Gegenständen in eine Anzahl von Schachteln einordnen soll, so kann zweierlei eintreten: entweder sind die bereits eingeordneten Gegenstände endgültig an ihrem Platze, oder ich muß jedesmal, wenn ich einen neuen Gegenstand einordne, die anderen oder wenigstens einen Teil von ihnen wieder herausnehmen. Im ersten Falle nenne ich die Klassifikation prädikativ, im zweiten nicht. Ein gutes Beispiel für eine nicht prädikative Definition hat Russell gegeben: A sei die kleinste ganze Zahl, deren Definition mehr als hundert deutsche Worte erfordert. A muß existieren, da man mit hundert Worten jedenfalls nur eine endliche Anzahl von Zahlen definieren kann. Die Definition, die wir eben von dieser Zahl gegeben haben, enthält aber weniger als hundert Worte. Und die Zahl A ist also definiert als undefinierbar.

Zermelo hat nun gegen die Verwerfung der nicht prädikativen Definitionen den Einwand erhoben, daß damit auch ein großer Teil der Mathematik hinfällig würde, z. B. der Beweis für die Existenz einer Wurzel einer algebraischen Gleichung.

Dieser Beweis lautet bekanntlich folgendermaßen:

Gegeben ist eine Gleichung F(x)=0. Man beweist nun, daß |F(x)| ein Minimum haben muß; sei x0 einer der Argumentwerte, für den das Minimum eintritt, also

|F(x)||F(x0)|

Daraus folgt dann weiter, daß F(x0)=0 ist. Hier ist nun die Definition von F(x0) nicht prädikativ, denn dieser Wert hängt ab von der Gesamtheit der Werte von F(x), zu denen er selbst gehört.

Die Berechtigung dieses Einwandes kann ich nicht zugeben. Man kann den Beweis so umformen, daß die nicht prädikative Definition daraus verschwindet. Ich betrachte zu diesem Zwecke die Gesamtheit der Argumente von der Form m+nip, wo m, n, p ganze Zahlen sind. Dann kann ich dieselben Schlüsse wie vorher ziehen, aber der Argumentwert, für den das Minimum von |F(x)| eintritt, gehört im allgemeinen nicht zu den betrachteten. Dadurch ist der Zirkel im Beweise vermieden. Man kann von jedem mathematischen Beweise verlangen, daß die darin vorkommenden Definitionen usw. prädikativ sind, sonst wäre der Beweis nicht streng.

Wie steht es nun mit dem klassischen Beweise des Bernsteinschen Theorems? Ist er einwandfrei? Das Theorem sagt bekanntlich aus, daß, wenn drei Mengen A, B, C gegeben sind, wo A in B und B in C enthalten ist, und wenn A äquivalent C ist, auch A äquivalent B sein muß. Es handelt sich also auch hier um ein Zuordnungsgesetz. Wenn das erste Zuordnungsgesetz (zwischen A und C) prädikativ ist, so zeigt der Beweis, daß es auch ein prädikatives Zuordnungsgesetz zwischen A und B geben muß.

Was nun die zweite transfinite Kardinalzahl 1 betrifft, so bin ich nicht ganz überzeugt, daß sie existiert. Man gelangt zu ihr durch Betrachtung der Gesamtheit der Ordnungszahlen von der Mächtigkeit 0; es ist klar, daß diese Gesamtheit von höherer Mächtigkeit sein muß. Es fragt sich aber, ob sie abgeschlossen ist, ob wir also von ihrer Mächtigkeit ohne Widerspruch sprechen dürfen. Ein aktual Unendliches gibt es jedenfalls nicht.

Was haben wir von dem berühmten Kontinuumproblem zu halten? Kann man die Punkte des Raumes wohlordnen? Was meinen wir damit? Es sind hier zwei Fälle möglich: entweder behauptet man, daß das Gesetz der Wohlordnung endlich aussagbar ist, dann ist diese Behauptung nicht bewiesen; auch Herr Zermelo erhebt wohl nicht den Anspruch, eine solche Behauptung bewiesen zu haben. Oder aber wir lassen auch die Möglichkeit zu, daß das Gesetz nicht endlich aussagbar ist. Dann kann ich mit dieser Aussage keinen Sinn mehr verbinden, das sind für mich nur leere Worte. Hier liegt die Schwierigkeit. Und das ist wohl auch die Ursache für den Streit über den fast genialen Satz Zermelos. Dieser Streit ist sehr merkwürdig: die einen verwerfen das Auswahlpostulat, halten aber den Beweis für richtig, die anderen nehmen das Auswahlpostulat an, erkennen aber den Beweis nicht an.

Doch ich könnte noch manche Stunde darüber sprechen, ohne die Frage zu lösen.

Kapitel 6 La mécanique nouvelle

Mesdames, messieurs!

Aujourd’hui, je suis obligé de parler français, et il faut que je m’en excuse. Il est vrai que dans mes précédentes conférences je me suis exprimé en allemand, en un très mauvais allemand: parler les langues étrangères, voyez-vous, c’est vouloir marcher lorsqu’on est boiteux; il est nécessaire d’avoir des béquilles; mes béquilles, c’étaient jusqu’ici les formules mathématiques et vous ne sauriez vous imaginer quel appui elles sont pour un orateur qui ne se sent pas très solide. Dans la conférence de ce soir, je ne veux pas user de formules, je suis sans béquilles, et c’est pourquoi je dois parler français.

En ce monde, vous le savez, il n’est rien de définitif, rien d’immuable; les empires les plus puissants, les plus solides, ne sont pas éternels: c’est là un thème que les orateurs sacrés se sont plu bien souvent à développer. Les théories scientifiques sont comme les empires, elles ne sont pas assurées du lendemain. Si l’une d’elles semblait à l’abri des injures du temps, c’était, certes, la mécanique newtonienne: elle paraissait incontestée, c’était un monument impérissable; et voilà qu’à son tour, je ne dirai pas que le monument est par terre, ce serait prématuré, mais en tout cas il est fortement ébranlé. Il est soumis aux attaques de grands démolisseurs: vous en avez un parmi vous, M. Max Abraham, un autre est le physicien hollandais M. Lorentz. Je voudrais, en quelques mots, vous parler des ruines de l’ancien édifice et du nouveau bâtiment que l’on veut élever à leur place.

Tout d’abord qu’est-ce qui caractérisait l’ancienne mécanique? C’était ce fait très simple: je considère un corps en repos, je lui communique une impulsion, c’est à dire je fais agir sur lui, pendant un temps donné une force donnée; le corps se met en mouvement, acquiert une certaine vitesse; le corps étant animé de cette vitesse, faisons agir encore la même force pendant le même temps, la vitesse sera doublée; si nous continuons encore, la vitesse sera triplée après que nous aurons une troisième fois donné une impulsion identique. Recommençons ainsi un nombre suffisant de fois, le corps finira par acquérir une vitesse très grande, qui pourra dépasser toute limite, une vitesse infinie.

Dans la nouvelle mécanique, au contraire, on suppose qu’il est impossible de communiquer à un corps partant du repos une vitesse supérieure à celle de la lumière. Que se passe-t-il? Je considère le même corps au repos; je lui donne une première impulsion, la même que précédemment, il prendra la même vitesse; renouvelons une seconde fois cette impulsion, la vitesse va encore augmenter, mais elle ne sera plus doublée; une troisième impulsion produira un effet analogue, la vitesse augmente mais de moins en moins, le corps oppose une résistance qui devient de plus en plus grande. Cette résistance, c’est l’inertie, c’est ce qu’on appelle communément la masse; tout ce passe alors dans cette nouvelle mécanique comme si la masse n’était pas constante, mais croissait avec la vitesse. Nous pouvons représenter graphiquement les phénomènes: dans l’ancienne mécanique, le corps prend après la première impulsion une vitesse representée par le segment Oν1¯; après la deuxième impulsion Oν1¯ s’accroît d’un segment ν1ν2¯ qui lui est égal, à chaque nouvelle impulsion, la vitesse s’accroît de la même quantité, le segment qui la représente s’accroît d’une longueur constante; dans la nouvelle mécanique, le segment vitesse s’accroît de segments ν1ν2¯, ν2ν3¯, …qui sont de plus en plus petits et tels que nous ne pouvons pas dépasser une certaine limite, la vitesse de la lumière.

Comment a-t-on été conduit à de telles conclusions? A-t-on fait des expériences directes? Les divergences ne se produiront que pour les corps animés de grandes vitesses; c’est alors seulement que les différences signalées deviennent sensibles. Mais, qu’est-ce qu’une très grande vitesse? Est-ce celle d’une automobile qui fait 100 kilomètres à l’heure; on s’extasie dans la rue sur une telle rapidité; à notre point de vue, c’est pourtant bien peu, une vitesse d’escargot. L’astronomie nous donne mieux: Mercure, le plus rapide des corps célestes parcourt lui aussi 100 kilomètres environ, non plus à l’heure mais à la seconde: pourtant, cela ne suffit pas encore, de telles vitesses sont trop faibles pour révéler les différences que nous voudrions observer. Je ne parle pas de nos boulets de canon, ils sont plus rapides que les automobiles, mais beaucoup plus lents que Mercure; vous savez cependant qu’on a découvert une artillerie dont les projectiles sont beaucoup plus vite: je veux parler du radium qui envoie dans tous les sens de l’énergie, des projectiles; la rapidité du tir est bien plus grande, la vitesse initiale est de 100 000 kilomètres par seconde, le tiers de la vitesse de la lumière; le calibre des projectiles, leur poids, sont, il est vrai, bien plus faibles et nous ne devons pas compter sur cette artillerie pour augmenter la puissance militaire de nos armées. Peut-on expérimenter sur ces projectiles? De telles expériences ont été effectivement tentées; sous l’influence d’un champ électrique, d’un champ magnétique il se produit une déviation qui permet de se rendre compte de l’inertie et de la mesurer. On a constaté ainsi que la masse dépend de la vitesse et énoncer cette loi: L’inertie d’un corps croît avec sa vitesse qui reste inférieure à celle de la lumière, 300 000 kilomètres par seconde.

Je passe maintenant au deuxième principe, le principe de relativité. Je suppose un observateur qui se déplace vers la droite; tout se passe pour lui comme s’il était au repos, les objets qui l’entourent se déplaçant vers la gauche: aucun moyen ne permet de savoir si les objets se déplacent réellement, si l’observateur est immobile ou en mouvement. On l’enseigne dans tous les cours de mécanique, le passager sur le bateau croit voir le rivage du fleuve se déplacer, tandis qu’il est doucement entraîné par le mouvement du navire. Examinée de plus près, cette simple notion acquiert une importance capitale; on n’a aucun moyen de trancher la question, aucune experience ne peut mettre en defaut le principe: il n’y a pas d’espace absolu, tous les déplacements que nous pouvons observer sont des deplacements relatifs. Ces considerations bien familières aux philosophes, j’ai eu quelquefois l’occasion de les exprimer: j’en ai même recueilli une publicité dont je me serais volontiers passé, tous les journaux réactionnaires français m’ont fait démontrer que le soleil tournait autour de la terre; dans le fameux procès entre l’Inquisition et Galilée, Galilée aurait eu tous les torts.

Revenons à l’ancienne mécanique: elle admettait le principe de relativité; au lieu d’être fondées sur des expériences, ses lois étaient déduites de ce principe fondamental. Ces considerations suffisaient pour les phénomènes purement mécaniques, mais cela n’allait plus pour d’importantes parties de la physique, l’optique par exemple. On considérait comme absolue la vitesse de la lumière relativement à l’éther: cette vitesse pouvait être mesurée, on avait théoriquement le moyen de comparer le déplacement d’un mobile à un deplacement absolu, le moyen de décider si oui ou non un corps était en mouvement absolu.

Des expériences délicates, des appareils extrêmement précis, que je ne décrirai pas devant vous, ont permis d’essayer la réalisation pratique d’une pareille comparaison: le résultat a été nul. Le principe de rélativite n’admet aucune restriction dans la nouvelle mécanique; il a, si j’ose ainsi dire, une valeur absolue.

Pour comprendre le rôle que joue le principe de relativité dans la Nouvelle Mécanique, nous sommes d’abord amenés à parler du temps apparent, une invention fort ingénieuse du physicien Lorentz. Nous supposons deux observateurs l’un A à Paris, l’autre B à Berlin. A et B ont des chronomètres identiques et veulent les régler: mais ce sont des observateurs méticuleux comme il n’y en a guère; ils exigent dans leur réglage une extraordinaire exactitude: ce sera, par exemple, non une seconde, mais un milliardième de seconde. Comment pourront-ils faire? De Paris à Berlin, A envoie un signal télégraphique, avec un sans-fil, si vous voulez, pour être tout à fait moderne. B note le moment de la réception et ce sera pour les deux chronomètres l’origine des temps. Mais le signal emploie un certain temps pour aller de Paris à Berlin, il ne va qu’avec la vitesse de la lumière; la montre de B serait donc en retard; B est trop intelligent pour ne point s’en rendre compte; il va remédier a cet inconvenient. La chose semble bien simple: on croîse les signaux, A reçoit et B envoie, on prend la moyenne des corrections ainsi faites, on a l’heure exacte. Mais cela est-il bien certain? Nous supposons que de A à B le signal emploie le même temps que pour aller de B à A. Or A et B sont emportés dans le mouvement de la terre par rapport à l’éther, véhicule des ondes électriques. Quand A a envoyé son signal il fuit devant lui, B s’éloigne de même, le temps employé sera plus long que si les deux observateurs étaient au repos; si au contraire c’est B qui envoie, A qui reçoit, le temps est plus court parce que A va au devant des signaux; il leur est absolument impossible de savoir si leurs chronomètres marquent ou non la même heure. Quelle que soit la méthode employée les inconvénients restent les mêmes l’observation d’un phénomène astronomique, une méthode optique quelconque se heurtent aux mêmes difficultés, B ne pourra jamais connaître qu’une différence apparente de temps, qu’une espèce d’heure locale. Le principe de relativité s’applique intégralement.

Dans l’ancienne mécanique pourtant, on démontrait avec ce principe toutes les lois fondamentales. On pourrait être tenté de reprendre les raisonnements classiques et de raisonner comme il suit? Soit encore deux observateurs, A et B pour les nommer comme on nomme toujours deux observateurs en mathématiques; supposons les en mouvement, s’éloignant l’un de l’autre; aucun d’eux ne peut dépasser la vitesse de la lumière; par exemple B sera animé de 200 000 kilométres vers la droite, A de 200 000 vers la gauche. A peut se croire au repos et la vitesse apparente de B sera, pour lui, 400 000 kilomètres. Si A connait la mécanique nouvelle il se dira: B a une vitesse qu’il ne peut atteindre, c’est donc que moi aussi je suis en mouvement. Il semble qu’il pourrait décider de sa situation absolue. Mais il faudrait qu’il puisse observer le mouvement de B lui-même; pour faire cette observation A et B commencent par régler leurs montres, puis B envoie à A des télégrammes pour lui indiquer ses positions successives; en les réunissant A peut se rendre compte du mouvement de B et tracer la courbe de ce mouvement. Or les signaux se propagent avec la vitesse de la lumière; les montres qui marquent le temps apparent varient à chaque instant et tout se passera comme si la montre de B avançait. B croira aller beaucoup moins vite et la vitesse apparente qu’il aura relativement à A ne dépassera pas la limite qu’elle ne doit pas atteindre. Rien ne pourra révéler à A s’il est en mouvement ou en repos absolu.

Il faut encore faire une troisième hypothèse beaucoup plus surprenante, beaucoup plus difficile à admettre, qui gêne beaucoup nos habitudes actuelles. Un corps en mouvement de translation subit une déformation dans le sens même où il se déplace; une sphère, par exemple, devient comme une espèce d’ellipsoïde aplati dont le petit axe serait parallèle à la translation. Si l’on ne s’aperçoit pas tous les jours d’une transformation pareille c’est qu’elle est d’une petitesse qui la rend presque imperceptible. La terre, emportée dans sa révolution sur son orbite se déforme environ de 1/200 000 000: pour observer un pareil phénomène il faudrait des instruments de mesure d’une précision extrême, mais leur précision serait infinie qu’on n’en serait pas plus avancé car emportés eux aussi dans le mouvement ils subiront la même transformation. On ne s’apercevra de rien; le mètre que l’on pourrait employer deviendra plus court comme la longueur qu’on mesure. On ne peut savoir quelque chose qu’en comparant à la vitesse de la lumière la longueur de l’un de ces corps. Ce sont là de delicates experiences, réalisées par Michelson et dont je ne vous exposerai pas le détail; elles ont donné des résultats tout à fait remarquables; quelqu’étranges qu’il nous paraissent, il faut admettre que la troisième hypothèse est parfaitement vérifiée.

Telles sont les bases de la nouvelle mécanique, avec l’appui de ces hypothèses on trouve qu’elle est compatible avec le principe de relativité.

Mais il faut la rattacher alors à une conception nouvelle de la matière.

Pour le physicien moderne, l’atome n’est plus l’élément simple; il est devenu un véritable univers dans lequel des milliers de planètes gravitent autour de soleils minuscules. Soleils et planètes sont ici des particules électrisées soit négativement soit positivement; le physicien les appelle électrons et bâtit le monde avec elles. D’aucuns se représentent l’atome neutre comme une masse centrale positive autour de laquelle circulent un grand nombre d’électrons chargés négativement, dont la masse électrique totale est égale en grandeur à celle du noyau central.

Cette conception de la matière permet de rendre compte aisément de l’augmentation de la masse d’un corps avec sa vitesse, dont nous avons fait un des caractères de la mécanique nouvelle. Un corps quelconque n’étant qu’un assemblage d’électrons, il nous suffira de le montrer sur ces derniers. Remarquons, à cet effet, qu’un électron isolé se déplaçant à travers l’éther engendre un courant électrique, c’est-à-dire un champ électromagnétique. Ce champ correspond à une certaine quantité d’énergie localisée non dans l’électron, mais dans l’éther. Une variation en grandeur ou en direction de la vitesse de l’électron modifie le champ et se traduit par une variation de l’énergie électromagnétique de l’éther. Alors que dans la mécanique newtonienne la dépense d’énergie n’est due qu’à l’inertie du corps en mouvement, ici une partie de cette dépense est due à ce que l’on peut appeler l’inertie de l’éther relativement aux forces électromagnétiques. L’inertie de l’éther augmente avec la vitesse et sa limite devient infinie lorsque la vitesse tend vers la vitesse de la lumière. La masse apparente de l’électron augmente donc avec la vitesse; les expériences de Kaufmann montrent que la masse réelle constante de l’électron est négligeable par rapport à la masse apparente et peut être considérée comme nulle.

Dans cette nouvelle conception, la masse constante de la matière a disparu. L’éther seul, et non plus la matière, est inerte. Seul l’éther oppose une résistance au mouvement, si bien que l’on pourrait dire: il n’y a pas de matière, il n’y a que des trous dans l’éther. Pour les mouvements stationnaires ou quasi-stationnaires, la mécanique nouvelle ne diffère pas — au degré d’approximation de nos mesures près — de la mécanique newtonienne, avec cette seule différence que la masse n’est plus indépendante ni de la vitesse, ni de l’angle que fait cette vitesse avec la direction de la force accélératrice. Si par contre la vitesse a une accélération considérable, dans le cas, par ex., d’oscillations très rapides, il y a production d’ondes hertziennes représentant une perte d’énergie de l’électron entraînant l’amortissement de son mouvement. Ainsi, dans la télégraphie sans fil, les ondes émises sont dues aux oscillations des électrons dans la décharge oscillante.

Des vibrations analogues ont lieu dans une flamme et de même encore dans un solide incandescent. Pour Lorentz, il circule à l’intérieur d’un corps incandescent un nombre considérable d’électrons qui, ne pouvant pas en sortir, volent dans tous les sens et se réfléchissent sur sa surface. On pourrait les comparer à une nuée de moucherons enfermés dans un bocal et venant frapper de leurs ailes les parois de leur prison. Plus la temperature est élevée, plus le mouvement de ces électrons est rapide et plus les chocs mutuels et les réflexions sur la paroi sont nombreuses. A chaque choc et à chaque réflexion une onde électromagnétique est émise et c’est la perception de ces ondes qui nous fait paraître le corps incandescent.

Le mouvement des électrons est presque tangible, dans un tube de Crookes. Il s’y produit un véritable bombardement d’électrons partant de la cathode. Ces rayons cathodiques frappent violemment l’anticathode et s’y réfléchissent en partie donnant ainsi naissance à un ébranlement électromagnétique que plusieurs physiciens identifient avec les rayons Röntgen.

Il nous reste en terminant à examiner les relations de la mécanique nouvelle avec l’astronomie. La notion de masse constante d’un corps s’évanouissant, que deviendra la loi de Newton? Elle ne pourra subsister que pour des corps en repos. De plus il faudra tenir compte du fait que l’attraction n’est pas instantanée. On peut donc se demander avec raison si la mécanique nouvelle ne va réussir qu’à compliquer l’astronomie sans obtenir une approximation supérieure a celle que nous donne la mécanique céleste classique. Mr. Lorentz a abordé la question. Partant de la loi de Newton supposée vraie pour deux corps électrisés au repos, il calcule l’action électrodynamique des courants engendrés par ces corps en mouvement; il obtient ainsi une nouvelle loi d’attraction contenant les vitesses des deux corps comme paramètres. Avant d’examiner comment cette loi rend compte des phénomènes astronomiques, remarquons encore que l’accélération des corps célestes a comme conséquence un rayonnement électromagnétique, donc une dissipation de l’énergie se faisant ressentir en retour par un amortissement de leur vitesse. A la longue, les planètes finiront donc par tomber sur le soleil. Mais cette perspective ne peut guère nous effrayer, la catastrophe ne pouvant arriver que dans quelques millions de milliards de siècles. Revenant maintenant à la loi d’attraction, nous voyons aisément que la différence entre les deux mécaniques sera d’autant plus grande que la vitesse des planètes sera plus grande. S’il y a une différence appréciable, ce sera donc pour Mercure qu’elle sera la plus grande, Mercure ayant de toutes les planètes la plus grande vitesse. Or il arrive justement que Mercure présente une anomalie non encore expliquée: le mouvement de son périhélie est plus rapide que le mouvement calculé par la theorie classique. L’accélération est de 38" trop grande. Leverrier attribua cette anomalie à une planète non encore découverte et un astronome amateur crut observer son passage au soleil. Depuis lors plus personne ne l’a vue et il est malheureusement certain que cette planète aperçue n’était qu’un oiseau. Or la mécanique nouvelle rend bien compte du sens de l’erreur relative à Mercure, mais elle laisse cependant encore une marge de 32" entre elle et l’observation. Elle ne suffit donc pas à ramener la concordance dans la théorie de Mercure. Si ce résultat n’est guère décisif en faveur de la mécanique nouvelle, il est encore moins défavorable à son acceptation puisque le sens dans lequel elle corrige l’écart de la théorie classique est le bon. La théorie des autres planètes n’est pas sensiblement modifié dans la nouvelle théorie et les résultats coïncident à l’approximation des mesures près à ceux de la théorie classique.

Pour conclure, il serait prématuré, je crois, malgré la grande valeur des arguments et des faits érigés contre elle, de regarder la mécanique classique comme définitivement condamnée. Quoiqu’il en soit d’ailleurs, elle restera la mécanique des vitesses très petites par rapport à celle de la lumière, la mécanique donc de notre vie pratique et de notre technique terrestre. Si cependant, dans quelques années sa rivale triomphe, je me permettrai de vous signaler un écueil pédagogique que n’éviteront pas nombre de maîtres, en France, tout au moins. Ces maîtres n’auront rien de plus pressé, en enseignant la mécanique élémentaire à leurs élèves, que de leur apprendre que cette mécanique là a fait son temps, qu’une mécanique nouvelle où les notions de masse et de temps ont une toute autre valeur la remplace; ils regarderont de haut cette mécanique périmée que les programmes les forcent à enseigner et feront sentir à leurs élèves le mépris qu’ils lui portent. Je crois bien cependant que cette mécanique classique dédaignée sera aussi nécessaire que maintenant et que celui qui ne la connaîtra pas à fond ne pourra comprendre la mécanique nouvelle.

Time-stamp: "15.05.2016 20:09"