le isometrie e la relatività ristretta - vsmp.ch · uno ha costruito il gruppo di lorentz in...

52
Le isometrie e la relatività ristretta Emanuele Dotto, Fabrizio Pini 1. Introduzione Questo testo prende lo spunto da quattro lavori di maturità di matematica svolti al Liceo cantonale di Mendrisio nel 2005, in occasione dell’anno della fisica, sotto la guida di F. Pini, da (in ordine alfabetico) Marco Battaglia, Joris Bressan, Alberto Bullani, Patrik Kuehn, Mohan Rusconi, Elia Schneider, Francesco Solcà, Igor Tor- riani. L’intento era di mostrare alcune differenze sostanziali fra meccanica classica e relatività ristretta, con un approccio più matematico di quanto non sia in gene- rale possibile fare con studenti liceali. La sintesi è stata curata da Emanuele Dotto, ex-studente del Liceo di Mendrisio e da F. Pini. L’obiettivo principale era quello di costruire, partendo da invarianti assegnati, le trasformazioni che permettono di passare dalle coordinate di un riferimento iner- ziale a quelle di un’altro sistema in moto relativo uniforme rispetto al precedente. Il compito di un primo gruppo di studenti era di caratterizzare le isometrie eucli- dee di R 2 e di R 3 , ricorrendo all’algebra lineare studiata nel corso di matematica. Pochi risultati, pur sempre standard ma non svolti nel corso, sono stati ripresi da testi classici 1 . Altri studenti si sono occupati del gruppo di Galileo quale gruppo di simmetria della meccanica classica. Infine due gruppi si sono suddivisi il compito di esplorare una parte della relati- vità ristretta. Uno ha costruito il gruppo di Lorentz in dimensione 1 + 1e1 + 3 (una temporale e una rispettivamente tre spaziali) come gruppo delle isometrie relative alla forma di Minkowski, passando per le funzioni e le rotazioni iperbo- liche. L’ultimo gruppo ha studiato la versione relativistica di alcuni moti classici. In particolare viene proposta qui una definizione del moto armonico relativistico, che ci appare per molti versi più naturale di altre. Nella letteratura 2 non esiste una definizione univoca. Si trovano alcuni approcci, vuoi con generalizzazioni dell’e- quazione di Newton in cui la Lorentz-invarianza non è sempre evidente, vuoi con un approccio Hamiltoniano o Lagrangiano attraverso un principio variazionale. Il problema viene affrontato come problema inverso: si sceglie una definizione, 1 Come ad esempio U.Stammbach, Lineare Algebra, Teubner, Stuttgart, 1994. 2 I.I. Cotaescu, Geometric Models of the Relativistic Harmonic Oscillator, arXiv:physics9704009/10.04.07, A.L. Harvey, Relativistic Harmonic Oscillator, Phys.Rev.D,6(8)1972. 111

Upload: nguyenmien

Post on 15-Feb-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Le isometrie e la relatività ristretta

Emanuele Dotto, Fabrizio Pini

1. Introduzione

Questo testo prende lo spunto da quattro lavori di maturità di matematica svoltial Liceo cantonale di Mendrisio nel 2005, in occasione dell’anno della fisica, sottola guida di F. Pini, da (in ordine alfabetico) Marco Battaglia, Joris Bressan, AlbertoBullani, Patrik Kuehn, Mohan Rusconi, Elia Schneider, Francesco Solcà, Igor Tor-riani. L’intento era di mostrare alcune differenze sostanziali fra meccanica classicae relatività ristretta, con un approccio più matematico di quanto non sia in gene-rale possibile fare con studenti liceali. La sintesi è stata curata da Emanuele Dotto,ex-studente del Liceo di Mendrisio e da F. Pini.

L’obiettivo principale era quello di costruire, partendo da invarianti assegnati, letrasformazioni che permettono di passare dalle coordinate di un riferimento iner-ziale a quelle di un’altro sistema in moto relativo uniforme rispetto al precedente.Il compito di un primo gruppo di studenti era di caratterizzare le isometrie eucli-dee di R2 e di R3, ricorrendo all’algebra lineare studiata nel corso di matematica.Pochi risultati, pur sempre standard ma non svolti nel corso, sono stati ripresi datesti classici1.Altri studenti si sono occupati del gruppo di Galileo quale gruppo di simmetriadella meccanica classica.Infine due gruppi si sono suddivisi il compito di esplorare una parte della relati-vità ristretta. Uno ha costruito il gruppo di Lorentz in dimensione 1 + 1 e 1 + 3(una temporale e una rispettivamente tre spaziali) come gruppo delle isometrierelative alla forma di Minkowski, passando per le funzioni e le rotazioni iperbo-liche. L’ultimo gruppo ha studiato la versione relativistica di alcuni moti classici.In particolare viene proposta qui una definizione del moto armonico relativistico,che ci appare per molti versi più naturale di altre. Nella letteratura2 non esiste unadefinizione univoca. Si trovano alcuni approcci, vuoi con generalizzazioni dell’e-quazione di Newton in cui la Lorentz-invarianza non è sempre evidente, vuoi conun approccio Hamiltoniano o Lagrangiano attraverso un principio variazionale.Il problema viene affrontato come problema inverso: si sceglie una definizione,

1Come ad esempio U.Stammbach, Lineare Algebra, Teubner, Stuttgart, 1994.2I.I. Cotaescu, Geometric Models of the Relativistic Harmonic Oscillator, arXiv:physics9704009/10.04.07,

A.L. Harvey, Relativistic Harmonic Oscillator, Phys.Rev.D,6(8)1972.

111

112 Le isometrie e la relatività ristretta

possibilmente Lorentz-invariante, che al limite non relativistico fa ritrovare l’o-scillatore classico. Ma questo è possibile con molte definizioni non equivalenti.Gli studenti hanno scelto un approccio piuttosto elementare: quello di dichiararearmonico un moto che, nel riferimento solidale con il corpo in movimento, hal’accelerazione a(τ) = a0 cos(ωτ + δ); sono poi risaliti all’espressione integraledel tempo coordinato t e della posizione x in funzione del tempo proprio τ. Sisono fermati solo davanti a un problema di integrazione, parzialmente aggiratoservendosi delle approssimazioni di Taylor, che permettono anche di ritrovare l’o-scillatore classico al limite non relativistico e le sue prime correzioni. Pini ha poiaggiunto le due appendici: la prima in cui si trovano le soluzioni come serie diFourier e la seconda in cui si abbandonano le considerazioni di natura puramentecinematica per privilegiare un discorso su forze, lavoro e energia.La sintesi di E. Dotto ha aggiunto quello che appare qui come primo capitolo inti-tolato “Un po’ di teoria”, servendosene poi per coordinare nel limite del possibilei contributi degli studenti. Di particolare interesse in questo capitolo è il risultato3,con relativa dimostrazione, della linearità di ogni isometria relativa a una formabilineare simmetrica e non degenere su uno spazio vettoriale di dimensione finita.

2. Un po’ di teoria

Per tutta la sezione noteremo V un generico spazio vettoriale su R di dimensionefinita n > 0.

Definizione 2.1. Un’applicazione α : V −→ R è lineare se soddisfa le due pro-prietà seguenti:

(1) α (x + y) = α (x) + α (y) ∀x, y ∈ V,

(2) α (λx) = λα (x) ∀x ∈ V ∀λ ∈ R.

Definizione 2.2. Un’applicazione β : V × V −→ R è bilineare se soddisfa leproprietà seguenti:

(1) linearità nella prima variabile:

β(λx + µy, z) = λβ(x, z) + µβ(y, z) ∀x, y, z ∈ V , ∀λ, µ ∈ R,

(2) linearità nella seconda variabile:

β(x, λy + µz) = λβ(x, y) + µβ(x, z) ∀x, y, z ∈ V , ∀λ, µ ∈ R.

3Si veda Vogt A., On the linearity of form isometries, SIAM J.Appl.Math.22(4)1972 e la relativabibliografia.

Emanuele Dotto, Fabrizio Pini 113

Definizione 2.3. Un’applicazione β : V × V −→ R è simmetrica se soddisfa lacondizione:

β (x, y) = β (y, x) ∀x, y ∈ V.

Definizione 2.4. Un’applicazione β : V×V −→ R è definita positiva se β (x, x) ≥0 per tutti gli x ∈ V e β (x, x) = 0 solo se x = 0.

Definizione 2.5. Un prodotto scalare su V è un’applicazione bilineare β : V ×V −→ R, simmetrica e definita positiva.

Ad un prodotto scalare si associa la norma definita, per un qualsiasi x ∈ V, dallarelazione

‖x‖ = (β(x, x))1/2 .

Definizione 2.6. Un’applicazione bilineare e simmetrica β : V ×V −→ R è dege-nere se l’insieme N = u | β(u, v) = 0 ∀v ∈ V non è ridotto al solo vettore nullo.In altri termini β è degenere se esiste v0 ∈ V, v0 6= 0, tale che β (v0, v) = 0 perogni v ∈ V.

Risulta evidente che una forma β definita positiva non può essere degenere. Esi-stono però applicazioni non degeneri che non sono definite positive. Al di làdel caso banale dato da −β, che risulta essere negativa definita, consideriamol’esempio seguente.

Esempio 2.1. Sia V = R2 e sia β definita da

β(x, y) = x1 y1 − x2 y2 ,

dove x = (x1, x2), y = (y1, y2) ∈ R2. β è evidentemente bilineare e simmetrica.Vedremo nel seguito che β è la pseudo-metrica di Minkowski. È un sempliceesercizio verificare che β non è degenere; β è indefinita riguardo al segno: infattiβ(x, x) può essere sia > 0 (vettori di tipo tempo), sia = 0 (vettori di tipo luce) sia < 0(vettori di tipo spazio).

Esempio 2.2. Sia V = Rn e sia B una matrice n× n reale e simmetrica. Definiamoper x, y ∈ Rn (“·” è l’abituale prodotto scalare euclideo)

β(x, y) = x · By = Bx · y .

La seconda uguaglianza è conseguenza della simmetria di B. È immediato vedereche β è bilineare e simmetrica.

Definizione 2.7. Un’isometria relativa a una forma bilineare simmetrica β è un’ap-plicazione α : V −→ V che soddisfa la condizione seguente:

β (x− y, x− y) = β (α (x)− α (y) , α (x)− α (y)) ∀x, y ∈ V. (1)

114 Le isometrie e la relatività ristretta

In particolare, se β è un prodotto scalare la condizione di isometricità si esprimecome

‖α(x)− α(y)‖ = ‖x− y‖

per tutti gli x, y ∈ V. In altri termini, un’isometria relativa a un prodotto scalarelascia invariata la distanza fra gli elementi a cui si applica.

Chiameremo isometrie che fissano l’origine, le isometrie che inviano 0 ∈ V in 0 ∈V. Un’ isometria che fissa l’origine possiede chiaramente la proprietà β (x, x) =β (α (x) , α (x)) ∀x ∈ V, ottenuta ponendo y = 0 nella (1).

Esempio 2.3. Per ogni v ∈ V l’applicazione τv : V −→ V data da τv(x) = x + v∀x ∈ V è la traslazione di vettore v.Relativamente a una qualsiasi forma bilineare simmetrica β, τv è un’isometria. Sev 6= 0, τv non fissa l’origine (e nessun altro vettore).

Proposizione 2.1. Sia α : V −→ V una qualsiasi isometria relativa ad una formabilineare simmetrica β. Allora α può essere scritta come:

α = τv α0,

dove τv : V −→ V è una traslazione di vettore v, e α0 : V −→ V è un’isometria che fissal’orgine.

Dimostrazione. Sia v = α(0). Dato che α è un’isometria, abbiamoβ (x− y, x− y) = β (α (x)− α (y) , α (x)− α (y)) ∀x, y ∈ V. Poniamo y = 0 e otte-niamo β (x, x) = β (α (x)− v, α (x)− v) ∀x ∈ V. Definiamo α0 : V −→ V comeα0(x) = α(x)− v ∀x ∈ V. Chiaramente 0 è un punto fisso di α0. Verifichiamo cheα0 è un’isometria:

β (α0 (x)− α0 (y) , α0 (x)− α0 (y)) =β (α (x)− v− α (y) + v, α (x)− v− α (y) + v) =β (α (x)− α (y) , α (x)− α (y)) = β (x− y, x− y) ∀x, y ∈ V.

Inoltre α(x) = α0(x) + v. Troviamo quindi la relazione cercata: α = τv α0.

Grazie a questo teorema possiamo d’ora in avanti limitarci a considerare le iso-metrie che fissano l’origine, sapendo che possiamo ottenere tutte le isometriecomponendo con delle traslazioni.

Proposizione 2.2. Sia α : V −→ V un’isometria relativa ad una forma bilineare simme-trica β. Se α fissa l’origine allora

β (x, y) = β (α (x) , α (y))

per tutti gli x, y ∈ V.

Emanuele Dotto, Fabrizio Pini 115

Dimostrazione. Siano x, y ∈ V. Calcoliamo in due modi β (x− y, x− y). Datoche α è un’isometria, abbiamo:

β (x− y, x− y) = β (α (x)− α (y) , α (x)− α (y)) =

= β (α (x) , α (x)) + β (α (y) , α (y))− 2β (α (x) , α (y)) =

= β (x, x) + β (y, y)− 2β (α (x) , α (y)) .

Nell’ultimo passaggio abbiamo utilizzato l’ipotesi che α fissa l’origine per scri-vere β(α(x), α(x)) = β(x, x) e β(α(y), α(y)) = β(y, y). D’altra parte abbiamoche β (x− y, x− y) = β (x, x) + β (y, y)− 2β (x, y). Uguagliando le due quantitàotteniamo il risultato voluto.

La proposizione appena dimostrata esprime, nel caso in cui β è un prodotto scala-re, l’invarianza di quest’ultimo e non solo della norma associata. Di conseguenzaα non conserva solo le distanze ma anche le misure angolari.

Viceversa si ha

Proposizione 2.3. Sia β una forma bilineare, simmetrica su V e sia α : V −→ V chefissa l’origine e soddisfa β (x, y) = β (α (x) , α (y)) ∀x, y ∈ V. Allora α è un’isometriarelativamente a β .

Dimostrazione. Si ha infatti

β(α(x)−α(y), α(x)− α(y)) =

= β(α(x), α(x)) + β(α(y), α(y))− 2β(α(x), α(y)) =

= β(x, x) + β(y, y)− 2β(x, y) = β(x− y, x− y) ,

ciò che prova che α è un’isometria.

Proposizione 2.4. Sia α : V −→ V un’isometria rispetto a una forma β bilinearesimmetrica e non degenere. Se α fissa l’origine allora α è lineare.

Dimostrazione. Sia v1, v2, . . . , vn una base di V (abbiamo inizialmente suppostoche V ha dimensione finita n). Mostriamo dapprima che anche le immagini α(v1),α(v2), . . . , α(vn) dei vettori di base sono linearmente indipendenti. Consideriamouna combinazione lineare nulla ∑n

i=1 λi α(vi) = 0. Allora per tutti i v ∈ V si ha

0 = β(n

∑i=1

λi α(vi), α(v)) =n

∑i=1

λi β(α(vi), α(v)) =

=n

∑i=1

λi β(vi, v) = β(n

∑i=1

λi vi, v) .

Abbiamo applicato in successione la bilinearità di β, la proposizione 2.2 e di nuovola bilinearità. Poiché, per ipotesi, β non è degenere dalla relazione precedente si

116 Le isometrie e la relatività ristretta

deduce che ∑ni=1 λi vi = 0. Per l’indipendenza lineare dei vettori della base ne

consegue che λ1 = λ2 = · · · = λn = 0 e quindi l’indipendenza lineare di α(v1),α(v2), . . . , α(vn).Dato che, in V, n vettori linearmente indipendenti formano una base, ogni v ∈ Vè della forma v = ∑n

j=1 µj α(vj).

Possiamo ora dimostrare la linearità di α. Per tutti gli x, y ∈ V e tutti i v ∈ Vespressi nella forma appena indicata si ha (applicando ripetutamente ancora unavolta la bilinearità e la proposizione 2.2)

β(α(x + y)− α(x)− α(y), v) = β(α(x + y)− α(x)− α(y),n

∑j=1

µj α(vj)) =

=n

∑j=1

µj β(α(x + y), α(vj))−n

∑j=1

µj β(α(x), α(vj))−n

∑j=1

µj β(α(y), α(vj)) =

=n

∑j=1

µj β(x + y, vj)−n

∑j=1

µj β(x, vj)−n

∑j=1

µj β(y, vj) =

= β(x + y,n

∑j=1

µj vj)− β(x,n

∑j=1

µj vj)− β(y,n

∑j=1

µj vj) =

= β(x + y, w)− β(x, w)− β(y, w) = β(0, w) = 0 ,

dove abbiamo posto w = ∑nj=1 µj vj. Riassumendo abbiamo dimostrato che β(α(x +

y)− α(x)− α(y), v) = 0 per tutti i v ∈ V. Ne deduciamo che α(x + y)− α(x)−α(y) = 0.Procediamo analogamente per dimostrare α(λ x)− λ α(x) = 0 per tutti gli x ∈ Ve tutti i λ ∈ R. Rappresentando ogni v ∈ V, come fatto sopra, nella formav = ∑n

j=1 µj α(vj) si ha, per tutti gli x e tutti gli y ∈ V,

β(α(λ x)− λ α(x), v) = β(α(λ x)− λ α(x),n

∑j=1

µj α(vj)) =

=n

∑j=1

µj β(α(λ x), α(vj))−n

∑j=1

λ µj β(α(x), α(vj)) =

=n

∑j=1

µj β(λ x, vj)−n

∑j=1

λ µj β(x, vj) =

=n

∑j=1

µj β(λ x, vj)−n

∑j=1

µj β(λ x, vj) = 0 .

Avendo così ottenuto che β(α(λ x)− λ α(x), v) = 0 per tutti i v ∈ V, l’ipotesi cheβ non sia degenere implica che α(λ x)− λ α(x) = 0.La linearità di α è così dimostrata.

Nel caso in cui α non fissa l’origine utilizzando la proposizione 2.1 si concludeche α è lineare inomogenea, ossia la composizione di una traslazione e di unatrasformazione lineare.

Emanuele Dotto, Fabrizio Pini 117

Si noti che nella dimostrazione precedente è fondamentale che la dimensione diV sia finita: solo così i vettori immagine α(vi) formano certamente una base diV. Il teorema è falso in dimensione infinita senza ipotesi supplementari quali adesempio la suriettività di α oppure la positività di β 4. Il controesempio seguenteè tolto dal lavoro di Vogt appena citato.

Esempio 2.4. Sia V l’insieme delle successioni reali (x1, x2, . . . ) = (xi)∞i=1 con sol-

tanto un numero finito di xi 6= 0. L’addizione e la moltiplicazione per uno scalaresono definite elemento per elemento: se x = (xi)

∞i=1, y = (yi)

∞i=1 e λ ∈ R allora

x + y = (xi + yi)∞i=1 , λ · x = (λ xi)

∞i=1 .

Rispetto a queste operazioni V è uno spazio vettoriale di dimensione infinita. Perk ≥ 1 sia ek ∈ V la successione i cui elementi sono tutti nulli ad eccezione delk-esimo che vale 1. Gli ek per k = 1, 2, . . . formano una base di V. Sia

β(x, y) = x1y1 − x2y2 + x3y3 − · · · =∞

∑i=1

(−1)i+1xi · yi .

Si noti che la somma che appare nella definizione di β è infinita solo in apparenza,in quanto solo un numero finito di xi e di yi è 6= 0. Si verifica facilmente che β

è bilineare simmetrica, non degenere ma indefinita riguardo al segno. Definiamoα : V −→ V come segue:

α(x) = (β(x, x),−β(x, x), x1, x2, . . . ) .

È immediato verificare che α(0) = 0 e che β(α(x), α(y)) = β(x, y) per tutti glix, y ∈ V. Quindi α è un’isometria che fissa l’origine (per la proposizione 2.3).Tuttavia α non è lineare a causa del termine quadratico β(x, x) nella prima e nellaseconda componente. Inoltre α è iniettiva ma non suriettiva (ad esempio e1 non èimmagine di alcun x ∈ V).

Proposizione 2.5. Un’isometria α : V −→ V relativa a una forma bilineare simmetricae non degenere β è biiettiva e anche l’inversa α−1 è un’isometria.

Dimostrazione. Supponiamo per cominciare che α fissi l’origine.Mostriamo dapprima l’iniettività. Siano x1, x2 ∈ V tali che α(x1) = α(x2). Pertutti i v ∈ V si ha allora

0 = β(α(x1)− α(x2), α(v)) = β(α(x1), α(v))− β(α(x2), α(v)) =

= β(x1, v)− β(x2, v) = β(x1 − x2, v) ;

dato che β non è degenere si può concludere che x1 − x2 = 0 e quindi l’iniettivitàè provata.Per provare la suriettività facciamo uso della linearità di α appena dimostrata.

4Per maggiori approfondimenti si veda Vogt A., On the linearity of form isometries, SIAMJ.Appl.Math.22(4)1972

118 Le isometrie e la relatività ristretta

È noto dall’algebra lineare che una trasformazione lineare iniettiva da V in V èanche suriettiva (a condizione che la dimensione di V sia finita). In alternativabasta notare che nella dimostrazione di 2.4 abbiamo provato, anche se un po’imlicitamente, che l’insieme immagine di im(α) è uguale a V.Verifichiamo per finire che l’inversa di α è ancora un’isometria. Infatti

β (x, y) = β(

α(

α−1 (x))

, α(

α−1 (y)))

= β(

α−1 (x) , α−1 (y))

.

Se l’origine non è fissa basta richiamarsi alla proposizione 2.1.

Osservazione 2.1. Il contesto in cui faremo uso dei risultati di questo capitolo è ilseguente. Immaginiamo V come spazio di eventi (spaziotemporali, ma potrebbe-ro anche essere inclusi gradi di libertà interni alle particelle) sul quale è definitauna forma bilineare β simmetrica e non degenere. Ogni isometria α relativa a β

rappresenta una simmetria del sistema fisico nel senso che le leggi fondamentalisono formalmente invarianti rispetto ad α. Le proprietà di α fin qui dimostrate(biiettività e linearità) appaiono del tutto naturali: la biettività permette di consi-derare equivalenti tutti i riferimenti connessi da un’isometria; la linearità assicurache gli stessi sistemi di riferimento siano tutti inerziali (a condizione che almenouno lo sia).

Definizione 2.8. Siano β : V × V −→ R una forma bilineare e F = ( f1, f2, ..., fn)

una base di V. Le componenti di β, relative alla base F, sono definite dalla matriceG, di componenti

Gij = β(

fi, f j)

, 1 ≤ i, j ≤ n.

La matrice G è la matrice di β relativa alla base F.

Proposizione 2.6. Siano u e v due vettori di V espressi nella base F = ( f1, f2, . . . , fn),e β : V ×V −→ R una forma bilineare di matrice G relativa a F. Allora

β (u, v) = uTGv.

(Il simbolo T indica la trasposizione di matrici.)

Dimostrazione. Dato che u e v sono espressi nella base F, possono essere scritticome combinazione lineare degli fi:

u = λ1 f1 + · · ·+ λn fn , v = µ1 f1 + · · ·+ µn fn.

Calcoliamo per prima cosa il termine di sinistra:

β (u, v) = β

(n

∑i=1

λi fi,n

∑j=1

µj f j

)=

n

∑i=1

λiβ

(fi,

n

∑j=1

µj f j

)=

n

∑i=1

λi

n

∑j=1

µjβ(

fi, f j)

=n

∑i=1

n

∑j=1

λiGijµj.

Emanuele Dotto, Fabrizio Pini 119

Calcoliamo ora il termine di destra e verifichiamo l’uguaglianza:

uTGv = (λ1, . . . , λn) G

µ1...

µn

= (λ1, . . . , λn)

∑nj=1 G1jµj

...∑n

j=1 Gnjµj

=

= λ1

n

∑j=1

G1jµj + · · ·+ λn

n

∑j=1

Gnjµj =n

∑i=1

λi

n

∑j=1

Gijµj =n

∑i=1

n

∑j=1

λiGijµj.

La simmetria di β ha come conseguenza quella di G; in altri termini GT = G.Per il teorema spettrale per matrici simmetriche n× n, G possiede solo autovalorireali λ1 ≤ λ2 ≤ · · · ≤ λn ed esiste una matrice ortogonale R tale che RTGR =

diag(λ1, λ2, . . . , λn). Gli autovettori di G formano una base ortonormata N di Rn

rappresentata nella base cartesiana dalle colonne della matrice R.

Proposizione 2.7. Siano β una forma bilineare simmetrica su V, G la sua matricerelativa ad una base F di V, λ1 ≤ λ2 ≤ · · · ≤ λn gli autovalori di G. Allora

a) β non degenere se e solo se λk 6= 0 per 1 ≤ k ≤ n;

b) β definita positiva se e solo se λk > 0 per 1 ≤ k ≤ n.

Dimostrazione. Basta effettuare il cambiamento dalla base F alla base N.

Faremo ampiamente uso del risultato seguente nel capitolo sulle trasformazionidi Lorentz.

Proposizione 2.8. Sia β : V × V −→ R una forma bilineare simmetrica di matrice Grelativa ad una base F di V. Sia α : V −→ V un’applicazione lineare di matrice L relativaa F. Allora α è un’isometria relativa a β se e solo se LTGL = G.

Dimostrazione. Basta notare che la proprietà LTGL = G è equivalente a

β (x, y) = β (α (x) , α (y)) ∀x, y ∈ V.

Grazie alla proposizione 2.3, il risultato è immediato.

La proposizione seguente permette di dedurre l’isometricità dall’invarianza diuna forma quadratica.

Proposizione 2.9. Sia β : V × V −→ R una forma bilineare simmetrica di matriceG relativa ad una base F di V. Sia α : V −→ V un’applicazione lineare di matrice Lrelativa a F. Per ogni x ∈ Rn poniamo y = Lx. Supponiamo soddisfatta la condizionexTGx = yTGy ∀x ∈ V. Allora α è un’isometria relativa a β.

120 Le isometrie e la relatività ristretta

Dimostrazione. Inserendo y = Lx scriviamo l’ipotesi su L e G come

xT(

G− LTGL)

x = 0 ∀x ∈ V.

La matrice G− LTGL rappresenta nella base F una forma bilineare γ. Dato cheG è simmetrica, anche G− LTGL è simmetrica e di conseguenza anche γ. Inoltreγ soddisfa γ (x, x) = 0 ∀x ∈ V. Dimostriamo che allora γ è la forma bilinearenulla. Basta applicare l’identità di polarizzazione, valida per ogni forma bilinearesimmetrica,

γ (x, y) =14(γ (x + y, x + y)− γ (x− y, x− y)) .

per dedurre che γ (x, y) = 0 ∀ (x, y) ∈ V × V. La matrice G − LTGL rappresen-tativa di γ sarà dunque nulla, per cui si ha LTGL = G. Grazie alla proposizioneprecedente α è un’isometria.

Proposizione 2.10. Sia α : V −→ V un’isometria lineare relativa a una forma bilineareβ simmetrica e non degenere, e sia L la matrice associata ad α relativa ad una data base.Allora:

det (L) = ±1

Dimostrazione. Sia G la matrice di β relativa alla base considerata. Per la pro-posizione 2.8 abbiamo G = LTGL. Ricordando che il determinante di un prodottoè il prodotto dei determinanti otteniamo dapprima

det (G) = det(

LTGL)= det

(LT)

det (G)det (L) .

Inoltre, poiché det (L) = det(

LT) e det (G) 6= 0 dato che β non è degenere(per quest’ultima asserzione si veda la proposizione 2.7 tenendo conto che ildeterminante è il prodotto degli autovalori), si ha

det (G) = det (L)2 det (G)

e quindi det (L)2 = 1, da cui segue la tesi.

Proposizione 2.11. Sia α : V −→ V un’isometria lineare relativa a un prodotto scalareβ. Allora gli autovalori di α hanno tutti modulo 1.

Dimostrazione. Sia v 6= 0 un autovettore di α associato ad un autovalore λ.Allora α (v) = λv; inoltre α è un’isometria e quindi

β (v, v) = β (α (v) , α (v)) = β (λv, λv) = λ2β (v, v) .

Dato che la forma β, in quanto prodotto scalare, è definita positiva e quindiβ (v, v) 6= 0, si ottiene λ2 = 1, da cui segue ovviamente la tesi.

Osserviamo che la proposizione è falsa se β non è definita positiva (o negativa),come provato dal controesempio che segue (si veda anche l’esempio 2.1).

Emanuele Dotto, Fabrizio Pini 121

Esempio 2.5. Sia V = R2 e sia β(x, y) = x1y1 − x2y2, dove x = (x1, x2), y =

(y1, y2) ∈ R2. β è bilineare, simmetrica e non degenere, ma indefinita riguardo alsegno. Sia α : R2 −→ R2 la trasformazione lineare di matrice L =

(cosh θ sinh θsinh θ cosh θ

)con θ 6= 0. Vedremo nel seguito che si tratta di una trasformazione di Lorentz delpiano, cioè di un’isometria relativa alla forma β. Gli autovalori di L sono e±θ , chenon hanno modulo unitario per θ 6= 0.

Proposizione 2.12. Sia β : V ×V −→ R una forma bilineare simmetrica e non degene-re. Allora l’insieme delle isometrie lineari relative a β è un gruppo rispetto all’operazionedi composizione.

Dimostrazione. Chiamiamo Ω l’insieme delle isometrie lineari relative a β. Ve-rifichiamo prima di tutto la stabilità di Ω rispetto alla composizione, cioè che lacomposizione di isometrie lineari è un’isometria lineare. Siano α, φ ∈ Ω. Abbia-mo che α(φ(0)) = α(0) = 0 e quindi la composizione fissa l’origine. Verifichiamoche α φ è un’isometria:

β (x, y) = β (φ (x) , φ (y)) = β (α (φ (x)) , α (φ (y))) .

Verifichiamo ora i tre assiomi di gruppo:

(1) Associatività: la composizione di applicazioni è sempre associativa.

(2) Esistenza del neutro: l’identità su V agisce chiaramente da neutro ed èun’isometria.

(3) Esistenza dell’inversa: abbiamo già dimostrato nella proposizione 2.5 cheun’isometria lineare relativa ad una forma bilineare non degenere ammetteun’inversa e che l’inversa rimane un’isometria.

2.1. Isometrie euclidee di Rn

Tutte le matrici in questo capitolo sono relative alla base cartesiana (o canonica)B = (e1, e2, . . . , en) o comunque a una base ortonormata.

Definizione 2.9. Il prodotto scalare euclideo δ (o prodotto scalare standard) diRn è definito come:

δ (x, y) =n

∑i=1

xiyi ∀x, y ∈ Rn,

dove x = (x1, . . . , xn)T e y = (y1, . . . , yn)

T. La matrice di δ è la matrice identità.

Per il resto dell’articolo indicheremo il prodotto scalare euclideo con δ(x, y), otalvolta anche con x · y, e chiameremo norma euclidea di un vettore x di Rn (oanche solo norma) il numero reale: |x| =

√δ (x, x).

122 Le isometrie e la relatività ristretta

Definizione 2.10. Un’isometria euclidea è un’isometria di Rn relativa al prodottoscalare euclideo.

Ci occuperemo solo della costruzione delle isometrie lineari grazie alla proposi-zione 2.4. Il gruppo completo può poi essere ottenuto componendo le isometrielineari con le traslazioni (si veda la proposizione 2.1).

La relazione G = LTGL che caratterizza in generale le isometrie (si veda la pro-posizione 2.8) si applica qui con G = In, l’identità di Rn. Quindi un’isometriaeuclidea di matrice L è caratterizzata da

LT L = LLT = In .

(L’uguaglianza LT L = LLT si ottiene moltiplicando LT L = In da sinistra per Le da destra per L−1.) In altri termini L è una matrice ortogonale; le sue colonnesono ortonormate. Il gruppo delle isometrie euclidee di Rn viene perciò dettogruppo ortogonale e notato O(n). Se la base non fosse ortogonale, G non sarebbela matrice identità e L non sarebbe ortogonale.

2.2. Isometrie di R2

Per cominciare costruiamo il gruppo O(2) delle isometrie euclidee di R2.

La proposizione seguente caratterizza le matrici (relative alla base cartesiana)degli elementi di O(2).

Proposizione 2.13. Sia α : R2 −→ R2 un’isometria euclidea che fissa l’origine. Allorala matrice di α relativa alla base cartesiana assume una delle due forme

Rθ =

(cos θ − sin θ

sin θ cos θ

)o Sθ =

(cos θ sin θ

sin θ − cos θ

)per θ ∈ R.

Dimostrazione. Sia L =

(a bc d

)la matrice di α. La relazione LLT = I2 si può

scrivere come a2 + c2 = 1

b2 + d2 = 1

ab + cd = 0

.

Per la prima equazione, esiste θ ∈ R (determinato a meno di un multiplo interodi 2π) tale che: a = cos θ , c = sin θ. La seconda colonna della matrice ortogonaleL dev’essere perpendicolare alla prima (per la terza equazione) e unitaria (per laseconda equazione), quindi necessariamente della forma ±

( − sin θcos θ

). La scelta del

segno + ci dà Rθ e quella del segno − ci fa ritrovare Sθ .

Emanuele Dotto, Fabrizio Pini 123

Notiamo che det Rθ = 1 e det Sθ = −1. Le isometrie euclidee del piano a de-terminante +1 sono le rotazioni, che formano un sottogruppo del gruppo delleisometrie euclidee. Il gruppo delle rotazioni del piano (di centro O) è chiamatoSO(2). Rθ è la rotazione di centro O e ampiezza θ. Si mostra facilmente che SO(2)è un gruppo commutativo in quanto

Rθ1 Rθ2 = Rθ1+θ2 = Rθ2+θ1 = Rθ2 Rθ1 .

Le isometrie con determinante −1 sono le simmetrie assiali (con asse passante perO). Si verifica facilmente che Sθ è la simmetria rispetto alla retta di R2 d’equazioney = x tan(θ/2) se 0 ≤ θ < π, x = 0 se θ = π. Notiamo che le simmetrie nonformano un sottogruppo di O(2), dato che la composizione di due simmetrieavrà determinante (−1)2 = 1. La composizione di un numero pari di simmetrieè dunque una rotazione, di conseguenza la condizione di stabilità che l’insiemedelle simmetrie dovrebbe possedere per essere un sottogruppo non è soddisfatta.Ad esempio si ha

Sθ1 Sθ2 = Rθ1−θ2 .

2.3. Isometrie di R3

servendoci dei risultati appena ottenuti costruiamo ora il gruppo ortogonale O(3).

La classificazione degli elementi di O(3) parte dai loro possibili autovalori reali.Dalla proposizione 2.11 sappiamo che, per un’isometria relativa ad un prodottoscalare, questi hanno modulo 1. Vediamo ora di conteggiarli con le rispettivemolteplicità in quanto radici del polinomio caratteristico (si veda la definizione2.14).

Proposizione 2.14. Sia α : R3 −→ R3 un’isometria euclidea, allora α possiede unooppure tre autovalori reali.

Dimostrazione. Sia L la matrice di α. Il suo polinomio caratteristico è di gradotre e le sue radici sono gli autovalori di L. Dal teorema fondamentale dell’algebra,sappiamo che esso possiede tre radici nel campo complesso, contate con le rispet-tive molteplicità. D’altra parte, visto che i coefficienti del polinomio caratteristicosono reali poiché L è reale, gli zeri non reali si presentano a coppie un cui elemen-to è il complesso coniugato dell’altro. Quindi il numero di radici non reali è 0 (equindi ci sono tre radici reali) oppure due (e quindi c’è una sola radice reale).

Definizione 2.11. Siano f : V −→ V un’applicazione lineare e λ un autovalore dif . Il sottospazio proprio di V associato a λ è

Eλ = x 6= 0 | f (x) = λx ∪ 0 ,

cioè l’insieme formato da tutti gli autovettori corrispondenti a λ e dal vettorenullo. Eλ è un sottospazio vettoriale di V.

124 Le isometrie e la relatività ristretta

Definizione 2.12. Siano β : V ×V −→ R una forma bilineare simmetrica e D ⊆ Vun sottospazio di V. Il sottospazio ortogonale di D è definito come

D⊥ = x ∈ V | β (x, v) = 0 ∀v ∈ D .

Risulta evidente che anche D⊥ è un sottospazio vettoriale di V.La forma β non è degenere quando V⊥ = 0.

Lemma 2.1. Siano β : V ×V −→ R un prodotto scalare, D ⊆ V un sottospazio, D⊥ ilsottospazio ortogonale. Allora per ogni u ∈ V esistono e sono univocamente determinatiu1 ∈ D e u2 ∈ D⊥ tali che u = u1 + u2.

Dimostrazione. Sia d la dimensione di D. Se d = n non vi è nulla da dimostrare:si ha u1 = u e u2 = 0. Supponiamo allora d < n.Sia B1 = (v1, . . . , vd) una base ortonormata di D.Poniamo u1 = ∑d

k=1 β(u, vk)vk u2 = u − u1 e proviamo che u2 ∈ D⊥. Bastamostrare che β(u2, vj) = 0 per j = 1, 2, . . . d. Infatti

β(u2, vj) = β(u, vj)− β

(d

∑k=1

β(u, vk)vk, vj

)=

= β(u, vj)−d

∑k=1

β(u, vk)β(vk, vj) =

= β(u, vj)−d

∑k=1

β(u, vk)δkj = β(u, vj)− β(u, vj) = 0 ,

dove si è tenuto conto di δkj = β(vk, vj) a causa dell’ortonormalità. L’unicità dellascomposizione si dimostra supponendo u = u1 + u2 = u′1 + u′2, dove u1, u′1 ∈ D,u2, u′2 ∈ D⊥, da cui segue u1 − u′1 = u′2 − u2 = 0, dato che D e D⊥ sono sottospazidi V con D ∩ D⊥ = 0.

Definizione 2.13. Con le notazioni del lemma precedente, u1 è la proiezioneortogonale di u su D, denotata con PDu.

u2 sarà allora la proiezione ortogonale di u su D⊥; l’operatore PD⊥ soddisfaPD⊥ = In − PD.Il proiettore ortogonale PD è evidentemente lineare, il suo nucleo ker PD è il sotto-spazio ortogonale; per un noto risultato di algebra lineare, si ha allora dim D⊥ =

n− d.

Sempre con le notazioni del lemma e della sua dimostrazione, sia B2 = (vd+1, . . . ,vn) una base ortonormata di D⊥. Allora B = B1 ∪ B2 = (v1, . . . , vd, . . . , vn) è unabase ortonormata di V.

Definizione 2.14. Siano f : V −→ V un’applicazione lineare e λ un suo autovalo-re. La molteplicità algebrica di λ è la molteplicità di λ come radice del polinomiocaratteristico, che noteremo Malg (λ) (∈N).

Emanuele Dotto, Fabrizio Pini 125

Definizione 2.15. Siano f : V −→ V un’applicazione lineare e λ un suo au-tovalore. La molteplicità geometrica di λ è il numero naturale Mgeom (λ) =

dim Eλ.

Lemma 2.2. Siano f : Rn −→ Rn un’applicazione lineare e λ un suo autovalore reale,allora

1 ≤ Mgeom (λ) ≤ Malg (λ) .

Dimostrazione. Poniamo k = Malg(λ) e l = Mgeom(λ). La disuguaglianza l ≥ 1è evidente. Dobbiamo provare che l ≤ k. Come nella dimostrazione del lemma 2.1e nelle considerazioni che lo seguono, siano B1 = (v1, . . . , vl) una base ortonor-mata di Eλ, B2 = (vl+1, . . . , vn) una base ortonormata del sottospazio ortogonaleE⊥λ . Allora B = B1 ∪ B2 è una base ortonormata di V.

La matrice L di α relativa alla base B è della forma triangolare a blocchi

L =

(D C0 A

)

dove D =diag (λ, . . . , λ) è la matrice diagonale l × l data da λ · Il , A è una ma-trice (n− l)× (n− l) e C una matrice l × (n− l). Di conseguenza il polinomiocaratteristico di L è (per una nota proprietà del determinante)

CL(t) = det(t · In − L) = CD(t) · CA(t) = (t− λ)lCA(t) .

Per definizione di molteplicità algebrica si deve però anche poter scrivere CL(t) =(t − λ)kQ(t), dove Q(t) è un polinomio di grado n − k con Q(λ) 6= 0. Ciò èpossibile solo se l ≤ k.

Si può avere anche la disuguaglianza stretta Mgeom(λ) < Malg(λ). Ad esempio

la matrice( 1 1 1

0 1 10 0 1

)possiede il polinomio caratteristico C(λ) = (λ− 1)3 e quindi

l’unico autovalore λ = 1 ha molteplicità algebrica 3. Il sottospazio proprio E1

è l’asse delle ascisse, per cui la molteplicità geometrica di λ = 1 è 1. Tuttavia,nel caso di un’isometria si ha il risultato seguente, grazie al quale, nel seguito delcapitolo, potremo ricorrere sia ad argomenti algebrici sia ad argomenti geometrici.

Proposizione 2.15. Siano α : Rn −→ Rn un’isometria euclidea lineare e λ un suoautovalore, allora:

Malg (λ) = Mgeom (λ) .

Dimostrazione. Riprendiamo le notazioni del lemma 2.2 e della sua dimostra-zione per riscrivere L nella forma (

D C0 A

)

126 Le isometrie e la relatività ristretta

Utilizziamo ora l’ipotesi di isometricità osservando dapprima che λ 6= 0 in quanto,come sappiamo dalla proposizione 2.5, ogni isometria lineare è biiettiva, e quindiil suo nucleo è ridotto al solo vettore nullo. Inoltre L è ortogonale per ipotesi (lesue colonne sono le immagini date da α della base ortonormata B); in particolarele prime l colonne sono perpendicolari alle ultime n− l colonne. Da quest’ultimaproprietà e dal fatto ricordato poc’anzi che λ 6= 0, si deduce che C è la matricenulla. L è dunque una matrice diagonale a blocchi:

L =

(D 00 A

).

I polinomi caratteristici CL(t), CD(t) e CA(t) soddisfano allora (per proprietà notedel determinante)

CL(t) = CD(t) · CA(t) = (t− λ)l · CA(t) .

Si ha però anche, dato che k è la molteplicità algebrica di λ,

CL(t) = (t− λ)k ·Q(t)

per un opportuno polinomio Q(t) di grado n− k con Q(λ) 6= 0. Se assumiamoche l < k, CA(t) è a sua volta fattorizzabile come

CA(t) = (t− λ)k−l ·Q(t) .

Se ne deduce che λ è pure autovalore di A di molteplicità algebrica k− l: esisteallora un vettore non nullo w = (wl+1, . . . , wn)T ∈ Rn−l tale che Aw = λw. Lastruttura a blocchi di L ci consente di completare w con l’aggiunta di l componentiiniziali tutte nulle per ottenere un autovettore di L, che notiamo ancora w, conautovalore λ. Per costruzione w ∈ E⊥λ . D’altronde Eλ contiene per definizione tuttigli autovettori di L, dunque anche w. Questo contraddice la proprietà Eλ ∩ E⊥λ =

0. L’assunzione l < k conduce a una contraddizione. Quindi l = k.

Per ricostruire il gruppo delle isometrie valuteremo tutti i possibili casi (sono solosei) con uno oppure tre autovalori ±1, contati con le rispettive molteplicità (sivedano le proposizioni 2.11 e 2.14 .)Notiamo dapprima che nel caso di un unico autovalore reale questo non può averemolteplicità 2. Infatti, in tal caso il polinomio caratteristico sarebbe della formaCL(t) = a (t± 1)2(t∓ 1) con a reale 6= 0. Ci sarebbero quindi due autovalori reali,contrariamente all’ipotesi.Nel caso invece di due autovalori distinti (necessariamente 1 e −1) resta esclusala molteplicità 3, che ci riporterebbe al caso di un unico autovalore. Riassumendo,possono presentarsi i seguenti sei casi (λ denota l’unico autovalore reale, λ1, λ2

due autovalori reali distinti).

a) λ = 1 e Malg (1) = 1;

Emanuele Dotto, Fabrizio Pini 127

b) λ = 1 e Malg (1) = 3;

c) λ = −1 e Malg (−1) = 1;

d) λ = −1 e Malg (−1) = 3

e) λ1 = 1, λ2 = −1, Malg (1) = 1 (e quindi Malg (−1) = 2);

f) λ1 = 1, λ2 = −1, Malg (1) = 2 (e quindi Malg (−1) = 1).

Passiamo ora in rassegna i diversi casi.

a) λ = 1 e Malg (1) = 1.Per la proposizione 2.15 abbiamo Mgeom (1) = 1. Dato che il nostro scopo è dicaratterizzare soltanto il tipo di isometria possiamo supporre senza perdita digeneralità che e1 ∈ E1. Dato che dim E1 = 1 si ha

E1 = x = µe1 | µ ∈ R .

E1 è l’asse Ox1 ed è l’unica retta di punti fissi; non ce ne sono altre poiché lamolteplicità geometrica è 1. Siccome e1 ∈ E1, la prima colonna di L è Le1 = e1.Quindi L21 = L31 = 0. La base cartesiana (e1, e2, e3) è ortonormata quindi E⊥1 =

x = a e2 + b e3|a, b ∈ R che è il piano coordinato Ox2x3.

Visto che un’isometria conserva il prodotto scalare, e quindi l’ortogonalità, pertutti gli x ∈ E⊥1 si ha e1⊥Lx, dunque Lx ∈ E⊥1 . E⊥1 è un sottospazio invarianterispetto a L. In particolare δ (Le2, e1) = δ (Le3, e1) = 0, cioè L12 = L13 = 0.

La restrizione di L a E⊥1 è un’isometria di R2. La matrice rappresentativa di L puòavere quindi una delle due forme

Rθ =

1 0 00 cos θ − sin θ

0 sin θ cos θ

oppure Sθ =

1 0 00 cos θ sin θ

0 sin θ − cos θ

.

Per costruzione queste due matrici hanno entrambe l’autovalore 1; dobbiamo ve-rificare che sia il solo autovalore reale. Calcoliamo quindi i polinomi caratteristicidelle matrici trovate:

CRθ(t) = det (tI3 − Rθ) = (t− 1)

(t2 − 2t cos θ + 1

).

Il secondo fattore non deve annullarsi per t = 1 (si avrebbe Malg(1) ≥ 2) maneppure per t = −1 (si avrebbero due autovalori reali invece di uno). Questecondizioni sono verificate se e solo se cos θ 6= ±1, cioè se θ /∈ πZ.

CSθ(t) = det (tI3 − Sθ) = (t− 1)2 (t + 1) .

128 Le isometrie e la relatività ristretta

Si vede che Sθ possiede due autovalori reali distinti e non soddisfa quindi lecondizioni poste. In definitiva, nel caso in esame, la matrice ha la forma

L =

1 0 00 cos θ − sin θ

0 sin θ cos θ

a condizione che θ 6= kπ per tutti i valori interi di k. Si tratta di una rotazione diasse E1 e di ampiezza θ. Si noti che se θ è un multiplo pari di π, Rθ è l’identità,esclusa qui perché l’unico autovalore reale λ = 1 avrebbe molteplicità 3 (vediil caso (b)), mentre se θ è un multiplo dispari di π si avrebbero entrambi gliautovalori ±1 (vedi il caso (e)).

b) λ = 1 e Malg (1) = 3.Per la proposizione 2.15 il sottospazio proprio E1 ha dimensione Mgeom(1) = 3.Allora E1 = R3 e L è la matrice identità.

L =

1 0 00 1 00 0 1

.

c) λ = −1 e Malg (−1) = 1.Si ha Mgeom (−1) = 1. Come nel caso (a), senza perdere la generalità, possiamosupporre che e1 ∈ E−1. La prima colonna di L sarà Le1 = −e1; quindi L21 =

L31 = 0. Per l’isometricità Le2, Le3⊥e1, e quindi L12 = L13 = 0. La matrice dellarestrizione di L al piano coordinato Ox2x3 è della forma Rθ o Sθ . Dato che l’unicoautovalore reale di L deve essere −1 ritroviamo come nel caso (a) L = Rθ :

L =

−1 0 00 cos θ − sin θ

0 sin θ cos θ

purché θ non sia un multiplo intero di π. Se θ è un multiplo pari di π, si hannodue autovalori reali (si veda allora il caso (f)); se invece θ è un multiplo dispari diπ si ha Malg (−1) = 3 (si veda il caso (d)). L rappresenta la composizione dellasimmetria rispetto al piano coordinato Ox2x3 (si veda il caso (f) per la sua matrice)e della rotazione Rθ . In effetti

L =

−1 0 00 1 00 0 1

· 1 0 0

0 cos θ − sin θ

0 sin θ cos θ

Emanuele Dotto, Fabrizio Pini 129

d) λ = −1 e Malg (−1) = 3.Con un ragionamento analogo al caso in cui λ = 1 e Malg (1) = 3 otteniamo

L =

−1 0 00 −1 00 0 −1

.

Questa trasformazione, che cambia il segno delle componenti dei vettori, è chia-mata parità o simmetria centrale (di centro O). Si noti che in R2 la parità ha deter-minante +1 ed è la rotazione di ampiezza π; in R3 invece il determinante è −1 enon può essere vista come una rotazione.

e) λ1 = 1, λ2 = −1, Malg (1) = 1 e Malg (−1) = 2.Dalla proposizione 2.15 deduciamo che dim (E1) = 1 e dim (E−1) = 2. Si notiche autovettori corrispondenti ad autovalori diversi sono perpendicolari: se Lx = x eLy = −y si ha da un lato che δ(Lx, Ly) = −δ(x, y) dall’altro, per l’isometricità,che δ(Lx, Ly) = δ(x, y), per cui δ(x, y) = 0. x e y sono perpendicolari. Da questofatto si deduce che E⊥1 = E−1 e E⊥−1 = E1. Se, senza limitazione della generalità,supponiamo e1 ∈ E1 la prima colonna di L è Le1 = e1; dato che e2, e3 ∈ E−1 sihanno Le2 = −e2 come seconda e Le3 = −e3 come terza colonna. Quindi

L =

1 0 00 −1 00 0 −1

,

che è la matrice della rotazione di asse E1 e di ampiezza π.

f) λ1 = 1, λ2 = −1, Malg (1) = 2 e Malg (−1) = 1.Con un ragionamento analogo al caso precedente otteniamo

L =

−1 0 00 1 00 0 1

,

che è la matrice della simmetria rispetto al piano coordinato Ox2x3.

Per riassumere, il gruppo O(3) delle isometrie euclidee di R3 che fissano l’origineè formato da:

• identità (caso (b));

• rotazioni di ampiezza non nulla e asse passante per O (casi (a) e (e));

• simmetrie rispetto a un piano passante per O (caso (f))

• composizione di rotazioni il cui asse passa per O con la simmetria rispettoal piano passante per O e ortogonale all’asse di rotazione (caso (c));

130 Le isometrie e la relatività ristretta

• parità (caso (d));

• la composizione di un qualunque numero di trasformazioni del tipo prece-dentemente elencato.

Le trasformazioni dei casi (a), (b) e (e) (e le loro composizioni) hanno determinan-te +1 e formano il gruppo SO(3) delle rotazioni di R3 aventi centro O. È facileverificare che il gruppo SO(3) non è commutativo.Le trasformazioni dei casi (c), (d) e (f) hanno invece determinante −1 e possonoessere tutte rappresentate come composizione di una rotazione (eventualmenteuguale all’identità) e di una simmetria rispetto a un piano; la parità P ad esem-pio è la composizione della rotazione di ampiezza π attorno all’asse Ox1 e dellasimmetria rispetto al piano Ox2x3.

Le composizioni delle trasformazioni precedenti con una qualunque traslazionefornisce il gruppo di tutte le isometrie di R3.

3. Il gruppo di Galileo

Mostriamo ora come il gruppo O(3) possa essere ampliato per ottenere il cosid-detto gruppo di Galileo.Le isometrie di R3 agiscono nello spazio geometrico tridimensionale lasciandoinvariate le misure lineari e angolari. Siano Oxyz e O′x′y′z′ due riferimenti carte-siani in moto rettilineo uniforme uno rispetto all’altro. La presenza di un motoinduce a considerare anche la variabile temporale t accanto alle variabili spaziali x,y e z. Si ottiene così lo spazio-tempo. I riferimenti considerati ricevono anche la va-riabile temporale; li indicheremo con Otxyz rispettivamente O′t′x′y′z′. Un puntoP dello spazio-tempo precisa il quando e il dove si verifica un certo evento, e vienedenominato appunto evento. Un evento sarà (t, x, y, z) rispettivamente (t′, x′, y′, z′)a seconda del riferimento considerato. Le trasformazioni di Galileo esprimono ilpassaggio da un sistema all’altro.Gli invarianti del gruppo di Galileo sono

• gli intervalli temporali: entrambi gli osservatori legati ai due riferimenti misu-rano, fra due eventi qualsiasi, lo stesso intervallo temporale. In altri terminila durata di un processo è la stessa per tutti gli osservatori. In particolaredue eventi simultanei per un osservatore lo sono anche per l’altro.

• le distanze spaziali: i due osservatori misurano, fra due eventi simultaneiqualsiasi, la stessa distanza.

Supponiamo che gli orologi dei due riferimenti siano sincronizzati e che quandot = 0 si abbia anche t′ = 0; analogamente supponiamo che per t = t′ = 0 leorigini O e O′ dei due riferimenti coincidano. In altri termini consideriamo solo

Emanuele Dotto, Fabrizio Pini 131

trasformazioni che fissano l’origine. Le trasformazioni più generali si possonopoi ottenere componendo con delle traslazioni spazio-temporali (t, x, y, z) 7−→(t + t0, x + x0, y + y0, z + z0).Per iniziare, consideriamo il caso in cui i due riferimenti si muovono relativamentedi moto rettilineo uniforme. Sia v =

( vxvyvz

)la velocità di O′x′y′z′ relativa a Oxyz.

Un evento P avrà coordinate (t, x, y, z) rispetto a Otxyz e (t′, x′, y′, z′) rispetto aO′x′y′z′ collegate dalle formule

t′ = t

x′ = x− vx · ty′ = y− vy · tz′ = z− vz · t

.

Si noti che t = t′ deriva dall’ipotesi di sincronizzazione degli orologi e di coin-cidenza dell’origine temporale (t0 = 0 nelle traslazioni considerate sopra)5. Lamatrice di questa trasformazione è data da

L =

1 0 0 0−vx

−vy I3

−vz

,

dove I3 è la matrice identità di ordine 3. Col trascorrere del tempo gli assi x e x′,y e y′, z e z′ rimangono paralleli e concordi; in particolare sono coincidenti pert = 0. Nulla impedisce però di applicare al riferimento spaziale un’isometria Mdi R3. Si ottiene così la matrice

Lv,M =

1 0 0 0−vx

−vy M−vz

.

Per costruzione, Lv,M lascia invariati gli intervalli temporali e le distanze spaziali.Al variare di v in R3 e di M in O(3), le trasformazioni Lv,M formano il gruppodi Galileo. Verifichiamo che questo insieme di trasformazioni possiede effettiva-mente la struttura di gruppo.

Siano

Lv,M =

1 0 0 0−vx

−vy M−vz

e Lw,N =

1 0 0 0−wx

−wy N−wz

due trasformazioni di Galileo che interpretiamo come segue: Lw,N rappresenta ilpassaggio da un riferimento R a un riferimento R′ in moto con velocità w rispetto

5Si può considerare anche la trasformazione T con t = −t′ e v = 0 detta inversione del tempoampliando ulteriormente il gruppo di Galileo. Tuttavia non lo faremo.

132 Le isometrie e la relatività ristretta

a R; Lv,M rappresenta a sua volta il passaggio da R′ ad un riferimento R′′ in motocon velocità v rispetto a R′. Verifichiamo la stabilità del prodotto, che esprime ilpassaggio da R a R′′. Si trova agevolmente

Lv,M · Lw,N =

1 0 0 0−u1

−u2 M · N−u3

,

dove u = v + Mw è la velocità di R′′ rispetto a R. In particolare quando M èl’identità si ha u = v + w, relazione questa nota come Teorema di addizione del-le velocità. La composizione di due trasformazioni di Galileo resta dunque unatrasformazione di Galileo; più precisamente si ha

Lv,M · Lw,N = Lv+Mw,MN .

Rimane da provare l’esistenza dell’inversa. Sia Lv,M una qualsiasi trasformazio-ne di Galileo. Si verifica facilmente, utilizzando quanto precede e ricordandol’ortogonalità di M, che essa possiede l’inversa

(Lv,M)−1 =

1 0 0 0−ux

−uy MT

−uz

,

dove u = −MTv è la velocita di R rispetto a R′. Quindi

(Lv,M)−1 = L−MTv,MT .

Abbiamo così appurato che l’insieme delle trasformazioni di Galileo è un gruppo(il prodotto di matrici è anche associativo).

L’insieme degli elementi L0,M per M ∈ O(3) può essere identificato direttamentecon O(3), in modo che il gruppo di Galileo è effettivamente un ampliamento del gruppoortogonale come ci eravamo proposti di ottenere. La non commutatività di O(3)implica quella del gruppo di Galileo.Per il determinante di una trasformazione di Galileo si ha

det Lv,M = det M = ±1 .

Limitando M al gruppo delle rotazioni SO(3) si ottiene il sottogruppo del gruppodi Galileo, che, in analogia al caso del gruppo di Lorentz che discuteremo nellaprossima sezione, denominiamo gruppo proprio di Galileo. Esso comprende glielementi del gruppo di Galileo il cui determinante è +1 (e che non invertono ilsenso del tempo, ma avevamo già omesso l’inversione temporale T dal gruppoche abbiamo costruito, vedi la nota 5).Il gruppo di Galileo è un gruppo di matrici, dunque di trasformazioni lineari.Questo garantisce che traiettorie rettilinee si trasformino in traiettorie rettilinee.Tutti i riferimenti sono quindi inerziali (basta che uno lo sia).

Emanuele Dotto, Fabrizio Pini 133

Osservazione 3.1. Scrivendo (v, M) per Lv,M ci si accorge che le trasformazioniappartenenti al gruppo proprio di Galileo sono gli elementi del prodotto cartesia-no del gruppo R3 delle traslazioni con il gruppo SO(3) delle rotazioni. La leggedi composizione

(v, M) · (w, N) = (v + Mw, M · N)

trovata sopra, caratterizza allora il gruppo proprio di Galileo come prodotto semi-diretto del gruppo delle traslazioni e del gruppo delle rotazioni.

4. Il gruppo di Lorentz

Nell’ultima parte del XIX secolo la discussione della teoria di Maxwell ha con-dotto all’esperimento di Michelson e Morley (1887) inteso fra l’altro a mettere inevidenza la dipendenza della velocità c della luce dallo stato di moto relativo disorgente e osservatore. L’esito fu del tutto negativo. Fra le spiegazioni avanzateper questo fallimento figura quella, assunta poi da Albert Einstein come postulatodella sua teoria della relatività ristretta:

la velocità della luce è la stessa in tutti i sistemi di riferimento in moto relativouniforme rispetto alla sorgente.

La luce emessa al tempo t = 0 dall’origine di un riferimento Ox1x2x3 si propagacome un’onda sferica, diffondendosi in tutte le direzioni. Possiamo così descrivereil comportamento del fronte d’onda:

x21 + x2

2 + x23 = c2t2 ,

che rappresenta, per ogni t, una superficie sferica di raggio c|t| nello spazio geo-metrico tridimensionale; nello spazio-tempo quadrimensionale, ciascuna sfera èsezione di un’iperpiano t = costante con una superficie conica, detta cono di luce.Introducendo x0 = ct al posto della sola variabile temporale, l’equazione del conodi luce è

x20 − x2

1 − x22 − x2

3 = 0 .

Per il postulato di Einstein la stessa equazione deve essere valida in un qualsiasiriferimento O′x′1x′2x′3 in moto uniforme relativamente al primo. In altri termini sidovrà avere

x20 − x2

1 − x22 − x2

3 = x′20 − x

′21 − x

′22 − x

′23 = 0 ,

il che sembrerebbe suggerire che la trasformazione che descrive il passaggio daun riferimento all’altro lasci invariata la forma quadratica

Q(x) = x20 − x2

1 − x22 − x2

3 .

134 Le isometrie e la relatività ristretta

Qui di seguito proveremo questa invarianza.

Sia g la matrice

g =

1 0 0 00 −1 0 00 0 −1 00 0 0 −1

e sia G la forma bilineare simmetrica e non degenere di matrice g:

G(x, y) = xTgy

per x, y ∈ R4. Si noti che Q(x) = xTgx = G(x, x) per tutti gli x.Sia L (la matrice del-)la trasformazione lineare che descrive il passaggio dal riferi-mento Ox0x1x2x3 al riferimento O′x′0x′1x′2x′3. Come dimostrato in 2.4, la linearitàè conseguenza dell’invarianza della forma G rispetto alla trasformazione. Essagarantisce che traiettorie rettilinee in un riferimento siano tali anche nell’altro; inaltri termini tutti i riferimenti considerati sono inerziali. La linearità impone inol-tre che per x0 = x1 = x2 = x3 = 0 si abbia anche x′0 = x′1 = x′2 = x′3 = 0. Ciònon è restrittivo in quanto, come sappiamo, il caso generale può essere ottenutocomponendo L con le traslazioni spazio-temporali.Per il postulato di Einstein, le forme quadratiche Q(x) e Q(Lx) si annullano en-trambe per (x1, x2, x3) fissato quando x0 = ±|x| dove |x| è la norma euclidea√

x21 + x2

2 + x23. Allora per tutti gli x ∈ R4 si ha

Q(Lx) = λ(x0 − |x|)(x0 + |x|) = λ(x20 − |x|2) = λ(x2

0 − x21 − x2

2 − x23) = λQ(x) .

Il caso λ 6= 1 corrisponde a un cambiamento dell’unità di misura, che non èrilevante ai nostri fini. La trasformazione lineare L soddisfa quindi la condizionexTgx = Q(x) = Q(Lx) = (Lx)TgLx = xT LTgLx per tutti gli x ∈ R4 e non soltantoquando Q si annulla. Per il teorema 2.9 L è allora un’isometria rispetto alla formabilineare simmetrica e non degenere G e per il teorema 2.8 si ha

LTgL = g .

Dato che G non è degenere, per il teorema 2.12 l’insieme delle trasformazioni Lche soddisfano questa relazione è un gruppo, il gruppo di Lorentz.

Il gruppo di Lorentz, che noteremo con L, si caratterizza dunque come il gruppodelle isometrie lineari relative alla forma bilineare simmetrica e non degenere G. Vedre-mo in seguito che L è, come il gruppo di Galileo, un ampliamento del gruppoortogonale O(3). Possiamo però notare una differenza sostanziale con il gruppodi Galileo, che è il gruppo di simmetria della meccanica classica. In quest’ultimaspazio e tempo sono considerati come entità distinte, e questo emerge bene anchedalla costruzione del gruppo di Galileo che abbiamo fatto, dove abbiamo impostoseparatamente l’invarianza degli intervalli temporali e quella delle distanze spazia-li. Per contro, le trasformazioni del gruppo di Lorentz sono isometrie relative ad

Emanuele Dotto, Fabrizio Pini 135

una (pseudo-)metrica che unifica coordinate spaziali e temporali.Lo spazio R4 munito della forma bilineare simmetrica e non degenere G è lospazio-tempo di Minkowski M. Ci sono tre classi di vettori in M:

1) i vettori x di tipo tempo per i quali G(x, x) > 0;

2) i vettori y di tipo spazio per i quali G(y, y) < 0;

3) i vettori z di tipo luce per i quali G(z, z) = 0.

Ognuna delle tre classi di viene trasformata in se stessa da una trasformazione diLorentz, poiché G(x, x) resta costante.

Vediamo ora qualche proprietà di L.

Proposizione 4.1. Sia L ∈ L, allora LT ∈ L.

Dimostrazione. Riprendiamo l’equazione LTgL = g e moltiplichiamola da sini-stra per g, ottenendo gLTgL = I4. Moltiplichiamo ancora da sinistra per L e otte-niamo LgLTgL = L. Infine moltiplicando da destra per L−1g otteniamo LgLT = g,che è il risultato cercato.

Proposizione 4.2. Per tutti gli L ∈ L si ha det L = ±1.

Dimostrazione. La proposizione è una conseguenza del teorema 2.10.

Ad esempio hanno determinante −1 l’inversione temporale T e la parità P:

T =

−1 0 0 0

0 1 0 00 0 1 00 0 0 1

e P =

1 0 0 00 −1 0 00 0 −1 00 0 0 −1

.

Le trasformazioni di Lorentz con determinante +1 formano un sottogruppo di Lcomprendente ad esempio le rotazioni spaziali ma anche la composizione PT.

Proposizione 4.3. Sia L ∈ L. Allora L00 ≥ 1 oppure L00 ≤ −1.

Dimostrazione. Consideriamo la relazione LTgL = g, e osserviamo che da essasi deduce

L0uL0k −3

∑j=1

LjuLjk =

0 per u 6= k1 per u = k = 0−1 per u = k 6= 0

. (1)

Se consideriamo in particolare il caso in cui u = k = 0 abbiamo

L200 − L2

10 − L220 − L2

30 = 1,

e quindi L200 ≥ 1, cioè L00 ≥ 1 o L00 ≤ −1.

136 Le isometrie e la relatività ristretta

Dato chect′ = L00 · ct + termini indipendenti da t

si vede che il tempo t′ cresce al crescere di t quando L00 ≥ 1 mentre decresce alcrescere di t quando L00 ≤ −1.Componendo due trasformazioni L1, L2, nessuna delle quali inverte il senso deltempo, se ne ottiene una terza con la stessa proprietà. Analogamente, se L noninverte il senso del tempo, anche l’inversa L−1 gode della stessa proprietà. Quindil’insieme delle trasformazioni di Lorentz L con L00 ≥ 1 è un sottogruppo di L,detto gruppo ortocrono.

Se teniamo conto dei due possibili valori ±1 del determinante e dei due possibilisegni dell’elemento L00 vediamo che il gruppo di Lorentz L può essere scompostoin quattro sottoinsiemi:

(1) L+ = L ∈ L|det L = 1 ,

(2) L− = L ∈ L|det L = −1 ,

(3) L↑ = L ∈ L|L00 ≥ 1 ,

(4) L↓ = L ∈ L|L00 ≤ −1 .

Abbiamo già mostrato che L+ e L↑ sono dei sottogruppi di L; dunque anche laloro intersezione

L↑+ = L+ ∩ L↑ = L ∈ L|det L = 1 e L00 ≥ 1 ,

chiamata gruppo proprio di Lorentz, formato dalle trasformazioni che conserva-no la direzione temporale (dette ortocrone) e l’orientamento spaziale.L− e L↓ non sono dei sottogruppi in quanto, ad esempio, non contengono l’iden-tità.

Nel seguito ci concentriamo sul gruppo proprio di Lorentz e su alcuni importantisuoi sottogruppi.

4.1. Il gruppo proprio di Lorentz in R2

Ci occuperemo ora della costruzione del gruppo proprio di Lorentz a 1 + 1 di-mensioni (una temporale e l’altra spaziale). In questo caso la matrice della formabilineare G è

g =

(1 00 −1

).

Poniamo L =

(L00 L01

L10 L11

)per una generica trasformazione di Lorentz in 1 + 1

dimensioni.

Emanuele Dotto, Fabrizio Pini 137

La condizione LTgL = g si traduce nel sistemaL2

00 − L210 = 1

L201 − L2

11 = −1

L00L01 − L10L11 = 0.

Ricordando la formula della trigonometria iperbolica

cosh2 x− sinh2 x = 1, ∀x ∈ R ,

vediamo che esistono θ ∈ R e φ ∈ R tali che L00 = cosh θ , L10 = sinh θ, L01 =

sinh φ e L11 = cosh φ. La terza equazione del sistema impone:

cosh(θ) sinh(φ)− sinh(θ) cosh(φ) = 0 .

Dato che cosh(θ) sinh(φ) − sinh(θ) cosh(φ) = sinh(θ − φ) e dato che il senoiperbolico si annulla solo in zero otteniamo θ = φ. Poniamo

Lθ =

(cosh θ sinh θ

sinh θ cosh θ

).

Le trasformazioni Lθ sono dette Lorentz-boost o rotazioni iperboliche. Si noti cheper ogni θ si ha det Lθ = +1 e (Lθ)00 = cosh θ ≥ 1. Inoltre per tutti i θ1, θ2 ∈ R siha

Lθ1 Lθ2 = Lθ1+θ2 = Lθ2 Lθ1 ;

in particolare Lθ L−θ = I2, cioè

(Lθ)−1 = L−θ .

L’insieme dei Lorentz-boost è dunque un gruppo commutativo le cui proprietàrendono naturale la denominazione di gruppo proprio di Lorentz in dimensione 1 + 1.

Consideriamo il moto di O′: la sua posizione vista da O è x1 = vt = vc x0 e

ovviamente x′1 = 0. Facendo uso della trasformazione di Lorentz si ha

x′1 = x0 sinh θ + x1 cosh θ = x0(sinh θ +vc

cosh θ) = 0 .

Possiamo perciò concludere che

vc= − sinh θ

cosh θ= − tanh θ.

Solitamente la relazione fra θ e v viene data come v/c = + tanh θ. In effettipossiamo riparametrizzare i Lorentz-boost con il parametro χ = −θ in modo cheil generico boost diventi

Lχ =

(cosh χ − sinh χ

− sinh χ cosh χ

)

138 Le isometrie e la relatività ristretta

e quindi v/c = tanh χ. Al variare di χ (e quindi di θ) in R si ha −1 < v/c < +1:la velocità v deve essere inferiore a quella della luce6.

Ricorrendo alle formule

cosh θ =1√

1− tanh2 θ, sinh θ =

tanh θ√1− tanh2 θ

.

di trigonometria iperbolica e alla relazione tanh θ = −v/c appena ottenuta pos-siamo eliminare il parametro θ dall’espressione dei Lorentz-boost

x′0 =x0 − v

c x1√1− v2

c2

, x′1 =x1 − v

c x0√1− v2

c2

Questa è la forma della trasformazione di Lorentz che appare di solito nei testi.

4.2. Il gruppo proprio di Lorentz in R4

Siamo interessati a trovare un modo per caratterizzare tutte le trasformazioniproprie di Lorentz in R4. Consideriamo dapprima un Lorentz-boost a quattrodimensioni:

Lθ =

cosh θ 0 0 sinh θ

0 1 0 00 0 1 0

sinh θ 0 0 cosh θ

, (2)

dove θ può variare in R. Lθ rappresenta il passaggio da un riferimento Ox1x2x3

a un riferimento O′x′1x′2x′3 in moto con velocità v lungo l’asse Ox3 (infatti x′1 = x1

e x′2 = x2, solo x0 e x3 variano). La dimostrazione della proposizione seguen-te è semplice richiamandosi a quanto mostrato a proposito dei Lorentz-boost indimensione 1 + 1.

Proposizione 4.4. L’insieme delle trasformazioni (2) è un sottogruppo commutativo delgruppo proprio di Lorentz L↑+.

Si badi che la proposizione considera tutti i boost lungo la stessa direzione x3. Piùin generale la proposizione è valida per tutti i boost lungo una direzione qualsiasi,ma non è più corretta se si compongono boost lungo direzioni diverse.

6Il prodotto c · χ è detto rapidità. È una delle diverse formalizzazioni della nozione empirica divelocità nel contesto relativistico. Si vedano J.M. Lévy-Leblond, Speed(s), Am.J.Phys 48(5),May 1980 eH.Blatter, T.Greber, Geschwindigkeit und relativistische Dynamik, MNU 56/8, 1,12.2003.

Emanuele Dotto, Fabrizio Pini 139

Sia R ∈ SO(3) la matrice di una rotazione spaziale e poniamo

L(R) =

1 0 0 000 R0

. (3)

L(R) è una trasformazione che applica una rotazione alle componenti spazialix1, x2, x3 ma lascia invariata la componente temporale x0.

Proposizione 4.5. L(R) ∈ L↑+

Dimostrazione. In primo luogo è immediato verificare che L(R)TgL(R) = g,quindi che L(R) ∈ L. Inoltre det L(R) = det(R) = 1, così che L(R) ∈ L+.Inoltre, per definizione, (L(R))00 = 1 e dunque L(R) ∈ L↑. Se ne deduce cheL(R) ∈ L↑+.

Proposizione 4.6. L’insieme delle trasformazioni L(R) può essere identificato con SO(3).Quindi il gruppo proprio di Lorentz è un ampliamento del gruppo delle rotazioni spaziali.

Dimostrazione. Basta osservare che per R1, R2, R ∈ SO(3) si ha

L(R1)L(R2) = L(R1R2) e L(R)−1 = L(R−1) = L(RT) = L(R)T.

Abbiamo ora a disposizione due sottogruppi di L↑+, quello dei Lorentz-boost Lθ equello delle rotazioni spaziali LR, che ci permettono di costruire il gruppo propriodi Lorentz.

Il seguente risultato caratterizza il gruppo proprio di Lorentz ricorrendo unica-mente ai Lorentz-boost lungo una direzione (qui l’asse x3) e le rotazioni spaziali7.

Proposizione 4.7. Tutte le matrici L ∈ L↑+ sono della forma

L = L(R1) Lθ L(R2) ,

dove L(Ri) per i = 1, 2 è una rotazione come in (3), e Lθ è un Lorentz boost come in (2).

Dimostrazione. Sia L ∈ L↑+. Estraiamo il vettore (in grassetto indichiamo i vet-tori dello spazio tridimensionale) f = (L10, L20, L30) 6= 0 e normalizziamolo cosìda ottenere un vettore unitario

e3 = λf = (c1, c2, c3) , c21 + c2

2 + c23 = 1.

Se f = 0, applicando la relazione LTgL = g si ottiene che L01 = L02 = L03 = 0 equindi L è la matrice di una rotazione L(R).

7Si veda la sezione 0.1 di G. Scharf, Finite Quantum Electrodynamics, Springer-Verlag, Berlin, 1989 ela sezione 5.5 di N.M.J. Woodhouse, Special Relativity, Springer, London 2003.

140 Le isometrie e la relatività ristretta

Scegliamo poi due vettori unitari e1 = (a1, a2, a3) e e2 = (b1, b2, b3), cosí da com-pletare e3 in una base ortonormata di R3 (relativa al prodotto scalare standard)con orientamento positivo, i.e.

det(e1, e2, e3) = 1.

La trasformazione

L(R1) =

1 0 0 00 a1 b1 c1

0 a2 b2 c2

0 a3 b3 c3

è una delle rotazioni spaziali (3), dato che l’orientamento dei vettori di base èpreservato. Visto che R1 soddisfa RT

1 R1 = I3 (cfr. 2.9) la rotazione inversa è datadalla trasposta

L(R1)−1 = L(R1)

T =

1 0 0 00 a1 a2 a3

0 b1 b2 b3

0 c1 c2 c3

.

Moltipicando L(R1)−1 e L si ottiene

L(R1)−1 L =

L00 L01 L02 L03

0 d11 d12 d13

0 d21 d22 d23

d30 d31 d32 d33

, dij ∈ R.

Questa matrice appartiene al gruppo L↑+, essendo prodotto di due suoi elementi(cfr la proposizione 4.5).

Gli zeri della prima colonna sono dovuti al fatto che f,e2 e e3 sono perpendicolari(sempre relativamente al prodotto scalare standard):

3

∑j=1

ajLj0 =3

∑j=1

ajλ cj = 0 ,3

∑j=1

bjLj0 =3

∑j=1

bjλ cj = 0.

La prima riga rimane invariata perché ogni suo elemento è il prodotto scalaredella colonna corrispondente della matrice L della prima riga di R−1

1 . Inoltrel’elemento d30 è dato da

d30 =3

∑j=1

L0jcj = λ3

∑j=1

c2j = λ.

Le altre componenti dij dipendono dalla scelta di e2, e3.Mostriamo ora che i due vettori f1 = (d11, d12, d13) e f2 = (d21, d22, d23) sonoortonormati nello spazio euclideo. Consideriamo la seconda e la terza colonna r1

Emanuele Dotto, Fabrizio Pini 141

e r2 della matrice(

L(R1)−1L

)T (si tratta sostanzialmente di f1, f2 con l’aggiuntadella componente 0)

r1 =

0

d11

d12

d13

, r2 =

0

d21

d22

d23

.

Dato che per la proposizione 4.1 la matrice(

L(R1)−1L

)T appartiene al gruppo diLorentz, abbiamo

rT1 gr2 = 0 , rT

i gri = 1 per i = 1, 2.

Segue così che

3

∑j=1

d1j d2j = 0 e3

∑j=1

d2ij = 1 = ‖fi‖2 per i = 1, 2 .

Abbiamo quindi verificato che f1 e f2 sono due vettori ortogonali e unitari. Con-sideriamo inoltre un terzo vettore f3 = (g1, g2, g3) così da ottenere una baseortonormata positiva (f1, f2, f3). Come precedentemente costruiamo la matrice

L(R2)−1 =

1 0 0 00 d11 d21 g1

0 d12 d22 g2

0 d13 d23 g3

.

Per costruzione delle basi ortonormate sinora definite otteniamo il prodotto

L(R1)−1 L L(R2)

−1 =

L00 0 0 h03

0 1 0 00 0 1 0

d30 0 0 h33

,

che appartiene al gruppo proprio di Lorentz. Gli zeri nell’ultima colonna si dedu-cono dalla perpendicolarità di f3 rispetto a f1 e a f2. Gli zeri nella prima e ultimariga derivano ancora una volta dalla relazione LTgL = g applicata alla matriceL(R1)

−1L.

Possiamo infine trovare le relazioni fra i quattro elementi ancora incogniti, semprepartendo dalla formula (1) ottenuta nella dimostrazione della proposizione 4.3:

L200 − d2

30 = 1 , h203 − h2

33 = −1 , L00h03 − d30h33 = 0 .

142 Le isometrie e la relatività ristretta

Come nel caso dei Lorentz boost in dimensione 1 + 1, abbiamo

L00 = h33 = cosh(θ) e d30 = h03 = sinh(θ) , θ ∈ R.

Otteniamo quindi

L(R1)−1 L L(R2)

−1 = Lθ ,

che può essere riscritto nella forma cercata

L = L(R1) Lθ L(R2) .

Dalla dimostrazione appena conclusa risulta chiaro che R1, R2 e θ non sono uni-vocamente determinati.Il risultato appena ottenuto mostra come l’unica “novità” nel passaggio dal grup-po classico SO(3) al gruppo relativistico L↑+ siano i Lorentz-boost.

5. Oscillatore armonico relativistico

Nella letteratura scientifica non si trova una definizione univoca di oscillatorearmonico relativistico. Proponiamo qui una definizione piuttosto elementare apartire da una situazione operativamente assai semplice: un osservatore solidalecon un corpo in movimento e munito di un orologio e di un accelerometro misu-ra l’accelerazione in funzione del tempo. Se l’andamento è sinusoidale il moto èarmonico.Per cominciare ricordiamo alcuni concetti e proprietà, in particolare il tempo pro-prio, la quadrivelocità e la quadriaccelerezione8.Il tempo proprio τ è il tempo rilevato da un orologio solidale con il fenomeno di cuisi misura la durata (ad esempio una massa in movimento da un punto all’altrolungo una determinata traiettoria). Il tempo t di un sistema di riferimento spazio-temporale è detto tempo coordinato. Se v è la velocità istantanea di un corpo in talesistema e γ(v) = 1/

√1− v2/c2 si ha

dtdτ

= γ(v) .

τ è un invariante rispetto alle trasformazioni di Lorentz. Per questo si prestaparticolarmente bene a parametrizzare le traiettorie nello spazio-tempo (dette lineed’universo). La quadrivelocità è definita come V = (V0, V1, V2, V3), dove

V0 =dx0

dτ, V1 =

dx1

dτ, V2 =

dx2

dτ, V3 =

dx3

8Si veda il cap. 6 di N.M.J. Woodhouse, Special Relativity, Springer, London 2003.

Emanuele Dotto, Fabrizio Pini 143

con x0 = ct. L’invarianza di τ rispetto ad ogni cambiamento di riferimento implicache la quadrivelocità V si trasforma come (x0, x1, x2, x3), cioè tramite la corrispon-dente trasformazione di Lorentz. Si ha (per questa e altre relazioni si rimanda altesto di Woodhouse citato in nota)

V = γ(v)(c, v) ,

dove v è l’abituale velocità tridimensionale (dx1/dt, dx2/dt, dx3/dt) e v il suo mo-dulo.Analogamente si può definire la quadriaccelerazione A = (A0, A1, A2, A3), dove

A0 =dV0

dτ, A1 =

dV1

dτ, A2 =

dV2

dτ, A3 =

dV3

dτ.

Anche la quadriaccelerazione, grazie all’invarianza del tempo proprio, si tra-sforma, in un cambiamento di riferimento, con la trasformazione di Lorentzcorrispondente. Si ha

A =vγ(v)4

c2dvdt

(c, v) + γ(v)2(0,dvdt

) .

Consideriamo un corpo (supposto puntiforme) che esegue un moto qualsiasi. Adogni istante gli possiamo associare il riferimento inerziale con origine nel corpoe nel quale quest’ultimo è istantaneamente in quiete. Lo chiamiamo riferimentoistantaneamente a riposo.

Per le relazioni date in precedenza, quando v = 0 si ha

V = (c, 0) , A = (0, a) ;

a = dv/dt è l’accelerazione tridimensionale misurata nel riferimento istantanea-mente a riposo. Sia G(u, v) = u0v0 − u1v1 − u2v2 − u3v3 la forma bilineare di Min-kowski. Considerando il riferimento inerziale Ox0x1x2x3 e quello istantaneamentea riposo e ricordando l’invarianza di G rispetto alle trasformazioni di Lorentz siottiene in tutti i sistemi inerziali

G(A, V) = 0 , G(V, V) = c2 , G(A, A) = −a2 ,

dove a è il modulo dell’accelerazione dv/dt nel riferimento istantaneamente ariposo, quella cioè sperimentata da un’osservatore che accompagna il corpo nelsuo moto.

Per introdurre l’oscillatore armonico ci limitiamo alla dimensione 1 + 1 (unatemporale ct = x0 e una spaziale x = x1).

Chiamiamo oscillatore armonico un corpo la cui accelerazione nel riferimentoistantaneamente a riposo è della forma

a(τ) = a0 cos(ωτ + δ) ,

144 Le isometrie e la relatività ristretta

dove a0, ω, δ sono dei numeri reali con a0 6= 0, ω > 0.Questa definizione ci appare semplice e naturale nella misura in cui essa di-pende solo da grandezze misurabili nel riferimento non inerziale del corpo inmovimento (tempo proprio e accelerazione).

A partire dall’accelerazione ricaviamo la quadrivelocità (t, x) e quindi tempocoordinato e posizione (t, x) in funzione del tempo proprio.

Le relazioni G(V, V) = c2 e G(A, A) = −a2 si esprimono come (il punto “ ˙ ”denota sempre la derivazione rispetto a τ)

c2 t2 − x2 = c2

c2 t 2 − x2 = −a(τ)2(1)

Dalla prima equazione si deduce l’esistenza di λ = λ(τ) ∈ R tale chet = cosh(λ(τ))

x = c sinh(λ(τ)) .(2)

λ(τ) e t sono a-dimensionali mentre x ha la dimensione di una velocità. Dalla (2)si ricava

t = λ(τ) sinh(λ(τ))

x = c λ(τ) cosh(λ(τ)).

Si noti che anche l’equazione G(A, V) = 0 risulta soddisfatta. Sostituendo x e tnella seconda equazione del sistema (1) otteniamo

c2λ(τ)2 sinh2(λ(τ))− c2λ(τ)2 cosh2(λ(τ)) = −a(τ)2,

che possiamo semplificare in

λ(τ) =a(τ)

c=

a0

ccos(ωτ + δ).

Integrando troviamo λ(τ) = a0c ω sin(ωτ + δ) + λ0 , dove λ0 è una costante di

integrazione che sarà determinata fra breve. cλ = cλ(τ) è la rapidità, connessacon la velocità v mediante la relazione tanh λ = v/c. Infatti

tanh λ =sinh λ

cosh λ=

1c· x

t=

1c· dx

dt=

vc

.

Le componenti non nulle c t e x della quadrivelocità sono date dac t = c cosh

( a0c ω sin(ωτ + δ) + λ0

)x = c sinh

( a0c ω sin(ωτ + δ) + λ0

) .

Integrando ancora una volta otteniamo

t(τ) =∫ τ

0cosh(λ(s)) ds e x(τ) = x0 + c

∫ τ

0sinh(λ(s)) ds .

Emanuele Dotto, Fabrizio Pini 145

Abbiamo posto t = 0 per τ = 0. x0 è il valore iniziale (per t = τ = 0) dellaposizione x.

Scegliamo λ0 in modo tale che i valori vmax e vmin della velocità soddisfino vmin =

−vmax. Ciò corrisponde alla scelta del riferimento inerziale in modo che la suaorigine sia fissa nel punto d’equilibrio dell’oscillatore, come avviene solitamentenel caso classico. La rapidità cλ(τ), e quindi la velocità v = c tanh λ, è massimarispettivamente minima quando sin(ωτ + δ) = ±1; in tal caso si ha (supponendoa0 > 0; se a0 < 0 occorre scambiare fra loro i valori dati per vmax e vmin)

vmax = c tanh( a0

c ω+ λ0

)e vmin = c tanh

(− a0

c ω+ λ0

).

vmin = −vmax corrisponde a λ0 = 0, così che la rapidità è

cλ(τ) =a0

ωsin(ωτ + δ) .

L’intervallo di tempo proprio trascorso fra due passaggi successivi dal punto diequilibrio (ad esempio il primo con velocità vmax e il successivo con velocità vmin

o viceversa) è uguale a mezzo periodo di λ(τ), ossia T/2 = π/ω. È questala durata che un’osservatore solidale con la massa oscillante legge sul proprioorologio. Un secondo osservatore fisso nel punto d’equilibrio misurerà, in tempocoordinato, un tempo T′/2 maggiore, dato da

T′/2 =∫ π/ω

0cosh(λ(s)) ds ≥ T/2 .

La disuguaglianza T′ ≥ T segue dal fatto che cosh λ ≥ 1 per tutti i λ reali. Siritrova così il cosiddetto paradosso dei gemelli: per l’osservatore in moto con lamassa oscillante il tempo trascorre più lentamente. Di conseguenza l’osservatoreinerziale misurerà una frequenza ν′ = 1/T′ inferiore a ν = 1/T rilevata dall’o-peratore solidale con il corpo in movimento. Si ha quindi una sorta di redshiftdiverso da quello cosmologico, da quello gravitazionale e ancora da quello daeffetto Doppler.

Per snellire la scrittura consideriamo ora solo il caso in cui δ = π/2. In questocaso

a(τ) = −a0 sin(ωτ) e λ(τ) =a0

c ωcos(ωτ) ,

per cui si ottiene, ponendo α = a0c ω ,

t(τ) =∫ τ

0cosh(α cos(ωs))ds ,

x(τ) = c∫ τ

0sinh(α cos(ωs))ds .

(3)

Siccome a(0) = 0, l’oscillatore si trova inizialmente nel punto d’equilibrio. Ab-biamo quindi posto x0 = x(0) = 0. Da v(t) = c tanh(λ(τ(t))) si ottiene comevelocità iniziale v0 = v(0) = c tanh(λ(0)) = c tanh (α) e quindi sempre |v0| < c .

146 Le isometrie e la relatività ristretta

Nel caso non relativistico da a(t) = −a0 sin(ωt) si ricavano la velocità istantaneav(t) = a0

ω cos(ωt), che coincide con la rapidità cλ(t) del problema relativistico, ela posizione x(t) = a0

ω2 sin(ωt).

Il limite classico si ottiene per α → 0 e corrisponde a |v0| c. mentre il caso rela-tivistico estremo corrisponde a |α| → ∞. Calcoliamo gli integrali (3) sviluppandogli integrandi in serie di potenze di α e troncando lo sviluppo dopo il secondotermine. Partendo da

t(τ) = cosh(α cos(ωτ)) = 1 +α2

2cos2(ωτ) + O(α4) ,

per integrazione, si ottiene

t(τ) =∫ τ

0(1 +

α2

2cos2(ωs))ds + O(α4) =

= τ +α2

2· 2ωτ + sin(2ωτ)

4ω+ O(α4) ;

(4)

si nota che, come atteso, il limite non relativistico è t = τ: tempo proprio e tempocoordinato coincidono. Si riconosce altresì la prima correzione relativistica.Inoltre

x(τ) = c sinh(α cos(ωτ)) = c α cos(ωτ) + cα3

6cos3(ωτ) + O(α5) .

Il limite non relativistico della la velocità è

v(t) = c α cos(ωt) =a0

ωcos(ωt) .

Integrando x(τ) otteniamo finalmente la posizione x in funzione del tempo pro-prio τ:

x(τ) = c∫ τ

0(α cos(ωs) +

α3

6cos3(ωs))ds + O(α5) =

=a0

ω2 sin(ωτ) + cα3

6· 9 sin(ωτ) + sin(3ωτ)

12ω+ O(α5) .

(5)

Il limite non relativistico è ancora una volta l’espressione classica:

x(t) =a0

ω2 sin(ωt) .

Nel caso relativistico, x(τ) non contiene solo la frequenza fondamentale ω, comeper l’oscillatore classico, ma anche le armoniche superiori: nella prima correzionerelativistica, proporzionale ad α3, appare anche la frequenza 3 ω. Un’analisi diFourier potrebbe confermare o smentire la congettura che nelle correzioni succes-sive appaiano le frequenze 5 ω, 7 ω . . . .Osservando poi lo sviluppo di t(τ), si potrebbe ulteriormente congetturare chele sue correzioni relativistiche contengano solo i multipli pari della frequenzafondamentale9.

9Dimostreremo queste congetture nell’Appendice 1, dove mostreremo anche l’esistenza di unacostante m = m(α) con la proprietà che t(τ)−mτ è 2π-periodica.

Emanuele Dotto, Fabrizio Pini 147

Osservazione 5.1. Abbiamo già osservato in precedenza come non sembri esiste-re nella letteratura una definizione univoca di moto armonico relativistico. Defi-nizioni non equivalenti possono condurre tutte al limite non relativistico corretto.Invece di partire dall’accelerazione a(τ) chiedendo che abbia una forma sinusoi-dale, avremmo potuto imporre che x(τ) = x0 sin(ωτ), per poi ridiscendere finoall’accelerazione a(τ) passando per la quadrivelocità e la rapidità. Avremmo ot-

tenuto a(τ) = −ω2x0 sin(ωτ)/√

1 + ω2x20

c2 sin2(ωτ). In definitiva la scelta ci parea volte una questione di gusto. Abbiamo già spiegato perché la nostra ci sem-bra più semplice e naturale. Le considerazioni svolte qui sono esclusivamentecinematiche È possibile che mettendo in gioco la dinamica si trovino modelli dif-ferenti e più appropriati10. Inoltre manca naturalmente un sistema fisico reale acui applicare il modello.

Esempio 5.1. Presentiamo ora un esempio che mette in evidenza alcune peculia-rità del nostro oscillatore.Per alleggerire la scrittura scegliamo le unità di spazio e di tempo in modo chec = 1 e ω = 1. In tal caso si ha a0 = α. Il caso relativistico estremo corrispondea α → ±∞, ma già solo per α = 2 la velocità iniziale v0 = tanh(α) supera il 95%della velocità della luce.

Le formule viste nella (3) diventano

t(τ) =∫ τ

0cosh(α cos(s))ds ,

x(τ) =∫ τ

0sinh(α cos(s))ds .

(6)

A loro volta i limiti non relativistici di t(τ) e di x(τ) sono

t(τ) = τ , xNR(τ) = α sin(τ) . (7)

Il periodo dell’oscillazione se misurato in tempo proprio nel riferimento solidalecon l’oscillatore è T = 2π, mentre quello registrato dall’osservatore inerziale è(senza rischio di confusione lo notiamo T invece di T′ come in precedenza)

T(α) = 4∫ π/2

0cosh(α cos(s))ds = 2π I0(α) . (8)

L’ampiezza dell’oscillazione nel riferimento inerziale è

xmax(α) = x(π/2) =∫ π/2

0sinh(α cos(s)ds =

π

2L0(α) . (9)

Le funzioni In(α) e Ln(α) (qui con n = 0) sono rispettivamente le funzioni diBessel modificate di prima specie e le funzioni di Struve modificate11. Notiamo

10Un approccio alla dinamica viene presentato nell’Appendice 2.11Si veda Abramowitz M., Stegun I.A., Handbook of Mathematical Functions, New York, 1972.

148 Le isometrie e la relatività ristretta

che il periodo T(α) dipende per il tramite di α dall’ampiezza xmax, come nel casodel pendolo e diversamente dall’oscillatore armonico classico.

Nella figura 1 riportiamo l’incremento percentuale (T(α)− 2π)/2π del periodorispetto al suo limite non relativistico, che è costante = 2π.Per l’osservatore inerziale il periodo cresce esponenzialmente con α (come le fun-zioni di Bessel In(α)). Ad esempio si ha T(0.1) = 6.29, T(0.5) = 6.68, T(1) = 7.95,T(1.5) = 10.35, T(2) = 14.32, T(3) = 30.67, tutti valori questi da confrontare con6.28 del caso non relativistico.

0.0 0.5 1.0 1.5 2.0Α

20

40

60

80

100%

Figura 1

Nella figura 2 rappresentiamo in funzione di α l’incremento percentuale (xmax(α)−α)/α dell’ampiezza d’oscillazione rispetto al suo valore non relativistico α. An-che le funzioni di Struve Ln(α) esibiscono una crescita esponenziale per α → ∞e con esse l’ampiezza xmax(α). Ad esempio: xmax(0.1) = 0.100, xmax(0.5) = 0.51,xmax(1) = 1.12, xmax(2) = 3.04, xmax(3) = 7.30.

0.0 0.5 1.0 1.5 2.0Α

20

40

60

80

100%

Figura 2

Emanuele Dotto, Fabrizio Pini 149

Nella figura 3 riportiamo le funzioni xNR(τ) e x(τ) per α = 2. Al crescere di α ilperiodo rimane uguale a 2π mentre cresce l’ampiezza come discusso a propositodella precedente figura.

Π 2 Π 3 Π 4 Π 5 Π 6 Π

Τ

-3

-2

-1

1

2

3

xHΤL

Figura 3

La figura 4 mostra ancora una volta per α = 2 il limite non relativistico xNR e la po-sizione x, stavolta però in funzione del tempo coordinato t. Appare chiaramenteil rallentamento dell’oscillazione vista dall’osservatore inerziale.

Π 2 Π 3 Π 4 Π 5 Π 6 Π

t

-3

-2

-1

0

1

2

3

xHtL

Figura 4

Le figure 5 e 6 rappresentano le superfici x(α, τ) e x(α, t) parametrizzate da α eτ rispettivamente da α e t. Si noti come il passaggio dal tempo proprio al tempocoordinato distorca la superficie.

0

10

20Τ

0.0

0.5

1.0

1.5

2.0

Α

-2

0

2

xHΑ,ΤL

Figura 5

150 Le isometrie e la relatività ristretta

0

10

20t

0.0

0.5

1.0

1.5

2.0

Α

-2

0

2

xHΑ,tL

Figura 6

Infine è interessante esaminare il caso relativistico estremo dal punto di vista deidue osservatori, quello solidale con il corpo oscillante e quello inerziale. Il primoregistra il tempo proprio τ dal proprio orologio e la posizione x in funzione di τ

basandosi sull’asse x del riferimento inerziale, una serie di “pietre miliari” che glisfrecciano davanti durante il moto. La velocità x(τ) che può calcolare sulla base diquesti rilevamenti è detta celerità (si vedano gli articoli di Lévy-Leblond e di Blattere Greber citati in precedenza). Quest’ultima, come già la rapidità, può assumerevalori reali qualsiasi. Il secondo osservatore invece registra tempo coordinato te posizione x(t) del riferimento inerziale. La velocità che può ricavare è quellaabituale v = dx(t)/dt il cui modulo è, come sappiamo, costantemente inferiore ac.

Supponiamo α→ ∞, ossia v0/c ≈ 1.L’osservatore inerziale vede l’oscillatore muoversi (con un periodo T 2π/ω)con velocità praticamente uguale a quella della luce fra i punti estremi ±xmax,punti in cui il senso del moto viene quasi istantaneamente invertito. Il grafico di xin funzione di t quindi è a denti di sega, come è confermato dalla figura 7. Si avràxmax = c T/4 o (tenuto conto che c = 1) limα→∞ xmax(α)/(T(α)/4) = 1, relazioneconfermata dal fatto che limα→∞ L0(α)/I0(α) = 1. Per quasi tutto il periodo dioscillazione il corpo gli appare in moto, in un senso o nell’altro, ad una velocitàprossima a quella della luce.

Per il corpo in movimento, e quindi per l’osservatore con esso solidale il periododi oscillazione è 2π/ω e lo spostamento fra un’estremità e l’altra avviene quasiistantaneamente poiché la velocità, la celerità in questo caso, tende ad infinito. Ilresto del tempo lo trascorre quasi immobile ad una o all’altra delle estremità. Ilgrafico di x in funzione di τ assume quindi una forma a merlatura come si puònotare nella figura 8. L’ampiezza di oscillazione è la medesima per tutt’e due gli

Emanuele Dotto, Fabrizio Pini 151

5000 10 000 15 000t

-4000

-2000

0

2000

4000

xHtL

Figura 7

osservatori in quanto tutt’e due si basano sullo stesso asse x.

1 2 3 4 5 6Τ

-4000

-2000

2000

4000

xHΤL

Figura 8

Le due ultime figure sono state eseguite con α = 10, che corrisponde a v0/c =

0.999999996

5.1. Appendice 1: l’analisi di Fourier

In questa appendice troviamo le serie di Fourier della funzione x(τ) e della com-ponente periodica di t(τ). Nel contempo dimostreremo le congetture fatte soprasulle frequenze presenti negli spettri di x e di t.

Sempre per semplificare la scrittura e senza riduzione della generalità poniamo,come nell’esempio, c = 1 e ω = 1.

Dimostriamo dapprima che la funzione x(τ) è 2π-periodica e dispari.

Per tutti i τ reali si ha

x(τ + 2π) =∫ τ+2π

0sinh(α cos(s))ds = x(τ) +

∫ τ+2π

τsinh(α cos(s))ds .

152 Le isometrie e la relatività ristretta

L’ultimo integrale che appare nell’equazione precedente è nullo: infatti esso èindipendente da τ, come si vede derivando,

ddτ

∫ τ+2π

τsinh(α cos(s))ds = sinh(α cos(τ + 2π))− sinh(α cos(τ)) = 0

(per la periodicità del coseno) e può quindi essere calcolato come∫ 2π

0sinh(α cos(s))ds =

∫ π

0sinh(α cos(s))ds +

∫ 2π

πsinh(α cos(s))ds = 0 .

Il semplice cambiamento di variabile s → s + π mostra che il secondo integraleè l’opposto del primo e quindi l’integrale considerato si annulla. Ciò prova la2π-periodicità di x(τ).Inoltre x(τ) è dispari. Infatti

x(−τ) =∫ −τ

0sinh(α cos(s))ds =

∫ τ

0sinh(α cos(−s))(−ds) = −x(τ) .

La funzione è ovunque derivabile. Essa ammette dunque una rappresentazionecome serie reale di Fourier uniformemente convergente della forma

x(τ) =∞

∑k=1

bk sin(kτ) ,

dove i coefficienti bk, per k = 1, 2, . . . sono dati da

bk =1π

∫ 2π

0x(τ) sin(kτ)dτ . (10)

Esplicitiamo la (10), scambiamo l’ordine di integrazione e poi integriamo rispettoa τ:

bk =1π

∫ 2π

0dτ∫ τ

0ds sinh(α cos(s)) sin(kτ) =

=1π

∫ 2π

0ds∫ 2π

sdτ sinh(α cos(s)) sin(kτ) =

=1

∫ 2π

0ds (cos(ks)− 1) sinh(α cos(s)) =

=1

∫ 2π

0sinh(α cos(s)) cos(ks)ds− 1

∫ 2π

0sinh(α cos(s))ds .

(11)

Il secondo integrale nell’ultima riga della (11) è nullo. Per accertarsene bastascrivere l’integrale

∫ 2π0 (. . . ) ds come la somma

∫ π0 (. . . ) ds +

∫ 2ππ (. . . ) ds ed ef-

fettuare la sostituzione s → s + π nell’integrale fra π e 2π. Ricordando checos(s + π) = − cos(s) e che sinh è una funzione dispari si ottiene la tesi.

La (11) diventa pertanto

bk =1

∫ 2π

0sinh(α cos(s)) cos(ks)ds . (12)

Emanuele Dotto, Fabrizio Pini 153

Anche questo integrale può essere spezzato in due parti:

bk =1

∫ π

0sinh(α cos(s)) cos(ks)ds+

+1

∫ 2π

πsinh(α cos(s)) cos(ks)ds =

=1

∫ π

0sinh(α cos(s)) cos(ks)ds+

+1

∫ π

0sinh(α cos(s + π)) cos(ks + kπ)ds =

=1 + (−1)k+1

∫ π

0sinh(α cos(s)) cos(ks)ds .

(13)

Si ottiene quindi che

bk =

2

∫ π

0sinh(α cos(s)) cos(ks)ds se k è dispari ,

0 se k è pari .(14)

Abbiamo così dimostrato la prima congettura: lo spettro dell’oscillazione di x(τ)contiene solo i multipli dispari della frequenza fondamentale ω.

Siamo in grado di esprimere anche il coefficiente bk dato nella (14) quando k èdispari. Utilizzando la relazione (vedere Abramowitz e Stegun op.cit. p.376)

In(α) =1π

∫ π

0e±α cos θ cos(nθ)dθ , (15)

dove le In(α) sono le già ricordate funzioni di Bessel modificate di seconda specie,e ponendo k = 2m + 1 (per m ∈ N) si ottiene, tenendo conto che I2m+1(α) è unafunzione dispari come si vede facilmente utilizzando la (15),

b2m+1 =2

2m + 1I2m+1(α) . (16)

Quindi

x(α; τ) =∞

∑m=0

2I2m+1(α)

2m + 1sin((2m + 1)τ) . (17)

Consideriamo ora la funzione t(τ) =∫ τ

0 cosh(α cos(s)ds. Sappiamo che essa nonè periodica. Tuttavia esiste m reale per il quale t(τ) − mτ è periodica. Comenel caso di x(τ) basta provare che

∫ τ+2πτ (cosh(α cos(s))−m)ds = 0 per tutti i τ.

Come sopra si dimostra l’indipendenza da τ verificando che la derivata rispettoa τ è identicamente nulla. Resta da trovare m tale che

0 =∫ 2π

0(cosh(α cos(s))−m)ds =

∫ 2π

0(cosh(α cos(s))ds− 2πm .

154 Le isometrie e la relatività ristretta

Si trova

m =1

∫ 2π

0cosh(α cos(s))ds.

Ancora una volta scriviamo l’integrale∫ 2π

0 (. . . ) ds come la somma∫ π

0 (. . . ) ds +∫ 2ππ (. . . ) ds e operiamo nel secondo integrale la sostituzione s→ s + π ottenendo

m =1π

∫ π

0cosh(α cos(s))ds = I0(α) .

Abbiamo così dimostrato che t(τ) = I0(α) τ+ funzione periodica. Troviamo ora laserie di Fourier di questa funzione periodica. Come già fatto per x(τ) è immediatorendersi conto che anche t(τ)−mτ è dispari e ovunque derivabile; essa ammettequindi una serie di Fourier uniformemente convergente della tipo

t(τ)−mτ =∞

∑k=1

ck sin(kτ) ,

dove i coefficienti bk, per k = 1, 2, . . . sono dati da

ck =1π

∫ 2π

0(t(τ)−m) sin(kτ)dτ . (18)

Ripetendo sostanzialmente gli stessi passaggi che ci hanno condotto alla (14) siperviene a

ck =

2

∫ π

0sinh(α cos(s)) cos(ks)ds se k è pari ,

0 se k è dispari .(19)

Con ciò anche la seconda congettura è dimostrata: lo spettro delle oscillazioni dit(τ) contiene solo multipli pari della frequenza fondamentale. Utilizzando ancorala (15) possiamo precisare meglio i coefficienti ck per k pari = 2m (per m ∈N?):

c2m =1m

I2m(α) .

In definitiva le soluzioni t(τ) e x(τ) espresse in forma integrale nella (3) e nella(6) sono date dalle serie di Fourier nelle quali abbiamo ripristinato la dipendenzada c e da ω

t(α; τ) = I0(α)τ +1ω

∑m=1

I2m(α)

msin(2m ωτ) ,

x(α; τ) = 2cω

I1(α) sin(ωτ) +cω

∑m=1

2I2m+1(α)

2m + 1sin((2m + 1)ωτ) .

(20)

In prima approssimazione si ha I0(α) = 1 + O(α2) e I1(α) = α/2 + O(α3), per cuisi ritrova ancora una volta il limite non relativistico x(t) = a0

ω2 sin(ωt).

Emanuele Dotto, Fabrizio Pini 155

5.2. Appendice 2: un po’ di dinamica

In questa appendice adottiamo un punto di vista del tutto trascurato finora inquesto articolo, quello della dinamica. Dopo aver usato all’inizio del capitolo al-cune proprietà della quadrivelocità e della quadriaccelerazione, introdurremo quiil quadrivettore energia-impulso e la quadriforza e formuleremo la versione re-lativistica dell’equazione di Newton. Calcoleremo poi la variazione dell’energiacinetica e della quantità di moto della massa oscillante fra due istanti dati e ve-dremo come esprimere in modo covariante la conservazione dell’energia e dellaquantità di moto ricorrendo a una sorta di “quadripotenziale”. Per finire rico-nosceremo il limite non relativistico dell’energia potenziale che avremo propostocome l’espressione classica di quella dell’oscillatore armonico.

Sia m la massa a riposo dell’oscillatore. La sua quantità di moto nel riferimentoinerziale è

p = mv γ(v) =mv√

1− v2/c2.

Per una massa libera, l’energia è

E = mc2 γ(v) =mc2

√1− v2/c2

.

mc2 è l’energia a riposo; E − mc2 viene interpretata come energia cinetica relati-vistica come è chiaramente suggerito dal suo sviluppo in serie di potenze div/c

E−mc2 =12

mv2 +38

mv2

c2 v2 + O(v4/c4) .

Energia e quantità di moto formano il quadrivettore energia-impulso P

P = mV = γ(v)(mc, mv) = (Ec

, p) . (21)

dove V è la quadrivelocità. La prima componente P0 è la componente temporaledi P, la seconda, P1, raggruppa invece le componenti spaziali (solo una nel nostrocaso in quanto stiamo lavorando in un’unica dimensione spaziale). In un cam-biamento di riferimento, P si trasforma con la corrispondente trasformazione diLorentz, come già ricordato per la quadrivelocità V. Perciò la pseudo-norma diMinkowski

G(P, P) = P20 − P2

1 =E2

c2 − p2 = m2c2 (22)

è un’invariante, essenzialmente la massa. Questa equazione può essere riscrittacome

E2 = m2c4 + p2c2 . (23)

In analogia con il caso classico si definisce il quadrivettore forza (o quadriforza) F:

dPdτ

= F . (24)

156 Le isometrie e la relatività ristretta

L’uso del tempo proprio assicura anche in questo caso il corretto comportamentodel quadrivettore in un cambiamento di riferimento. La (24) può essere vistacome la versione relativistica dell’equazione di Newton. Identifichiamo la componentespaziale F1 della quadriforza:

F1 =dP1

dτ=

ddτ

(γmv) = γdpdt

= γ f ,

dove f = dp/dt è l’espressione classica della forza. Nel caso di un moto unidi-mensionale, quando la velocità e la forza f sono collineari, si ha12

f =dpdt

=m

(1− v2/c2)3/2 ·dvdt

= m γ(v)3 dvdt

. (25)

Tenuto conto di dp/dt = p/γ, dv/dt = v/γ, dalla (25) segue che

p = m γ(v)3 v . (26)

Dalla relazione v = c tanh(λ), dove cλ è la rapidità, si ricava

v = cλ

cosh2(λ)= c

λ

γ(v)2 ,

per cui la (26) diventap = m c γ(v) λ . (27)

La forza è pertanto

f (t) =dpdt

=p

γ(v)= m c λ = m a(τ) , (28)

dove t(τ) è data dalla (3). Si noti che abbiamo ritrovato l’equazione di Newtonnella sua forma classica (forza = massa×accelerazione) a condizione di esprimerel’accelerazione nel riferimento della massa in movimento13 (dove γ = 1).

La figura 9 mostra, avendo posto c = 1, ω = 1 e m = 1, l’andamento dellaforza visto dal riferimento inerziale. Si nota l’allungamento del periodo (2π nelriferimento del corpo in movimento) e la distorsione della forza (sinusoidale nelsistema della massa oscillante).

Possiamo ora identificare anche la componente temporale F0 della quadriforza.Da un lato, partendo dalla (21) e dalla (24), si ha

F0 =dP0

dτ=

1c

dEdτ

cdEdt

, (29)

dall’altro, derivando la (22) rispetto a τ, si ottiene

P0F0 − P1F1 = 0 , (30)

12Si veda L.D. Landau, E.M. Lifschits, Teoria dei campi, Roma, 1981.13Si veda anche H.Blatter, T.Greber, Geschwindigkeit und relativistische Dynamik, MNU 56/8, 2003.

Emanuele Dotto, Fabrizio Pini 157

2 4 6 8 10 12 14t

-2

-1

1

2

f HtL

Figura 9

che esprime la perpendicolarità di P e di F nella geometria di Minkowski. Con la(21) e la (30) si deduce che

F0 =P1F1

P0=

γ

cf v . (31)

Dalla (29) segue allora

dEdτ

= γ f v = f x edEdt

= f v (32)

F0 è essenzialmente il lavoro per unità di tempo (la potenza) trasferito alla massam. Riassumendo, la quadriforza è

F = γ (vc

f , f ) . (33)

Per interpretare correttamente F è utile notare quanto segue. Siano τ1 un istantedi tempo proprio, t1 l’istante corrispondente espresso in tempo coordinato. Inte-grando cF0 fra τ = 0 e τ = τ1 si ottiene per la (32) la variazione di energia fra idue istanti:

∆E = E(t1)− E(0) = E(τ1)− E(0) =∫ τ1

0f xdτ =

∫ t1

0f vdt ,

che è la formula classica.Integrando invece F1 fra gli stessi istanti si calcola la variazione della quantità dimoto, ossia l’impulso sull’intervallo temporale preso in considerazione:

∆p = p(t1)− p(0) = p(τ1)− p(0) =∫ τ1

0γ f dτ =

∫ t1

0f dt ,

che è ancora una volta la formula classica per il riferimento inerziale.

Ponendo U(τ) = −∆E, I(τ) = −∆p abbiamo

E(τ) + U(τ) = E(0) = costante

p(τ) + I(τ) = p(0) = costante ,(34)

158 Le isometrie e la relatività ristretta

dunque il quadrivettore (U/c, I) è una sorta di quadripotenziale che aiuta adesprimere la conservazione dell’energia e della quantità di moto. Esso si trasformasecondo Lorentz in un cambiamento di riferimento. Di conseguenza le relazionidi conservazione (34) sono valide in ogni sistema di riferimento.

Inserendo f = −ma0 sin(ωτ), x = c sinh(α cos(ωτ)), γ = cosh(α cos(ωτ)) nelleformule precedenti e integrando esplicitamente si ottiene scrivendo τ per τ1

∆E = −mc2(cosh(α)− cosh(α cos(ωτ)) ,

∆p = −mc(sinh(α)− sinh(α cos(ωτ)) .

Scriviamo ancora i “potenziali” (per comodità nel seguito ometteremo le virgolet-te e parleremo liberamente di potenziali e di quadripotenziale)

U(τ) = mc2(cosh(α)− cosh(α cos(ωτ)) ,

I(τ) = mc(sinh(α)− sinh(α cos(ωτ)) .(35)

Per meglio afferrarne il significato è opportuno collocarsi, piuttosto che nellospazio-tempo, nello spazio delle variabili coniugate rispetto a quelle spazio–tempo-rali, cioè in quello delle variabili P0 e P1 (o E/c e p), e adottare un punto divista intrinseco, indipendente dal sistema di riferimento. Per ogni τ il puntoP(τ) = (mc cosh(α cos(ωτ)), mc sinh(α cos(ωτ))) si trova sul ramo di iperboleP0 = mc cosh(s), P1 = mc sinh(s) (s ∈ R) (la cui equazione è data anche dalla (23)con la condizione E > 0). Al variare del tempo proprio, P(τ) si muove periodi-camente fra i punti (mc cosh(α),±mc sinh(α)) passando per (mc, 0) (il parametroα è considerato fisso). Così vincolato P(τ) rappresenta il moto dell’oscillatore nellospazio coniugato. Si vede facilmente che il relativo quadrivettore tangente P(τ) èuguale alla quadriforza F. Quest’ultima si rivela essere la “velocità” del corpoquando il moto è visto nello spazio coniugato. L’invarianza del ramo di iperbolerispetto al gruppo proprio di Lorentz prova che le nostre considerazioni hannoun significato intrinseco, indipendente dal sistema di riferimento. Sappiamo comericavare la quadriforza agente sull’oscillatore e come trasformare la “posizione”P(τ) in un cambiamento di riferimento.Nel quadripotenziale possiamo ignorare i termini costanti (dipendenti solo da α).Ciò corrisponde ad uno spostamento del livello zero del potenziale, spostamentosempre legittimo dal punto di vista fisico. Nel nostro caso il quadripotenziale èallora −P(τ).

A titolo di esempio vogliamo vedere come si trasforma P(τ) passando dal riferi-mento inerziale qui considerato al riferimento istantaneamente a riposo al tempoτ. Il nuovo riferimento inerziale deve muoversi con la velocità dell’oscillatore

Emanuele Dotto, Fabrizio Pini 159

nell’istante scelto. Le variabili P0, P1 si trasformano in P′0, P′1 secondo le formuleP′0 = P0 cosh(λ(τ))− P1 sinh(λ(τ))

P′1 = −P0 sinh(λ(τ)) + P1 cosh(λ(τ)),

dove cλ(τ) = cα cos(ωτ) è la rapidità della massa m all’istante τ. SostituendoP0 = mc cosh(λ(τ)), P1 = mc sinh(λ(τ)), si ottiene

P′0 = mc e P′1 = 0 .

Com’era facilmente prevedibile, l’energia è mc2 e la quantità di moto è nulla inquanto nel nuovo riferimento il corpo è istantaneamente in quiete.

Interpretare U e I come potenziali sembrerebbe problematico in quanto ci si at-tenderebbe una loro dipendenza da x e, visto il contesto relativistico nel qualeci muoviamo, anche da t. Tuttavia la questione si risolve se si nota che nel casodi un sola dimensione spaziale il passaggio da τ a x è solo una riparametrizza-zione della traiettoria. Possiamo sfruttare la corrispondenza biunivoca fra x e τ

limitatamente agli intervalli −xmax ≤ x ≤ xmax rispettivamente − π2ω ≤ τ ≤ π

2ω .Scriviamo τ = τ(x) per l’inversa di x(τ) e consideriamo così U(τ) = U(τ(x))come funzione di x.Il riferimento inerziale che abbiamo scelto è particolare in quanto vede in quieteil centro d’attrazione dell’oscillatore (x = 0). Possiamo assumere che in questoparticolare riferimento i potenziali dipendano solo da x (anche Harvey, op. cit.fa la medesima assunzione in tre dimensioni spaziali). Il passaggio da τ a x cipermette di trovare il limite non relativistico di U(x). Non consideriamo più lacomponente spaziale I.

Non disponiamo di un’espressione esplicita di τ(x) e quindi nemmeno di U(x).Tuttavia abbiamo una rappresentazione parametrica (x(τ), U(τ)) che ci permettedi rappresentare U in funzione di x come nella figura 10, che riporta, nel casoα = 2 (e con c = 1, ω = 1 e m = 1), il potenziale appena ottenuto, confrontato conquello classico 1

2 x2, che non gli è mai inferiore.

Calcoliamo ora, per un qualsiasi valore del parametro α, l’approssimazione diTaylor di U(x) di ordine 4 attorno a x = 0.

Occorrono i valori di U e delle sue derivate in x = 0 fino all’ordine 4. Per il calcolo,esprimiamo la derivata dτ/dx. Da x(τ) = c sinh(α cos(ωτ)) segue ponendo percomodità s(x) = ω τ(x)

s′(x) =dsdx

c1

sinh(α cos(s(x))). (36)

Come consueto l’apice “ ′ ” indica la derivata rispetto a x.La costruzione di U come integrale della forza (28) implica che

U′(x) = ma0 sin(s(x)) (37)

160 Le isometrie e la relatività ristretta

-3 -2 -1 1 2 3x

1

2

3

4

UHxL

Figura 10

e quindi, tenuto anche conto della (36),

U′′(x) = ma0 cos(s(x))s′(x) = ma0ω

ccos(s(x))

sinh(α cos(s(x)). (38)

Il calcolo della terza derivata conduce a

U′′′(x) = ma0ω

cα cos(s) cosh(α cos(s))− sinh(α cos(s))

sinh2(α cos(s))sin(s) s′ =

= ma0

c

)2 α cos(s) cosh(α cos(s))− sinh(α cos(s))sinh3(α cos(s))

sin(s) .(39)

Ricordando che ciò che in realtà ci serve è il valore delle derivate in x = 0 quandos = 0, e quindi sin(s) = 0, ci si accorge che la quarta derivata può essere calcolataanche solo parzialmente (con (. . . ) denotiamo la lunga frazione a fattore davantia sin(s) in U′′′):

U(4)(x) = ma0

c

)2 [(. . . )′ sin(s) + (. . . ) cos(s) s′

]=

= ma0

c

)2[(. . . )′ sin(s) +

ω

c(. . . )

sinh(α cos(s))cos(s)

].

(40)

Dato che s(0) = 0, le equazioni (37), (38), (39) e (40) implicano che le sole derivatedi U, fra quelle calcolate, che non si annullano in x = 0 sono U′′ e U(4); piùprecisamente si trova

U′′(0) = mω2 α

sinh(α),

U(4)(0) = mω2(ω

c

)2 α(α cosh(α)− sinh(α))sinh4(α)

.(41)

Emanuele Dotto, Fabrizio Pini 161

Passiamo ora al limite non relativistico supponendo α → 0. Se riscriviamo leespressioni della (41) come serie di potenze di α troncate all’ordine 2 abbiamo

U′′(0) = mω2 (1− 16

α2) + O(α4) ,

U(4)(0) = mω2(ω

c

)2 13(1− 17

30α2) + O(α4) ;

inserendole nello sviluppo di Taylor di U(x) otteniamo finalmente

U(x) ≈ 12

mω2(1− α2

6)x2 +

172

mω2(ω

c

)2(1− 17

30α2)x4 . (42)

Si riconosce nel primo termine 12 m ω2x2 il potenziale dell’oscillatore armonico non

relativistico (m ω2 è la costante elastica della molla nelle presentazioni elementari).I termini successivi costituiscono la prima correzione relativistica e sono d’ordi-ne O(α4). Per provare quest’ultima asserzione ripristiniamo c e ω nella (9) eotteniamo

xmax = x(π

2ω) =

π

2L0(α) =

α + O(α3) . (43)

L0(α) è la funzione di Struve modificata di ordine 0.

Tenendo conto della (43) e della condizione |x| ≤ xmax il termine 172 mω2 (ω

c

)2 x4

tende a zero almeno come α4. Infatti esso può essere riscritto e stimato, comesegue:

172

mω2(ω

c

)2x4 =

172

mc2(ωx

c

)4≤

≤ 172

mc2(ωxmax

c

)4=

172

mc2α4 + O(α6) ;

Allo stesso modo si vede che il termine −1/12 α2x2 è d’ordine O(α4). Rispet-to al limite non relativistico, la prima correzione è quindi d’ordine O(α2), ossiaO(v2

0/c2).

Bibliografia

[1] U. Stammbach. Lineare Algebra. Teubner, Stuttgart, 1994.

[2] I.I. Cotaescu, Geometric Models of the Relativistic Harmonic Oscillator.arXiv:physics9704009/10.04.07.

[3] A.L. Harvey, Relativistic Harmonic Oscillator. Phys.Rev.D, 6(8), 1972.

[4] A. Vogt, On the linearity of form isometries. SIAM J.Appl.Math. 22(4), 1972.

[5] J.M. Lévy-Leblond, Speed(s). Am.J.Phys, 48(5), May 1980.

[6] H. Blatter, T. Greber, Geschwindigkeit und relativistische Dynamik. MNU 56/8,01, 12.2003.

162 Le isometrie e la relatività ristretta

[7] G. Scharf, Finite Quantum Electrodinamics. Springer–Verlag, Berlin, 1989.

[8] N.M.J. Woodhouse, Special Relativity. Springer–Verlag, London, 2003.

[9] M. Abramowitz, I.A. Stegun, Handbook of Mathematical Functions. New York,1972.

[10] L.D. Landau, E.M. Lifšits, Teoria dei campi. Editori Riuniti, Roma, 1981.

Emanuele Dotto

Department of Mathematical SciencesUniversity of CopenhagenUniversitetsparken 5DK-2100 Københavne–mail: [email protected]

Fabrizio Pini

e–mail: [email protected]