universit`a del salento fondamenti di fisica cosmicastraf/...fisica_cosmica/lezioni_parte_i.pdf ·...

62
Universit` a del Salento Fondamenti di Fisica Cosmica Corso di Laurea in Fisica F.Strafella Dipartimento di Fisica, Universit` a del Salento La Via Lattea

Upload: ngotruc

Post on 17-Feb-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Universita del Salento

Fondamenti di Fisica CosmicaCorso di Laurea in Fisica

F.Strafella

Dipartimento di Fisica, Universita del Salento

La Via Lattea

2 F.Strafella

Indice

1 Iniziazione 51.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Proprieta della luce ed analisi degli errori . . . . . . . . . . . . . . 6

1.2.1 Magnitudini e sistemi fotometrici . . . . . . . . . . . . . . 91.2.2 Flussi osservati e conteggi . . . . . . . . . . . . . . . . . . 12

1.3 Errori e distribuzioni di probabilita . . . . . . . . . . . . . . . . . 141.3.1 Analisi degli errori e livello di confidenza . . . . . . . . . . 18

1.4 Effetti dell’atmosfera . . . . . . . . . . . . . . . . . . . . . . . . . 261.4.1 Estinzione da parte dell’atmosfera . . . . . . . . . . . . . . 301.4.2 Seeing: teoria & pratica . . . . . . . . . . . . . . . . . . . 34

1.5 Telescopi [t.b.d.] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461.6 Ottica e Telescopi . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

1.6.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 471.6.2 Ottica Attiva ed Adattiva . . . . . . . . . . . . . . . . . . 60

2 Rivelatori di radiazione 632.1 Proprieta generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.2 Rivelatori di tipo CCD . . . . . . . . . . . . . . . . . . . . . . . . 722.3 Rivelatori IR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 762.4 Rivelatori UV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3 Riduzione dei dati osservativi 813.1 Procedure di riduzione . . . . . . . . . . . . . . . . . . . . . . . . 81

3.1.1 Sottrazione del bias . . . . . . . . . . . . . . . . . . . . . . 823.1.2 Sottrazione delle strutture del bias . . . . . . . . . . . . . 843.1.3 Correzioni di linearita . . . . . . . . . . . . . . . . . . . . 853.1.4 Sottrazione della “dark current” . . . . . . . . . . . . . . 853.1.5 Sottrazione del pre-flash e correzione per “deferred charge” 863.1.6 Correzione dell’ombra prodotta dall’otturatore . . . . . . 87

3

4 F.Strafella

3.1.7 Correzione di flat field . . . . . . . . . . . . . . . . . . . . 883.1.8 Flat-field nell’IR . . . . . . . . . . . . . . . . . . . . . . . 92

3.2 Operazioni durante le osservazioni . . . . . . . . . . . . . . . . . . 933.3 Trattamento delle immagini astronomiche . . . . . . . . . . . . . 95

3.3.1 Display delle immagini . . . . . . . . . . . . . . . . . . . . 953.3.2 Formato FITS . . . . . . . . . . . . . . . . . . . . . . . . . 963.3.3 Combinare immagini . . . . . . . . . . . . . . . . . . . . . 100

3.4 L’Arte della fotometria . . . . . . . . . . . . . . . . . . . . . . . . 1063.4.1 Fotometria con diaframma (aperture photometry) . . . . . 1073.4.2 Campi affollati (Crowding) . . . . . . . . . . . . . . . . . . 1093.4.3 Estinzione atmosferica . . . . . . . . . . . . . . . . . . . . 1133.4.4 Stelle standard . . . . . . . . . . . . . . . . . . . . . . . . 114

4 Trasformate, segnali e strumenti di osservazione 1194.1 Breve introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . 1194.2 Caratteristiche delle linee spettrali . . . . . . . . . . . . . . . . . 1294.3 Caratteristiche generali degli spettrometri . . . . . . . . . . . . . 135

4.3.1 Concetti generali in spettroscopia . . . . . . . . . . . . . . 1354.3.2 Interferometro di Fabry-Perot e Filtri interferenziali . . . . 1364.3.3 Spettrometri a reticolo . . . . . . . . . . . . . . . . . . . . 1474.3.4 Spettroscopia in pratica . . . . . . . . . . . . . . . . . . . 1524.3.5 Accoppiamento con un telescopio . . . . . . . . . . . . . . 1564.3.6 Trasmissione . . . . . . . . . . . . . . . . . . . . . . . . . . 1574.3.7 Modi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1584.3.8 Rapporto Segnale/Rumore . . . . . . . . . . . . . . . . . . 158

4.4 Radio Astronomia ed interferometria . . . . . . . . . . . . . . . . 160

Capitolo 1

Iniziazione

1.1 Introduzione

Le tecniche per l’osservazione e l’acquisizione di dati in astronomia sono in mas-sima parte rivolte alla rivelazione della luce emessa dai corpi celesti e sono essen-zialmente le stesse utilizzate in fisica sperimentale. Se differenze vi sono, questesono dovute principalmente ai modesti flussi di luce che caratterizzano gli oggetticelesti rispetto agli esperimenti di laboratorio. Tuttavia negli anni piu recenti sie assistito ad un forte sviluppo delle capacita di costruire grandi telescopi percui molte delle limitazioni che fin qui hanno influito negativamente su molte mi-sure astronomiche tendono ora a cadere per i vantaggi offerti dalle grandi areecollettrici dei telescopi piu recenti.

Nel seguito discuteremo delle modalita che si adottano per raccogliere al me-glio i dati astronomici e di come estrarne informazione, sia in linea di principioche in pratica.

La filosofia che adottiamo nel seguito prevede la discussione degli strumentidi osservazione sia per capire come funzionano che per rendersi conto del tipoe dell’accuratezza delle informazioni che essi possono dare. Tutto questo e in-dispensabile per poter sfruttare al meglio i dati che si acquisiscono durante leosservazioni.

Nel contesto delle nostre discussioni il termine “strumento” indichera generi-camente telescopio, strumento di piano focale, rivelatore, anche se in particolareandremo a discutere strumenti per l’imaging e per la spettroscopia. Un cennomolto breve verra comunque fatto per presentare alcuni strumenti piu sofisticaticome possono essere quelli per l’ “imaging spectroscopy” e per l’interferometria.

In questo corso non ci sara molto spazio per familiarizzare con i principalipacchetti di riduzione dati che sono diffusi in ambiente astronomico. Questa

5

6 F.Strafella

scelta lascia alla responsabilita dello studente di familiarizzare con almeno uno diquesti pacchetti: provandolo, leggendo la documentazione, parlando con i colleghipiu esperti. Le operazioni di “data reduction” infatti si apprendono meglio se cisi impegna in un particolare progetto, magari con l’aiuto iniziale di un tutore. Inun certo senso questo approccio obbliga ad “imparare facendo”.

Notate che la regola generale per ottenere il meglio dai vostri dati e di diffi-dare delle procedure pre-confezionate, a meno che non abbiate gia verificato laloro qualita nelle condizioni in cui le andrete ad usare. E preferibile comunqueche realizziate voi le procedure per le vostre analisi, tenendo presente che tutti glistrumenti di osservazione hanno problemi abbastanza diversi e che quindi richie-dono tecniche di analisi conseguentemente differenti. Ribadiamo che, se propriovolete rischiare usando qualcosa di pre-confezionato, allora ricordate che primadi usare una procedura e indispensabile fare un test di prova che vi assicuri chela state utilizzando nel modo corretto.

1.2 Proprieta della luce ed analisi degli errori

La stragrande maggioranza delle informazioni che percepiamo dagli oggetti astro-nomici le riceviamo sotto forma di luce. Altre informazioni ci giungono dall’osser-vazione dei raggi cosmici ed in futuro potremmo anche essere in grado di rivelarele onde gravitazionali. Tuttavia, anche tenendo conto delle esplorazioni del nostroSistema Solare con l’utilizzo di sonde, a tutt’oggi la luce e il canale d’elezione perlo studio del mondo extraterrestre.

A questo proposito elenchiamo di seguito alcuni punti rilevanti:

- La luce, dalla meccanica quantistica, ha caratteristiche sia di onda che diparticella in modo tale che l’energia trasportata sia espressa dalla relazione

E = hν = hc

λ(1.1)

dove c e la velocita della luce, h la costante di Planck, ν e λ sono rispetti-vamente la frequenza e la lunghezza d’onda della radiazione.

- Il diverso valore della lunghezza d’onda o della frequenza assegna la ra-diazione ad una particolare regione dello spettro elettromagnetico. Questoe convenzionalmente diviso in ordine di lunghezze d’onda crescenti come:raggi γ, raggi X, ultravioletto (UV), ottico, infrarosso (IR), millimetrico(mm), radio.

Dip. di Fisica @ UNISALENTO 7

- Per descrivere la quantita di radiazione emessa da una sorgente o anche perindicare quella che noi riceviamo, usiamo tre importanti concetti: l’intensitaIλ, il flusso Fλ e la luminosita Lλ.

Per la maggior parte delle sorgenti la luce emessa e una funzione della lun-ghezza d’onda e percio siamo di solito interessati a misurare le quantita Iλ,Fλ ed Lλ monocromatiche, che spesso vengono anche riferite come densitadi I, F ed L ( p.es. si parla spesso di “flux density” ). Per confondere ulte-riormente la terminologia le quantita monocromatiche vengono anche dette“specifiche” per cui si potra usare il termine “flusso specifico” intendendocon questo la quantita monocromatica Fλ.

Il flusso viene indifferentemente riferito sia all’unita di frequenza (Fν) che intermini di lunghezza d’onda (Fλ). Tra queste due diverse rappresentazionideve valere la relazione:

Fνdν = −∫

Fλdλ (1.2)

che rappresenta l’invarianza dell’energia totale sia se la esprimiamo in fun-zione della frequenza ν che della lunghezza d’onda λ.

Dalla precedente relazione possiamo ottenere:

Fν = −Fλdλ

dν= Fλ

c

ν2= Fλ

λ2

c(1.3)

Allo stesso modo sia la luminosita che l’intensita possono essere espressein unita di frequenza o lunghezza d’onda. Notare che da queste relazionidiscende che uno spettro che appare costante in funzione della lunghez-za d’onda λ non apparira piu costante se rappresentato in un grafico infunzione della frequenza ν.

- L’ intensitaa Iν(θ, φ) e definita come l’energia che fluisce attraverso l’unitadi superficie, per unita di tempo e di frequenza (o lunghezza d’onda), nell’u-nita di angolo solido in direzione (θ, φ). Con θ si e indicato l’angolo rispettoalla normale alla superficie e con φ l’angolo azimutale.

- Il flusso Fν invece e la quantita di energia che, provenendo da tutte ledirezioni, passa attraverso l’unita di superficie. Il legame con l’intensita delcampo radiativo e data da:

Fν =

Iν(θ, φ) cos θ dΩ (1.4)

8 F.Strafella

dove dΩ rappresenta l’elemento di angolo solido e l’integrazione e estesa atutto l’angolo solido. Si noti che il fattore cos θ tiene conto del fatto chela radiazione proveniente da una direzione inclinata di un angolo θ “vede”un’area efficace pari a cos θ volte l’area considerata (quella da cui emergela radiazione).

- Infine la luminosita Lν e l’energia totale emessa dalla sorgente, ad una datafrequenza, per unita di tempo ed e quindi assimilabile ad una potenza perunita di frequenza. Per una sorgente che emette radiazione in modo isotropo

Lν = 4πD2Fν (1.5)

dove con D si e indicata la distanza della sorgente dall’osservatore chemisura il flusso Fν

La quantita che noi effettivamente misuriamo e il flusso per le sorgentispazialmente non risolte (p.es. le stelle), mentre per quelle risolte (p. es.Sole, Luna, nebulose, galassie) oltre al flusso possiamo anche determinarela distribuzione di intensita sulla loro immagine proiettata sul piano delcielo. Si noti poi che potremo calcolare la luminosita L solo conoscendo ladistanza di una sorgente.

Domande: come dipendono dalla distanza della sorgente le tre quantita I, F,L ? Quali sono le unita in cui si esprimono queste quantita ? A quale quantitae collegata la magnitudine apparente di una stella ? A quale la magnitudineassoluta ?

Si noti che si possono incontrare (specialmente in campi diversi come l’in-gegneria) termini alternativi a quelli usati dagli astronomi per caratterizzare ilcampo radiativo. Si incontrano spesso in letteratura termini come “radiant flux”,“irradiance”, “radiance”, “spectral intensity” per citarne alcuni: si tratta sempredi grandezze collegate, ma non esattamente uguali, al flusso Fλ ed all’intensitaIλ che sono state appena definite. Per questo e necessario capire bene in qualiunita si stanno presentando i risultati delle misure prima di poterli discutere inmodo appropriato.

Terminologia usata per indicare il tipo di misura a cui ci si riferisce:

fotometria: misure di flusso riferite ad una banda passante (spettrale)larga;

spettroscopia: misure di flussi relativi a diverse lunghezze d’onda;

Dip. di Fisica @ UNISALENTO 9

spettrofotometria: misure assolute di flussi a diverse lunghezze d’on-da e di solito ottenuti con bande passanti piu strette che nel caso dellafotometria;

astrometria/morfologia: misure della dipendenza dei flussi osservati dal-la posizione. In genere le misure assolute non sono importanti in quest’am-bito.

Nella pratica noi misuriamo flussi, non densita di flusso, a causa del fatto glistrumenti di osservazione devono avere una certa “banda passante” (espressa con∆ν oppure ∆λ) entro cui misurare la radiazione. Naturalmente piu e stretta labanda passante piu appropriata sara la misura che ci fa risalire poi alla densitadi flusso ad una data lunghezza d’onda.

A questo proposito diremo anche che, con la maggior parte dei rivelatorimoderni, misuriamo flussi di fotoni (usando rivelatori del tipo “photon counting”)piuttosto che flussi di energia (con rivelatori del tipo “bolometro”) per cui e utiletener conto della relazione tra i due tipi di flusso data da:

flusso di fotoni(λ1, λ2) =flusso di energia

energia del fotone=

∫ λ2

λ1

Fλλ

hcdλ (1.6)

1.2.1 Magnitudini e sistemi fotometrici

In astronomia e comune l’uso di una particolare unita per la misura del flussoluminoso: la magnitudine. Questa e legata al flusso luminoso di una sorgentedalla relazione

mλ = −2.5 logFλ

F0,λ(1.7)

dove il fattore F0,λ al denominatore corrisponde ad un flusso di riferimento chedipende dallo specifico sistema fotometrico adottato. Si notera che siccome lamgnitudine e una grandezza logaritmica la differenza tra magnitudini corrispondead un rapporo di flussi. La densita di flusso per un oggetto astronomico e quindilegata alla magnitudine da

Fλ = F0,λ10−0.4mλ (1.8)

Per definire un sistema fotometrico dobbiamo evidentemente stabilire il valoredel flusso di riferimento F0λ. Questo e stato spesso scelto in base al flusso di Vega(α Lyr) che quindi e diventata la sorgente di riferimento per tutte le misure astro-nomiche. In particolare, alla lunghezza d’onda di λ = 5500 A , corrispondentealla banda V della fotometria, la densita di flusso di Vega e valutata

F0,λ=V = 3.6 × 10−9 erg cm −2 s−1 A−1

10 F.Strafella

e quindi una stella che a λ = 5500 A produce un flusso all’osservatore pari aquello di Vega sara per definizione di magnitudine mλ = 0. Alternativamentepossiamo scrivere che

mλ=V = −2.5 log Fλ − 21.1

Esprimendo il tutto in termini di frequenza (cfr. eq.[1.3]) avremo

F0,ν=V = 3.63 × 10−20 erg cm −2 s−1 Hz−1

e quindi

mν=V = −2.5 log Fν − 48.6

Estendendo lo stesso discorso alle altre lunghezze d’onda e possibile quindicostruire un sistema di magnitudini che vede i flussi della stella Vega alle diverselunghezze d’onda come riferimento fotometrico per tutti gli altri oggetti celesti.Questo ovviamente implica che Vega viene assunta di magnitudine zero in tuttele bande spettrali utilizzate e quindi, come conseguenza, il flusso di riferimentocambia in funzione della lunghezza d’onda considerata.

Attraverso le magnitudini cosı definite e possibile quindi descrivere

- la brillanza relativa degli oggetti celesti, usando le differenze del valore dellamagnitudine tra due oggetti diversi alla stessa lunghezza d’onda,

- la forma dello spettro osservato, utilizzando ancora differenze di magnitu-dine ma per lo stesso oggetto a due diverse lunghezze d’onda.

Si noti che, mentre nel primo caso la brillanza relativa tra due stelle diversedipende sia dalla brillanza intrinseca che dalla loro distanza dall’osservatore, nelsecondo caso la differenza di magnitudini a due diverse lunghezze d’onda si rife-risce alla stessa stella e quindi non dipendera dalla distanza della sorgente (se siesclude l’effetto dell’ estinzione interstellare).

Uno dei sistemi fotometrici piu utilizzati e il cosiddetto sistema UBVRI cheutilizza filtri a larga banda centrati rispettivamente a circa 3500 A, 4500 A,5500 A, 6500 A, 8000 A. Per questo sistema possiamo in generale scrivere larelazione tra magnitudini e flussi cosı

m U,B,V,R,I h −2.5 log

U,B,V,R,IFλ(oggetto) dλ

U,B,V,R,IFλ(Vega) dλ

(1.9)

dove i valori dei flussi ad una particolare lunghezza d’onda sono stati sostituitida un piu realistico integrale sulla banda passante di uno dei filtri utilizzati perla misura del flusso luminoso.

Dip. di Fisica @ UNISALENTO 11

Figura 1.1: Curve di trasmissione relativa per i filtri fotometrici piu diffusamenteimpiegati nelle osservazioni ottiche da Terra. La linea continua denota i filtriU,B,V, mantre la linea tratteggiata si riferisce alle bande R ed I. Con una lineapunteggiata sono indicati i filtri a banda piu stretta della fotometria cosiddettadi Stromgren. La regione in cui l’occhio umano rivela la radiazione va all’incircada 3000 a 7000 A.

Dato che la stella Vega e classificata di tipo A0-V, possiamo concludere chenel sistema fotometrico cosı definito la differenza di magnitudine tra due bandespettrali differenti (p.es. mB − mV ) da il rapporto dei flussi alle due lunghezzed’onda corrispondenti relativamente al rapporto dei flussi che si sarebbe ottenutoper una stella di tipo A0-V.

Per quanto detto allora, data la magnitudine di una stella nelle bande UBVRIe disponendo di una misura del flusso assoluto di Vega (p.es. in Hayes 1985: Ca-libration of Fundamental Stellar Quantities, IAU Symp 111) e possibile calcolareil flusso a terra.

12 F.Strafella

Figura 1.2: Lo spettro di Vega come zero del sistema di magnitudini.

1.2.2 Flussi osservati e conteggi

Il risultato di una misura non e esattamente il flusso intrinseco della sorgentestudiata. Per risalire a questa grandezza e necessario tener conto di molti fattoriche influenzano il risultato della misura:

1 l’area collettrice del telescopio;

2 le perdite (dovute all’estinzione) ed i guadagni di fotoni (dovuti a diffu-sione ed emissione in direzione dell’osservatore) imputabili alla presenzadell’atmosfera terrestre;

3 l’efficienza globale dell’ottica e del rivelatore.

In generale il segnale astronomico puo essere rappresentato da

S = A ∆t

hc/λqλ aλ dλ (1.10)

Dip. di Fisica @ UNISALENTO 13

Tabella 1.1: Caratteristiche dei filtri, a banda larga ed intermedia, piucomunemente usati per osservazioni nella regione ottica.Banda λeff ∆λ/λ Flussi di magnitudine zero Note

(µm) (µm) erg/(cm2 s A) Watt/(m2 Hz) Jy

U 0.36 0.15 4.35(-9) 1.88(-23) 1810 broadB 0.44 0.22 7.20(-9) 4.44(-23) 4260 broadV 0.55 0.16 3.92(-9) 3.81(-23) 3640 broadR 0.64 0.23 1.76(-9) 3.01(-23) 3080 broadI 0.79 0.19 8.3(-10) 2.43(-23) 2550 broadJ 1.26 0.16 3.4(-10) 1.77(-23) 1600 broadH 1.60 0.23 1.2(-10) 1080 broadK 2.22 0.23 3.9(-11) 6.3(-24) 670 broadL 3.4 8.1(-12) 3.1(-24) broadM 5.0 2.2(-12) 1.8(-24) broadN 10.2 1.23(-13) 4.3(-25) broadu narrowv narrowb narrowj narrow

Nota: 1 Jy = 10−23 erg sec−1 cm−2 Hz−1 = 10−26 W m−2 Hz−1

1 Jy = 107 photons sec−1 m−2 (∆λ/λ)−1

dove A rappresenta l’area collettrice (del telescopio), ∆t il tempo di integra-zione, qλ l’efficienza globale del sistema di raccolta e rivelazione, ed infine aλ

rappresenta la trasmissione dell’atmosfera.

Tuttavia, anche se la precedente equazione e formalmente corretta, non vienemai utilizzata per collegare il segnale misurato S al flusso intrinseco della sorgenteFλ, non solo a causa della difficolta di conoscere accuratamente il valore deiparametri strumentali in gioco ma anche della loro variabilita nel tempo. Ilmetodo che invece viene generalmente adottato e di misurare tutti i segnali inmodo differenziale rispetto ad un set di stelle standard le cui brillanze siano gianote da precedenti lavori di calibrazione (questi aspetti saranno approfonditi nelsuccessivo paragrafo 3.4.4).

Sebbene quindi l’eq.(1.10) non sia utile all’osservatore e comunque molto uti-lizzata in fase di programmazione delle osservazioni per calcolare approssimati-vamente il numero di fotoni che si potranno ricevere da una data sorgente, in undeterminato tempo di integrazione, con specifiche condizioni dell’apparato stru-mentale. Il numero di fotoni attesi durante la misura e infatti un’informazione

14 F.Strafella

critica nella preparazione di una proposta osservativa per poter valutare in primaapprossimazione sia il tempo di integrazione necessario per una data osservazionesia l’incertezza associata alle stesse misure.

A questo punto e utile ricordare che la comprensione del ruolo degli errori (ov-vero delle incertezze di misura) e assolutamente importante in tutte le disciplinescientifiche, in particolare in Astronomia dove le sorgenti sono spesso deboli, ifotoni scarsi e gli errori per niente trascurabili.

1.3 Errori e distribuzioni di probabilita

Dato un flusso medio di fotoni c’e una funzione di probabilita che ci informasulla fluttuazione del numero effettivo di fotoni che riceviamo, anche se fossimoin grado di rivelare sempre il 100% dei fotoni in arrivo, a causa dell’incertezzastatistica. Oltre all’incertezza nel numero di fotoni che arrivano vi sono poi leincertezze strumentali che pure si aggiungono. Per discutere questi problemiqui richiamiamo brevemente alcuni concetti sulle distribuzioni di probabilita conqualche enfasi sulla distribuzione di Poisson che si applica al nostro caso specificodella rivelazione di fotoni.

Pensiamo al risultato della misura di una data grandezza (p.es. un flusso diradiazione) che puo assumere valori continui all’interno di un ampio intervallo[xmin ÷ xmax]. Definiamo poi come distribuzione di pobabilita della nostra gran-dezza l’espressione p(x)dx che descrive la provabilita di trovare un valore per lanostra grandezza nell’intervallo [x ÷ x + dx]. Perche la p(x) abbia il senso diprobabilita sara anche necessario che l’integrale su tutti i valori possibili dellagrandezza sia unitario:

p(x) dx = 1 (1.11)

A questo punto e interessante ricordare alcune definizioni collegate alla distri-buzione p(x):

- la media:

µ =

x p(x) dx

- la varianza:

σ2 =

(x − µ)2 p(x) dx

da cui si ricava la cosiddetta devizione standard σ =√

varianza

Dip. di Fisica @ UNISALENTO 15

- la mediana: xmed definita dalla relazione

∫ xmed

−∞p(x) dx

∫ +∞

−∞p(x) dx

=1

2

- la moda: xmod che corrisponde al valore piu probabile per cui si ha

p(xmod) = pmax

Le grandezze appena definite caratterizzano la particolare distribuzione e la lorointerpretazione geometrica dipendera dalla natura della distribuzione. Sebbenetutti noi immaginiamo facilmente la media e la varianza di una distribuzionegaussiana. e bene ricordare che la stessa visione non e sempre applicabile a tuttele distribuzioni anche se per tutte le distribuzioni le grandezze introdotte sonotutte perfettamente definite.

E molto importante rendersi conto della differenza che c’e tra la media, lavarianza, etc. calcolate su un campione di misure, e le stesse grandezze associatealla popolazione. Mentre queste ultime si riferiscono alla distribuzione intrinseca(vera) e sono legate alla natura del fenomeno fisico studiato, le grandezze cam-pionarie sono solo delle stime che possiamo dedurre a partire da un numero finitodi misure (il campione o sample) che abbiamo a disposizione.

Le quantita campionarie sono calcolate dalle:

media campionaria x ≡∑

xi

N(1.12)

varianza campionaria σ2x ≡

(xi − x)2

N − 1=

x2i − (

xi)2/N

N − 1(1.13)

dove la seconda espressione della varianza, non richiedendo la preventiva de-terminazione della media x, mostra la sua utilita nel calcolo della varianza all’au-mentare del numero di misure disponibili. Naturalmente le grandezze campiona-rie cosı determinate tendono ai valori della media e varianza della popolazione altendere di N → ∞.

Distribuzione binomiale

La distribuzione che meglio si presta a descrivere la rivelazione dei fotoni e lacosiddetta binomiale. Questa da la probabilita di osservare un particolare valore

16 F.Strafella

x di un possibile evento (l’arrivo di un certo numero x di fotoni), dato il numerototale n di eventi (le prove indipendenti), e la probabilita p di osservare il singoloevento (tra tutti gli altri possibili) in una singola operazione di misura

P (x, n, p) =n! px (1 − p)n−x

x! (n − x)!(1.14)

Per questa distribuzione si puo calcolare la media

µ ≡∫

x P (x) dx = n p (1.15)

e la varianza

σ2 ≡∫

(x − µ)2 P (x) dx = n p (1 − p) (1.16)

Distribuzione di Poisson

Nel caso della rivelazione di fotoni n e il numero totale di fotoni emessi dallasorgente e p e la probabilita di rivelarne uno in particolare, durante la nostraosservazione, tra tutti quelli emessi. In effetti noi non conosciamo nessuno diquesti due valori, sappiamo pero che p ≪ 1 e che possiamo stimare il numeromedio di quelli rivelati come µ ≃ n p.

In queste condizioni se n & 150 ed il valore di np e molto simile a quellodi np(1 − p) (diciamo entro il 10%) la distribuzione binomiale tende a quella diPoisson

P (x, µ) =µx exp−µ

x!(1.17)

Dalle precedenti relazioni per la distribuzione binomiale si ricavano utili ri-sultati sulla media e varianza della poissoniana che si possono esprimere:

media = µ

varianza ≡ σ2 =∑

x

(x − µ)2 P (x, µ) = n p = µ (1.18)

deviazionestandard = (varianza)1/2 = σ = µ

Si noti che questo tipo di risultati non sono limitati al conteggio di fotoni masi applicano ad ogni osservabile che noi possiamo rivelare attraverso misure diconteggio. In Figura 1.3 e mostrata la distribuzione poissoniana per due valoridiversi della media.

Dip. di Fisica @ UNISALENTO 17

Figura 1.3: Poissoniana per due valori ( 4 e 12) della media. Si noti come gia conuna media µ=12 la distribuzione comincia a mostrarsi simmetrica e a somigliaread una gaussiana.

Distribuzione di Gauss

Dalla Figura 1.3 si vede come la distribuzione di probabilita tende ad esseresimmetrica per grandi valori della media. In questo caso e anche possibile ap-prossimare la poissoniana intorno alla sua media con una distribuzione di Gaussche viene anche detta distribuzione normale :

P (x, µ, σ) =1√2πσ

e−(x−µ)2

2σ2 (1.19)

Si noti che questa somiglianza nelle due distribuzioni per grandi valori dellamedia ci permette di usare le usuali tecniche di minimi quadrati per fittare idati sperimentali. Infatti queste tecniche sono ben fondate solo nel caso di unadistribuzione normale (gaussiana) degli errori di misura nei dati sperimentali.

L’importanza della distribuzione normale sta sopratutto in due altre caratte-ristiche:

- la gran parte delle variabili fisiche mostrano un comportamento ben descri-vibile sulla base di questa distribuzione

- questa distribuzione e il limite a cui tende qualsiasi convoluzione di funzionigeneriche che descrivano possibili fonti di errore che influenzano le misure.

Questa seconda proprieta emerge dal cosiddetto teorema del limite centraleche in parole povere recita: se una quantita fisica dipende da un gran numero

18 F.Strafella

di variabili casuali con distribuzioni di probabilita qualsiasi, la stessa quantitasara distribuita normalmente (cioe secondo la gaussiana).

1.3.1 Analisi degli errori e livello di confidenza

Se notiamo ora che l’ampiezza di una distribuzione di misure e legata all’in-certezza delle stesse miure, possiamo considerare la deviazione standard comeuna grandezza adatta a valutare questa incertezza. Siccome per la distribuzionedi Poisson vale le relazioni 1.18 vediamo come l’aumento della media µ corri-sponde ad un minore aumento della deviazione standard che va come

õ per

cui e abbastanza evidente che valutazione accurata delle incertezze di misura eindispensabile per:

- stimare la quantita di tempo di osservazione richiesta per abbattere l’incer-tezza relativa delle misure fino al punto da poter ottenere le informazioniscientifiche che ci servono;

- valutare se i dati ottenuti durante le osservazioni sono consistenti con glierrori aspettati: se non lo sono o abbiamo imparato nuova astrofisica o nonabbiamo capito a fondo i nostri dati osservativi.

Il controllo di questi aspetti e particolarmente importante in Astronomia, unadisciplina in cui i segnali provenienti dagli oggetti osservati sono deboli e moltospesso i programmi osservativi richiedono la rivelazione di segnali che si spingonofin sotto il livello del rumore.

Nella realta noi potremo dare solo risposte probabilistiche che si basano suopportuni test che costruiamo per calcolare la probabilita che le osservazioni sianoconsistenti con la distribuzione aspettata (la cosiddetta “ipotesi nulla”).

Facciamo un esempio prendendo una curva di luce di una stella per la qualeabbiamo osservato la brillanza un certo numero di volte e nell’ultima osservazioneeseguita abbiamo notato una brillanza che ci sembra particolarmente alta rispet-to alle precedenti misure. Ci domandiamo quindi se quest’ultima osservazioneabbia evidenziato un flare1 della stella e per esaminare questa possibilta suppo-niamo che le nostre misure siano descrivibili con una gaussiana, ovvero che sianonormalmente distribuite intorno alla brillanza media della stella. In questo casopossiamo usare la error function (anche detta erf(x)) che e praticamente l’inte-grale della gaussiana. Da questa funzione possiamo determinare la probabilita

1Col termine flare si indica un rapido aumento della brillanza della stella prodotto da feno-meni superficiali legati ad attivita magnetica e convettiva simile a quella che che si osserva sulSole.

Dip. di Fisica @ UNISALENTO 19

di misurare un dato valore della brillanza e da questa stessa funzione sappiamoanche che il 68% delle misure cadono entro ±1σ dalla media, e che il 95.3% ca-dono entro ±2σ. Quindi se abbiamo osservato N volte la luce della stella conuna incertezza (photon noise) pari a σ su ciascuna misura, possiamo verificare seil numero di misure che cadono oltre il limite di 2σ dalla media e maggiore diquello che ci aspettiamo dalla statistica dei fotoni. Per decidere se un singolo va-lore sia significativo si potrebbe adottare un criterio piu stringente che potrebberichiedere di essere oltre 5σ dalla media, in questo modo aumentando il livellodi significativita della misura. D’altro canto, se nell’intervallo 2σ ÷ 4σ si trovanomolte piu misure di quante ci si aspetterebbe dalla statistica dei fotoni allora sipotrebbe concludere, con un certo livello di significativita, che si sta osservan-do una variazione della brillanza della stella e non semplicemente la prevedibilefluttuazione statistica nel numero di fotoni che si raccolgono ad ogni misura. Einteressante anche sottolineare che, nel caso ottenessimo che tutte le misure ri-cadono entro 1σ dal valore aspettato allora c’e qualcosa di sbagliato nella nostrastima dell’errore oppure le misure non sono indipendenti l’una dall’altra.

Come predire gli errori di misura

Data una stima del valor medio del flusso di fotoni che ci aspettiamo di osservare,possiamo calcolare il rapporto tra il segnale S ed il rumore N che chiameremobrevemente rapporto S/N, o anche S/N ratio

S/N =S√σ2

(1.20)

dove con S abbiamo indicato il valore medio del flusso. Se l’oggetto che studiamoproduce un flusso S ′ che porta ad avere un segnale misurato S = S ′ A t, dovecon A e t abbiamo rispettivamente indicato l’area collettrice (p.es. lo specchioprincipale di un telescopio) ed il tempo di integrazione, nel caso piu semplice incui c’e solo il rumore statistico N dei fotoni avremo:

N ≡ σ =√

S =√

S ′ A t =⇒ S/N =√

S ′ A t (1.21)

In altre parole, una volta fissato l’oggetto da studiare ed il telescopio, il rapportoS/N cresce con la radice del tempo di integrazione usato per ottenere la misura.Notate che S e una quantita osservabile per cui il rapporto S/N puo essere de-terminato indipendentemente dalla conoscenza del telescopio o della sorgente see possibile ottenere una misura di prova del segnale prodotto dalla sorgente.

Una stima piu realistica comunque deve includere anche il rumore prodottodalla brillanza B′ (da Background) del fondo del cielo che e sempre presente.

20 F.Strafella

Questa brillanza e espressa in unita di flusso per area di cielo (e detta anchebrillanza superficiale) e quindi di solito viene data in unita di mag arcsec−2,oppure in mag sr−1). Si intuisce quindi che la quantita di luce proveniente dalfondo del cielo che andra a inquinare la nostra misura dipendera da quanta partedi cielo (angolo solido) accettiamo durante le nostre osservazioni. Se indichiamocon a l’area di cielo interessata abbiamo che

B = B′ a A t (1.22)

Il numero totale di fotoni osservati durante la misura e quindi dato dallasomma dei due contributi: un segnale proveniente dal cielo e l’altro dalla sorgente:

O = S + B = (S ′ + B′a) A t (1.23)

Dalla statistica di Poisson ricaviamo per l’incertezza totale sul conteggio di fotoni:

σ =√

O =√

S + B =√

(S ′ + B′a) A t (1.24)

che corrisponde ad una valutazione del rumore nella misura. Se ora teniamoconto che faremo anche una misura del solo cielo B per sottrarre il contributo delfondo possiamo scrivere

S = O − B = S ′ A t (1.25)

Questo porta alla forma dell’equazione del rumore in presenza di un fondo usandole espressioni 1.25 ed 1.24

S/N =S√

S + B=

S ′

√S ′ + B′a

√A t (1.26)

E interessante notare che si possono incontrare due casi limite per i quali valgonoespressioni semplificate:

S ′ ≫ B′a =⇒ S/N ≃√

S ′A t =√

S (1.27)

S ′ ≪ B′a =⇒ S/N ≃ S ′

√B′a

√A t =

S√B

(1.28)

il primo caso viene detto signal-limited, mentre il secondo background-limited.Nel caso background-limited il rapporto S/N e minore e questo fa capire l’impor-tanza di minimizzare B. Questo si puo ottenere sia osservando in condizioni dicielo scuro che di minimizzando l’area di cielo da cui si ricevono fotoni (angolo di

Dip. di Fisica @ UNISALENTO 21

accettazione) durante la misura. Quest’ultima richiesta si puo anche tradurre intermini di ottimizzazione del seeing e quindi della ricerca di siti di osservazioneche abbiano una buona qualita (in senso astronomico) dell’atmosfera.

A questo punto possiamo ulteriormente sfruttare i concetti fin qui esposti perconfrontare le capacita osservative di due telescopi di diversa area, A1 ed A2. Perchiarire questo punto andiamo a stimare come varia il flusso limite che si riescea rivelare con un dato valore del rapporto S/N, in un dato tempo di integrazionet. Nel primo caso “signal limited” possiamo scrivere:

S1/N1

S2/N2=

S ′

1A1t√

S ′

2A2t(1.29)

mentre per il secondo caso “background limited” abbiamo:

S1/N1

S2/N2

=S ′

1

√A1t

S ′

2

√A2t

(1.30)

dove abbiamo tenuto conto che il fondo B′ e sempre lo stesso ed e indipendente daltelescopio utilizzato. Se adesso vogliamo paragonare tra loro il segnale rivelabilenei due casi ad un fissato valore del rapporto S/N, abbiamo:

S ′

2 = S ′

1

A1

A2

caso signal − limited

S ′

2 = S ′

1

A1

A2caso background − limited

da cui si vede che, dato il tempo di integrazione ed il rapporto S/N richiesto, ilflusso osservabile va come il rapporto delle aree nel caso signal limited, mentreva con la radice di questo rapporto se il background e il fattore limitante.

Errore strumentale

Completiamo la discussione sul rumore considerando il rumore strumentale che,prodotto dallo stesso sistema di rivelazione, in ogni caso si aggiunge al rumorepoissoniano prodotto dal conteggio dei fotoni rivelati. Un esempio comune diquesto tipo di errore e dato dal rumore di lettura dei rivelatori di tipo CCD (dettoRON, da Read-Out-Noise) . Questo e un rumore additivo, a media zero, prodottodal sistema di lettura indipendentemente dal livello del segnale. Se indichiamo ilrumore di lettura con il simbolo σRO possiamo riscrivere la relazione 1.26 come

S/N =S

S + B + σ2RO

22 F.Strafella

se si considera un singolo pixel del rivelatore. Siccome pero un oggetto punti-forme occupa piu di un pixel sul rivelatore CCD, diciamo occupa Npix pixel, laprecedente si riscrivera

S/N =S

S + B + Npixσ2RO

(1.31)

Per grandi valori del Read-Out-Noise il comportamento del rapporto S/N eanalogo a quello del caso background-limited. Questo fatto fa vedere chiaramenteche, in presenza del rumore di lettura, la qualita dell’immagine deve essere curatain modo tale che una stella non vada ad illuminare un numero di pixel eccessivoper non degradare eccessivamente il rapporto S/N. E anche evidente come sianecessario ridurre al massimo il rumore di lettura nel caso di applicazioni con bassilivelli di background, cosa che avviene generalmente nel caso della spettroscopia.

Oltre a quelle finora discusse vi sono comunque altre fonti di errore, che pureintervengono nel determinare il risultato finale e quindi il rapporto S/N: qui cilimitiamo a citare la dark current, il rumore di digitalizzazione, le incertezze nelladeterminazione della brillanza del fondo cielo che si va a sottrarre alla misura, glierrori insiti nella particolare tecnica fotometrica utilizzata. Questi contributi alrumore potranno essere meglio discussi piu avanti.

Propagazione degli errori

Se finora abbiamo visto come stimare le incertezze nei conteggi, che sono prati-camente le quantita osservate, ora ci proponiamo di valutare come queste si pro-pagano quando andiamo a calcolare quantita derivate a partire dalla conoscenzadei segnali osservati.

In generale, quando abbiamo a che fare con una quantita x = f(u, v, ...)derivata a partire da altre grandezze u, v, ... affette da incertezza, ci domandiamocome valutare l’incertezza σx una volta che siano note le incertezze σu, σv, ....

Se gli errori sono piccoli rispetto alle grandezze misurate allora possiamoscrivere

xi − x = (ui − u)∂x

∂u+ (vi − v)

∂x

∂v+ ... (1.32)

da cui ricaviamo per l’incertezza totale media

σ2x = lim

N→∞

1

N

N

(xi − x)2 = σ2u(

∂x

∂u)2 + σ2

v(∂x

∂v)2 + 2σ2

uv

∂x

∂u

∂x

∂v(1.33)

Nelle precedenti abbiamo indicato con σ2uv la quantita

σ2uv = lim

N→∞

1

N

N

(ui − u)(vi − v) (1.34)

Dip. di Fisica @ UNISALENTO 23

e ci siamo limitati per semplicita a considerare solo le due variabili u e v. L’ulti-mo termine nell’equazione 1.33 prende il nome di covarianza e rappresenta unamisura di quanto le due variabili u e v sono correlate. Si noti che l’annullarsi deltermine di covarianza corrisponde a variabili non correlate, ovvero statisticamenteindipendenti. Per variabili scorrelate ci aspettiamo infatti che nel calcolo di σ2

uv

per ogni ui troveremo termini positivi e negativi nella vi con uguale probabilitafacendo quindi tendere la somma a zero.

L’applicazione di questo criterio di propagazione implica le seguenti regole dicomposizione delle incertezze:

Operazione x = σ2x

addizione/sottrazione u + v σ2u + σ2

v + σ2uv

moltiplicazione/divisione uv v2σ2u + u2σ2

v + 2uvσ2uv

logaritmo ln(u) σ2u/u

2

Se andiamo ad indagare ulteriormente sugli errori propagati non sempre ot-teniamo che la loro distribuzione rispecchia quella delle variabili originarie. Inaltre parole, se u e v sono distribuite normalmente, in generale non e detto chex = f(u, v) sia anche distribuita normalmente. Nel richiamare i concetti legatialla valutazione dell’incertezza nelle misure abbiamo finora discusso la propaga-zione degli errori associati a singole misure di uguale peso tra loro. Nel casopiu generale pero avremo a che fare con grandezze che possono essere ottenutecome medie di una serie di misure. Se, per esempio, abbiamo piu misure dellabrillanza di una stella e vogliamo la migliore stima della media e della varian-za della popolazione 2 da cui provengono le misure, ci affidiamo al criterio dellamassima probabilita. Tecnicamente diremo che la migliore stima di un parametrodella popolazione (media, varianza, ...) e data da quel valore che massimizza laprobabilita che la stima stessa corrisponda al valore vero della grandezza nellapopolazione genitrice. In termini piu semplici e quando gli errori associati alle imisure disponibili sono tutti uguali, la migliore stima risulta quella calcolata conl’usuale espressione della media campionaria in eq.1.12. Usando la propagazionedegli errori la stima dell’incertezza su questa media e:

σ2x =

N

σ2i

N2=

σ2

N

2col termine popolazione si intende la distribuzione vera dalla quale noi estraiamo un nu-mero limitato di campioni (le misure) che vengono usati per stimare le caratteristiche dellapopolazione

24 F.Strafella

dove si e sfruttato il fatto che gli errori di misura (le σi) sono tutti uguali (σi =σ =costante). Se invece abbiamo a che fare con errori che variano da una misuraall’altra (p.es. a causa di diversi tempi di esposizione utilizzati) allora la mediain eq.1.12 viene sostituita da una media pesata

x =

xi

σ2i

1σ2

i

e l’errore su questa media si calcola con

σ2x =

σ2i

σ4i

(∑

1σ2

i)2

=1

1σ2

i

Ora che abbiamo le espressioni generali come scegliamo i pesi σi associati allesingole misure ? Una possibilita ci viene offerta dalla statistica di Poisson chesuggerisce di associare ad un valore del conteggio medio µ un’incertezza pari a√

µ. Ricordiamo tuttavia che nel caso reale noi abbiamo a che fare non con lamedia µ ma con la media campionaria x e questo puo introdurre un bias3 nellenostre valutazioni che sara tanto piu importante quanto piu piccoli saranno ivalori del conteggio ottenuti dalle osservazioni.

Un’altra considerazione possiamo farla attraverso un esempio: avendo osser-vato in tre momenti diversi la stessa stella ed avendo ottenuto rispettivamente40, 50 e 60 conteggi, ci domandiamo quale sia la migliore stima della media.Saremmo tentati di dire che la media e evidentemente 50 conteggi. Tuttavia seutilizziamo la media pesata assumendo che l’errore statistico nei tre casi vale√

40,√

50 e√

60 otteniamo una media di 48.6 conteggi. Evidentemente, siccomel’errore statistico e minore per conteggi piu bassi la media pesata sara spostataverso conteggi un po’ minori rispetto al caso non pesato. Quindi se utilizziamocome pesi gli errori poissoniani individuali produciamo un bias verso valori piubassi del conteggio. Nella pratica, piuttosto che pesare le misure con l’errorestatistico del conteggio converra pesarle con altri criteri come p.es. il tempo diosservazione t. Questa scelta funziona bene nel caso di errori poissoniani (lavarianza e proporzionale ai conteggi e quindi a t), ma puo non essere la sceltamigliore quando gli errori strumentali (che non dipendono da t) sono importanti.P.es. in presenza di rumore di lettura (che e costante e non dipende da t) leesposizioni piu lunghe che producono piu conteggi saranno meno influenzate diquelle piu brevi e quindi dovrebbero essere pesate di piu di quanto avremmo fatto

3col termine bias si intende lo spostamento del valore misurato di una grandezza dal valorevero causato dall’intervento di un segnale spurio

Dip. di Fisica @ UNISALENTO 25

calcolando il semplice rapporto tra i diversi tempi di integrazione. In questo casoe opportuno calcolare la media campionaria tra i conteggi ottenuti per unita ditempo e poi usare questo valore scalato all’appropriato tempo di integrazione tiper valutare l’errore poissoniano di ogni misura.

Come applicazione di quanto abbiamo visto ci occupiamo ora di accertarequali conseguenze comporta la suddivisione in piu parti di una osservazione pro-grammata per un tempo di integrazione totale t. Le considerazioni che abbiamosviluppato sul rapporto S/N ci permettono infatti di stimare il tempo di integra-zione necessario ad ottenere i conteggi utili ad affrontare con successo il nostroproblema scientifico. Tuttavia, nella pratica osservativa si pone spesso il pro-blema di suddividere il tempo di integrazione. Le ragioni per far questo sonomolteplici e possono riguardare l’inseguimento (tracking) della sorgente nel cielo,la reiezione dei segnali dovuti ai raggi cosmici, il controllo delle condizioni delcielo (monitoring), la saturazione del rivelatore, ... Siccome da questa necessitapuo derivare una riduzione del rapporto S/N e opportuno approfondire questopunto quantitativamente.

Consideriamo quindi un oggetto astronomico che produce un flusso di fotoniS ′ sovrapposto ad un cielo con brillanza superficiale B′ che viene osservato conun rivelatore che produce un rumore di lettura σRO. Se facciamo una singolamisura con un breve tempo di esposizione ∆t otterremo un segnale con varianza

σ2∆t = S ′A∆t + B′aA∆t + Npixσ

2RO

e, sommando n esposizioni per ottenere un tempo di integrazione totale t = n∆t,avremo che la varianza risultante sara

σ2n∆t = nσ2

∆t

Se ora invece consideriamo di fare un’unica esposizione di durata totale t =n∆t avremo una varianza

σ2t = S ′At + B′aAt + Npixσ

2RO

Il rapporto tra i rumori ottenuti nei due casi di n esposizioni brevi di durata∆t e di un’unica esposizione lunga di durata t = n∆t sara quindi

σn∆t

σt=

S ′At + B′aAt + nNpixσ2RO

S ′At + B′aAt + Npixσ2RO

(1.35)

Dalla relazione precedente si vede come, sia nel caso signal-limited che inquello background-limited, l’osservazione si puo suddividere in piu parti senza

26 F.Strafella

pregiudizio del rapporto S/N finale. Se pero il rumore di lettura del rivelatoree importante allora la suddivisione in parti del tempo di integrazione totale pro-duce un peggioramento del rapporto S/N che va come la radice del numero disuddivisioni del tempo di integrazione.

Errori casuali ed errori sistematici

Finora si e detto degli errori casuali. Oltre a questi vi sono anche gli errorisistematici che possono essere anche piu problematici da trattare. Questi nonsono casuali ma sono correlati con qualche grandezza che caratterizza le vostreparticolari osservazioni. L’esempio piu immediato nel caso di immagini ottenutecon un CCD e il cosiddetto flat field: si tratta di un segnale sistematico che sisomma al segnale astronomico e che e prodotto dalla diversa sensibilita relativadei pixel che costituiscono il rivelatore. In pratica questo puo essere visualizzatocome un “pattern”4 che appare osservando un fondo omogeneo come puo essereuno schermo illuminato uniformemente e posto davanti al telescopio.

Si noti che l’analisi degli errori casuali che ci aspettiamo di ritrovare nellenostre misure si rivela spesso utile a scoprire eventuali errori sistematici presentinei dati acquisiti. Uno strumento efficace per mettere in evidenza eventuali errorisistematici e’ rappresentato da un grafico in cui rappresentiamo i residui (cioe ledifferenze) che riscontriamo, tra i dati ottenuti ed il modello che li dovrebberappresentare, in funzione di tutte le variabili in gioco. Se gli errori sono davverocasuali i residui saranno casualmente distribuiti tra positivi e negativi, mentreuna asimmetria nella loro distribuzione vi fara sospettare o la presenza di errorisistematici o l’inadeguatezza del modello utilizzato.

1.4 Effetti dell’atmosfera

La brillanza del cielo e un fattore molto importante che interviene nelle osser-vazioni astronomiche ponendo un limite alla osservabilita degli oggetti di bassaluminosita. Le sorgenti che producono questo fenomeno non sono in genere uni-formemente distribuite per cui la brillanza del cielo dipende dalla direzione diosservazione. Oltre alla dipendenza direzionale ci troviamo anche di fronte aduna grande variabilita temporale che rende difficile una valutazione a priori dellabrillanza del cielo. A causa di queste complicazioni e quindi usuale stimare labrillanza del cielo durante le stesse osservazioni, avendo pero l’accortezza di otte-nere le nostre stime facendo misure su un cielo che sia il piu vicino possibile, sia in

4col termine pattern si intende indicare la forma che caratterizza un segnale

Dip. di Fisica @ UNISALENTO 27

spazio che in tempo, al cielo delle nostre osservazioni. Questo e particolarmenteimportante quando si osserva nella regione IR, dove il contributo del fondo alsegnale rivelato ha caratteristiche di forte intensita e variabilita.

Le principali sorgenti della brillanza del cielo le possiamo elencare cosı

- Luce zodiacale: ha origine solare (quindi mostra uno spettro continuo) ede prodotta dalla diffusione da parte di grani di polvere interplanetaria chesi trovano in maggiore concentrazione intorno al piano di rivoluzione deipianeti (piano dell’eclittica). La magnitudine in banda V di questa brillanzae valutata nell’intervallo mV ≃ 22.2 ÷ 23.5 mag arcsec−2, a seconda dellalatitudine e longitudine eclittica verso cui osserviamo;

- Luminescenza del cielo (detta anche “airglow”): si tratta di luce emessa inlinee spettrali dalle molecole dell’alta atmosfera che vengono eccitate dallaluce solare e dai raggi cosmici;

- Aurore: luce in linee spettrali emesse da molecole atmosferiche eccitate dalvento solare. Questo fenomeno e particolarmente favorito in vicinanza deipoli magnetici dove le linee del campo magnetico terrestre (che hanno unageometria globale di tipo dipolare) incanalano le particelle cariche del ventosolare producendo ai poli un aumento del flusso di particelle;

- Luce diffusa del Sole : minima se si evita di osservare al crepuscolo o all’alba;

- Luce diffusa della Luna: molto variabile nel tempo ed in lunghezza d’on-da. Valori tipici osservati in un buon sito astronomico sono riportati inTabella 1.2;

- Inquinamento da luce artificiale: puo essere molto forte in alcune lineespettrali tipiche delle lampade a fluorescenza dell’illuminazione pubblica;

- Luce diffusa o emessa dal telescopio e dalla cupola

- Luce da stelle e galassie non risolte

Lo spettro della luminosita di fondo del cielo osservato a La Palma, in assenzadi luna, e mostrato in Figura 1.4.

Dal punto di vista dell’osservazione le conseguenze prodotte della brillanzasuperficiale del cielo dipendono anche dalla qualita dell’immagine, visto che in

28 F.Strafella

Tabella 1.2: Brillanza del cielo notturno nella regione ottica dello spettro infunzione della fase lunare.

fase lunare U B V R I(giorni) mag arcsec−2

0 22.0 22.7 21.8 20.9 19.93 21.5 22.4 21.7 20.8 19.97 19.9 21.6 21.4 20.6 19.710 18.5 20.7 20.7 20.3 19.514 17.0 19.5 20.0 19.9 19.2

una immagine di bassa qualita il disco di seeing5 e angolarmente piu ampio equindi consente ai fotoni provenienti dal fondo del cielo di mescolarsi in maggioremisura al segnale stellare che invece e sempre lo stesso (il suo integrale noncambia se lo si distribuisce su piu pixel). Per esemplificare consideriamo cheun cielo che in banda V e di 22 mag arcsec−2 con un buon seeing permettedi essere background-limited attorno a 22 mag. Con un seeing cattivo la stessacondizione e gia raggiunta intorno a 20 mag ed e quindi importante non solo avereun cielo oscuro ma anche avere una buona qualita del seeing (che corrisponde aduna atmosfera poco turbolenta ! ). Se il seeing non e molto buono puo esserevantaggioso restringere la banda dei filtri utilizzati per le osservazioni in mododa diminuire i fotoni del fondo. Ovviamente, riducendosi anche la luce raccoltadall’oggetto questo implichera anche l’uso di un maggior tempo di integrazioneper poter ottenere la stessa misura.

Se poi si continuasse a restringere la banda passante del nostro strumento diosservazione, ad un certo punto si transita dalle condizioni tipiche della fotometriaa quelle che caratterizzano la spettroscopia. Quando la luce raccolta dal telescopioviene dispersa in lunghezza d’onda come avviene in spettroscopia, la radiazioneproveniente dal fondo del cielo subisce la stessa dispersione e, essendo “diluita” inlunghezza d’onda, non costituisce piu generalmente un grosso problema. Solo nelcaso in cui il cielo emette le sue proprie linee spettrali a lunghezze d’onda moltovicine o addirittura sovrapposte a quelle emesse dall’oggetto in studio avremmocomunque un problema (blending delle linee). Nel caso poi della spettroscopia ad

5Il termine seeing viene usato per indicare la qualita del cielo astronomico e si riferisce disolito alle dimensioni angolari osservate per una sorgente puntiforme. Queste vengono spessodate in termini della FWHM (da Full Width at Half Maximum, o larghezza a mezza altezza)dell’immagine stellare

Dip. di Fisica @ UNISALENTO 29

Figura 1.4: Spettro della brillanza del cielo notturno a La Palma (Isole Cana-rie). Si noti come la brillanza aumenta alle lunghezze d’onda maggiori dove ilcontributo delle linee emesse dalla molecola OH domina lo spettro.

alta risoluzione le osservazioni non sono praticamente mai background-limited mapiuttosto tendono ad essere read-out-noise-limited, proprio perche’ la radiazionedel fondo del cielo arriva sui pixel del rivelatore molto dispersa in lunghezzad’onda.

Nel caso della fotometria IR nelle bande del vicino IR, J (1.25 µm), H (1.65µm) e K(2.2 µm), il cielo mostra le brillanze riportate in tabella 1.3. Come si vede,diversamente dal caso della regione ottica (vedi Tabella 1.2) non e’ indicata unadipendenza dalla fase lunare perche il fenomeno della diffusione della luce diventasempre meno importante all’aumentare della lunghezza d’onda della radiazione(come si nota anche in Tabella 1.2).

In queste condizioni il fondo del cielo appare particolarmente brillante e leosservazioni nella regione del vicino-IR sono sempre background-limited anchein spettroscopia, eccetto che per oggetti brillantissimi come i pianeti o le stellepiu brillanti. Questo fatto implica differenze importanti nel modo di acquisire ed

30 F.Strafella

Tabella 1.3: Brillanza superficiale del cielo notturno nella regione del vicino IRper alcuni siti astronomici. I valori sono dati in mag arcsec−2.

Sito J H Kmag arcsec−2

La Silla (bright) 15.8 13.8 12.7La Silla (dark) 16.7 15.0 13.0Las Campanas 15.6 13.7 12.4Paranal 16.0 14.0 13.2Mauna Kea 15.7 13.6 13.0

analizzare i dati ottenuti da osservazioni nell’ottico rispetto al caso delle bandeIR. Inoltre, a causa della presenza di moltissime linee di emissione del cielo, pergli spettri IR e difficile valutare a priori il rapporto S/N perche esso e fortementedipende dalla particolare regione spettrale (sempre entro le bande IR) in cui vo-gliamo misurare lo spettro della sorgente. In compenso, nella regione IR la lucediffusa della Luna non produce un fondo importante (si ricordi che la diffusionedi Rayleigh va come λ−4) e per questo le osservazioni vengono eseguite preferi-bilmente in periodo di Luna piena, lasciando alle osservazioni ottiche l’uso deitelescopi nelle notti piu scure.

1.4.1 Estinzione da parte dell’atmosfera

E noto che l’atmosfera terrestre non trasmette il 100% della luce che arriva daglioggetti astronomici. I responsabili dell’estinzione della luce sono essenzialmente:

- diffusione (scattering) da polveri

- gli aerosol

- le molecole di: O3, H2O, O2, CO2, N2O, CH4

Questi producono effetti che sono in generale dipendenti dalla lunghezza d’onda,dal tempo, e dalla direzione di osservazione.

Nella regione ottica dello spettro l’estinzione atmosferica e una funzioneabbastanza morbida (nel senso di lentamente variabile) della lunghezza d’onda ederiva dall’azione della diffusione Rayleigh, degli aerosol e dell’ozono (vedi Figu-ra 1.5). La variazione nel tempo e mostrata in Figura 1.6 ed a causa di questadipendenza l’estinzione dovrebbe essere determinata durante le osservazioni se si

Dip. di Fisica @ UNISALENTO 31

vogliono ottenere accuratezze fotometriche migliori di qualche percento. Gene-ralmente si ritiene che la forma spettrale dell’estinzione vari molto meno del suovalore assoluto ad una data lunghezza d’onda. Per questa ragione spesso si usanoanche i coefficienti medi di estinzione quando si fanno misure relative di flusso,cosa che avviene generalmente in spettroscopia quando si e interessati a misurerelative di flusso ottenute a diverse lunghezze d’onda.

Figura 1.5: Tipico andamento del coefficiente di estinzione media nel sito diFlagstaff, Arizona).

Nella regione IR invece le variazioni di estinzione sono molto piu dipendentidalla lunghezza d’onda a causa del fatto che l’assorbimento e di natura mole-colare e quindi essenzialmente dovuto a bande roto-vibrazionali che poi sono leresponsabili della definizione delle finestre atmosferiche (denominate J, H, K, L,M) che sono mostrate in Figura 1.7. A lunghezze d’onda piu lunghe le bandemolecolari ancora dominano l’estinzione, come si vede in Figura 1.8 per il medioinfrarosso ed in Figura 1.9 per la regione sub-millimetrica.

Se ora teniamo conto che la luce di una stella osservata al tramonto attra-versa l’atmosfera terrestre percorrendo un cammino molto maggiore di quellocorrispondente ad una stella allo Zenit, intuiamo subito che ci dovremo aspettareuna estinzione della luce delle stelle che aumenta all’aumentare della distanzazenitale. Partendo allora dalla definizione di massa d’aria unitaria X = 1 comela quantita di atmosfera attraversata dalla radiazione in direzione dello zenit,

32 F.Strafella

Figura 1.6: Variabilita temporale della opacita degli aerosol ottenuta, per diverselunghezze d’onda, a Flagstaff.

allora possiamo facilmente esprimere le masse d’aria corrispondenti ad un angoloz dallo zenit come:

X ≃ sec z

dovesec z = (sin φ sin δ + cos φ cos δ cos h)−1

avendo indicato con φ, δ, h rispettivamente latitudine del luogo, declinazionedell’oggetto nel cielo e angolo orario dell’osservazione.

La relazione precedente e esatta solo nel caso di un’atmosfera a strati pianie paralleli e quindi, poiche l’atmosfera terrestre non e piana, questa approssima-zione funziona tanto peggio quanto piu l’oggetto osservato e basso sull’orizzonte(z > 60, ovvero X > 2). Per masse d’aria maggiori si dovrebbe quindi usare piucorrettamente l’espressione:

X = sec z − 0.0018167(sec z − 1) − 0.002875(sec z − 1)2 − 0.0008083(sec z − 1)3

Per valutare l’effetto dell’estinzione sulla luce stellare immaginiamo di avereuno strato di atmosfera di lunghezza dx, caratterizzato da un’opacita κ, nel quale

Dip. di Fisica @ UNISALENTO 33

Figura 1.7: La trasmissione dell’atmosfera nel vicino IR definisce le “finestre”in cui e possibile osservare il cielo dal suolo. Le curve di trasmissione dei filtriusati in astronomia sono indicate, con un tratto piu scuro, all’interno di ogni“finestra”.

entra una radiazione con un flusso F ed esce con un flusso F +dF . La variazionedi flusso puo essere espressa da:

dF = −κFdx =⇒ F = F0e−

R

κdx = F0e−τ

dove con κ si e indicato il coefficiente di assorbimento dell’atmosfera e con F0

il flusso entrante in atmosfera. Se la struttura dell’atmosfera e la stessa in tutte ledirezioni zenitali z allora la profondita ottica τ della atmosfera sara proporzionalealla massa d’aria attraversata X per cui

τ = τ0X

dove con τ0 si e indicata la profondita ottica in direzione z = 0 (zenit). Possiamoallora scrivere

F = F0e−τ0X

. Esprimendo tutto in magnitudini si ottiene:

m = m0 + 1.086τ0X = m0 + kλX

dove kλ definisce il coefficiente di estinzione in magnitudini che puo essere specifi-cato per un dato set di lunghezze d’onda e quindi per un dato sistema fotometrico.

Attenzione: nell’adottare la proporzionalita tra τ (o k) e la massa d’ariaricordiamoci che si suppone che l’atmosfera non cambi durante tutta la duratadelle osservazioni, nel qual caso si parla di cielo fotometrico. Si tratta pero diuna situazione piuttosto rara.

34 F.Strafella

Figura 1.8: Trasmissione atmosferica nella regione del vicino e medio IR. Si notil’ampia finestra nella regione dei 10 µm e l’indicazione delle principali molecoleresponsabili dell’assorbimento.

1.4.2 Seeing: teoria & pratica

La radiazione che da un oggetto astronomico raggiunge l’atmosfera terrestre puoessere rappresentata come un fascio parallelo che, una volta entrato nell’atmosfe-ra, si propaga subendo importanti modifiche causate dalla variazione dell’indicedi rifrazione del mezzo n(λ, r, t) che dipende sia dalla lunghezza d’onda λ chedalla posizione r e dal tempo t. La dipendenza dalla lunghezza d’onda e la causadel fenomeno della rifrazione differenziale (anche detto dispersione atmosferica)che tende a spostare la direzione apparente della sorgente nel cielo di un angolotanto piu grande quanto piu corta e la lunghezza d’onda interessata. Un’altraimportante caratteristica dell’indice di rifrazione atmosferico e la sua notevo-le fluttuazione temporale e spaziale, una proprieta che si riflette negativamentesulla risoluzione spaziale delle osservazioni astronomiche ottenibili da Terra. Ilfenomeno che viene osservato in conseguenza di queste caratteristiche dell’atmo-sfera e un ulteriore allargamento dell’immagine stellare rispetto alla dimensioneche ci saremmo aspettati in presenza del solo effetto della diffrazione. L’originedi questa variabilita temporale e nella turbolenza dell’atmosfera che, generandosulla linea di vista una struttura complicata di temperatura e densita, non solocomporta una variazione spaziale dell’indice di rifrazione ma rende anche questastessa struttura rapidamente variabile.

In breve possiamo immaginare un fronte d’onda che, inizialmente piano, sicorruga durante il percoso nell’atmosfera che lo porta fino all’osservatore, comemostrato in Figura 1.10. Una volta che il fronte d’onda abbia raggiunto il telesco-pio, le deformazioni della sua superficie possono essere in prima approssimazione

Dip. di Fisica @ UNISALENTO 35

Figura 1.9: Trasmissione dell’atmosfera nella regione sub-millimetrica ad unaaltezza di circa 4000 m (Mauna Kea, Hawaii).

pensate come tante regioni planari la cui dimensione tipica e rappresentata dalcosiddetto parametro di Fried r0. Questa situazione, che e illustrata dalla Figu-ra 1.11, e anche soggetta, per quanto detto prima, a rapide variazioni nel tempoche portano a modifiche della forma d’onda in arrivo su intervalli di tempo chevanno dal secondo fino ad alcuni millisecondi.Questo da luogo a due fenomeni:

- scintillazione dell’immagine prodotta da telescopi con un diametro D ≪ r0,che e dovuta alle variazioni di ampiezza dell’onda incidente che, nella regio-ne ottica, si verificano generalmente su scale spaziali di alcuni cm. Questofenomeno e tipico dell’occhio che raccoglie luce su una dimensione dellapupilla molto minore di r0, mentre diventa sempre meno evidente all’au-mentare del diametro di un telescopio perche il fronte d’onda coinvoltocontiene molte regioni di Fried che, mediandosi, danno luogo ad un valoremedio piu stabile per il flusso di luce raccolto;

- seeing, termine con il quale si indica l’effetto combinato del cambiamento

36 F.Strafella

Figura 1.10: Schema di propagazione di un’onda in atmosfera disomogenea econseguente corrugamento del fronte d’onda.

Figura 1.11: L’onda corrugata viene approssimata come se fosse composta di datante piccole regioni di raggio r0 (parametro di Fried) entro le quali l’onda vieneconsiderata piana.

posizionale e delle variazioni della qualita dell’immagine stellare al pianofocale. L’effetto del seeing e diverso a seconda della dimensione dell’aper-tura del telescopio utilizzato. Per piccole aperture (D ∼ r0) si osserverauna figura di diffrazione (quella prodotta dall’apertura del telescopio) che simuove rapidamente intorno ad un baricentro dell’immagine. Per aperturepiu grandi (D > r0) si osservano invece una serie di figure di diffrazione,in gergo dette speckles, ognuna prodotta da una regione del fronte d’ondadi dimensione d ∼ r0. Gli speckles a loro volta si muovono rapidamenteintorno al baricentro dell’immagine, mantenendosi entro distanze angolariminori di ∼ 1 arcsec in un buon sito di osservazione.

L’osservazione di questi due effetti implica anche che

Dip. di Fisica @ UNISALENTO 37

- la forma locale del fronte d’onda in arrivo e piatta solo su scale spazialigeneralmente piu piccole del diametro del telescopio;

- le direzioni di provenienza apparente delle varie parti “piatte” in cui sidivide il fronte d’onda sono contenute entro circa 1 arcsec in un buon sitodi osservazione;

- la scala temporale delle variazioni va da alcuni millisecondi in su.

L’effetto prodotto dal seeing puo essere studiato all’interno di un modello di tur-bolenza sviluppato in lavori successivi da Kolmogorov, Tatarsky e Fried. Quici limiteremo ad illustrare solo alcuni risultati senza dimostrarli: il lettore in-teressato potra poi riferirsi alla letteratura specifica. Per presentare in breve ilmodello introduciamo l’idea che un campo turbolento di una generica variabileX (velocita, densita, ...) si possa caratterizzare con una funzione di strutturadefinita da

SX(∆r) =⟨

|X(r + ∆r) − X(r)|2⟩

(1.36)

dove r indica il vettore posizione e ∆r un intorno del punto individuato da r.L’operazione di media, indicata da 〈...〉, viene fatta su tutte le possibili posizionir e per ogni valore di ∆r.Nel modello di Kolmogorov per la turbolenza l’indice di rifrazione ha una funzionedi struttura del tipo

Sn(∆r) = C2n

∆r3

3

con Cn detta costante di struttura dell’indice di rifrazione. Da questa espressionesi puo ricavare la funzione di struttura per la fase φ dell’onda corrugata quandoquesta arriva alla superficie del telescopio

Sφ(∆r) = 6.88∆r5/3

r0

con r0 detta lunghezza di coerenza, o parametro di Fried , che vale a sua volta

r0 = 0.185 λ6/5 cos3/5 z

(∫

C2ndh

)

−3/5

(1.37)

dove l’integrale e da intendersi esteso alla linea di vista. Usando le regole dell’ot-tica si puo convertire Sφ(∆r) nell’immagine, prodotta dal telescopio, corrispon-dente alla specifica struttura della fase. In termini pratici possiamo dire che il ri-sultato che si ottiene per la dimensione d dell’immagine e all’incirca inversamente

38 F.Strafella

proporzionale al parametro di Fried:

d ∼ λ

r0

una dimensione angolare da confrontarsi con quella prodotta dalla sola diffrazionedata da

d ∼ λ/D.

Da questo semplice paragone possiamo concludere che il seeing determina (nelsenso che domina sulla diffrazione) la forma dell’immagine stellare quando r0 < De che un sito di osservazione con un r0 piu grande avra un seeing migliore.Tipicamente il seeing e piu importante della diffrazione a corte lunghezze d’onda(UV, ottico, vicino IR) e per grandi telescopi, mentre l’inverso vale per le grandilunghezze d’onda (lontano IR, radio) dove di solito prevale l’effetto della diffrazio-ne. Per un telescopio con apertura di 4 metri i due effetti si equivalgono intornoa λ ∼ 5 µm, cioe il parametro di Fried a λ = 5µm vale circa r0 = 2 m.

La chiave di tutta questa discussione sta proprio nel parametro di Fried chee una grandezza che varia da luogo a luogo e dipende dal tempo attraverso ilsuo legame con l’indice di rifrazione, come si vede dalla relazione (1.37). Nellamaggior parte dei siti osservativi si incontrano tre situazioni che influenzano que-sto paramentro e che sono legate alla turbolenza dell’atmosfera che si genera adiverse altezze:

- regime di surface layer: turbolenza prodotta dall’interazione vento-superficiee dalle attivita dell’uomo

- regime di planetary boundary layer influenzato dal ciclo termico giorno-notte

- regime di free atmosphere legato allo shear di venti a quote intorno ai 10km (tropopausa)

Come riferimento si tenga conto che per un tipico sito astronomico si ha r0 ∼ 10cm a λ = 5000 A.

Un’altra importante grandezza e legata alla distanza angolare entro la qualela turbolenza mostra la stessa struttura (pattern). Questo angolo e detto angoloisoplanatico e la regione del cielo corrispondente viene detta patch isoplanatico.La Fig.1.12 illustra graficamente il problema: quando la distanza angolare tradue direzioni nel cielo aumenta, la parte di atmosfera attraversata da fasci diluce provenienti da due direzioni diverse tende ad essere tanto piu diversa quantomaggiore e la separazione angolare. E evidente che il fronte d’onda che arriva

Dip. di Fisica @ UNISALENTO 39

Figura 1.12: La radiazione proveniente da due diverse direzioni, A e B, subisceuna deformazione del fronte d’onda istantaneo che arriva all’ingresso del nostrostrumento di osservazione. Le differenze tra i due fronti d’onda in arrivo sarannotanto maggiori quanto maggiore e la distanza angolare tra le due direzioni diprovenienza, a causa delle diverse colonne di atmosfera attraversate.

al telescopio sara istantaneamente corrugato in modo tanto piu diverso quantomaggiore e la distanza angolare.

L’angolo isoplanatico, entro cui il fronte d’onda puo’ essere considerato simil-mente deformato, e espresso da:

θ = 0.314r0

H(1.38)

dove H e la distanza media degli strati che producono il seeing data da

H = sec z

(∫

C2n h5/3 dh

C2n dh

)3/5

avendo indicato con h l’altezza. Per r0 = 10 cm ed H ∼ 5000 m si ricava θ ∼ 1.3arcsec. Nel vicino-IR (banda K a 2.2 µm) invece con r0 = 70 cm ed H ∼ 5000 msi ricava θ ∼ 9 arcsec.

Influenza del seeing sulla qualita dell’immagine

La forma globale della distribuzione della luce raccolta da una sorgente puntifor-me (stella) e specificata dalla point spread function (PSF).

40 F.Strafella

La diffrazione da la distribuzione di base che fa da limite ultimo alla qualitapossibile per la PSF di un sistema ottico. Tuttavia sia le aberrazioni del sistemaottico che il moto apparente della sorgente al piano focale, possono peggiorarela qualita della PSF aggiungendole struttura ed, in definitiva, allargandola. Perquantificare gli effetti del seeing sulla PSF si usano diversi parametri che sonoindicativi di diverse caratteristiche della PSF.

Il primo e il cosiddetto Strehl ratio, parametro molto usato nel campo dell’ot-tica adattiva per dare l’idea del degrado prodotto dal corrugamento del fronted’onda. Lo Strehl ratio e dato dal rapporto tra l’intensita di picco della PSF nellecondizioni effettive di lavoro e l’intensita (sempre di picco) che si sarebbe otte-nuta in presenza del solo effetto della diffrazione. E intuitivo allora che, siccomela PSF tende ad allargarsi all’aumentare delle deformazioni presenti sul fronted’onda in arrivo, un cattivo seeing produrra come conseguenza un’abbassamentodel valore di picco della PSF e quindi lo Strehl ratio tendera a diminuire quandoil fronte d’onda si deforma per qualche motivo. Usando la fluttuazione r.m.s. delfronte d’onda come parametro indicativo della sua deformazione, in Figura 1.13viene mostrato l’andamento dello Strehl ratio all’aumentare di questo indicatore.

Un’altro modo per caratterizzare la PSF di un sistema ottico sfrutta il concettodi energia contenuta entro una certa area della stessa PSF. In particolare si usa lapercentuale di energia contenuta nell’immagine della PSF all’interno di un datoraggio, in funzione del raggio stesso. Tecnicamente questo parametro viene dettoencircled energy ed il grafico Figura 1.14 ne mostra l’andamento.

Un modo piu compiuto di caratterizzare le capacita di un sistema ottico equello di usare la cosiddetta Modulation Transfer Function (detta in breve MTF).Questa funzione e largamente usata per dare informazione su come il sistemaottico risponde alle varie frequenze spaziali. Per chiarire il significato della MTFimmaginiamo di sottoporre il sistema ottico ad un segnale modulato (da cuiil nome di Modulation ...) del tipo di quello mostrato in Figura 1.15 in cui lastruttura (pattern) originale dell’immagine di test e indicata con A mentre con B eindicata l’immagine ottenuta attraverso il nostro sistema ottico. Allo stesso modocon C e D sono indicati i profili che si ottengono rispettivamente dalle immaginiA e B. Si noti che il profilo di A e netto e “salta” rapidamente tra i valori di 0 e255 (riferendosi ad una scala di grigi a 8 bit), mentre il profilo B dell’immagineottenuta e caratterizzato da salti molto piu smussati e non sempre tra 0 e 255.In particolare alle alte frequenze spaziali si nota che il contrasto tra massimoe minimo tende a diminuire. In breve potremmo dire che mentre per le bassefrequenze spaziali (a sinistra nell’immagine) il contrasto viene preservato, quandosi considerano le frequenze piu alte l’immagine B non e piu una rappresentazione

Dip. di Fisica @ UNISALENTO 41

Figura 1.13: Lo Strehl ratio in funzione della fluttuazione rms delle deformazionidel fronte d’onda. All’aumentare delle deformazioni del fronte d’onda (valorerms dato in frazione di lunghezza d’onda) lo Strehl ratio diminuisce. Ogni lineasi riferisce ad una particolare approssimazione analitica adottata.

fedele dell’oggetto A. La definizione formale della MTF la possiamo dare cosı

MTF =Imax − Imin

Imax + Imin

dove abbiamo indicato con Imax ed Imin l’intensita massima e minima del segnale.Da notare che questo rapporto per il segnale di test “A” vale MTF=1 a tuttele frequenze, mentre per l’immagine “B”, che rappresenta cio che si osserva avalle del sistema ottico, il rapporto diminuisce sempre piu all’aumentare dellafrequenza segnalando un degrado delle capacita del sistema nel riprodurre fedel-mente un segnale modulato ad alta frequenza. Traducendo questo linguaggio neitermini dell’astronomia potremo dire che il sistema ottico esaminato non sara ingrado di evidenziare due stelle come separate se l’angolo visuale che le separa eminore di un certo angolo limite determinato dal minimo contrasto che riusciamoa decifrare nelle immagini.

42 F.Strafella

Figura 1.14: PSF ed encircled energy in funzione del raggio.

E interessante anche notare che la MTF e data dalla trasformata di Fourier6

della PSF e quindi e espressa, invece che in termini spaziali, in termini di fre-quenza spaziale ν. Le osservazioni fatte dal suolo sono limitate dal seeing che,come abbiamo visto, e il risultato della turbolenza della nostra atmosfera. Seper descrivere l’atmosfera si usa il modello di turbolenza di Kolmogorov si puoricavare l’espressione analitica per la MTF:

MTF (ν) = e−(3.44(λν/r0))5/3

dove la ν indica, in questo contesto, la frequenza spaziale. E interessante notareche la forma di questa funzione e abbastanza vicina a quella di una una gaussianaed e per questo che, siccome la trasformata di Fourier di una gaussiana e ancorauna gaussiana7, allora si utilizza spesso l’idea che il seeing (cioe la PSF) possaessere abbastanza bene approssimato da una gaussiana, almeno nella sua partecentrale che viene detta core 8 Sottolineamo pero che le due funzioni (PSF egaussiana) differiscono poi sensibilmente nelle ali. Questo e un punto importanteper ottenere una buona fotometria: se nelle ali della PSF l’intensita decresce, ilnumero di pixel coinvolti pero cresce e quindi diventa importante avere ancheuna buona rappresentazione matematica delle ali della PSF.

Allora, se si vuole una migliore descrizione del profilo del seeing conviene usare

6nel seguito discuteremo meglio sulla trasformata di Fourier di un segnale7e l’unica funzione con questa proprieta8Si noti che il core gaussiano e una buona approssimazione solo per immagini ottenute da

osservazioni da Terra (ground-based) essendo il prodotto dalla turbolenza atmosferica che eovviamete assente se si osserva da una piattaforma spaziale.

Dip. di Fisica @ UNISALENTO 43

Figura 1.15: Rappresentazione della risposta di un sistema ottico ad un segnalemodulato a varie frequenze.

la cosiddetta Moffat function data da:

I(r) = Ic(1 + (r/α)2)−β (1.39)

dove con Ic si e indicata l’intensita massima ed α, β sono parametri che dipendonodal seeing. La funzione di Moffat e una Lorenziana modificata con un indice dellalegge di potenza variabile9. Spesso pero, a causa dei difetti dell’ottica oppure deltracking 10 l’immagine stellare che si ottiene non e perfettamente circolare e pertener conto di questo si utilizza la relazione:

r2 = x2 + y2 + e[x2(1 + cos 2φ) + y2(1 − cos 2φ) + 2 xy sin φ]

che rappresenta un ellisse di ellitticita e con l’asse maggiore inclinato di un an-golo φ rispetto all’asse x. Sostituendo questa nella equazione 1.39 produce lacosiddetta “elliptical Moffat” che meglio rappresenta una PSF asimmetrica. Siottiene quindi una funzione di due variabili (x,y) in grado di rappresentare megliola eventuale ellitticita delle immagini stellari. Questa funzione si puo esprimere

9Vedi Moffat 1969, Astronomy & Astrophysics, vol.3, p.455-46110Con questo termine si indica la guida del telescopio durante il tempo di integrazione usato

per ottenere l’immagine.

44 F.Strafella

anche come:

I(x, y) = p1

1 + [(x − p2)/p4]2 + [(y − p3)/p5]

2

−p6

dove p1,p2,..,p6 sono parametri da adattare alla forma effettivamente osservataper la PSF. Piu precisamente questi rappresentano:

parametro significato per la PSFp1 ampiezza al massimop2, p3 coordinate x,y del centro dell’immaginep4, p5 legati alla larghezza della funzione lungo gli assi x,yp6 esponente che determina la forma della funzione nella ali

Una illustrazione di come la MTF si modifica in presenza di alcuni tipi diaberrazione e mostrata in Figura 1.16. Si noti come la PSF, mostrata nei graficia sinistra, fa vedere come cambia la situazione al piano focale, mentre la corri-spondente MTF nei grafici a destra evidenzia il cambiamento della risposta infrequenza, e quindi della risoluzione spaziale, del sistema.

E molto diffuso comunque l’uso di specificare la qualita dell’immagine delseeing attraverso la larghezza del seeing a meta del massimo (Full Width at HalfMaximum, abbreviato in FWHM). Il motivo e probabilmente legato alla facilitacon cui la FWHM si puo valutare direttamente ad occhio sull’immagine oppureapprossimando all’immagine stellare una funzione che, per quanto abbiamo detto,per le osservazioni da Terra e una gaussiana. Ricordiamo a questo proposito che lacorrispondenza tra FWHM e l’ampiezza della gaussiana e FWHM = 2σ

√2 ln 2 =

2.355 σ. Tuttavia, nel valutare la FWHM dalle immagini bisogna fare attenzioneagli effetti dovuti al campionamento della PSF: infatti se l’energia e concentratain pochissimi pixel (caso di sottocampionamento) la valutazione della FWHMpuo essere abbastanza inaccurata. Infine, teniamo comunque presente che laFWHM non descrive completamente la PSF, rappresentando solo una delle suecaratteristiche.

Dip. di Fisica @ UNISALENTO 45

Figura 1.16: La corrispondenza tra PSF (s sinistra) e MTF (a destra) per diversicasi di aberrazione. In ogni riquadro la PSF e’ rappresentata per tre valori diStrehl ratio= 1, 0.8 e 0.4, che corrispondono a deformazioni crescenti del fronted’onda. I quattro casi rappresentati sono (curve in rosso): a) errore picco-vallenel fronte d’onda di λ/4 e λ/2; b) stessa situazione per l’aberrazione sferica; c)errori di 0.42 e 0.84 causati da aberrazione di coma; d) errori di 0.37 e 0.74dovuti ad astigmatismo .

46 F.Strafella

1.5 Telescopi [t.b.d.]

Figura 1.17: Schemi ottici principali usati nei telescopi.

1.6 Ottica e Telescopi

Gli oggetti astronomici tipicamente appaiono deboli all’osservazione ed e quindievidente la motivazione degli sforzi che si fanno nel costruire telescopi di diametrosempre piu grande per raccogliere piu luce possibile. Per avere un’idea pensiamoche un oggetto di mV = 20 mag produce un flusso a terra di 0.01 fotoni s−1

cm−2 quando lo osserviamo con un filtro di larghezza ∆λ ∼ 1000 A. Usando untelescopio con un diametro di 4 m il numero di fotoni raccolti sull’intera areacollettrice diventa di circa 1200 fotoni s−1.

Dip. di Fisica @ UNISALENTO 47

Tabella 1.4: Tipi di telescopio riflettore.

Tipo Specchio primario Specchio secondarioKepleriano Sfera o Parabola NessunoHerscheliano Parabola fuori asse NessunoNewtoniano Parabola diagonale piattoGregoriano Parabola EllisseMarsenne Parabola ParabolaCassegrain Parabola IperboleRitchey-Chretien Parabola modificata Iperbole modificataDall-Kirckam Ellisse SferaSchmidt Rifrattore asferico SferaBouwers-Maksutov Menisco rifrattore Sfera

1.6.1 Definizioni

Un sistema ottico deve raccogliere e convogliare la luce su una qualche superfi-cie e possibilmente anche formare immagini, mantenendo quindi l’informazionespaziale sugli oggetti osservati. Per definire le quantita che intervengono nel ca-raterizzare un tale sistema consideriamo prima una singola superficie che separadue mezzi con indici di rifrazione n ed n′. Introduciamo tre coordinate (x, y, z):le prime due che rappresentano le distanze sul piano della superficie ottica (p.es.il piano di una lente) e la terza, z, che e orientata secondo la perpendicolare allasuperficie. Ricordiamo inoltre che qui tratteremo di ottica geometrica, ignorandoper ora la diffrazione, il che equivale a dire che le considerazioni che svolgeremovalgono per lunghezze d’onda λ −→ 0 per le quali la diffrazione tende a ze-ro. Lasciando ogni dimostrazione a testi piu specificamente orientati, ricordiamoche per lunghezze d’onda finite l’ottica geometrica si puo applicare con buonaapprossimazione su scale x ≫ λ.

Una superficie

- Un raggio incidente su una superficie ottica subira il fenomeno della rifra-zione descritta dalla legge di Snell

n sin(i) = n′ sin(i′)

48 F.Strafella

dove con i ed i′ abbiamo indicato l’angolo di incidenza e di rifrazione delraggio. Dalla relazione precedente segue che nel caso in cui n′ = −n (casodella riflessione) allora sara anche i′ = −i.

- Un elemento ottico produce un’immagine di una sorgente in s in un puntoconiugato s′ che puo essere reale o virtuale. Un’immagine reale si formain qualche punto dello spazio, mentre una virtuale si forma in un puntodal quale i raggi appaiono provenire o in cui convergono, senza che perola luce passi effettivamente da quel punto. Si tratta quindi di punti in cuiconvergono non i raggi reali, ma loro prolungamenti come in Figura 1.18.Un esempio e dato dall’immagine virtuale di una stella che si forma alfuoco primario di un telescopio in montatura Cassegrain: nessun raggioeffettivamente passa dall’immagine, come mostrato in Figura 1.19, eppurei raggi dopo la riflessione allo specchio secondario si comportano come seprovenissero dal punto virtuale che si trova dietro lo stesso specchio.

Figura 1.18: Esempio di immagine virtuale formata da uno specchio.

- L’immagine non sara mai perfetta nel senso che non tutti i raggi prove-nienti da una sorgente puntiforme passano esattamente nello stesso puntoimmagine s′. Questo e il risultato della presenza, inevitabile nei sistemireali, delle aberrazioni che possono degradare la qualita dell’immagine inmisura piu o meno importante. Se consideriamo un fascio di raggi paralleli

Dip. di Fisica @ UNISALENTO 49

Figura 1.19: Nella montatura “Cassegrain” l’immagine di una stella prodottadallo specchio primario rimane virtuale perche i raggi vengono intercettati dal-lo specchio secondario prima di raggiungere il fuoco del primario. Lo specchiosecondario si comporta come una lente che riporta dietro lo specchio principalel’immagine virtuale, rendendola reale. Si noti come la lunghezza focale effettivadel sistema sia molto maggiore di quella del solo specchio primario.

(corrispondenti ad un onda piana) le aberrazioni saranno tanto piu rilevan-ti quanto piu grande sara la distanza ∆x, ∆y tra due raggi che incidonosul sistema ottico. e utile quindi definire come raggio principale un raggioche passa per il centro dell’apertura (l’apertura viene spesso indicata anchecome pupilla d’ingresso) di un sistema ottico. Definiamo invece raggio pa-rassiale e raggio marginale rispettivamente i raggi che passano in prossimitadel centro (x, y piccoli) oppure del bordo dell’apertura(x, y grandi). Nelseguito per semplicita ci riferiremo a raggi parassiali per i quali gli angoli ingioco sono piccoli, le aberrazioni sono minime e le superfici ottiche possonoessere specificate con il solo raggio di curvatura.

- L’angolo di campo Θf e l’angolo formato dal raggio principale con l’assez perpendicolare al sistema ottico. Si noti che il termine parassiale nonimplica che sia Θf = 0, ma si riferisce solo al fatto che un raggio passi invicinanza del centro della pupilla.

- La relazione principale che lega la distanza dell’oggetto s, con quella del-l’immagine s′ e con il raggio di curvatura R della superficie ottica che separai due mezzi di indice di rifrazione n ed n′ e:

n′

s′− n

s=

(n′ − n)

R(1.40)

I punti s ed s′ sono detti punti coniugati e sono tali che se uno dei due si trovaall’infinito allora l’altro cade esattamente alla distanza focale del sistema

50 F.Strafella

ottico. Nel caso astronomico s e sempre all’infinito per cui l’immagine adistanza s′ si formera nel punto focale f ′ del sistema ottico e sara s′ = f ′,ottenendo che

n′

f ′=

n

f=

(n′ − n)

R≡ P (1.41)

dove si e’ tenuto conto delle due possibili direzioni di provenienza del fasciodi radiazione. Il termine a destra dell’eq.(1.41) dipende solo dalle proprietadella superficie e prende il nome di potere ottico, P, della superficie. Il casodella riflessione si tratta in analogia, utilizzando l’idea che la riflessioneequivale ad una rifrazione negativa che possiamo descrivere con n = −n′,da cui sostituendo in eq.1.41

1

f=

2

R(1.42)

che fa vedere che la lunghezza focale di uno specchio e R/2 e quindi e lameta del raggio di curvatura.

- Definiamo ora il rapporto focale come il rapporto tra la lunghezza focale edil diametro dell’apertura F = f/D. Questa quantita e anche indicata conF/# (o anche F/number) dove il simbolo # sta per il valore numerico delrapporto. Per esempio F/10 sta ad indicare che F = f/D = 10. Il rapportofocale da subito l’idea di come un facio di raggi paralleli viene focalizzatoverso il fuoco: un F/number grande o piccolo significa dire che l’angolo diconvergenza dei raggi e rispettivamente piccolo o grande. Nel primo caso siparla di sistema ottico lento, mentre nel secondo di ottica veloce perche ilfascio converge piu rapidamente (entro una distanza minore).

- Si dice magnificazione m di un sistema il rapporto tra l’altezza dell’immagi-ne e quella dell’oggetto. Se consideriamo il caso di angoli piccoli (≪ 1 rad)la legge di Snell la possiamo riscrivere come n i = n′i′. Tenendo quin-di conto che in questa approssimazione i = arctan(h/s) ≃ h/s e chei′ = arctan(h′/s′) ≃ h′/s′ otteniamo:

nh

s= n′

h′

s′

da cui

m =h′

h=

ns′

n′s

Questa quantita e negativa se l’immagine e invertita rispetto all’oggetto eanche nel caso di riflessione che corrisponde al caso con n = −n′.

Dip. di Fisica @ UNISALENTO 51

Figura 1.20: Illustrazione del comportamento ottico di una superficie, con raggiodi curvatura C, che separa due mezzi con indice di rifrazione n ed n′.

- A questo concetto e anche legata la scala di un sistema ottico definita comeil rapporto tra la distanza angolare ∆α tra due oggetti all’infinito e la lorodistanza spaziale ∆x al piano focale del sistema. Dal considerare i due raggiprincipali provenienti dai due oggetti si ricava

tan∆α ∼ ∆α =∆x

f

da cui si ottiene la corrispondenza di scala:

∆α

∆x=

1

f

Con questa espressione possiamo valutare quanti radianti corrispondono adun millimetro di piano focale, mentre per esprimerci in termini di “secon-di d’arco per millimetro” (indicati di solito con arcsec mm−1 oppure con′′/mm) dovremo moltiplicare il risultato della precedente per il numero diarcsec contenuti in un radiante (≃ 206265).

Superfici multiple

- Per valutare l’effetto della combinazione di piu superfici ottiche bisognerasemplicemente considerare l’immagine prodotta dalla prima superficie comel’oggetto per la seconda superficie, e cosı via per le altre. Possiamo ingenerale definire i parametri di un sistema multiplo con riferimento aglistessi parametri di un sistema a singola superficie. Per esempio, possiamo

52 F.Strafella

definire la lunghezza focale effettiva del sitema ottico come quella di una solasuperficie ottica equivalente. Si ricordi pero che il concetto di equivalenzache qui stiamo introducendo si puo applicare con buona approssimazionesolo al caso di raggi parassiali. Come esempio usiamo una lente costituitada due superfici in aria (ricordando che naria ≃ 1). Per la prima superficieabbiamo:

n

s′1− 1

s1

=n − 1

R1

= P1

per la seconda1

s′2− n

s2=

1 − n

R2= P2

dove s2 = s′

1 − d con d che rappresenta la distanza tra le due superfici checostituiscono la lente, cioe lo spessore della stessa lente. Questo per indicarecorrettamente le distanze dalla seconda superficie che devono ovviamenteessere misurate a partire dalla seconda superficie. Dopo un po’ di algebrasi ottiene l’effettiva lunghezza focale (misurata a partire dal centro dellalente):

P =1

f ′= P1 + P2 −

d

nP1P2 =

n − 1

R1+

1 − n

R2− d

n

(n − 1)(1 − n)

R1R2(1.43)

dove con f ′ abbiamo questa volta indicato la lunghezza focale equivalentedella combinazione delle superfici. Nel caso di lenti sottili (cioe con R moltogrande) l’ultimo termine a destra tende a zero piu rapidamente degli altri,per cui otteniamo la forma:

P =1

f ′=

n − 1

R1

+1 − n

R2

=1

f1

+1

f2

(1.44)

Esempio 1 Una lastra a facce piane e parallele: in questo caso R → ∞ e e quindiP → 0. Tuttavia quando un fascio di radiazione attraversa una lastradi spessore d ed indice di rifrazione n′ si deve tenere conto che si verificauno spostamento laterale del fascio pari a ∆x = d tan i(1−n/n′), con nindice di rifrazione del mezzo esterno alla lastra ed i angolo di incidenzadel fascio;

Esempio 2 Il telescopio a due specchi: molti degli strumenti usati in astronomiasono realizzati con due specchi che si possono presentare in varie com-binazioni a seconda del progetto ottico: newtoniano, gregoriano, cas-segrain, schmidt, maksutov ... Il piu diffuso e certamente il cassegrainil cui schema ottico e mostrato in Figura 1.21.

Le grandezze di base che caratterizzano questo tipo di telescopi sono:

Dip. di Fisica @ UNISALENTO 53

Figura 1.21: Schema dell’ottica cassegrain.

54 F.Strafella

- rapporto delle lunghezze focali: ρ = R2/R1 = f2/f1

- ingrandimento del secondario: m = −s′2/s2

- retro-distanza focale: f1β = Dη

- rapporto focale del primario: F = f1/D

- rapporto tra le altezze dei raggi marginali (vedi figura): k = y2/y1

Con un po di geometria si possono ottenere varie relazioni tra queste gran-dezze, in particolare le due seguenti:

ρ =km

m − 1; e : 1 + β = k(m + 1)

e possiamo derivare la lunghezza focale effettiva ed il corrispondente rap-porto focale dalla eq. 1.43 per le lenti spesse

f = f1m ; F = F1m

Da quest’esempio si vede che l’ottica di un telescopio e specificata da treparametri scelti tra f, f ′, m, k, β, ρ (escludendo le terne ρ, m, k e β, m, k checompaiono in una sola equazione). Di solito f1 e limitato dalla tecnologia,m viene scelto per ottenere la scala desiderata al piano focale, k e legatoalla separazione tra gli specchi ed e un compromesso tra la richiesta direndere il telescopio piu compatto possibile e di non perdere troppa luceper l’oscuramento prodotto dallo specchio secondario che sara tanto piugrande quanto piu compatto il telescopio. Naturalmente si vorra ancheottenere un piano focale dietro lo specchio primario !

Infine diamo alcune definizioni di uso comune nei sistemi ottici dotati di moltesuperfici:

- aperture stop: di solito e lo specchio principale e determina la quantita diluce che raggiunge l’immagine

- field stop: determina la dimensione angolare del campo osservato ed inastronomia questo e di solito determinato dalle dimensioni del rivelatore

- pupil: regione nella quale tutti i raggi provenienti dal campo osservato(quindi da tutti gli angoli di campo) passano dalla stessa apertura (lo spec-chio principale e anche detto una pupilla di ingresso, tutte le sue immaginiprodotte dal sistema ottico sono pupille).

Dip. di Fisica @ UNISALENTO 55

- entrance pupil: immagine dell’aperture stop come viene vista dalla sorgente(come abbiamo gia detto e di solito il primario)

- exit pupil: immagine dell’aperture stop formata da tutti gli altri elementiottici.

In un telescopio a due specchi la pupilla di uscita e l’immagine del primarioprodotta dal secondario e la sua posizione si puo calcolare tenendo conto che ladistanza d tra primario e secondario e proprio la distanza dell’oggetto di cui ilsecondario fa l’immagine. Ponendo quindi s = d nell’equazione della riflesione erisolvendo per s′ si ricava la distanza della pupilla di uscita dal secondario. Laposizione in cui si viene a trovare la pupilla di uscita non coincide con quella delpiano focale dove si formano le immagini degli oggetti posti all’infinito. Se oraindichiamo con f1δ la distanza tra pupilla di uscita e piano focale, si puo ricavareche

δ =km2

m + k − 1=

m2(1 + β)

m2 + β

Questo concetto di pupilla di uscita puo essere molto utile nell’inquadrare ilproblema delle aberrazioni nei sistemi ottici. Queste possono essere infatti vistecome l’errore del fronte d’onda che, entrato come onda piana nella pupilla diingresso, viene distorto dal percorso entro il sistema ottico e quindi appare nonperfettamente piano all’uscita.

Aberrazioni

Con il termine aberrazioni indichiamo tutti quei difetti che, presenti in un sistemaottico reale, ne degradano le immagini rispetto al caso di un’ottica ideale. Questepossono essere sia di natura geometrica, come nel caso di raggi che pur provenendodalla stessa sorgente non finiscono nello stesso punto immagine, oppure di naturafisica come nel caso degli effetti prodotti dalla diffrazione. In tutti i casi il risultatofinale e che il fronte d’onda, che nel caso ideale di convergenza ad un unicopunto (il fuoco) sarebbe a simmetria sferica, e in effetti distorto. Le aberrazionigeometriche prendono vari nomi a seconda del tipo di errore che i raggi possonoessere quindi il prodotto di:

- aberrazione sferica

- aberrazione di coma

- astigmatismo

- curvatura di campo

56 F.Strafella

Nei telescopi tuttavia alcune di queste aberrazioni possono essere molto attenua-te da un attento progetto ottico che sfrutti la possibilita di correggere i difettiintrodotti dalla prima riflessione sul primario con una particolare forma dellasuperficie del secondario. P.es. se adottiamo uno specchio primario parabolico,quindi con K1 = −1, si possono usare le relazioni di aberrazione per calcolare K2

dello specchio secondario in modo che l’aberrazione sferica si annulli ottenendoimmagini perfette sull’asse ottico. La condizione per questo e

K2 = −[

(m + 1)

(m − 1)

]2

+m3

k(m − 1)3(K1 + 1) (1.45)

Un telescopio cosı fatto, che viene detto anche classico, pur producendo buone im-magini sull’asse ottico, mostra un rapido degrado della qualita ottica man manoche ci si allontana dall’asse ottico (quindi per angoli di campo crescenti) a causaessenzialmente dall’aberrazione di coma (in relazione alla comea l’astigmatismo etrascurabile). Il progettista dell’ottica puo comunque avere una maggiore libertase non si richiede che la prima superficie sia parabolica e quindi si lasciano liberii valori sia di K1 che K2. In questa situazione si possono minimizzare sia l’aber-razione sferica che la coma ottenendo un progetto ottico cosiddetto aplanatico.L’espressione rilevante in questo caso e

K1 = −1 − 2(1 + β)

m2(m − β)(1.46)

Un telescopio che segue questo tipo di disegno ottico e detto Ritchey-Chretien. einteressante lo schema seguente in cui sono riassunte le caratteristiche principalidi due tipi di disegno ottico a due superfici molto utilizzate in astronomia, chesono il Cassegrain ed il Gregoriano:

Parametro Cass. Gregor. Cass. Gregor.Classico Classico Ritchey-Chretien Aplanatico

m 4 -4 4 -4k 0.25 -0.417 0.15 -0.417

1-k 0.75 1.417 0.75 1.417mk 1 1.667 1 1.667

ATC 2.03 2.03 0.0 0.0AAS 0.92 0.92 1.03 0.80ADI 0.079 0.061 0.075 0.056

km R1 7.25 -4.75 7.625 -5.175kp R1 4.0 -8.0 4.0 -8.0

ATC=Angular Tangential Coma; AAS=Angular AStigmatismADI=

Dip. di Fisica @ UNISALENTO 57

dove le aberrazioni sono date in arcsec per oggetti posti ad una distanza dall’asseottico (fuori asse) di 18 arcmin. Si vede come un disegno aplanatico sia preferibilea quello classico perche quest’ultimo e dominato dalle aberrazioni di coma fuoriasse. Si vede anche come il progetto aplanatico di tipo gregoriano sia legger-mente migliore del cassegrain. Quando pero si considera che la realizzazione delgregoriano implica una maggiore dimensione del telescopio e quindi della cupolache lo contiene, si capisce perche spesso si preferisca il cassegrain aplanatico. Aparita di dimensioni un gregoriano pero dovra avere uno specchio principale piurapidamente convergente e quindi un aumento del costo di realizzazione e dellasensibilita agli errori di allineamento.

Ray tracing

Per realizzare un progetto ottico piu accurato non ci si puo tuttavia limitare aconsiderare le aberrazioni del terzo ordine, ma bisognera utilizzare la tecnica piugenerale del ray-tracing che consiste in una calcolo sistematico dei percorsi seguitida una grande quantita di raggi entranti nel sistema ottico che vanno a finire sulpiano focale. Con questa analisi, che coinvolge soltanto considerazioni di otticageometrica, e possibile visualizzare lo sparpagliamento (spread) nell’immaginedi una sorgente all’infinito che si ottiene con un dato sistema ottico. Esistonomolti programmi che fanno questo lavoro con diversi gradi di complessita e con iquali e possibile produrre una serie di diagrammi che illustrano le caratteristichedell’immagine prodotta su tutto il campo di vista. Il caso tipico e quello dellospot diagram mostrato in Figura-?? che mostra come apparirebbe l’immagine diuna sorgente all’infinito al variare dell’angolo di campo.

Diffrazione

Sappiamo che la luce e soggetta al fenomeno della diffrazione ogni qualvolta vienefatta passare in una apertura di forma generica. Nel caso dell’astronomia la luce erappresentata da un’onda piana che proviene da una sorgente all’infinito, mentrel’apertura attraverso cui passa prima di essere rivelata e la pupilla di ingressodel telescopio (specchio principale). Per una pupilla circolare di diametro Dsappiamo che la distanza angolare tra il centro geometrico dell’immagine ed ilprimo zero della figura di diffrazione e data da

θ ≃ 1.22λ/D

Con questa indicazione possiamo ricavare che il limite perche la risoluzione ango-lare di un telescopio sia limitato dal seeing e non dalla diffrazione e D ≃ 20 cm,

58 F.Strafella

quando λ = 5500 A. Questa valutazione viene fatta ricordando che il seeing at-mosferico limita la risoluzione angolare intorno ad 1 arcsec e quindi l’aumento deldiametro dei telescopi a terra al di la dei 20 cm non produce un aumento di risolu-zione spaziale. Tuttavia bisogna dire che vi sono diverse ragioni per riconsiderarequesto punto alla luce degli sviluppi tecnologici dell’astronomia osservativa:

- l’uso di telescopi spaziali ha liberato dal problema della turbolenza atmo-sferica,

- l’estenzione delle osservazioni alla regione IR dove la diffrazione ha un effettomaggiore e la turbolenza atmosferica un effetto minore,

- lo sviluppo delle tecniche di ottica adattiva che tendono a rimuovere alcunedistorsioni del fronte d’onda prodotte dall’atmosfera

Per rendersi conto in maniera quantitativa della figura di diffrazione bisogna ri-farsi al meccanismo di propagazione delle onde in termini di ampiezza e fase.Essenzialmente si considera che ogni punto dell’onda entrante all’apertura delsistema ottico si puo pensare come una sorgente di nuove onde sferiche che sipropagano fino a raggiungere il fuoco del sistema ottico. Si tratta quindi diintegrare (sommare) i vari contributi che provengono da tutti i punti della aper-tura tenendo conto del gioco delle fasi che produce un aumento (onde in fase) ouna diminuzione (onde sfasate) dell’intensita dell’onda sommata. L’espressionerisultante e l’integrale di diffrazione che mostra come l’intensita sul piano dell’im-magine e legata all’intensita e fase sul piano della pupilla di ingresso. Intensitae fase del fronte d’onda possono essere dati ad ogni piano nel sistema ottico ecostituiscono la cosiddetta Optical Transfer Function (OTF) che ha una interes-sante proprieta: la OTF al piano della pupilla e quella al piano dell’immaginesono l’una la trasformata di Fourier dell’altra. Tenendo poi conto che la PointSpread Function (PSF) non e altro che il modulo quadro della OTF al pianofocale, possiamo scrivere

PSF = |OTF(pupilla)|2

conOTF(pupilla) = P(x, y) exp(ikφ(x, y))

dove P(x,y) e la Pupil Function legata alle proprieta di trasmissione della pupillae generalmente costituita da 1 e 0 a seconda che la regione considerata sia libera(p. es. specchio) oppure bloccata (p. es. l’ombra dello specchio secondarioe dello spider). La variabile φ rappresenta la fase dell’onda alla pupilla e puoessere presa come una differenza di fase rispetto ad una fase di riferimento sulla

Dip. di Fisica @ UNISALENTO 59

pupilla stessa. Il numero d’onda e k = 2π/λ. Nel caso piu semplice di un’ondapiana non deformata l’integrale di diffrazione si puo risolvere analiticamente eper un’apertura circolare, ostruita al centro con un cerchio di raggio frazionarioǫ = Rapertura/Rostruzione, si ottiene

PSF ∝[

2J1(v)

v− ǫ2 2J1(ev)

ev

]2

(1.47)

dove

v = πrλF

J1 e la funzione di Bessel al primo ordine

r e la distanza nel piano dell’immagine

F= f/D e il rapporto focale e λ la lunghezza d’onda.

Questa espressione da la cosiddetta Airy pattern che e mostrata in Figura-??.Si trova che il raggio del primo cerchio nullo e ad una distanza fisica di r =1.22λF ovvero ad una distanza angolare θ = 1.22λ/D. I casi reali possonoessere piu complicati e richiedere quindi un’integrazione numerica dell’integraledi diffrazione facendo una trasformata di Fourier.

Altre sorgenti di aberrazione

Finora abbiamo discusso di aberrazioni originate dalla geometria delle superficiottiche e dal fenomeno fisico della diffrazione, e Alcuni problemi che sono fontedi ulteriori aberrazioni:

- errori di lavorazione delle superfici ottiche : raramente nella lavorazione diuna superficie ottica il risultato e esattamente quello che era stato previstodalle specifiche richieste

- disallineamenti tra diverse superfici ottiche il cui effetto (del terzo ordine)puo essere valutato utilizzando espressioni per elementi ottici decentrati.Per un sistema di due specchi si trova che il decentramento o il tilting deglispecchi produce un aumento della coma costante su tutto il campo: quindiper un telescopio male allineato la coma domina sempre sull’astigmantismo.

- problemi meccanici e di supporto: quando gli specchi sono montati nelleloro celle il loro peso si distribuisce sulle strutture di supporto meccanico.

60 F.Strafella

Si determinano cosı due effetti: l’uno riguarda gli specchi che, non essendocompletamente rigidi subiscono una deformazione che cambia al cambia-re della direzione di puntamento del telescopio. L’altro effetto interessa lastruttura meccanica del telescopio che non e mai perfettamente rigida: que-sto comporta una flessione che porta ad un disallineamento del secondarioin funzione della direzione di puntamento. Oltre a questi effetti si deveanche considerare che la dilatazione termica della struttura, indotta dal-le variazioni di temperatura ambiente durante le osservazioni, produce unavaruiazione di distanza tra primario e secondario implicando una variazionedel fuoco.

- aberrazione cromatica: anche se i telescopi impiegano specchi, quasi sem-pre negli strumenti di piano focale vengono impiegate anche delle lenti che,a causa della variazione dell’indice di rifrazione con la lunghezza d’onda,soffrono dell’aberrazione cromatica. Questa puo essere minimizzata utiliz-zando opportune combinazioni di materiali ottici per realizzare gli elementidell’ottica in modo che le aberrazioni cromatiche si compensino. Rimanecomunque sempre una qualche aberrazione che si aggiunge alle altre.

- il seeing: l’atmosfera della Terra introduce differenze di cammino otticoper raggi che, provenendo dalla stessa sorgente, vengono raccolti in puntidiversi dello specchio principale. In genere questa e la sorgente dominantedi aberrazione per telescopi sulla Terra. Per minimizzare il problema eessenziale scegliere un buon sito per il telescopio in modo tale che il migliorvalore del seeing del sito impone anche il limite di accuratezza al quale valela pena lavorare le ottiche.

1.6.2 Ottica Attiva ed Adattiva

Lo scopo principale dello sviluppo dell’ottica adattiva in astronomia e quello dieliminare o almeno contrastare gli effetti del seeing. Con il termine ottica attiva siintende invece una tecnica di rimozione o compensazione di tutti quegli effetti diaberrazione che sono prodotti dal cambiamento della direzione di puntamento deltelescopio, che si svolgono su scale temporali molto piu lunghe (e quindi a bassafrequenza, diciamo meno di 1 Hz) rispetto a quelle dell’ottica adattiva che tipica-mente si svolgono a frequenze tra 10 e 1000 Hz. A bassa frequenza le correzionidell’ottica attiva si possono effettuare usando degli attuatori che possono essereapplicati agli specchi principale o secondario per deformarne opportunamente lasuperficie riflettente. A piu alte frequenze non e piu possibile agire su specchi digrandi dimensioni e quindi si preferisce agire su uno specchio molto piu piccolo e

Dip. di Fisica @ UNISALENTO 61

deformabile posto sull’immagine della pupilla di ingresso. La possibilita di realiz-zare effettivamente un’ottica adattiva dipende dalla nostra capacita di rivelare ledeformazioni del fronte d’onda in arrivo e quindi di saper applicare le correzionidel caso in un tempo piu breve di quello tipico in cui l’atmosfera tcambia. Perottenere questo risultato si utilizzano tre componenti principali:

un sensore del fronte d’onda

un sistema di controllo che permette di prevedere quali deformazioni sianonecessarie alla correzione del fronte d’onda (per rendere piano il fronte)

un elemento ottico che riceve i segnali dal sistema di controllo e li traducenelle opportune deformazioni della superficie ottica

Si possono usare diversi modi per valutare la forma del fronte d’onda ma i piuutilizzati sono due basati sul sistema di Shack-Hartmann, mostrato in Figura1.22.Questo e costituito da una matrice (array) di piccole lenti ognune delle qualiintercetta una parte dell’onda piana incidente producendo una propria immagine(detta anche spot). Questo sistema puo essere usato in due modi:

- se l’onda incidente e’ piana le distanze tra gli spot saranno regolarmentespaziate come la matrice di lentine. In presenza di deformazioni del pianodell’onda incidente avremo che le distanze tra gli spot si modificherannoconseguentemente. Dalla misura di queste variazioni si puo risalire allaforma dell’onda e quindi applicare una opportuna correzione agli elementiattivi dell’ottica.

- il secondo metodo usa lo stesso array di lentine per produrre l’array di spot.Diversamente dal metodo precedente che si basa sulla misura delle distanzetra gli spot che si formano al piano focale dell’array, questo misura inveceper ogni spot l’ampiezza dell’onda prima e dopo il piano focale in punti fissisull’asse ottico di ogni lentina. Questo corrisponde a fare la misura dellospot dove e fuori fuoco (sfocato). Le differenze di ampiezza misurate tra glispot prima e dopo il piano focale danno poi l’informazione sulle differenzedi fase dell’onda incidente.

62 F.Strafella

Figura 1.22: Sistema Shack-Hartmann per la misura della deformazione del fronted’onda.