Il mito della caverna: inferenza statistica in Platone

Mi rendo conto che con questo, il mio verrà irrevocabilmente annoverato tra i blog  più pallosi di tutta la Websfera. Tuttavia, con garbo, me ne infischio. Ho deciso di scrivere prima di tutto per me e questo è stato il risultato. Uno dei risultati…! Va bene, abbasso la cresta.  Diciamocelo: non credo scriverò mai più qualcosa di così impegnato e siccome mi sono scervellata per scriverlo, salgo sulla sedia e ve lo leggo! Altro motivo che m’ ha spinto a copiare qui le mie “arzigogolerie” è che da quanto segue, trapela il mio talento in tutta la sua potenza: mi ritengo infatti, saltatrice esperta di pali in fresche frasche. In particolare, si riporteranno divagazioni su due cose che, secondo me, solo apparentemente non c’ azzeccano niente (termine tecnico n.d.r.) l’ una con l’ altra: statistica e filosofia. La verità è che non sono affatto distanti e che, per vostra informazione, i primi grandi matematici erano filosofi! Pertanto, in my opinion, Platone e Friedrich Gauss, si conoscevano (Seh, lallero!) e magari si davano pure la mano come Nietzsche e Marx e altri compagni di scuola (cit.). Non ci credete?!  State a vedere, uomini di poca fede!

 

Dei massimi sistemi  (9/04/2011)

Opinione e conoscenza. Non necessariamente viaggiano sullo stesso binario.Non necessariamente l’ opinione che ci facciamo di qualcosa, o qualcuno, corrisponde a verità. Non sempre opinione vuol dire conoscenza.
Ve l’ hanno mai spiegato in termini statistici?
Un post nato dalla mia passione per questa materia.

Strumenti di lavoro:
Due concetti: retta di regressione e scatter.

  • La retta di regressione è l’ interpolazione di una nuvola di punti, che chiameremoscatter.
  • Lo scatter è l’ insieme di punti, dati dalle combinazioni di due o più variabili.

Nel grafico, la linea che attraversa la nuvola è la “Retta di regressione”.

Qui si vede meglio, con meno combinazioni (x,y):

Cosa significano:
La nuvola di punti rappresenta la realtà: come le cose effettivamente si presentano.
Immaginiamo che queste “cose” siano i prezzi (asse y) che un titolo assume nel tempo (asse x).
Il prezzo di un titolo (quotazione), può essere rilevato su base mensile, settimanale, giornaliera, infragiornaliera.
In realtà anche considerare quotazioni giornaliere significa comunque, fare una semplificazione della realtà, perchè il prezzo di un titolo varia istante, dopo istante nel tempo (t). Per semplicità, consideriamo il prezzo di un titolo in un’ ottica end-of-the day (prezzo = chiusura giornaliera del titolo).

  • Per ogni titolo, avremo quindi una combinazione di giorni (asse x) – prezzo di chiusura (asse y).
  • Per ogni titolo, avremo una serie storica (time series) infinita di prezzi.

“Infinita”?! Come faccio a lavorare (fare una media, un’ indice, …) su una popolazione infinita di oggetti?
Lavoro su un campione e su questo campione cercherò di fare una  riproduzione più vicina possibile alla verità delle cose. Questo modellino, che andrò a costruirmi, mi serve per dare un’ idea della realtà, senza necessariamente conoscere tutto di questa realtà. Altrimenti, che senso avrebbe fare stime a rialzo o ribasso di un titolo, se già ho a disposizione la serie storica infinita dei suoi prezzi? Tra l’ altro millantare di conoscere oggi la serie di prezzi futuri è davvero poco credibile. Possiamo predire il futuro, ma non possiamo prevederlo.
Quindi, proprio in virtù di questo, mi costruisco un modellino, per stimare gli infiniti valori che la variabile “prezzo del titolo” assumerà nel tempo, che chiamerò Regressione Lineare.

  • Regressione perché si tratta di una retta sulla quale regrediscono in maniera più veritiera possibile le effettive combinazioni di prezzi nel tempo.
  • Lineare sta ad indicare che la funzione  matematica in considerazione, è non esponenziale (senza esponenti). Significa che non ha punti di flesso (praticamente sono “righe”).

Per stimare l’ andamento di una variabile, devo sapere da cosa questa dipenda.
Il prezzo di un’ azione tipicamente dipende dal rendimento: aumenta il rendimento, aumenta il prezzo dell’ azione (sono in relazione diretta). Può dipendere anche da altre variabili.
Chiamiamo il prezzo Y e i rendimenti X1. Le altre variabili da cui dipende y saranno: X2, X3, …, Xn.

  • Y= variabile dipendente
  • X1, X2, … , Xn = variabili indipendenti, o esplicative, o regressori.

Quanto appena detto, posso riassumerlo in questo modo:
Y= f (X1, X2,…Xn)
La variabile dipendente è frutto di una combinazione lineare (somme di prodotti) delle esplicative.Y= a°+b1*X1+b2*X2+…+bnXn  + e            [1]

e= errore, l’ effetto del caso sul valore finale della Y che mi ricavo. Non posso governare tutto.
La variabile prezzo, così come i rendimenti e le altre, assumono valori diversi nel tempo. Di conseguenza, gli elementi di quella funzione sono variabili multidimensionali  (vettori).

  • Se la Y dipende da una sola variabile —> Regressione lineare semplice: la Y è univariata.
  • Se la Y dipende da almeno due variabili —> Regressione lineare multipla: la Y è multivariata.

Come si utilizzano:
La seconda è il caso più esteso e ha dunque validità di regola generale.
Per semplicità consideriamo il caso della regressione semplice.
Il meccanismo è lo stesso: parto da un campione di combinazioni e costruisco una stima della [1]
Per farla più rappresentativa possibile devo minimizzare l’ errore. Cioè trovare quel vettore di b (beta) che minimizzi l’ errore. In particolare si utilizza il metodo dei minimi quadrati (OLS). Grazie a questo metodo riduco al minimo la somma dei quadrati degli scarti tra valori teorici e osservati. Per ogni istante di tempo, quindi per ogni combinazione, l’ errore è la distanza tra il punto Y dello scatter e il corrispondente Y della retta che mi sono costruita:


Devo ridurre al minimo la somma di tutte queste distanze. Però in realtà non sono governabili , allora lo faccio scegliendo il b. Un esempio di modello che otterrò è:
Y= 5+4*X1+1,2*X2

Se quei coefficienti (beta) li ho trovati con il metodo dei minimi quadrati, so per certo che qualsiasi valore delle X inserirò, riavrò indietro un valore Y stimato il più vicino possibile all’ Y vero.
Praticamente quel vettore b è una proiezione dello scatter. Infatti, proietta, sullo stesso piano geometrico delle variabili indipendenti, la stima di Y facendogli correre la strada più breve possibile: quella strada è l’ errore.

Considerazioni finali: 
Bene. Questo altro non è che il Mito della Caverna di Platone. Se conoscete quella storia, potrete capire l’ inferenza statistica e l’ econometria, senza troppe difficoltà. Il mito racconta di uomini chiusi in una caverna. Non riescono a vedere quello che c’ è fuori con i propri occhi, ma lo percepiscono attraverso delle ombre, che si insinuano in determinati momenti della giornata. Non vedono la realtà, ma la percepiscono e se ne fanno un’ idea con una loro rappresentazione. E’ la stessa cosa che accade qui: l’ inferenza statistica è la luce che ci permette di vedere quelle ombre. Il nostro compito è quello di fare in modo che quelle ombre somiglino il più possibile a quello che accade fuori. La retta di regressione, in particalare il beta dei minimi quadrati, è quel fuoco incaricato di proiettare ombre più realistiche possibile:opinione e conoscenza.

 

 

 

Annunci

5 Responses to Il mito della caverna: inferenza statistica in Platone

  1. 125ml ha detto:

    Poat impegnativo ma mi ha incuriosito, mi ha incuriosito la coesistenza di emozioni volatili, effimere (nel senso stretto della parola) con mere formule matematiche.
    Quando come esempio hai introdotto i prezzi e abbiamo virato (lettore solidale io) sull’economia un pò mi sono dovuto riconcentrare e l’ultimo colpo di coda mi è piaciuto.
    La butto lì… principio di indeterminazione di Heisenberg.
    a rileggerci.

  2. Salinaversosud ha detto:

    Ti dirò, non me l’ aspettavo!
    Non mi aspettavo un sacco di cose, tra queste, che qualcuno leggesse tutto e si “concentrasse” per una cosa arzigogolata scritta da me. Sarò onesta: che bella sensazione! 🙂

    Non conoscevo il principio di indeterminazione. Non lo conosco ancora. Ho aperto qualche pagina (senza fare la figa: ho aperto wikipedia!) per capire se parlavamo di arte, filosofia… o quantistica!
    Io adoVo questo tipo di input e adoro trovare e cercare connessioni tra le cose. Tu perché me lo hai proposto? Io ne so poco, ho appena “imparato” che è impossibile studiare congiuntamente due misure (es. peso e quantità) perché quello che si guadagna in precisione in una, si perde nell’ altra (sbaglio?). Il mio problema è che non so perché!
    Credo comunque d’ aver colto il generico senso di “per quanto ci si possa provare”, rimarrà sempre un pezzettino “scoperto”. E’ un po’ come dividere una torta in fette, una fetta in pezzi, un pezzo in dadini, un dadino in briciole e dentro quelle briciole?! (No, forse l’ esempio non calza prima o poi s’ arriva al quanto, o no?!…meglio una direttrice, divisa in segmenti, divisi a loro volta, fino ad arrivare a un punto…un “insieme infinito di punti”, va a capire quale!)
    Forse anche la quantistica è una scienza più umana di quel che sembra. Forse anche il rigore di quelle matrici, che ho visto su wikipedia, altro non significa che per quanto possiamo sforzarci di mettere a punto nuovi espedienti di calcolo, computo e determinazione, ci sarà sempre una piccola percentuale di indeterminazione…di rischio! Mi piace! Ora il tuo suggerimento mi suona davvero pertinente! Grazie ml, a rileggerci!

  3. 125ml ha detto:

    Ho letto tutto perchè da quasi ingegnerucolo quale sono, anche io, ogni tanto, gioco ad unire concetti scientifici a riflessioni del tutto personali.
    Poi ti dirò sono curioso di farmi un’idea di chi scrive ciò che leggo e questo post a differenza di quello che può sembrare superficialmente contiene moooolti indizi.
    Il principio di indeterminazione si studia in chimica, fisica blabla…
    In soldoni dice che non è possibile conoscere contemporaneamente tutte le proprietà di un oggetto, per cui l’universo fisico per come lo conosciamo è frutto di un insieme di probabilità che si manifestano nelle nostre osservazioni, per cui il tipo di conoscenza che ne deriva è probabilistico” e qui è il punto in cui è scattata la connessione.

  4. limiteumano ha detto:

    E pensare che io su queste cose ci lavoro. Però come il Papa non crede in Dio, io sono un assicuratore che non crede nella statistica.
    Le ombre che vediamo nella caverna sono solo frutto dei nostri desideri e delle nostre illusioni. La realtà fuori è diversa.

  5. salinaversosud ha detto:

    Certo che è diversa, altrimenti non esisterebbe il rischio!

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: