Recent Changes - Search:

Pagine di servizio

Gruppi

Pagine in allestimento

Strumenti

Domini correlati

PmWiki

pmwiki.org

edit SideBar

♕ Statistica inferenziale

La Sapienza Università di Roma



a cura di P. Forster & D. Rüegg
Statistica inferenziale
La statistica inferenziale (inferenza vuol dire trarre delle conclusioni logiche a partire dai dati disponibili) ha come obiettivo, invece, quello di stabilire delle caratteristiche dei dati e dei comportamenti delle misure rilevate (variabili statistiche) con una possibilità di errore predeterminata. Le inferenze possono riguardare la natura teorica (la legge probabilistica) del fenomeno che si osserva.

1.  Scopi del campionamento





2.  Metodi di campionamento





Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

2.1  I sondaggi

una fotografia della realtà




◦⦆─────⦅◦

2.2  Come si costruisce un campione





◦⦆─────⦅◦

2.3  Campionamento non probabilistico





◦⦆─────⦅◦

2.4  Campionamento per randomizzazione

semplice




3.  Errori di campionamento





Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

3.1  Influenza del caso





4.  Variabilità di una stima





Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

4.1  Errore standard e limiti fiduciali





5.  Test di significatività





Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

5.1  Il test del chi-quadro

Negli esempi che seguono, ci limiteremo ad utilizzare come test di significatività, il test del chi-quadro (formula sotto). Questo test fra i molti disponibili, oltre che di semplice applicazione, è adeguato per comprendere il procedimento generale atto a valutare le conclusioni ricavabili da un campionamento.

Tutti i metodi che si basano su distribuzioni probabilistiche dei dati, quali la distribuzione normale, sono detti parametrici. In contrapposizione, le tecniche non parametriche sono quelle che non sono basate su alcuna distribuzione probabilistica. In generale i test non parametrici dovrebbero essere preferiti quando i dati non si distribuiscono secondo una normale, o comunque non si è in grado di dimostrarlo, ad esempio per numerosità ridotta.
Il test del chi-quadro è un test statistico non parametrico atto a verificare se i valori di frequenza ottenuti tramite rilevazione, sono diversi in maniera significativa dalle frequenze ottenute con la distribuzione teorica. Questo test ci permette di accettare o rifiutare una data ipotesi.

L'istogramma sopra a sinistra, mostra i risultati ottenuti dal lancio di due dadi ripetuto per 36 volte. A destra, sono riportati i risultati attesi (dopo 36 lanci) in base alla probabilità di uscita dei vari risultati : ottenere un 2 con due dadi è più difficile che ottenere un 4 (con 4 lanci ci si può aspettare che esca un 2 e tre volte 4). Ancóra, nell'istogramma a sinistra, le differenze positive (risultati oltre il previsto) sono rappresentate da zone colorate in verde; quelle negative, da zone colorate in rosso. Supponendo che dopo un certo numero di lanci, si ottenga una serie di lanci "non fortunati", diremo che la "sfortuna" ci perseguita se l'istogramma di sinistra si discosta oltre un certo valore da quella che sarebbe la distibuzione dei risultati attesi. Diversamente, diremo che le nostre perdite sono una semplice conseguenza del caso (qualche volta si vince e qualche volta si perde, anche se generalmente tendiamo a prestare maggior attenzione alle perdite).

Il test con il quale si decide se due o più eventi sono tra loro associati, oppure una semplice conseguenza della probabilità, utilizza la cosiddetta ipotesi zero, Ho.

Il diagramma in alto illustra i passi per effettuare un test di significatività:

  1. formulazione dell'ipotesi Ho: gli eventi osservati sono dovuti al caso; non esiste alcuna correlazione tra loro;
  2. per verificare l'ipotesi Ho applichiamo il test, che può risultare:
    • positivo: accettiamo l'ipotesi Ho → tra gli eventi osservati non esiste una correlazione
    • negativo: rifiutiamo l'ipotesi Ho → tra gli eventi osservati esiste una correlazione
test del chi-quadro
gradi di
libertà
probabilità
10% 5% 1%
1 2.71 3.84 6.63
2 4.61 5.99 9.21
3 6.25 7.81 11.34
4 7.78 9.49 13.28
5 9.24 11.07 15.00

Per eseguire il test, occorre calcolare chi quadro e confrontarlo con Vt. Esaminando la formula per calcolare chi quadro (incorniciata in verde), si nota che contiene una somma di termini (numeri osservati e numeri attesi) elevati al quadrato in modo da restituire comunque un numero positivo (nell'istogramma relativo al lancio dei dadi, le zone in rosso e le zone in verde non devono compensarsi reciprocamente); inoltre, è evidente che maggiore è la differenza fra valori osservati e valori attesi, maggiore sarà il risultato. Quanto più alto è questo risultato, tanto maggiore è la probabilità che la relazione non sia correlativa '-(e quindi aleatoria o casuale)-'.

Per ottenere Vt, si utilizzano i dati riportati in tabella (v. esempi seguenti) rispettando due criteri:

  1. il numero di gradi di libertà, che in una tabella formata da r righe e c colonne, è dato da: (r - 1) x (c - 1);
  2. il valore massimo per il quale, in corrispondenza di una certa probabilità e dei gradi di libertà del sistema in studio, dobbiamo accettare l'ipotesi Ho. Se questo valore è superato, allora rifiutiamo Ho.

Per esempio, una tabella formata da 3 colonne e due righe, ha (3-1) x (2-1)= 2 gradi di libertà; e quindi i valori Vt risultano: 4,61 (10%); 5,99 (5%); 9,21 (1%). Supponendo che dal calcolo si sia ottenuto un valore chi quadro = 6 , si deduce che H0 è maggiore di 4,61 e anche 5,99 ma inferiore a 9,21 . Pertanto possiamo concludere che:

  • l'ipotesi zero è respinta per 4,61 (10%) : con probabilità del 90% i dati ottenuti non sono dovuti al caso (esiste però la probabilità del 10% che i dati siano casuali);
  • l'ipotesi zero è respinta per 5,99 (5%) : con probabilità del 95% i dati ottenuti non sono dovuti al caso (esiste però la probabilità del 5% che i dati siano casuali);
  • l'ipotesi zero è accettata per 9,21 (1%) : con probabilità del 99% i dati ottenuti sono dovuti al caso (esiste però la probabilità del 1% che i dati non siano casuali).

Gli esempi applicativi che seguono mostrano come l'applicazione del test non presenti difficoltà. Però, occorre tenere a mente che qualsiasi risultato è sempre associato ad una probabilità. Questo significa che se l'ipotesi H0 è accettata, la distribuzione dei dati controllata è dovuta al caso (ma non lo è con una certa probabilità); se è rifiutata, la distribuzione dei dati non è dovuta al caso (ma lo è con una certa probabilità). Queste precisazioni sono necessarie in quanto se fosse possibile ottenere una probabilità del 100%, il procedimento induttivo avrebbe la stessa efficacia epistemologica di quello deduttivo. E questo è impossibile per definizione (v. riquadro).

E' noto che la conoscenza si sviluppa attraverso due procedimenti: deduttivo e induttivo.

Il primo, parte da un certo assunto e da questo si deduce una conclusione. Per esempio, poiché la somma degli angoli interni ad un quadrato è 360º, la somma degli angoli interni ai singoli due triangoli rettangoli in cui può essere scomposto è 180º.

Il metodo induttivo, si sviluppa in modo opposto: per esempio, dall'esame di un certo numero di conigli, si conclude che sono vegetariani, però questa è una inferenza speculativa in quanto non sono stati osservati "tutti" i conigli e, per quanto siano molti non sono "tutti". Dunque, con il metodo induttivo, si può inferire che tutti i conigli esaminati mangiano verdura e per gli altri probabilmente è così!

◦⦆─────⦅◦

5.2  Esempi applicativi





◦⦆─────⦅◦

5.3  Correzione di Yates





◦⦆─────⦅◦

5.4  Test esatto di Fisher





◦⦆─────⦅◦

5.5  Osservazioni da non sottovalutare





6.  Meta-analisi





Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

6.1  L'esame di una metanalisi*





◦⦆─────⦅◦

6.2  Le specifiche della metanalisi





◦⦆─────⦅◦

6.3  Eterogeneità





◦⦆─────⦅◦

6.4  Indagare le cause di eterogeneità






◦⦆─────⦅◦

6.5  Una curiosa meta-analisi*





◦⦆─────⦅◦

6.6  Nota conclusiva





7.  Allegati

Sono trattati i seguenti argomenti:
Schermo
Schermo
Schermo

7.1  Nota dell'autore

Dott. Marcello Guidotti Università La Sapienza di Roma.

Alcuni esempi discussi sono stati tratti dal sito: http://www.datavis.ca/gallery/

Marcello Guidotti, copyright 2003-2006-2010 - ultimo aggiornamento 13 settembre 2010
questa pagina può essere riprodotta su qualsiasi supporto o rivista purché sia citata la fonte e l'indirizzo di questo sito (ai sensi degli artt. 2575 e 2576 cc. Legislazione sul diritto d'autore). Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purché utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi è alcun richiamo diretto o indiretto alla loro qualità e/o efficacia il cui controllo è affidato alle autorità regolamentatorie.

◦⦆─────⦅◦

7.2  Sitografia

MedPop

description: Biometria, Statistica, epidemiologica, descrittiva, inferenziale, Indici di peso corporeo, Rischio peso, Colesterolemia, Lipidemie, MedPop, Medicina popolare
description: Insidie, statistiche, Visualizzazione grafica, Standardizzazione, Statistiche strane, Statistica descrittiva, Statistica inferenziale, MedPop, Medicina popolare
description: Epidemiologia, statistica, Correlazione, causalità, ipotesi, Implicazioni, confusione, Analisi di regressione, Statistiche di paragone, MedPop, medicina popolare
description: Dati, statistici, fondamentali, Media, moda, mediana, Deviazione standard, Indicatori, distribuzioni, Campo di variazione, Coefficiente di variazione, interpretazione, Lavoisier, somma, totale, Medie, mobili, Ovvietà, paradosso di Simpson, fattore d'inganno, Contesto, MedPop, Medicina popolare
description: Formula di Broca, Body mass index, BMI, IMC, giovani, Indice di massa corporea, mortalità
description: biometria, antropometria, medicina popolare, profana, laica, complementare, rischio peso, aspettativa vita, corporeo, Indici, IMC, indice di massa corporea, BMI, body mass index, Valutazione, biologiche, biologica, Implicazioni, mediche, sanitarie, Determinanti, peso, Valutazione peso, Misure, pazienti, sottopeso, sovrapeso, magrezza, obesità, Peter Forster, Daniela Rüegg
description: Medicina popolare, MedPop, biometria, colesterolo, lipidi, Lipidemie, lipoproteine, popolazioni, nazioni, sessi, età, referenza, prevenzione, rischi, colesterolemia, statistiche, misurazione, mortalità, riferimento, sanitario, chimico, Col, HDL, diagnosi, alimentazione, Medicamenti, economia, socioeconomia, statine, infarto, occlusioni, arterie, Aterosclerosi, Peter Forster, Daniela Rüegg
description: Medicina popolare, MedPop, biometria, colesterolo, lipidi, Lipidemie, lipoproteine, popolazioni, nazioni, sessi, età, referenza, prevenzione, rischi, colesterolemia, statistiche, misurazione, mortalità, riferimento, sanitario, chimico, Col, HDL, diagnosi, alimentazione, Medicamenti, economia, socioeconomia, statine, infarto, occlusioni, arterie, Aterosclerosi, Peter Forster, Daniela Rüegg

Wikipedia

Vari

  • galenotech: FACOLTA' di FARMACIA e MEDICINA corso di laurea in SCIENZE FARMACEUTICHE APPLICATE: La Sapienza Università di Roma
  • EPIDEMIOLOGIA STATISTICA: : FACOLTA' di FARMACIA e MEDICINA corso di laurea in SCIENZE FARMACEUTICHE APPLICATE: La Sapienza Università di Roma
  • Tubes: filmini didattici KHANacademy
  • Statistics Tubes: filmini didattici KHANacademy

7.3  Commenti

alla pagina Biometria / ♕ Statistica inferenziale: ev. cliccare sul titolo per accedere.

Commento 
Autore 
Enter code 572


Edit - History - Print - Recent Changes - Search
Page last modified on December 31, 2011, at 09:29 AM