Criteris i mètodes per provar hipòtesis estadístiques, exemples

Taula de continguts:

Criteris i mètodes per provar hipòtesis estadístiques, exemples
Criteris i mètodes per provar hipòtesis estadístiques, exemples
Anonim

La prova d'hipòtesis és un procediment necessari en estadístiques. Una prova d'hipòtesi avalua dues afirmacions mútuament excloents per determinar quina afirmació és millor recolzada per les dades de la mostra. Quan es diu que una troballa és estadísticament significativa, es deu a una prova d'hipòtesi.

Mètodes de verificació

Els mètodes per comprovar les hipòtesis estadístiques són mètodes d'anàlisi estadística. Normalment, es comparen dos conjunts d'estadístiques o es compara un conjunt de dades mostrejades amb un conjunt de dades sintètiques d'un model idealitzat. Les dades s'han d'interpretar de manera que afegeixin nous significats. Podeu interpretar-los assumint una determinada estructura del resultat final i utilitzant mètodes estadístics per confirmar o rebutjar la suposició. La hipòtesi s'anomena hipòtesi i les proves estadístiques utilitzades per a aquest propòsit s'anomenen hipòtesis estadístiques.

H0 i H1 hipòtesis

Hi ha dos principalsels conceptes de prova estadística d'hipòtesis: l'anomenada "hipòtesi principal o nul·la" i "hipòtesi alternativa". També s'anomenen hipòtesis de Neyman-Pearson. La hipòtesi de la prova estadística s'anomena hipòtesi nul·la, la hipòtesi principal o H0 per abreujar. Sovint es coneix com la hipòtesi predeterminada o la suposició que res ha canviat. Sovint, una violació d'un supòsit de prova s'anomena primera hipòtesi, hipòtesi alternativa o H1. H1 és una abreviatura d'alguna altra hipòtesi, perquè tot el que sabem és que les dades H0 es poden descartar.

prova d'hipòtesi nul·la
prova d'hipòtesi nul·la

Abans de rebutjar o no rebutjar la hipòtesi nul·la, cal interpretar el resultat de la prova. Una comparació es considera estadísticament significativa si és poc probable que la relació entre els conjunts de dades sigui la implementació de la hipòtesi nul·la segons la probabilitat llindar, el nivell de significació. També hi ha criteris de bondat d'ajust per a la prova d'hipòtesis estadístiques. Aquest és el nom del criteri de prova d'hipòtesi, que s'associa a la suposada llei de la distribució desconeguda. Aquesta és una mesura numèrica de la discrepància entre les distribucions empíriques i teòriques.

Procediment i criteris per comprovar les hipòtesis estadístiques

Els mètodes de selecció d'hipòtesis més comuns es basen en el criteri d'informació d'Akaike o en el coeficient bayesià. La prova d'hipòtesi estadística és una tècnica clau tant en inferència com en inferència bayesiana, tot i que els dos tipus tenen diferències notables. Proves d'hipòtesi estadísticaDefinir un procediment que controli la probabilitat de decidir erròniament una hipòtesi d'impagament incorrecta o nul·la. El procediment es basa en la probabilitat que funcioni. Aquesta probabilitat de prendre una decisió equivocada és la improbabilitat que la hipòtesi nul·la sigui certa i que no existeixi cap hipòtesi alternativa particular. La prova no pot mostrar si és vertader o fals.

Mètodes de prova d'hipòtesis estadístiques
Mètodes de prova d'hipòtesis estadístiques

Mètodes alternatius de teoria de la decisió

Existeixen mètodes alternatius de teoria de la decisió, en els quals la primera i la hipòtesi nul·la es consideren més d'igu altat. Altres enfocaments de presa de decisions, com la teoria bayesiana, intenten equilibrar les conseqüències de les males decisions en totes les possibilitats en lloc de centrar-se en una sola hipòtesi nul·la. Una sèrie d' altres enfocaments per decidir quina de les hipòtesis és correcta es basen en les dades, quines d'elles tenen les propietats desitjades. Però la prova d'hipòtesis és l'enfocament dominant per a l'anàlisi de dades en molts camps de la ciència.

Comprovació de la hipòtesi estadística

Sempre que un conjunt de resultats difereix d'un altre conjunt, cal confiar en proves d'hipòtesis estadístiques o proves d'hipòtesis estadístiques. La seva interpretació requereix una comprensió adequada dels valors p i dels valors crítics. També és important entendre que, independentment del nivell de significació, les proves encara poden contenir errors. Per tant, pot ser que la conclusió no sigui correcta.

El procés de prova consisteix enmúltiples passos:

  1. S'està creant una hipòtesi inicial per a la investigació.
  2. S'indiquen les hipòtesis nul·les i alternatives rellevants.
  3. Explica els supòsits estadístics sobre la mostra de la prova.
  4. Determinar quina prova és adequada.
  5. Seleccioneu el nivell de significació i el llindar de probabilitat per sota del qual es rebutjarà la hipòtesi nul·la.
  6. La distribució de l'estadística de prova de la hipòtesi nul·la mostra els possibles valors en què es rebutja la hipòtesi nul·la.
  7. Càlcul en curs.
  8. Es pren la decisió de rebutjar o acceptar la hipòtesi nul·la a favor d'una alternativa.

Hi ha una alternativa que utilitza un valor p.

Exemples de prova d'hipòtesis estadístiques
Exemples de prova d'hipòtesis estadístiques

Proves de significació

Les dades pures no tenen cap utilitat pràctica sense interpretació. En estadística, quan es tracta de fer preguntes sobre dades i interpretar els resultats, s'utilitzen mètodes estadístics per garantir l'exactitud o la probabilitat de les respostes. Quan es posen a prova hipòtesis estadístiques, aquesta classe de mètodes s'anomena proves estadístiques o proves de significació. El terme "hipòtesi" recorda els mètodes científics, on s'investiguen hipòtesis i teories. En estadística, una prova d'hipòtesi dóna com a resultat una quantitat donada una hipòtesi determinada. Us permet interpretar si una suposició és certa o s'ha fet una infracció.

Interpretació estadística de les proves

Proves d'hipòtesis'utilitzen per determinar quins resultats de la investigació conduiran al rebuig de la hipòtesi nul·la per a un nivell de significació predeterminat. Els resultats d'una prova d'hipòtesi estadística s'han d'interpretar per poder continuar treballant-hi. Hi ha dues formes comunes de criteris de prova d'hipòtesis estadístiques. Aquests són valors p i valors crítics. En funció del criteri seleccionat, els resultats obtinguts s'han d'interpretar de manera diferent.

Què és un valor p

La sortida es descriu com a estadísticament significativa quan s'interpreta el valor p. De fet, aquest indicador significa la probabilitat d'error si es rebutja la hipòtesi nul·la. En altres paraules, es pot utilitzar per anomenar un valor que es pot utilitzar per interpretar o quantificar el resultat d'una prova, i per determinar la probabilitat d'error en rebutjar la hipòtesi nul·la. Per exemple, podeu realitzar una prova de normalitat en una mostra de dades i trobar que hi ha poques possibilitats de valor atípic. Tanmateix, la hipòtesi nul·la no s'ha de rebutjar. Una prova d'hipòtesi estadística pot retornar un valor p. Això es fa comparant el valor de p amb un valor de llindar predeterminat anomenat nivell de significació.

Comprovació estadística d'hipòtesis nul·les
Comprovació estadística d'hipòtesis nul·les

Nivell d'importància

El nivell de significació s'escriu sovint amb la lletra grega "alfa" minúscula. El valor general utilitzat per alfa és el 5%, o 0,05. Un valor alfa més petit suggereix una interpretació més fiable de la hipòtesi nul·la. El valor p es compara ambvalor alfa preseleccionat. El resultat és estadísticament significatiu si el valor p és menor que alfa. El nivell de significació es pot invertir restant-lo a un. Això es fa per determinar el nivell de confiança de la hipòtesi a partir de les dades de mostra observades. Quan s'utilitza aquest mètode de prova d'hipòtesis estadístiques, el valor P és probabilístic. Això vol dir que en el procés d'interpretació del resultat d'una prova estadística, un no sap què és cert o fals.

Teoria de prova d'hipòtesis estadístiques

El rebuig de la hipòtesi nul·la significa que hi ha prou evidència estadística que sembla probable. En cas contrari, vol dir que no hi ha prou estadístiques per rebutjar-lo. Es pot pensar en les proves estadístiques en termes de la dicotomia de rebutjar i acceptar la hipòtesi nul·la. El perill de la prova estadística de la hipòtesi nul·la és que, si s'accepta, pot semblar que és certa. En canvi, seria més correcte dir que la hipòtesi nul·la no es rebutja perquè no hi ha prou evidència estadística per rebutjar-la.

Hipòtesi estadística que prova els criteris de bondat d'ajust
Hipòtesi estadística que prova els criteris de bondat d'ajust

Aquest moment sovint confon els extres novells. En aquest cas, és important recordar que el resultat és probabilístic i que fins i tot acceptar la hipòtesi nul·la encara té una petita possibilitat d'error.

Hipòtesi nul·la vertadera o falsa

La interpretació del valor de p no vol dir que zerola hipòtesi és certa o falsa. Això vol dir que s'ha optat per rebutjar o no rebutjar la hipòtesi nul·la a un cert nivell de significació estadística a partir de les dades empíriques i la prova estadística escollida. Per tant, el valor p es pot considerar com la probabilitat de les dades donades sota una hipòtesi predeterminada incorporada a les proves estadístiques. El valor p és una mesura de la probabilitat que s'observi la mostra de dades si la hipòtesi nul·la és certa.

Interpretació de valors crítics

Algunes proves no tornen p. En canvi, poden tornar una llista de valors crítics. Els resultats d'aquest estudi s'interpreten de manera similar. En lloc de comparar un únic valor p amb un nivell de significació predeterminat, l'estadística de prova es compara amb un valor crític. Si resulta ser menor, vol dir que no va ser possible rebutjar la hipòtesi nul·la. Si és superior o igual, s'ha de rebutjar la hipòtesi nul·la. El significat de l'algorisme de prova d'hipòtesis estadística i la interpretació del seu resultat és similar al valor p. El nivell de significació escollit és una decisió probabilística de rebutjar o no rebutjar la suposició de la prova base donades les dades.

Errors a les proves estadístiques

La interpretació d'una prova d'hipòtesi estadística és probabilística. La tasca de provar hipòtesis estadístiques no és trobar una afirmació vertadera o falsa. L'evidència de la prova pot ser errònia. Per exemple, si l'alfa era del 5%, això significa que en la seva majoria és 1 de 20la hipòtesi nul·la serà rebutjada per error. O no serà a causa del soroll estadístic de la mostra de dades. Tenint en compte aquest punt, un valor p petit al qual rebutjar la hipòtesi nul·la pot significar que és falsa o que s'ha comès un error. Si es comet aquest tipus d'error, el resultat s'anomena fals positiu. I aquest error és un error de primer tipus en provar hipòtesis estadístiques. D' altra banda, si el valor p és prou gran com per significar el rebuig de la hipòtesi nul·la, pot significar que és cert. O no és correcte i s'ha produït algun esdeveniment poc probable a causa del qual s'ha produït l'error. Aquest tipus d'error s'anomena fals negatiu.

Comprovació estadística d'hipòtesis nul·les
Comprovació estadística d'hipòtesis nul·les

Probabilitat d'errors

En provar hipòtesis estadístiques, encara hi ha la possibilitat de cometre algun d'aquests tipus d'errors. Són molt probables dades falses o conclusions falses. Idealment, s'hauria d'escollir un nivell de significació que minimitzi la probabilitat d'un d'aquests errors. Per exemple, les proves estadístiques de les hipòtesis nul·les poden tenir un nivell de significació molt baix. Tot i que els nivells de significació com 0,05 i 0,01 són comuns en molts camps de la ciència, el nivell de significació més utilitzat és 310^-7, o 0,0000003. Sovint s'anomena "5-sigma". Això vol dir que la conclusió va ser aleatòria amb una probabilitat d'1 en 3,5 milions de repeticions independents dels experiments. Els exemples de prova d'hipòtesis estadístiques sovint comporten aquests errors. Aquesta és també la raó per la qual és important tenir resultats independents.verificació.

Exemples d'ús de la verificació estadística

Hi ha diversos exemples habituals de prova d'hipòtesis a la pràctica. Un dels més populars és el conegut com "Tast de te". La doctora Muriel Bristol, una col·lega del fundador de la biometria, Robert Fisher, va afirmar poder dir amb certesa si es va afegir primer a una tassa de te o de llet. Fisher es va oferir a donar-li vuit tasses (quatre de cada varietat) a l'atzar. L'estadística de la prova era senzilla: comptar el nombre d'èxits en l'elecció d'una tassa. La regió crítica va ser l'únic èxit de 4, possiblement basat en el criteri de probabilitat habitual (< 5%; 1 de cada 70 ≈ 1,4%). Fisher va argumentar que no cal una hipòtesi alternativa. La senyora va identificar correctament cada copa, fet que es va considerar un resultat estadísticament significatiu. Aquesta experiència va portar a Fisher al llibre Statistical Methods for Researchers.

Exemple de l'acusat

El procediment de judici estadístic és comparable a un tribunal penal on l'acusat es presumeix innocent fins que es demostri la culpabilitat. El fiscal intenta demostrar la culpabilitat de l'acusat. Només quan hi ha proves suficients per a un càrrec es pot declarar culpable l'acusat. A l'inici del procediment, hi ha dues hipòtesis: "L'acusat no és culpable" i "L'acusat és culpable". La hipòtesi d'innocència només es pot rebutjar quan l'error és molt poc probable perquè no es vol condemnar un acusat innocent. Aquest error s'anomena error de tipus I i la seva apariciórarament controlat. Com a conseqüència d'aquest comportament asimètric, l'error de tipus II, és a dir, l'absolució de l'autor, és més freqüent.

Exemples de validació estadística
Exemples de validació estadística

Les estadístiques són útils a l'hora d'analitzar grans quantitats de dades. Això s'aplica igualment a la prova d'hipòtesis, que poden justificar les conclusions encara que no existeixi cap teoria científica. A l'exemple del tast de te, era "obvi" que no hi havia cap diferència entre abocar llet al te o abocar te a la llet.

L'aplicació pràctica real de la prova d'hipòtesis inclou:

  • provar si els homes tenen més malsons que les dones;
  • atribució del document;
  • Avaluació de la influència de la lluna plena en el comportament;
  • determinar l'abast en què un ratpenat pot detectar un insecte mitjançant un eco;
  • triar el millor mitjà per deixar de fumar;
  • Comprovar si els adhesius de para-xocs reflecteixen el comportament del propietari del cotxe.

Les proves d'hipòtesis estadístiques tenen un paper important en l'estadística en general i en la inferència estadística. Les proves de valor s'utilitzen com a reemplaçament de la comparació tradicional del valor previst i el resultat experimental en el nucli del mètode científic. Quan una teoria només és capaç de predir el signe d'una relació, les proves d'hipòtesis dirigides es poden configurar de manera que només un resultat estadísticament significatiu recolzi la teoria. Aquesta forma de teoria de l'avaluació és la més rígidacrítiques a l'ús de la prova d'hipòtesis.

Recomanat: