Distribució Pearson: definició, aplicació

Taula de continguts:

Distribució Pearson: definició, aplicació
Distribució Pearson: definició, aplicació
Anonim

Quina és la llei de distribució de Pearson? La resposta a aquesta àmplia pregunta no pot ser senzilla i concisa. El sistema Pearson va ser dissenyat originalment per modelar observacions visibles distorsionades. Aleshores, era ben conegut com ajustar un model teòric perquè coincideixi amb els dos primers acumulants o moments de dades observades: qualsevol distribució de probabilitat es pot ampliar directament per formar un grup d'escales de localització.

Hipòtesi de Pearson sobre la distribució normal dels criteris

Excepte en casos patològics, es pot fer que l'escala de localització coincideixi amb la mitjana observada (primer acumulant) i la variància (segon acumulant) de manera arbitrària. No obstant això, no se sabia com construir distribucions de probabilitat en les quals es poguessin controlar amb la mateixa llibertat l'asi (tercer cumulant estandarditzat) i la curtosi (quart acumulant estandarditzat). Aquesta necessitat es va fer evident quan es va intentar ajustar models teòrics coneguts a les dades observades,que mostrava asimetria.

Al vídeo següent podeu veure l'anàlisi de la distribució chi de Pearson.

Image
Image

Història

En el seu treball original, Pearson va identificar quatre tipus de distribucions (numerades de l'I al IV) a més de la distribució normal (que originalment es coneixia com a tipus V). La classificació depèn de si les distribucions s'admeten en un interval limitat, en un semieix o en tota la línia real, i si eren potencialment esbiaixades o necessàriament simètriques.

En el segon article es van corregir dues omissions: va redefinir la distribució tipus V (originalment només era la distribució normal, però ara amb gamma inversa) i va introduir la distribució tipus VI. En conjunt, els dos primers articles cobreixen els cinc tipus principals del sistema Pearson (I, III, IV, V i VI). Al tercer article, Pearson (1916) va introduir subtipus addicionals.

Funcions de distribució de Pearson
Funcions de distribució de Pearson

Millora el concepte

Rind va inventar una manera senzilla de visualitzar l'espai de paràmetres del sistema Pearson (o la distribució de criteris), que va adoptar més tard. Avui en dia, molts matemàtics i estadístics utilitzen aquest mètode. Els tipus de distribucions de Pearson es caracteritzen per dues magnituds, normalment anomenades β1 i β2. El primer és el quadrat d'asimetria. La segona és la curtosi tradicional, o el quart moment estandarditzat: β2=γ2 + 3.

Els mètodes matemàtics moderns defineixen la curtosi γ2 com a cumulants en comptes de moments, de manera que per a un normaldistribució tenim γ2=0 i β2=3. Aquí val la pena seguir el precedent històric i utilitzar β2. El diagrama de la dreta mostra de quin tipus és una distribució de Pearson concreta (indicada amb el punt (β1, β2).

Estadístiques de Pearson
Estadístiques de Pearson

Moltes de les distribucions esbiaixades i/o no mesocúrtiques que coneixem avui encara no eren conegudes a principis de la dècada de 1890. El que ara es coneix com a distribució beta va ser utilitzat per Thomas Bayes com a paràmetre posterior de la distribució de Bernoulli en el seu article de 1763 sobre la probabilitat inversa.

La distribució beta va guanyar protagonisme a causa de la seva presència al sistema Pearson i va ser coneguda fins a la dècada de 1940 com a distribució Pearson tipus I. La distribució del tipus II és un cas especial del tipus I, però normalment ja no s'identifica.

La distribució Gamma es va originar a partir del seu propi treball i era coneguda com a Distribució Normal Pearson Tipus III abans que adquirís el seu nom modern als anys 30 i 40. Un article de 1895 d'un científic va presentar la distribució de tipus IV, que conté la distribució t de Student, com a cas especial, anterior a l'ús posterior de William Seely Gosset durant diversos anys. El seu article de 1901 presentava una distribució amb gamma inversa (tipus V) i beta primers (tipus VI).

Una altra opinió

Segons Ord, Pearson va desenvolupar la forma bàsica de l'equació (1) basada en la fórmula per a la derivada del logaritme de la funció de densitat de distribució normal (que dóna una divisió lineal per la quadràticaestructura). Molts especialistes encara es dediquen a provar la hipòtesi sobre la distribució dels criteris de Pearson. I demostra la seva eficàcia.

Distribució alternativa de Pearson
Distribució alternativa de Pearson

Qui era Karl Pearson

Karl Pearson va ser un matemàtic i bioestadístic anglès. Se li atribueix la creació de la disciplina de l'estadística matemàtica. El 1911 va fundar el primer departament d'estadística del món a la University College de Londres i va fer importants contribucions als camps de la biometria i la meteorologia. Pearson també va ser partidari del darwinisme social i l'eugenesia. Va ser el protegit i biògraf de Sir Francis G alton.

Biometria

Karl Pearson va ser fonamental en la creació de l'escola de biometria, que va ser una teoria competidora per descriure l'evolució i l'herència de les poblacions al tombant del segle XX. La seva sèrie de divuit articles "Contribucions matemàtiques a la teoria de l'evolució" el va establir com el fundador de l'escola biomètrica de l'herència. De fet, Pearson va dedicar gran part del seu temps durant 1893-1904 a desenvolupament de mètodes estadístics per a la biometria. Aquests mètodes, que s'utilitzen àmpliament avui en dia per a l'anàlisi estadística, inclouen la prova de chi quadrat, la desviació estàndard, la correlació i els coeficients de regressió.

Coeficient de correlació de Pearson
Coeficient de correlació de Pearson

La qüestió de l'herència

La llei de l'herència de Pearson deia que el plasma germinal està format per elements heretats dels pares, així com d'avantpassats més llunyans, la proporció dels quals variava segons diverses característiques. Karl Pearson era un seguidor de G alton, i encara que el seuLes obres diferiren en alguns aspectes, Pearson va utilitzar una gran part dels conceptes estadístics del seu professor per formular una escola biomètrica per a l'herència, com ara la llei de regressió.

Distribució Pearson
Distribució Pearson

Funcions de l'escola

L'escola biomètrica, a diferència dels mendelians, no es va centrar a proporcionar un mecanisme per a l'herència, sinó a proporcionar una descripció matemàtica que no fos de naturalesa causal. Si bé G alton va proposar una teoria discontínua de l'evolució en la qual les espècies canviarien a grans s alts en lloc de petits canvis acumulats amb el temps, Pearson va assenyalar defectes en aquest argument i va utilitzar les seves idees per desenvolupar una teoria contínua de l'evolució. Els mendelians preferien la teoria discontínua de l'evolució.

Si bé G alton es va centrar principalment en l'aplicació de mètodes estadístics a l'estudi de l'herència, Pearson i el seu col·lega Weldon van ampliar el seu raonament en aquesta àrea, la variació, les correlacions de la selecció natural i sexual.

Distribució típica
Distribució típica

Una mirada a l'evolució

Per a Pearson, la teoria de l'evolució no pretenia identificar el mecanisme biològic que explica els patrons d'herència, mentre que l'enfocament mendelià va declarar que el gen era el mecanisme de l'herència.

Pearson va criticar Bateson i altres biòlegs per no adoptar mètodes biomètrics en el seu estudi de l'evolució. Va condemnar els científics que no es van centrarvalidesa estadística de les seves teories, afirmant:

"Abans de poder acceptar [qualsevol causa de canvi progressiu] com a factor, no només hem de mostrar la seva plausibilitat, sinó, si és possible, demostrar la seva capacitat quantitativa."

Els biòlegs han sucumbit a "especulacions gairebé metafísiques sobre les causes de l'herència" que han substituït el procés de recollida de dades experimentals, que en realitat poden permetre als científics reduir les teories potencials.

pont estadístic
pont estadístic

Lleis de la natura

Per a Pearson, les lleis de la natura van ser útils per fer prediccions precises i per resumir les tendències de les dades observades. El motiu va ser l'experiència "que una determinada seqüència va passar i es va repetir en el passat".

Per tant, identificar un mecanisme particular de la genètica no ha estat un esforç digne per als biòlegs, que haurien de centrar-se en les descripcions matemàtiques de les dades empíriques. Això va provocar en part una amarga disputa entre biometristes i mendelians, inclòs Bateson.

Després que aquest últim rebutgés un dels manuscrits de Pearson que descrivia una nova teoria de la variació o homotipia de la descendència, Pearson i Weldon van fundar l'empresa Biometrika el 1902. Encara que l'enfocament biomètric de l'herència finalment va perdre la seva perspectiva mendeliana, els mètodes que van desenvolupar en aquell moment són vitals per a l'estudi de la biologia i l'evolució actual.

Recomanat: