Estadística

"En la história de la estadística existen también piedras angulares y pilares fundamentales, como la distribución de campana de Gauss, el método de mínimos cuadrados, y el principio de máxima verosimilitud"

Stephen M. Stigler.

 

Personas en línea

En estos momentos hay 4 personas visitando "Estadística y Empresa"

Comentarios recientes

El método de Máxima Verosimilitud

Enviado por Maximiliano Silva Quiroz el 18/05/2008 a las 17:33
Maximiliano Silva Quiroz

 

seh-lelha.org: Muchos procedimientos estadísticos suponen que los datos siguen algún tipo de modelo matemático que se define mediante una ecuación, en la que se desconoce alguno de sus parámetros, siendo éstos calculados o estimados a partir de la información obtenida en un estudio bien diseñado para tal fin. Existen diferentes procedimientos para estimar los coeficientes de un modelo de regresión, o para estimar los parámetros de una distribución de probabilidad. De entre esos procedimientos probablemente el más versátil, ya que se puede aplicar en gran cantidad de situaciones, y por ello uno de los más empleado se conoce con el nombre de "método de máxima verosimilitud" (en inglés "method of maximum likelihood").

Aunque para aquellos que tiene una formación estadística este método es perfectamente conocido y comprendido, sin embargo muchos de los usuarios de los programas estadísticos, que están habituados a calcular modelos de regresión logística, o modelos de supervivencia de riesgo proporcional o de Cox, modelos de Poisson, y muchos otros, desconocen cómo se efectúa la estimación de los coeficientes de esos modelos, por lo que nos parece adecuado dedicar una de éstas páginas mensuales a describir su filosofía e interpretación. Por otro lado, no es infrecuente que empleemos técnicas de forma habitual y mecánica, sin conocer en qué se sustentan y en última instancia en qué consisten realmente: no me cabe ninguna duda que casi todo el mundo tiene claro qué es una distribución de probabilidad normal, pero ¿cuánta gente que utiliza la t de Student sabe qué es realmente eso?

Podemos considerar que el método de máxima verosimilitud, abreviado a menudo como MLE, tal y como hoy lo conocemos e interpretamos fue propuesto por Fisher(1890-1962), aunque ya de una forma mucho más artificiosa fue inicialmente atisbado por Bernoulli (1700-1782), cuyo planteamiento fue revisado y modificado por su coetáneo y amigo el gran matemático Euler(1707–1783). Sin embargo la resolución de los problemas numéricos planteados por este método en la mayor parte de los casos son de tal magnitud que no ha sido posible su amplia utilización hasta la llegada de los modernos ordenadores.

El principio de Máxima Verosimilitud.

Supongamos que se desea estimar la prevalencia en España de personas de más de 50 años con cifras de tensión igual o superior a 160/100 mmHg. Vamos a llamar a esa prevalencia p y si se calcula en tanto por 1 será 0<= p<=1. Para ello se obtiene una muestra aleatoria y representativa de esa población de tamaño N. Supongamos que denotamos con la letra X el número de sujetos que presentan cifras tensionales iguales o superiores a los límites fijados en nuestra muestra. El valor concreto que observaremos para X puede ser 0 (ningún sujeto), 1, 2, hasta como máximo N (todos los sujetos).

En este ejemplo es razonable suponer que la variable aleatoria X, número de sujetos con cifras altas de tensión, que observaremos en nuestro estudio (es aleatoria porque si repetimos el trabajo con otra muestra diferente del mismo tamaño es poco probable que el valor observado sea exactamente el mismo) siga una distribución de probabilidad binomial, cuya fórmula es la siguiente:

binomial1.JPG

donde CX,N es el número combinatorio que se calcula como N!/X!(N-X)!

Para simplificar la exposición, supongamos que se utiliza una muestra de N=200 sujetos. Una vez que efectuamos el estudio conocemos el valor de X y podemos calcular la probabilidad de observar exactamente ese valor para diferentes prevalencias posibles en la población. Esa probabilidad que hemos llamado P(X) es función de N, X y p; luego conocidas las dos primeras variables podemos probar con distintos valores de prevalencia p y determinar qué valor de prevalencia en la población nos conduce a una mayor P(X), o lo que es lo mismo para qué valor real de la prevalencia en la población es más probable que observemos ese valor concreto de X en una muestra aleatoria de N sujetos.

Supongamos que el número X de pacientes con cifras de tensión iguales o superiores al límite prefijado es de 60. Podemos plantear cuál es la probabilidad de obtener 60 sujetos hipertensos en una muestra de 200 personas si la prevalencia real fuera de p=0.2. Substituyendo esos valores en la ecuación (1) obtenemos P(X)=0.00022. Si la prevalencia real fuera p=0.3 el valor de P(X) calculado sería 0.06146, mayor que el anterior; y si p=0.4 entonces P(X)=0.00082, que también es menor que el calculado para p=0.3. El método de máxima verosimilitud nos dice que escogeremos como valor estimado del parámetro aquél que tiene mayor probabilidad de ocurrir según lo que hemos observado, es decir aquél que es más compatible con los datos observados, siempre suponiendo que es correcto el modelo matemático postulado.

 

maxverosim1.jpg

 

Etiquetas:






Suscribirse a los comentarios de este artículo en RSS

relojes web gratis