En este curso se centra en la Introducción a la Estadística Robusta, que es una alternativa de estimación a
los métodos estadísticos clásicos. El objetivo es mostrar aquellos estimadores
que no sean afectados por valores extremos.
![]() |
Fuente:https://www.elsevier.es/es-revista-atencion-primaria-27-articulo-utilizacion-metodos-robustos-estadistica-inferencial-13049898 |
La estadística robusta intenta proporcionar métodos que emulan a los
métodos clásicos, pero que no son afectados por valores atípicos u otras pequeñas discrepancias respecto a las suposiciones
de los datos. En Estadística, los métodos clásicos confían en hipótesis que no
se resuelven o no se verifican a menudo en la práctica. Por ejemplo, se asume a
menudo que los residuales de los datos están distribuidos normalmente, por lo
menos aproximadamente, o que se puede confiar en el Teorema de Límite Central
para producir estimaciones normalmente distribuidas. Desafortunadamente, cuando
hay valores atípicos en los datos, los resultados
producidos por los métodos clásicos son a menudo muy influenciados por los datos extremos.
![]() |
Fuente:https://www.um.es/cepoat/masterarqueomatica/?page_id=131 |
Esto puede estudiarse empíricamente examinando la distribución muestral de varios
estimadores bajo un modelo, en los que se mezcla en una pequeña cantidad de contaminación en una muestra dada, que se enseñara en la unidad dos. Por ejemplo, uno puede utilizar una
mezcla de 95 % de datos de una distribución normal, con el 5 % de datos de otra
distribución normal con el mismo promedio
pero con una desviación estándar significativamente mayor. Para
cuantificar la robustez de un estimador, es necesario definir algunas medidas de
robustez como punto de quiebre y la función de influencia que serán
estudiados en la unidad tres.
![]() |
Fuente: https://cincelar.net/qu%C3%A9-tipos-de-personas-existen-a-la-hora-de-realizar-una-presentaci%C3%B3n-b2a9d60a2fb |
Ejemplo
Supongamos
que tenemos observaciones $x_i$ con una ligera contaminación, es decir, que son
datos $x_i$ con
mezcla de datos “Buenos” y “Malos”, cada observación tiene una probabilidad de $(1-\epsilon)$ de ser datos "Buenos" y con probabilidad $(\epsilon)$ de ser datos "Malos", donde $(\epsilon)$ es un número entre 0 y 1.
Supongamos
además que los datos “Buenos” provienen de una Población $\mathbb{N}(\mu,\sigma^{2})$
y los datos “Malos” provienen de una población $\mathbb{N}(\mu,9\sigma^{2})$, en
pocas palabras, estas observaciones $x_i$ tienen el mismo parámetro $\mu$ pero los datos están dispersos en un factor
de 3.
La distribución de la población con contaminación de datos malos y buenos es:
La distribución de la población con contaminación de datos malos y buenos es:
\[F(x)=(1-\epsilon)\Phi\left(\ensuremath{\frac{x-\mu}{\sigma}}\right)+\epsilon\Phi\left(\ensuremath{\frac{x-\mu}{3\sigma}}\right)\]
Donde:
Donde:
\[\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-y^{2}/2}dy\]
Es la función estándar acumulada.
Se proponen dos
medidas de dispersión de los datos con respecto a la media, la desviación media
absoluta y la desviación media cuadrática (desviación estándar).
\[d_{n}=\frac{1}{n}\sum|x_{i}-\bar{x}|,\,\,\,s_{n}=\left[\frac{1}{n}\sum\left(x_{i}-\bar{x}\right)^{2}\right]^{1/2}\]
Es aquí donde existe una gran disputa desde 1920, entre Eddington (1914, pag147) y Fischer (1920, pag 762) acerca de la eficiencia entre estos dos estadígrafos, en este curso se muestran formas de comparación y medición de la eficiencia relativa entre estos estadígrafos y otros en el curso de “Introducción a la Estadística Robusta”.
\[d_{n}=\frac{1}{n}\sum|x_{i}-\bar{x}|,\,\,\,s_{n}=\left[\frac{1}{n}\sum\left(x_{i}-\bar{x}\right)^{2}\right]^{1/2}\]
Es aquí donde existe una gran disputa desde 1920, entre Eddington (1914, pag147) y Fischer (1920, pag 762) acerca de la eficiencia entre estos dos estadígrafos, en este curso se muestran formas de comparación y medición de la eficiencia relativa entre estos estadígrafos y otros en el curso de “Introducción a la Estadística Robusta”.
Objetivos del Curso
Entender la
Estadística Robusta como elemento esencial en la comparación de estimadores
clásicos y robustos en función de las diferentes situaciones metodológicas de análisis de datos.
- Conocer y aplicar el proceso de toma de decisiones a situaciones de comparación de metodologías estadísticas clásica y robusta.
- Entender el concepto de punto de quiebre y la función de influencia.
- Que el alumno sea consciente de la diferencia entre estimadores clásicos y robustos.
- Identificar las situaciones en las que resulta conveniente tomar la metodología de estadística robusta y la clásica.
Metodología
La metodología utilizada es la exposición teórica por parte del
docente y se combina con elementos prácticos de ejemplos, así como debates, tratando de
acercar el tema a la realidad de aplicación en los ámbitos económicos, financieros
y sociales.
Competencias
Competencias transversales:- Capacidad de resolver problemas.
- Capacidad para aplicar los conocimientos teóricos a la práctica aplicada.
- Aprendizaje autónomo.
Evaluación
- Test Nro. 1 10 %
- Tarea Nro. 1 10 %
- Certamen Nro. 1 20 %
- Test Nro. 2 10 %
- Tarea Nro. 2 10 %
- Test Nro. 3 10 %
- Tarea Nro. 3 10%
- Certamen Nro. 2 20%