El lunes 31 de mayo el Dr. Ricardo Rios, profesor de la Escuela de Matemática de la UCV nos habló un poco sobre la estadística no paramétrica y nos mostró como estimar densidades, a partir de muestras aleatorias. A continuación el resumen de su charla.
El proceso estadístico podría verse en varias etapas: diseño de experimento, selección de muestras, pruebas de hipótesis, determinación del modelo probabilístico subyacente y predicción. En todos esos pasos, el conocimiento de la función de densidad con respecto a la medida de contar, la de Lebesgue o cualquier medida regular tiene un rol preponderante. La estructura unimodal del histograma de muchas muestras, más la universalidad del Teorema del Límite Central hicieron de la densidad gaussiana o de Laplace la reina de la densidades, siendo ésta descrita por sus parámetros de centramiento y de dispersión. Muchos estudios se basan en medir cuan lejos se está de una densidad de Laplace, con todas las formas de medir que tiene la Teoría de la Medida. Generalmente, se suele llamar estadística paramétrica a la que se encarga de dar las mejores estimadores de los parámetros que describen una densidad. Cuando este supuesto es débil, la más de las veces, se suele dejar que "los datos hables por si solos" y se entra en el campo de los modelos no paramétricos, vedados por sus dificultades de uso cuando esto empezó y muy populares ahora gracias a la expansión de las capacidades de cálculo.
Veremos en esta charla cómo el Teorema de Glivenco-Cantelli, llamado por la escuela rusa el Teorema de oro de la Estadística, pasa a ser la clave de una maquinaria muy poderosa de modelación que nos pone a discutir hasta el mismo concepto de función. Centraremos nuestra charla en la estimación no paramétrica de la densidad para datos independientes, sin quitarle el ojo al problema de los datos dependientes, en particular en series temporales.
La estimación de de la función de densidad. Un paseo al azar por la estimación no paramétrica.
El proceso estadístico podría verse en varias etapas: diseño de experimento, selección de muestras, pruebas de hipótesis, determinación del modelo probabilístico subyacente y predicción. En todos esos pasos, el conocimiento de la función de densidad con respecto a la medida de contar, la de Lebesgue o cualquier medida regular tiene un rol preponderante. La estructura unimodal del histograma de muchas muestras, más la universalidad del Teorema del Límite Central hicieron de la densidad gaussiana o de Laplace la reina de la densidades, siendo ésta descrita por sus parámetros de centramiento y de dispersión. Muchos estudios se basan en medir cuan lejos se está de una densidad de Laplace, con todas las formas de medir que tiene la Teoría de la Medida. Generalmente, se suele llamar estadística paramétrica a la que se encarga de dar las mejores estimadores de los parámetros que describen una densidad. Cuando este supuesto es débil, la más de las veces, se suele dejar que "los datos hables por si solos" y se entra en el campo de los modelos no paramétricos, vedados por sus dificultades de uso cuando esto empezó y muy populares ahora gracias a la expansión de las capacidades de cálculo.
Veremos en esta charla cómo el Teorema de Glivenco-Cantelli, llamado por la escuela rusa el Teorema de oro de la Estadística, pasa a ser la clave de una maquinaria muy poderosa de modelación que nos pone a discutir hasta el mismo concepto de función. Centraremos nuestra charla en la estimación no paramétrica de la densidad para datos independientes, sin quitarle el ojo al problema de los datos dependientes, en particular en series temporales.