Biometría II
Ciclo superior – 2º Cuatrimestre
Biometría II
La biología es una ciencia cuantitativa, que avanza a partir del conocimiento obtenido de la observación y la experimentación. Para llevar a cabo una investigación científica válida es esencial un cuidadoso diseño experimental o muestral que optimice los recursos disponibles, así como un adecuado planteo del modelo estadístico que responda a este diseño. Aún las hipótesis biológicas más sencillas suelen requerir modelos estadísticos complejos, que si están fuera del alcance del investigador pueden conducir a una simplificación arbitraria de los análisis, empobreciendo y sesgando las conclusiones.
En este curso se estudiarán modelos lineales con nivel creciente de complejidad, que permitirán a los estudiantes contar con una amplia gama de recursos para modelar variables provenientes de variados diseños y de distinta naturaleza. En el módulo 1 se presentarán los modelos lineales generales, que representan el abordaje clásico para variables respuesta con distribución normal. Veremos alternativas de modelado frente al habitual incumplimiento del supuesto de igualdad de varianzas y de independencia en las observaciones. En el módulo 2 se presentarán los modelos lineales generalizados, que permiten analizar otras distribuciones de probabilidad, como binomial, Poisson, etc y finalmente se abordarán los modelos lineales generalizados mixtos, de uso cada vez más difundido.
Para el análisis de los datos se utilizará R. R no solo es uno de los paquetes estadísticos de mayor versatilidad y crecimiento en los últimos años sino que es además un lenguaje de programación, de distribución gratuita y de código abierto, concebido como proyecto colaborativo.
Correo electrónico de contacto
Programa de Biometría II
Módulo 1. Modelos lineales generales y mixtos
- Diseño Experimental. Estudios observacionales vs experimentales. Causalidad. Conceptos básicos del diseño experimental: aleatorización, replicación, control del error. Seudorreplicación. Distintos diseños experimentales.
- Modelos. Modelos lineales vs no lineales. Variable respuesta con distribución normal, variables predictoras cuantitativas y cualitativas. Métodos de estimación: bootstrap, cuadrados mínimos, máxima verosimilitud. Selección de modelos: test de hipótesis, teoría de la información, principio de parsimonia
- Modelos lineales generales de efectos fijos. Análisis de la varianza y regresión lineal. Supuestos. Análisis de residuos. Comparaciones múltiples. Modelado de la heterocedasticidad. Modelos simples y múltiples, con y sin interacción. Regresión múltiple, análisis de la varianza de dos o más factores. Colinealidad, ortogonalidad. Polinomios.
- Métodos de comparación multivariada. Análisis multivariado de la varianza (MANOVA). Hipótesis, supuestos, comparaciones. Función discriminante. Corrección por múltiples tests
- Modelos mixtos. Factores aleatorios. Componentes de varianza. Modelado de la correlación entre observaciones: términos anidados, bloques, parcela dividida
- Diseño de medidas repetidas. Estructura de la matriz de covarianzas. Matriz de simetría compuesta, autorregresiva orden I, autorregresiva continua, Toeplitz, desestructurada.
Módulo 2. Modelos lineales generalizados y mixtos
- Introducción a los modelos lineales generalizados. Modelos para distribuciones no normales: Bernoulli, Binomial, Poisson, Binomial negativa. Estimación por máxima verosimilitud. Función de enlace. Evaluación, diagnóstico y selección de modelos
- Regresión Poisson. Modelos simples y múltiples. Supuestos. Sobredispersión y subdispersión. Binomial negativa. Modelos inflados en cero
- Regresión logística. Distribución Bernoulli y binomial. Odds ratio. Modelos simples y múltiples. Supuestos.
- Modelos lineales generalizados mixtos. Modelos anidados, bloques, parcela dividida, medidas repetidas.
Modalidad de dictado
La materia se dicta en el segundo cuatrimestre. Tiene una carga horaria semanal de 11 horas: 5 horas de teóricas y 6 de TP.
Existen tres modalidades de cursado, dependiendo de la condición del estudiante:
Biometría II. Materia de grado. Cuatrimestral. Correlativas: ciclo troncal de la carrera aprobado. Plan firmado que incluya Biometría II
Modelos lineales generales y mixtos (Módulo 1). Materia de postgrado, 8 semanas, 48 hs de clases teóricas, 64 hs de práctica en laboratorio obligatoria. Otorga 3 puntos
Modelos lineales generalizados y mixtos (Módulo 2). Materia de postgrado, 6 semanas, 36 hs de clases teóricas, 48 hs de práctica en laboratorio obligatoria. Otorga 2 puntos
Los estudiantes de postgrado pueden optar por cursar uno o ambos módulos. El módulo 2 tiene como correlativa el módulo 1, o Análisis de la varianza y diseño de experimentos, o conocimientos equivalentes. Los estudiantes de postgrado y docentes de FCEN están exceptuados del pago de aranceles. Para el resto de los estudiantes de postgrado, el curso es arancelado.
Debido a la alta demanda, existe cupo para el cursado de posgrado. En junio se habilitará la preinscripción.
Regiman de aprobación
Para la aprobación de la materia los estudiantes deberán:
- Aprobar dos exámenes parciales
- Aprobar las tareas o seminarios que se pauten oportunamente en los trabajos prácticos
- Aprobar un trabajo práctico final grupal que consistirá en el análisis de datos reales aplicando alguno de los modelos vistos durante el curso.
Régimen de promoción: Para acceder a la promoción de la materia los estudiantes deberán, además de los requisitos anteriores, obtener una nota mínima de 70 puntos en cada parcial y un promedio general de al menos 80 puntos.
Examen Final: Los estudiantes que hayan aprobado los trabajos prácticos pero que no cumplan con las condiciones de promoción deberán rendir examen final escrito.
Bibliografía
- Quinn, GP y Keough, MJ. 2002. Experimental design and data analysis for biologists. Cambridge University Press, Cambridge, Reino Unido.
- Crawley, M.J. 2007 The R Book. Wiley, England.
- Zuur, A., Ieno, E. N., & Smith, G. M. 2007. Analysing ecological data. Springer Science & Business Media.
- Zuur, A., Ieno, E.N., Walker, N., Saveliev, A.A., Smith, G.M. 2009. Mixed Effects Models and Extensions in Ecology with R. Springer, New York.
- Zuur AF, Hilbe JM and Ieno EN. 2013. Beginner’s Guide to GLM and GLMM with R . Highland Statistics Ltd.
- Agresti, A., & Kateri, M. (2011). Categorical data analysis (pp. 206-208). Springer Berlin Heidelberg.
- Borcard, D., Gillet, F., Legendre P. 2011. Numerical Ecology with R. Springer, New York.
- Faraway, J. J. 2016. Extending the linear model with R: generalized linear, mixed effects and nonparametric regression models. CRC Press.
- Pinheiro J.C., Bates D.M. 2004. Mixed-Effects Models in S and S-PLUS. Springer, New York.
HORARIOS
Clases teóricas
Lunes y Miércoles de 9:30 a 12 hs.
TPs y seminarios
Módulos
Inicio de Módulo 1: Lunes 18 de Agosto
Inicio de Módulo 2: Lunes 6 de octubre
Correlativas
- Ciclo troncal
- Materia incluida en el Plan de Estudios
Profesores
- Adriana Perez
Profesores colaboradores
- M. Soledad Fernandez
- Gerardo Cueto
Docentes Auxiliares
- María José Corriale
- Adelia González Arzac
- Juan Santiago
- Guidobono
- Nicolás Flaibani
- Martín Echeverría
- Nicole Halvorsen