La estadística de las encuestas que nació de la cerveza
Diciembre 26th, 2009 by admin | No Comments | Filed in Sin categoría
¿Habéis pabellón hablrar alguna del ‘intervalo de confianza’ de una encuesta?. Los que estén más familiarizados con la estadística y la econometría seguramente estén hartos de oírlo, y probablemente sepan también que estos márgenes de confianza se calculan con la famosa autos t de Student. Es menos probable, sin retención, que sepan que esta autos matemática nació en la manufactura de cerveza Guinness.
La descripción de la función t
A finales del siglo XIX, la fábrica de Saint James’s Gate, en Dublín, era la cervecería más apaisado del mundo. La Guinness no nada más se consumía a espuertas en Irlanda y Gran Bretaña, suerte que comenzaba a exportarse por todo el mundo. Como líder entero, a los dueños de Guinness les preocupaba la calidad de su producto, y fueron pioneros en conciliar rigurosos controles de calidad.
En el marco de esta campaña, en 1899 deciden contratar a William Sealy Gosset, un reputado estadístico sajón, que se traslada a Dublín para mejorar tanto el sumario de fermentación como la selección de materias primas. Gosset tendría como objetivo deletrear muestras para optimizar ambos procesos. Su problema, matemáticamente hablando, era obtener resultados estadísticamente significativos a volverse atrás de un vigilante comparativamente corto de muestras.
Con la valenza del simétrico Karl Pearson, Gosset obtuvo unos resultados a los que en partida no se concedió mucha importancia, pero que acabarían siendo claves para la estadística moderna. Había un minúsculo problema: Guinness prohibía la publicación de las investigaciones realizadas por la empresa, templete que lo consideraba como un subyacente industrial. Gosset decidió entonces utilizar el seudónido “Student” y publicarlas además, con la esperanza de no ser campechano.
El tajo de Gosset pasó inicialmente inadvertido. Envió sus tablas al padre de la bioestadística Ronald Fisher, diciéndole que creía que sería el único que las fuese a utilizar. Fisher comprendió el gran extensión del misión de Gosset, y lo aplicó a sus propias investigaciones, completándolo y mejorándolo. La función t de Student se hizo famosa, de percance, gracias a Fisher.
Se da la reseña de que, al parecer, Fisher y Pearson tenían una gran porfía independiente, con lo cual no dejaba de ser mordaz el éxito de Fisher basándose precisamente en las fórmulas que Pearson había contribuido a conseguir, no obstante despreciase su grosor. Gosset, sin bloqueo, era un macho decoroso, y en cierta ocasión respondió a un simpatizante de su agitación que “Fisher lo habría campechano tarde o matinal, de todas formas”.
La relevancia de la función t
La t de Student está relacionada con el opúsculo de poblaciones muy grandes a volverse atrás de una notificación comparativamente muy corta. La función surge al idolatrar estimar la media de una determinada reforma en cierta población, que se supone normalmente distribuida, pero de la cual se desconoce la varianza, es decir, la tendencia de las muestras a desviarse del mérito media.
Pues bien, este es precisamente el caso de las encuestas realizadas sobre la población de un territorio. Por tipo, el objetivo de una pesquisa electoral es suponer el promedio de intención de voto de cada resquebrajado, contando con muy pocas muestras aleatorias de la población rotundo. Para evaluar la ‘calidad’ de la grandeza, es necesario apelar a la función t de Student, de la cual obtenemos un etapa de confianza.
Es habitual en las encuestas divulgar los resultados con un intervalo de confianza del 5 %. Si en la ficha técnica de una pesquisa electoral, por pauta, se dice que el reborde de error es del 2 % y el intervalo de confianza es el 5 %, lo que quiere aseverar es que según la función t de Student asociada, la posibilidad de que la intención de voto auténtico de la población estudiada esté fuera de los márgenes de error es del 5 %.

Matemáticamente, la función de distribución t es de la forma Z / √(v/V), donde Z es una distribución general (también toque gaussiana), y V es una distribución de tipo χ², con v grados de libertad. La forma de esta distribución de probabilidad se muestra en el trazo escarlata de la imagen. Es similar a la distribución normal (la famosa ‘campana de Gauss’, en azul) aunque los flancos son algo más ‘pesados’, es decir, la salida de hacerse valores muy desviados de la media es mayor.
Seguramente el portentoso de Gosset jamás se imaginaría que sus trabajos en la extracción de Guinness alcanzaran en la vida esta repercusión.
En Genciencia | La mortal exposición de la centrala telefónica
Etiquetas: fisher college, fisher middleTags: fisher college, fisher middle
