Introducción a la Estadística

Antiguamente se entendía por estadística el conjunto de técnicas que el Estado aplicaba para elaborar un censo, a fin de conocer el número de habitantes y las características de éstos, como sus edades, nivel social y económico, profesiones, etc. De hecho, para mucha gente de nuestro tiempo, la palabra estadística sigue significando puras y largas descripciones numéricas. Sin embargo, esta recolección de datos, que se manipulan a fin de extraer resultados numéricos que tengan por sí mismos un significado útil para el estudio que nos interesa, o bien que sobre ellos se pueda realizar un análisis a fondo, es tan sólo una rama de la estadística, la estadística descriptiva.

La estadística descriptiva constituye lo que podríamos denominar la primera fase del método estadístico, y está destinada a preparar la verdadera tarea de la estadística: una vez realizado el trabajo de clasificación y agrupación, obtener conclusiones de los datos recogidos. Por ejemplo, mediante el estudio de una pequeña parte de un gran grupo, predecir el resultado válido para todo el grupo. Esta segunda fase es conocida inferencia estadística, en la que podríamos incluir el cálculo de las probabilidades de que las predicciones realizadas son exactas, y así conocer el margen de error con el que se trabaja. En esta fase aparece una de las intersecciones que la estadística tiene con la probabilidad, ciencias ambas que durante mucho tiempo coexistieron de forma totalmente paralela. Pero aún podríamos incluir una tercera fase del método estadístico, que corresponde al análisis e interpretación de los datos obtenidos.

En los siglos XVII y XVIII se aplicaron los métodos estadísticos a problemas relacionados con los llamados juegos de azar que, precisamente, constituyeron el punto de partida de la teoría de la probabilidad. en el siglo XIX, el progreso de la estadística permitió aplicarla a las ciencias sociales. Pero hoy e día el campo de aplicaciones de la estadística es asombrosamente amplio y se llega a considerar un instrumento fundamental de innumerables ramas de la ciencia: política, economía, psicología, biología, medicina, etc. su uso permite resolver problemas sobre el control de las fabricaciones industriales, los pronósticos meteorológicos, las previsiones políticas y económicas de un país, etc.

Aunque la estadística es una ciencia con fundamentación matemática, las verdaderas dificultades aparecen, sobre todo, en la fase que menos, por no decir nada, tiene que ver con las matemáticas: precisamente en la recogida de datos. Por ejemplo, si nos interesa conocer las inclinaciones políticas de un país, es evidente que no  podemos indagar sobre cada uno de los individuos que lo conforman; hemos de realizar un estudio sobre una muestra, es decir, sobre un conjunto representativo del total. Aquí radica la primera dificultad, en la elección de un buen conjunto que refleje la verdadera característica del estudio. Una segunda dificultad sería la realización de la encuesta, es decir, las preguntas cuyas respuestas van a suponer el instrumento de trabajo.

En definitiva, la estadística, entendida como recogida e interpretación de datos, requiere una gran minuciosidad.

Propósito de la Estadística

La estadística no tiene por objeto el estudio individual de los elementos de un conjunto, sino todo lo contrario. Su propósito consiste en el estudio global del conjunto, es decir, de una o más características comunes a todos los elementos de un determinado conjunto. Esto requerirá, pues, definir de forma precisa la característica que se pretende estudiar y el conjunto en el que se quiere estudiar, de manera que siempre se esté en condiciones de saber si el tal elemento es o no del conjunto y si dispone o no de tal característica.

El vocabulario que se utiliza en la estadística para designar los conceptos elementales, que exponemos a continuación, como son los conjuntos, las características y demás instrumentos de trabajo, es específico de esta ciencia, tal y como ocurre en todas las ciencias.

Población

Debido a que las primeras estadísticas, es decir, las primeras descripciones numéricas fueron realizadas por el Estado para la elaboración de un censo, algunos conceptos fundamentales de la estadística se designan con términos relacionados con la demografía, como es el caso de «población».

Llamaremos población al conjunto objeto de estudio. Así, el concepto de población en estadística tiene un sentido mucho más amplio que el significado común de esta palabra. Una población es cualquier agrupación de datos o elementos con características comunes que se desean estudiar, aunque es bastante frecuente que estos datos correspondan a los individuos de una población, en la acepción común de la palabra. Es corriente, pues, en estadística, llamar individuos a los elementos de un conjunto que se estudia, independientemente de su naturaleza.

Una población, que también recibe los nombres de colectivo o universo, podrá estar formada por casi cualquier tipo de cosas: temperaturas, lluvias, enfermedades, periódicos, calificaciones de exámenes, personas, plantas, etc. Ahora bien, las poblaciones estadísticas deberán estar definidas de forma muy clara y precisa. Por ejemplo, si nos referimos a la población de temperaturas, es imprescindible precisar la localidad donde se han registrado, así como el mes y el año, o incluso, la semana, si es necesario, en que se han realizado las mediciones. Según el caso, tendríamos que dar todavía más detalles como la latitud respecto al nivel del mar o la hora del día en que se registran esas temperaturas, o si resultan de calcular las medidas de varias tomas.

Muestras

En casi todos los casos, la población que nos interesa estudiar es imposible de abarcar por varias razones, aunque la más fuerte es su excesivo tamaño. Resulta impensable, por ejemplo, conocer las inclinaciones políticas de un país preguntando a todos los individuos que forman el censo. También podríamos encontrarnos con situaciones en que el estudio de cada uno de los elementos que forman la población supondría su destrucción, como son los procesos de control de calidad. No tiene sentido gastar todas las bombillas para averiguar su duración, o destrozar todos los coches para comprobar los efectos de un choque frontal, o comer todas las unidades de un producto alimenticio para saber su calidad.

Recurriremos, en todos estos casos, a la teoría del muestreo. Consiste en elegir una parte de la población y trabajar sobre ella. Dicha parte recibe el nombre de muestra. Así, llamaremos muestra a un subconjunto de la población seleccionado con carácter representativo. La representatividad de una muestra es uno de los puntos clave para conseguir la verdadera información que persigue el estudio estadístico. Una buena muestra es la que dispone de las propiedades de la población de la que se seleccionó. Ha de disponer, por tanto, de la misma proporción de individuos con la propiedad que se va a estudiar en la población. De ello ha de resultar evidente que una muestra puede ser representativa respecto a una propiedad y no serlo respecto a otra en una misma población.

El primer problema que se nos plantea es, pues, la elección de la muestra. Si lo que se pretende es inferir ciertas propiedades de la población, la elección de forma totalmente intencionada de ka muestra no será de mucha utilidad. Por lo general, se busca que la muestra cumpla los dos requisitos siguientes:

  • Por lo general, supone mayor representatividad una muestra que ha sido seleccionada al azar. Hablaremos entonces de muestras aleatorias, muestras elegidas de forma casual o aleatoria.
  • Pretendemos que la muestra represente a toda la población en el mayor grado posible; por ello la elección ha de representar la mayor cantidad posible de características de que disponga la población, aunque no todas ellas sean objeto de estudio, y con la proporción que tienen en en esa población. Perseguimos, pues, la uniformidad y homogeneidad de la muestra en relación a la población.

Estos dos apartados son igualmente importantes. Supongamos, por ejemplo, que el objetivo del estudio es el nivel cultural de una determinada localidad. Es indudable que las conclusiones resultarán erróneas si la información se obtiene de un solo barrio o de individuos de una misma edad o profesión. Convendría, tanto en este caso como en otros, considerar los distintos subconjuntos de la población, es decir, todas las subpoblaciones posibles, y elegir al azar intentando mantener la misma proporción con que aparecen en la población total.

Podemos presentar así la muestra como un concepto concreto que, mediante un proceso de absorción, deriva en el concepto teórico de población.

Deja un comentario