martes, 14 de abril de 2015

Representaciones gráficas de datos estadísticos

Publicado por Ciudad Universitaria Virtual de San Isidoro

La representación gráfica de datos estadísticos tiene como objetivo ofrecer una visión de conjunto del hecho sometido a investigación, de una manera más directa y perceptible que la mera presentación de los datos numéricos. Por ello, las representaciones gráficas son un medio eficaz para análisis de las estadísticas ya que las regularidades se recuerdan y aprecian con más facilidad cuando se examinan gráficamente. Pero no dejan de ser un método auxiliar, ya que la interpretación de un diagrama siempre es subjetiva.

También se pueden usar como avance o para llamar la atención del experimentador sobre los elementos más destacables de los datos o poner de manifiesto alguna relación inesperada. También son útiles para expresar los resultados en forma visible después de haber realizado un análisis.

Los gráficos se han de explicar por sí mismos, ya que frecuentemente los lectores no leen el texto de un informe detalladamente. También es conveniente que los gráficos vayan acompañados de un texto aclaratorio tan específico como sea posible.

Las representaciones gráficas pueden usar sistemas geométricos de representación o símbolos alusivos. Estos últimos no buscan una rigurosa exactitud, sino impresionar a las personas a las que van dirigidos.

El sistema de representación más usual es el cartesiano. En el eje horizontal de abcisas, por convenio, se representan los valores positivos de la escala a la derecha y a la izquierda los negativos. En el eje vertical de ordenadas, los valores positivos se representan hacia arriba y los negativos hacia abajo.

Las representaciones estadísticas se realizan, en su inmensa mayoría en el primer cuadrante de los cuatro, arriba a la derecha.


Gráficos de variable cualitativa

Si el resultado de observación de un elemento de la muestra no es una medida, sino una cualidad o atributo no medible, la variable de estudio es una variable cualitativa.

Las representaciones gráficas más usuales para variables cualitativas son:

- Diagrama de rectángulos

- Diagrama de sectores

- Pictograma

- Perfil ortogonal

- Cartograma

- Perfil radial


Diagrama de rectángulos

Es una representación cartesiana, en la que en el eje de abcisas figuran las distintas modalidades o atributos y en el eje de ordenadas los valores de las correspondientes frecuencias, levantando rectángulos de áreas proporcionales a las frecuencias absolutas. Los rectángulos tendrán de base la unidad y de altura la frecuencia absoluta de cada valor. Los rectángulos no tienen porque ir solapados.


Ejemplo:

Supongamos que en una determinada zona de muestreo se anotan el número de especies distintas encontradas de anfibios, reptiles, aves y mamíferos, cuyo recuento ha sido el siguiente:

- Anfibios: 7

- Reptiles: 10

- Aves: 23

- Mamíferos: 11

Construir el diagrama de barras (rectángulos) correspondiente).


En abscisas las modalidades y en ordenadas los valores numéricos. Si se hace en una hoja de cálculo, como Excel y Calc, se colocan en una columna las modalidades y en otra los valores numéricos, y se construye el gráfico, que a veces en vez de denominarse de barras (estas son horizontales), se denomina de columnas.

Diagrama de barras

Diagrama de sectores

Es la representación en un círculo, mediante sectores circulares de las distintas modalidades de un carácter. Para construirlo, las áreas de los sectores han de ser proporcionales a las frecuencias de cada modalidad. Para ello hay que hacer corresponder 360º a la suma de todas las frecuencia, efectuando luego la correspondiente proporcionalidad.


Ejemplo:

Con los datos del ejercicio anterior, construir el correspondiente diagrama de sectores.


El procedimiento consiste en hacer corresponder los 360º del círculo a la suma total de las frecuencias. En este caso, se haría corresponder los 360º con 41 que es la suma total.

Una simple regla de tres nos indicaría cuantos grados corresponderían al número de anfibios y así con cada una de las otras modalidades:

360 -------- 51 
   x  --------  7

x = (7 x 360)/51 = 49,41º       

Si se hace en una hoja de cálculo, como Excel y Calc, se colocan en una columna las modalidades y en otra los valores numéricos, y se construye el diagrama de sectores, como gráfico circular.

Pictogramas

Son una representación gráfica que utiliza un dibujo alusivo a la distribución estudiada. La altura del dibujo ha de ser proporcional a la frecuencia.

Otra forma de representación es tomar un dibujo estándar, repitiéndolo un número de veces proporcional a la frecuencia.

Los pictogramas deben comparar magnitudes relativas, ya que un aumento no proporcional en el tamaño del objeto puede dar una impresión no correcta. Por ejemplo, queremos representar que el ganadero A tiene una vaca y el ganadero B tiene dos. Si ponemos en el ganadero A una vaca y en el ganadero B dos estaría bien representado, pero si ponemos en el ganadero A una vaca y en el ganadero B una vaca con el doble de altura, no estaríamos representando 2 vacas sino 4. Por tanto, hay que ser cautos en este sentido.

Libro con pictogramas
Libro con pictogramas
Perfil ortogonal

Es una representación utilizada frecuentemente en Pedagogía y Psicología. Se representan en abcisas las distintas modalidades y en ordenadas los valores de esas modalidades.

Ejemplo:

Las calificaciones de un alumno de Ciencias Ambientales han sido las siguientes: 5 en Geología, 4 en Química, 3 en Física, 8 en Estadística, 7 en Botánica y 6 en Zoología. Representar su perfil ortogonal.


Cartogramas

Se usan, entre otros, en estudios geográficos y ecológicos. Es una representación del carácter estudiado sobre mapas. Las distintas modalidades que adopta el carácter se representan sobre el mapa con distintos colores o colores de distinta intensidad, o con distintos punteados.

Cartograma
Cartograma
Cartograma
Cartograma. Otra forma de presentación es representar la zona de forma proporcional a sus datos

Perfil radial

Consiste en tomar un punto cualquiera como punto de partida y a partir de él trazar tantos radios como modalidades se tengan, todos ellos formando ángulos de la misma amplitud. Sobre estos resultados se toma una distancia al centro proporcional a la frecuencia de cada modalidad. Uniendo los puntos extremos obtenidos, se obtiene un polígono cerrado que es el perfil radial.

Ejemplo:

Dibujar el perfil radial correspondiente al anterior ejercicio (calificaciones de un alumno de Ciencias Ambientales)

Perfil radial

Para dibujar un perfil radial en una hoja de cálculo, se ha de elegir realizar o insertar gráfico en formato de gráfico radial. Puede variar la denominación según programas y versiones.


Gráficos de variable cuantitativa discreta

Los gráficos más utilizados son:

- Diagrama de barras

- Polígono de frecuencias

- Diagrama de barras acumulativo


Diagrama de barras

Se dibujan un par de ejes cartesianos. En el eje de abcisas se toman los distintos valores de la variable y en el de ordenadas las frecuencias. Cada valor de la variable y su correspondiente frecuencia, constituye una pareja de números, a los que corresponde en el plano un punto, habiendo tantos puntos como valores tome la variable.

Para dar mayor visibilidad al gráfico se acostumbra a representar la ordenada de cada punto mediante una línea gruesa o barra, de ahí su nombre.

Como las frecuencias son siempre positivas, el gráfico sólo requiere los cuadrantes I y II del plano. Habitualmente el gráfico de barras aparece en el primer cuadrante.

Según se utilicen frecuencias absolutas o frecuencias relativas, se obtendrá el diagrama de barras absoluto o relativo.

Obtenemos un conjunto de barras verticales cuya suma de longitudes debe ser n (tamaño de la muestra) o dependiendo de si las frecuencias representadas son absolutas o relativas.


Polígono de frecuencias

Uniendo los extremos superiores de las barras en el diagrama de barras, se obtiene una línea quebrada abierta que recibe el nombre de polígono de frecuencias.

Si el polígono se ha construido sobre un diagrama en el que se han utilizado frecuencias absolutas, lo llamaremos polígono de frecuencias absolutas. Si se trabajó con frecuencias relativas obtendremos el polígono de frecuencias relativas.


Diagrama de barras acumulativo

La representación de las frecuencias acumuladas correspondiente a una variable discreta, se efectúa de la siguiente manera:

Sobre el eje de abscisas se llevan los valores de la variable y sobre el eje de las ordenadas, los valores de las frecuencias acumuladas (absolutas o relativas). Se levantan barras de altura igual a la frecuencia y por el extremos superior de cada barra se trazan paralelas al eje de abscisas, hasta cortar a la barra siguiente. se obtiene así una representación escalonada, cuya justificación se debe a que entre cada dos valores consecutivos de la variable, las frecuencias acumuladas permanecen invariables. A este gráfico se le conoce como diagrama de barras acumulativo.


Ejemplo:

Las notas de 86 alumnos de la asignatura Historia del Derecho han sido las siguientes:

- 0: 2 alumnos
- 1: 3 alumnos
- 2: 5 alumnos
- 3: 7 alumnos
- 4: 11 alumnos
- 5: 23 alumnos
- 6: 15 alumnos
- 7: 9 alumnos
- 8: 7 alumnos
- 9: 3 alumnos
- 10: 1 alumno

Construir los siguientes gráficos:

- Diagrama de barras

- Polígono de frecuencias

- Diagrama de barras acumulativo


Para construir el diagrama de barras colocaremos en abscisas la nota obtenida y en ordenadas el número de alumnos. En una hoja de cálculo, como Excel o Calc, se pueden elegir diagramas de barras, a veces llamados de columnas o diagramas X-Y. Estos programas permiten sofisticaciones en la presentación como efectos 3D.

Diagrama de barras


Polígono acumulado de frecuencias

El polígono acumulado de frecuencias también se puede representar como un área sombreada, eligiendo si lo hacemos con un programa un gráfico de áreas.

Polígono acumulado de frecuencias con área

Para construir el diagrama de barras acumulativo, a cada dato de las ordenadas (nº de alumnos) se sumará el anterior.

Diagrama de barras acumulativo


Gráficos para variables agrupadas en intervalos de clase

Cuando la variable aleatoria toma muchos valores distintos y hay muchas observaciones, es conveniente agrupar los valores de la variable en intervalos de clase. Los gráficos que se utilizan más en este caso son:

a) Histograma

b) Polígono de frecuencias

c) Polígono acumulativo de frecuencias


Histograma

Consideramos el caso en que la variable viene dada en intervalos de clase. Ahora una frecuencia cualquiera no corresponde a un solo valor de la variable, sino a todo un intervalo, por tanto no existen parejas de puntos a las que corresponderían puntos en el plano, en el gráfico. Entonces se recurre a otro criterio de representación, el de representación por áreas.

Los histogramas son representaciones gráficas por áreas. Sobre el eje de abscisas se marcan los extremos de los intervalos de clase de la variable y se levantan rectángulos cuya base tiene como medida la amplitud de los intervalos de clase y su altura es tal que el área del rectángulo es igual a la frecuencia, absoluta o relativa, según que el histograma sea de frecuencias absolutas o relativas.

Esta representación gráfica es la más utilizada cuando se trata de una variable continua.

Se han de distinguir con claridad dos casos:

1) Cuando los intervalos de clase son de amplitud constante.

2) Cuando los intervalos de clase son de amplitud variable.

Cuando los intervalos son de amplitud constante, como la base de los rectángulos que se van a construir es siempre de igual magnitud, puede tomarse dicha base como unidad de medida de la variable. En este caso, las áreas de los rectángulos son exactamente iguales a las alturas. Por esta razón, el criterio de representación área = frecuencia se convierte en altura = frecuencia. Debe observarse que el área total cubierta por la figura es igual al número total de observaciones.

Cuando los intervalos de clase con de amplitud diferente, las frecuencias no pueden tomarse como alturas. La representación gráfica correcta exige el cálculo de las alturas, cosa muy fácil ya que la tabla estadística nos da las bases (amplitudes de los intervalos) y las áreas (frecuencias). La altura será la frecuencia partida por la amplitud del intervalo.


Polígono de frecuencias

A partir del histograma, obtenemos otra representación muy usual: el polígono de frecuencias que se obtiene uniendo los puntos medios de los lados superiores de los rectángulos levantados en el histograma de frecuencias, dando como resultado una línea quebrada.


Ejemplo:

Una empresa vende herramientas numeradas de series 0 a 10, según su tamaño. El número de ellas vendidas en el mes de agosto ha sido el siguiente:

                          Intervalo      Nº herramientas vendidas

0-5            123
5-7             180
7-9             112
9-10             36

Para realizar el histograma, ya que los intervalos no tienen la misma amplitud, hemos de calcular las alturas de los rectángulos que serán:

H1 = 123/5 = 24,6; H2 = 180/2 = 90; H3 = 112/2 = 56; H4 = 36/1 = 36.

Con estos datos construiremos el histograma, en este caso, por motivos didácticos, para distinguir cada rectángulo están representados en distintos colores.

Histograma

La forma de construir un histograma en una hoja de cálculo, como Excel o Calc, a veces no se presenta de forma tan sencillo como los anteriores, aunque se puede realizar de muchas maneras. Una de ellas es rellenando datos consecutivos de tal forma que su resultado final sea el polígono buscado. Si se quiere mejorar la presentación se puede hacer mejorando el gráfico final como imagen mediante y tratándolo con un programa de tratamiento de imágenes, como Paint, Gimp o Photoshop.

Polígono de frecuencias absolutas


Polígono acumulativo de frecuencias

Al agrupar los valores de la variable en intervalos de clase, se supone que los valores se distribuyen uniformemente en dicho intervalo. Este supuesto de repartición uniforme hace que en la acumulación, a medida que se recorren los intervalos de la variable X dentro de un intervalo, la frecuencia acumulada va creciendo de un modo lineal o rectilíneo. Se obtiene así una lineal poligonal que empieza en 0 y acaba en n.

Para facilitar la representación podemos fijarnos en que si los intervalos tienen la misma amplitud, uniendo los extremos derechos de los rectángulos que componen el histograma de frecuencias acumuladas, se obtiene el polígono acumulativo.

En caso de que los intervalos no tengan la misma amplitud, seleccionamos los puntos en el plano haciendo corresponder al extremo superior de cada intervalo la frecuencia acumulada correspondiente al ese intervalo. Obtenemos así una línea poligonal que partirá de cero a la que llamaremos polígono acumulativo de frecuencias.


Ejemplo:

Los salarios por hora en euros de 50 personas que tuvo que contratar una empresa para un determinado trabajo fueron los siguientes:

Salarios/h(€/h) Nº personas

0-10       21
10-20      12
20-30      11
30-40       4
40-50              2

Construir el polígono acumulativo de frecuencias


En primer lugar, construiremos una tabla, en la que figuren los intervalos, la marca de clase o punto medio de cada intervalo, la frecuencia absoluta y la frecuencia acumulada absoluta que se calculará sumando a cada una la anterior.

Intervalos
Marca de clase
Frecuencia absoluta
Frecuencia acumulada absoluta
0-10
5
21
21
10-20
15
12
33
20-30
25
11
44
30-40
35
4
48
40-50
45
2
50

Para construirlo en una hoja de cálculo sirve un diagrama X-Y, apareciendo en abcisas la marca de clase y en ordenadas la frecuencia acumulada.

Polígono acumulativo de frecuencias

Para saber más y ampliar conocimientos

- Lectura: El Diario. Representación gráfica de datos: claridad, manipulación y fraude
- Lectura: Hiru. Representación gráfica de datos estadísticos
- Libro: M. Purificación Galindo Villardón. Exposición intuitiva de métodos estadísticos. Universidad de Salamanca. Salamanca, 1984.


Estadística

0 comentarios:

Publicar un comentario