estadistica de probabilidad

jueves, 21 de abril de 2011

DIAGRAMAS DE CAJA


Utilizando un diagrama de tallo y hojas, podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribución
35 38 32 28 30 29 27 19 48 40 
39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagramas de Tallos y Hojas y compararla con la anterior.
Teniendo.
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
Un diagrama de caja es una manera de resumir un conjunto de datos numéricos, se utiliza a menudo en el análisis exploratorio de datos para mostrar la forma y simetría de la distribución, su valor central y su variabilidad. La imagen producida se compone de los valores más extremos en el conjunto de datos (los valores máximo y mínimo), los cuartiles inferior y superior, y la mediana.

El término “cuartiles” se refiere a los tres valores que dividen a un conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados generalmente por Q1, Q2, Q3:
  • El primer cuartil, es el valor debajo del cual queda la cuarta parte (25%) de todos los valores de la sucesión.
  • El segundo cuartil es precisamente la mediana (valor que divide al conjunto en dos partes iguales).
  • El tercer cuartil, es el valor por debajo del cual quedan las tres cuartas partes (75%) de los datos.
La escena que sigue muestra la distribución de las edades de un grupo de estudiantes de séptimo grado. La figura muestra un diagrama de caja correspondiente a la Tabla de la derecha, dicha caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo (min) y máximo de las estaturas. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.


No hay comentarios:

Publicar un comentario