lunes, 9 de mayo de 2016

la técnica de  histograma 
En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador (como la longitud o la masa). De esta manera ofrece una visión en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.
En general se utilizan para relacionar variables cuantitativas continuas, pero también se lo suele usar para variables cuantitativas discretas, en cuyo caso es común llamarlo diagrama de frecuencias y sus barras están separadas, esto es porque en el "x" ya no se representa un espectro continuo de valores, sino valores cuantitativos específicos como ocurre en un diagrama de barras cuando la característica que se representa es cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
características 
  • Síntesis 
Resume gran cantidad de datos en un formato fácil de manejar.
  • Análisis
Permite el análisis de datos sobre su comportamiento y variación y que es complejo de entender en una tabla de datos numéricos.
  • Medio de comunicación eficaz.
Permite transmitir información de forma clara y simple  de situaciones complejas.
Otros aspectos característicos de un histograma son:
  • La estratificación
Es la separación de un conjunto de datos en diferentes categorías o clases y donde los elementos de cada categoría o grupo tienen las mismas características.
  • El recorrido
Es la medida de la dispersión. Es la diferencia entre el valor máximo y el valor mínimo.
  • Las clases
Son las partes iguales en que se divide el campo de variabilidad de los datos.
  • La frecuencia de una clase
Existen dos tipos de frecuencia:
  • Absoluta
Número o cantidad de datos de una clase
  • Variables
El porcentaje de datos de una clase respecto al total de datos.
B)    Elaboración de un histograma.

Los pasos a seguir son:
  • Recogida y preparación de los datos objeto del análisis
Se recogen los datos objeto del análisis de manera que sean objetivos, exactos, completos y representativos.
  • Establecer los valores extremos y su recorrido
Determinar el valor máximo, el valor mínimo y su recorrido (Diferente entre V_max y V_min)
  • Definir las clases
Dividir la característica en clases según sus características comunes. Se aconseja que el número de datos no sea inferior a 40.
  • Construir las clases anotando los límites de cada una de ellas
Los valores extremos son los límites de una clase, que pueden o no figurar en el conjunto de datos. Además estos límites pueden pertenecer o no pertenecer  la clase que están delimitando.
  • Asociar a cada dato su clase y calcular la frecuencia
Establecer el número de datos que están incluidos en cada una de las clases.
Si su clasificación se hace por ordenador se clasificarán los datos de menor a mayor y contar sobre el conjunto clasificado el número de datos de cada clase.
Si fuese una clasificación manual se tendrá que:
  • Comenzar con el primer dato e identificar la clase en la clase en que está incluido y marcar para esta clase un palote.
Se continúa con el resto de datos siguiendo el mismo procedimiento.
  • Para efectuar el recuento definitivo de agrupan los palotes en grupos de cinco, cuatro verticales y el quinto cruzándolos.
  • El sumatorio de todos los palotes marcados para cada una de las clases corresponde a la frecuencia de la misma.
  • Verificar que el total de datos es igual a la suma de las frecuencias de todas las clases
  • Dibujar y rotular los ejes para representar las frecuencias en el eje ordenadas y las clases en el eje de abscisas
En el eje vertical (frecuencias) se rotulan los números naturales según su valor y escala
En el eje horizontal (clases) se divide en tantos segmentos iguales como clases se tengan.
  • Dibujar las barras del gráfico
Para cada clase se representa una barra vertical con una altura igual al número de elementos de la clase o frecuencia.
  • Rotular el gráfico
Anotar todas aquellas observaciones, títulos, los límites de tolerancia, etc.… para comprender el gráfico.
tipos de histogramas 
  • Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.
  • Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.
  • Diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.
  • Polígono de frecuencias
Es un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.
  • Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis, por ejemplo: (10-20) aunque existen algunas otras.


Resultado de imagen para caracteristicas de histograma
Construcción de un histograma

  • Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
  • Paso 2
Obtener todos los números de clases, existen 2 criterios para determinar el número de clases (o barras) –por ejemplo, la regla de Sturges. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
  • Paso 3
Establecer la longitud de clase: es igual al rango dividido por el número de clases.
  • Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos diferentes
  • Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace una gráfica de pastel, las bases de las barras son los intervalos de clases y la altura es la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

Resultado de imagen para caracteristicas de histograma

12 comentarios: