Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
1. REPRESENTACIÓN DE DATOS: Los datos de la investigación y el respectivo análisis, deben preferentemente ser organizados en función a las hipótesis para poder más fácilmente ofrecer resultados que la acepten o rechacen, a partir de ello los resultados se presentan en cuadros y gráficos. Si se considera que los cuadros y gráficos son numerosos, el investigador puede consignar parte de estos en la sección de anexos, presentando en el cuerpo de informe sólo los más importantes. Con la tabulación se dispone de la suma o total de los datos, pero esto no basta. Existe la necesidad de ordenarlos y presentarlos de manera, sistemática para facilitar su lectura y análisis. Las formas de presentar los datos arrojados por la investigación estadística se desarrollan con el firme propósito de esclarecer la forma de lectura de los mismos. Es recomendable utilizar (cada vez que sea posible) más de un método, siendo el mixto el método por excelencia. La forma de presentación de datos puede ser escrita, semi tabular, tabular, gráfica y mixta. 1.1. PRESENTACIÓN ESCRITA. Hasta el año 1741, en que el danés Achersen sustituyó por medio de tablas el enunciado literario de los datos, éste era el método utilizado para la presentación de los datos. Consiste en incorporar en forma de textos los datos estadísticos recopilados. Actualmente es la modalidad adoptada en informes, documentos y libros, sin perjuicio de utilizar también la presentación tabular. Este es un ejemplo de presentación escrita: Las estadísticas muestran que en el Perú, en el año 2000 la población femenina fue de 12 millones 59 mil habitantes, representado el 50.4% de la población total estimada, el 49.8% restante, es decir, 11 millones 888 mil conforman la población masculina lo que equivale al 49.6%. 1.2. PRESENTACIÓN SEMITABULAR. Es en donde aparece el texto y se incorporan las cifras en forma de relación. Ejemplo: COMPONENTES DEL PRODUCTO NACIONAL BRUTO-RAZÓN DE CRECIMIENTO ANUAL. (DATOS EXPRESADOS EN PORCENTAJES) PERIODO
PNB
1985-1990 1990-1995 1995-2000
5.0 2.8 5.0
CONSUMO PERSONAL Artículos Artículos no duraderos duraderos 3.8 3.1 5.4
3.8 9.7 12.4
Servicios
3.1 1.2 3.9
1.3. PRESENTACIÓN TABULAR: Esta forma de representación consiste en ordenar los datos numéricos en filas y columnas, con las especificaciones correspondientes acerca de su naturaleza. Los datos estadísticos podrían presentarse incorporados a un texto pero es evidente que esto no es posible cuando se trata de muchos datos. En este caso se recurre a los cuadros y las tablas, mediante las cuales la información susceptible de expresión numérica aparece en forma concreta, breve, ordenada y de fácil de examinar. 1.3.1.
PARTES DE UN RECUADRO O TABLA
1
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
Todo cuadro o tabla estadística posee por lo menos cuatro elementos esenciales · · · ·
Título. Columna matriz. Encabezamiento de las columnas. Cuerpo.
En algunos casos se agregan además como indicaciones complementarias: · · ·
La numeración La indicación de fuente. Notas al pie o al calce.
1.3.1.1. CUADROS Y TABLAS: REGLAS PARA SU CONSTRUCCIÓN Existen ciertas normas y reglas para la construcción de cuadros o tablas adoptadas universalmente Y que pueden resumirse en las siguientes: ·
Título: debe responder sintéticamente a las preguntas: ¿Qué?, ¿dónde?, ¿cómo? y ¿cuándo?; es decir, debo expresar de qué se trata, cómo se compone, dónde sucedió y cuándo se ha clasificado. El título debe reunir dos cualidades fundamentales: claridad y concisión, pero combinadas de tal modo que la claridad no perjudique la concisión alargando el título, y que la concisión, no perjudique la claridad ocasionando confusión o no reflejando todas las características y cualidades contenidas en el cuadro.
·
·
·
Columna matriz: situada a la izquierda del cuadro abarca las designaciones y conceptos que dominan el contenido de las demás columnas; si estas designaciones y conceptos son cualidades se ordenarán alfabéticamente; cuando se trata de conceptos cuantitativos el ordenamiento puede hacerse de forma ascendente o descendente, según se estime más oportuno; cuando hay fechas, el ordenamiento se hace cronológicamente. Encabezamiento de columnas: comprende los títulos de cada columna de datos; se procurará que en la construcción de estos epígrafes las palabras sean lo más cortas y expresivas posibles, escribiéndose preferentemente en forma horizontal. Cuando un título de encabezamiento es común a varias columnas, se adopta una disposición escalonada de arriba a abajo y de izquierda a derecha. Las letras de los encabezamientos deben ser de distinto tamaño en relación con la importancia respectiva. Cuerpo: comprende la parte del cuadro en que están colocados los datos en líneas y en columnas. Ejemplo de una Tabla Estadística DEPARTAMENTO TUMBES PIURA
1.3.1.2.Columna REPRESENTACION Matriz GRÁFICA.
GRADO DE ESCOLARIDAD AÑOS 1995 1998 2001 78.48 81.57
70.77 82.42
74.74 76.34
PROMEDIO 2004 76.20 78.16
73.85 75.31
Cuerpo
Este tipo de representación, como medio auxiliar del que se vale la estadística para llevar al lector sus conclusiones, ha adquirido notable desarrollo en los últimos tiempos. Si bien es cierto que el método gráfico representa en forma más atractiva y expresiva los datos compilados, desde el punto de vista estrictamente técnico, no podemos considerarla como un modo riguroso de representación estadística.
2
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
a) COMPONENTES DE UN GRÁFICO. Un gráfico, al igual que una tabla, está compuesto de las partes siguientes: a. Identificación del gráfico b. Título del gráfico. c. Cuerpo del gráfico o gráfico propiamente dicho (incluye la clave o leyenda de ser necesaria ésta). d. Pie del gráfico. En la actualidad es muy infrecuente encontrar un gráfico hecho a mano. Generalmente se emplean sistemas graficadores de microcomputadoras. Esto no invalida la necesidad de conocer las reglas y convenciones establecidas con respecto a la confección de los mismos. b) RECOMENDACIONES PARA ELABORAR GRÁFICOS. · · ·
En su gran mayoría los gráficos se inscriben en un sistema de ejes coordenados, siendo el circular o de sectores una excepción. En uno de los ejes se representan las frecuencias observadas o los valores calculados a partir de los datos, mientras que en el otro se representa el criterio principal de clasificación. La escala relativa al eje donde se representan frecuencias debe comenzar en cero. De ser necesario, se puede interrumpir “adecuadamente” la escala. Decimos adecuadamente porque la forma de realizar esa ruptura depende del tipo de gráfico.
· · ·
La longitud de un eje debe ser, aproximadamente, entre una vez y una vez y media la del otro. Esta proporcionalidad es importante, pues garantiza la comparabilidad entre gráficos. Cada eje debe ser rotulado, es decir, indicar que representa, y en caso de que corresponda, la unidad de medida usada. Un gráfico no debe sobrecargarse de líneas a cifras, el solo da la idea general del fenómeno, pues los detalles están representadas en la tabla correspondiente.
c) LIMITACIONES EN LA UTILIZACIÓN DE LA REPRESENTACIÓN GRÁFICA. Debemos hacer notar, asimismo, una serie de limitaciones a la utilización de la representación gráfica: · · · · ·
No puede representar tantos datos como un cuadro o tabla estadística. No permite la apreciación de detalles. El gráfico no puede dar valores exactos. Los gráficos requieren mayor tiempo en su ejecución que los cuadros y tablas. Se presta a deformaciones, por las escalas utilizadas.
La ventaja del método no es la de dar una expresión más exacta que la de las cifras, sino dar una idea más simple y permanente del progreso gradual y de cantidades comparables en períodos diferentes, presentando a la vista una figura o gráfico cuyas proporciones corresponden al monto de las cantidades que se intenta expresar. Las gráficas pueden mejorar una presentación centrando la atención en los puntos importantes que no pueden explicarse claramente en las tablas. Son medios rápidos y atractivos de presentar números, tendencias y relaciones. d) ERRORES MÁS COMUNES EN LA CONFECCIÓN DE GRÁFICOS. En la confección de una gráfica se pueden cometer dos tipos de errores: errores de forma y errores de contenido. Aquí mencionaremos los que se han observado con más frecuencia en las publicaciones científicas. De forma: No uso de la identificación.
3
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
No aparición de título o títulos extremadamente extensos. Títulos que no responden a las preguntas básicas. Gráficos muy cargados y/o sumamente complejos de interpretar. Desproporción notable entre las longitudes de los ejes. Omisión de los rótulos de los ejes y/o las unidades de medida.
De contenido: Uso de gráficos inadecuados dada la naturaleza de lo que se representa. Omisión de la leyenda donde se han usado claves o símbolos. No respetar alguna de las reglas establecidas para la construcción del gráfico en particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta. e) CONCLUSIONES SOBRE LOS GRÁFICOS. 1. Los gráficos se reciben con agrado por parte de los editores y lectores, pero la apariencia es lo menos importante, el objetivo de la presentación gráfica es mejorar la presentación del contenido científico. 2. Si el contenido de los resultados se puede hacer de forma textual, no se recomienda la presentación gráfica, ya que eleva los costos de publicación. 3. El objetivo básico de un gráfico es transmitir la información de forma tal que pueda ser captada rápidamente, de un golpe de vista, un gráfico debe ser ante todo sencillo y claro, a pesar de su aspecto artístico ya que se elabora para ser incluido en un trabajo científico. 1.3.1.2.1.
CLASES DE GRÁFICOS.
La Gráfica de Torta, de Barras y de Líneas son los formatos que se utilizan con mayor frecuencia. a. GRÁFICA DE TORTA.
Es una de las formas más simples y efectivas de representar relaciones proporcionales. Tenga precaución con la costumbre de colocar excesiva información en una sola gráfica de torta. Mantenga entre 5 y 6 segmentos y los grupos de segmentos que representan porcentajes pequeños, generalmente menos de un 5%. b. GRÁFICA DE BARRAS. Si usted utiliza más de cuatro (04) gráficas de este tipo, debe de considerar el empleo de una Gráfica de Barras. Una Gráfica de Barras presenta las magnitudes de los datos según la longitud de varias barras que estén colocadas con respecto a una escala horizontal o vertical.
4
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
Estas gráficas son las mejores para ejemplificar comparaciones múltiples y relaciones complejas. Gráfica de Barras por Conglomerados
Para comparar diferentes conjuntos de datos en una sola gráfica, utilice una Gráfica de Barras por conglomerados. Agrupan los temas generales y luego dividen la información en categorías especificas. Puesto que usualmente, no hay suficiente espacio para todas estas clasificaciones, dibuje cada barra con un patrón diferente y/o color y describa la barra en una leyenda debajo de la gráfica. c. GRÁFICA DE LÍNEAS. Las Gráficas de Líneas muestran de manera efectiva las tendencias durante un período de tiempo. En las siguientes situaciones se prefieren una gráfica de línea:
Cuando los datos involucran un largo período de tiempo. Cuando se comparan diferentes series en un mismo diagrama. Cuando el énfasis está en el movimiento y no en la cantidad real. Cuando se presentan las tendencias de la distribución de frecuencia. Cuando se emplea una escala de cantidades Cuando se quieren presentar pronósticos
1.3.1.3. HISTOGRAMA. Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable la escala del eje correspondiente a la variable se rotula con los límites inferiores de notación de las clases consideradas y se agrega al final el que le correspondería a una clase subsiguiente inexistente. En este caso, las frecuencias deben resultan proporcionales no a la altura de las barras, sino al área de las mismas, lo que significa que la obtención de las alturas de las barras resulta un poco más compleja que en los gráficos anteriores. Además, las barras van contiguas y no separadas, por la naturaleza continua de la variable de clasificación. Para lograr la proporcionalidad entre la frecuencia y el área de la barra que ésta representa el procedimiento es el siguiente: sabemos que el área de un rectángulo es el producto de la base por la altura y que la base de una barra en el gráfico es, precisamente, la amplitud del intervalo de clase, luego la formulación de esa proporcionalidad sería: FRECUENCIA OBSERVADA = AMPLITUD DEL INTERVALO. ALTURA DE LA BARRA.
5
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
Conocemos la frecuencia observada Y la amplitud de cada uno de los intervalos, por tanto, para calcular las alturas de las barras sólo se tendría que despejar en la fórmula correspondiente, lo que quedaría: ALTURA DE LA BARRA = FRECUENCIA OBSERVADA AMPLITUD DEL INTERVALO. Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse como número de individuos por unidad de medida de la variable en cuestión, por ejemplo: defunciones por año de edad número de individuos por Kg. de peso; etc. El procedimiento que hemos explicado es el general, pero sucede,· en el caso particular de que las amplitudes de todos los intervalos de clase sean iguales, que no es estrictamente necesario realizar estos cálculos: sería dividir todas las frecuencias por una constante yeso no alteraría el gráfico, pues se mantendría la misma relación de proporcionalidad entre las frecuencias. Veámoslo a través de un ejemplo, cuando las amplitudes de los intervalos son iguales: Distribución según grupos de edad. Cuba, 2002.
En este caso se usó la frecuencia absoluta como altura de la barra. Todas las barras tienen el mismo ancho y van unidas, una a continuación de la otra, porque están representando una variable continua (edad). Es sencillo darse cuenta de que es imposible presentar otra distribución en ese gráfico, pues unas barras podrían ocultar a otras. Es decir, este tipo de gráfico sólo es útil para presentar una distribución. 1.3.1.4. POLÍGONO DE FRECUENCIAS. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución o una clasificación cruzada de una variable cuantitativa continúa con una cualitativa o cuantitativa discreta, ya que por la forma de construcción del histograma sólo se puede representar una distribución. Para su confección, una vez construidas y rotuladas las escalas, de manera similar a como se realiza para un histograma, los valores de alturas obtenidos se ubican sobre el punto medio o marca de clase de los intervalos correspondientes y luego se procede a unir esos puntos con segmentos de recta. Veamos un ejemplo de polígono de frecuencias: Distribución según edad. Cuba, 2002.
6
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
1.3.1.5. GRÁFICO DE FRECUENCIAS ACUMULADAS U OJIVA. Su objetivo, al igual que el histograma y el polígono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas. No se utilizan barras en su confección, sino segmentos de recta, por elfo no sólo es útil para representar una distribución de frecuencias sino también cuando se quiere mostrar más de una distribución o una clasificación cruzada de una Variable cuantitativa continua con una cualitativa o cuantitativa discreta. Este es un ejemplo de una ojiva: Distribución según edad. Frecuencia acumuladas Cuba, 2002.
La diferencia con el polígono de frecuencia es que la frecuencia acumulada no se ubica sobre el punto medio de la clase, sino al final de la misma, ya que representa el número de individuos acumulados hasta esa clase. Como el valor de la frecuencia acumulada es mayor a medida que avanzamos en la distribución, la poligonal que se obtiene siempre va a ser creciente y esa forma particular de la misma es la que ha hecho que se le dé también el nombre de ojiva. 1.3.1.6. GRÁFICO ARITMÉTICO SIMPLE Este es uno de los más sencillos de confeccionar. Su uso estadístico fundamental es en la representación de series cronológicas, y en casos particulares, como el del Crecimiento y Desarrollo Humanos, para representar los valores promedio o posicionales (medias, medianas y percentiles) de muchas dimensiones: peso para la edad, peso para la talla y talla para la edad, entre otras.
7
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
Uno de los ejes (habitualmente el horizontal) se usa para la unidad de tiempo estudiada: años, días, etc., En el otro eje se representa la frecuencia o el indicador calculado a partir de esos datos. En este tipo de gráfico es particularmente importante la relación de proporcionalidad entre los ejes para evitar malas interpretaciones del fenómeno que se presenta. El gráfico que sigue es un ejemplo de gráfico de este tipo: Tasas de hepatitis B y C Cuba, 1996 - 1999.
En el mismo gráfico se puede presentar más de una serie de datos si la escala usada se adecua para todas, cuando los valores de las mismas no son extremadamente diferentes. 1.3.1.7. OTROS TIPOS DE REPRESENTACIÓN GRÁFICA. Semilogarítmico: en ocasiones, al representar series cronológicas para comparar, resulta que los valores de las diferentes series pueden diferir grandemente y eso hace prácticamente imposible el uso del Grafico Aritmético Simple, pues deben aparecer en la escala del eje Y valores que pueden estar muy distantes entre sí. La solución es usar una escala logarítmica en dicho eje y así pueden colocarse todos los datos sin alterar seriamente sus comportamientos, de modo tal que las comparaciones sean válidas. Veámoslo con un ejemplo: Tasas de hepatitis A y C. Cuba, 1996 1999.
El eje correspondiente a las tasases un eje logarítmico, para poder representar números de magnitudes tan diferentes al unísono.
8
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
También hay formas de presentación gráfica que no son gráficos propiamente dichos. Al menos, no de los tipos que hemos visto. Esas presentaciones pueden ser:
Mapas con localizaciones específicas de fotos. Esquemas. Organigramas, etc.
1.3.1.8. PRESENTACIONES MIXTAS: Además de las formas presentadas anteriormente, puede hacerse una combinación de técnicas con la finalidad de que los datos sean presentados de una forma más clara. De este modo se puede hacer una presentación que contenga ciertos datos o cifras estadísticas seguidas de una tabla que apoye lo antes presentado. En esa misma forma es considerable el presentar una tabla o cuadro y juntamente con ésta la gráfica correspondiente a los datos presentados en la tabla. 1.3.1.9. DIAGRAMA DE GANTT: Los cronogramas de barras o «gráficos de Gantt» fueron concebidos por el ingeniero norteamericano Henry L. Gantt, uno de los precursores de la ingeniería industrial contemporánea. Gantt procuró resolver el problema de la programación de actividades, es decir, su distribución conforme a un calendario, de manera tal que se pudiese visualizar el período de duración de cada actividad sus fechas de iniciación y terminación e igualmente el tiempo total requerido para la ejecución de un trabajo. El instrumento que desarrolló permite también que se siga el curso de cada actividad, al proporcionar información del porcentaje ejecutado de cada una de ellas, así como el grado de adelanto o atraso con respecto al plazo previsto. Este gráfico consiste simplemente en un sistema de coordenadas en que se indica: En el eje Horizontal: un calendario; o escala de tiempo definido en términos de la unidad más adecuada al trabajo que se va a ejecutar: hora, día, semana, mes, etc. En el eje Vertical: las actividades que constituyen el trabajo a ejecutar. A cada actividad se hace corresponder una línea horizontal cuya longitud es proporcional a su duración. Símbolos Convencionales: en la elaboración del gráfico de Gantt se acostumbra utilizar determinados símbolos, aunque pueden diseñarse muchos otros para atender las necesidades específicas del . Los símbolos básicos son los siguientes:
Iniciación de una actividad. Término de una actividad. Línea fina que conecta las dos «L» invertidas. Indica la duración prevista de la actividad. Línea gruesa. Indica la fracción ya realizada de la actividad, en términos de porcentaje. Debe trazarse debajo de la línea fina que representa el plazo previsto. Plazo durante el cual no puede realizarse la actividad. Corresponde al tiempo improductivo puede anotarse encima del símbolo utilizando una abreviatura. Indica la fecha en que se procedió a la última actualización del gráfico, es decir, en que se hizo la comparación entre las actividades previstas y las efectivamente realizadas.
Para construir un diagrama de Gantt se recomienda seguir los siguientes pasos:
Dibujar los ejes horizontal y vertical. Escribir los nombres de las tareas sobre el eje vertical.
9
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
En primer lugar se dibujan los bloques correspondientes a las tareas que no tienen predecesoras. Se sitúan de manera que el lado izquierdo de los bloques coincida con el instante cero del proyecto (su inicio).
A continuación, se dibujan los bloques correspondientes a las tareas que sólo dependen de las tareas ya introducidas en el diagrama. Se repite este punto hasta haber dibujado todas las tareas. Ejemplo: MES FECHA
ENERO
FEBRERO
6 A 10 13 A 24
20 A 25
MARZO 1 A 19
22 A 31
ACTIVIDADES Introducción Fundamentación teórica Planeación Organización Ejecución Control Prácticas y Ejercicios 1.3.1.10.
EL FLUJOGRAMA. A) ¿Qué es? Es una representación gráfica de la secuencia de actividades de un proceso, que muestra lo que se realiza en cada etapa, los materiales o servicios que entran y salen del proceso, las decisiones que deben ser tomadas y las personas involucradas. B) ¿Para qué se usa? El flujograma se usa para: a. Entender un proceso e identificar las oportunidades de mejora de la situación actual. b. Diseñar un nuevo proceso, incorporando las mejoras c. Facilitar la comunicación entre las personas involucradas en el mismo proceso. d. Divulgar, en forma clara y concisa, informaciones sobre procesos C) ¿Cómo usar el flujograma? Para usar el flujograma hay que tener en cuenta lo siguiente: a. Defina el proceso que se va a realizar. b. Escoja un proceso relacionado con el producto o servicio más importante. c. Elabore un flujo del proceso, identificando sus grandes bloques de actividades. d. Organice, para la elaboración del flujograma, un grupo compuesto por las personas involucradas en las actividades del proceso. e. Defina detalladamente las etapas del proceso y describa las actividades y los productos o los servicios que resulten de cada una de ellas. f. Identifique los responsables para la realización de cada actividad identificada. g. Compruebe si el flujograma diseñado corresponde a la forma como se ejecuta el proceso en la practica, y haga las correcciones que considere necesarias
10
Escuela de Psicología Estadística
Ing. Pedro Núñez Ramírez
D) ¿Qué símbolos se utilizan en el flujograma? El flujograma utiliza un conjunto de símbolos para representar las etapas del proceso, las personas o los sectores involucrados, la secuencia de las operaciones y la circulación de los datos y los documentos. Los símbolos más comunes utilizados son los siguientes: Límites: Este símbolo se usa para identificar el inicio y el fin de un procesoOperación: Representa una etapa del proceso. El nombre de la etapa y de quien la ejecuta se registra al interior del rectángulo: Documento: Simboliza al documento resultante de la operación respectiva. En su interior se anota el nombre que corresponda: Decisión: Representa al punto del proceso donde se debe tomar una decisión. La pregunta se escribe dentro del rombo. Dos flechas que salen del rombo muestran la dirección del proceso, en función de la respuesta real.
11