viernes, 11 de junio de 2010

UASD - ESTADISTICA - Organización y Presentación de datos


Organización y Presentación de datos

Organización de datos

Técnicas de resumir y presentar datos: 
Distribuciones de frecuencias, 
Lista de elementos con sus características :cuadros, gráficos estadísticos.

Distribución de frecuencias:  
En estadística existe una forma de organizar las informaciones.
Se le llama distribución de frecuencias y consiste en el ordenamiento de los datos a través de clases y frecuencias. 
Es el agrupamiento de datos en categorías, que muestran el número de observaciones en cada categoría mutuamente excluyente.

Cuando los datos se presentan en una distribución de frecuencias se les denomina datos agrupados. 
Cuando todos los datos observados de una variable se enumeran en forma desorganizada le vamos a denominar datos no agrupados.

Para elaborar una distribución de frecuencias es necesario dar los siguientes pasos:



Recorrido o rango. 
Se denomina recorrido o rango a la diferencia existente entre el valor máximo observado y el mínimo en una distribución u ordenamiento. 
En una distribución u ordenamiento de datos existe una diversidad de valores que varían de menor a mayor y viceversa.
  
R = X máx. - X mín.

Numero de clases. Como se puede observar en el segundo y tercer paso resultaría muy difícil resolver estas ecuaciones por simples métodos matemáticos ya que cada una de ellas presenta dos incógnitas. 
Como solución a este problema surge la formula de Sturges que se expresa así:
 
NC =  1+ 3.32 X log n

Donde n = numero total de valores.

Amplitud de clase (AC). 
Una clase esta definida por un límite inferior (Li) y un límite superior (Ls). 

A la diferencia entre el límite superior y el límite inferior de una clase se la llama intervalo de clase.

Este indica el recorrido o rango de los valores incluidos en una clase.

AC= Ls – Li    o también es

AC= R / NC

Punto medio de clase o marca de clase. 
Para fines de análisis de datos, los valores de las clases se representan a través del punto medio de clase o marca de clase. 
El punto medio de clase se define como la semi-suma de los límites de clase
El punto medio de clase se identifica como:

PM = ½ (límite superior + límite inferior).

PM= (Li + Ls) / 2
 
Frecuencia simple de clase: 
Al construir una distribución de frecuencias, se tienen diferentes intervalos de valores que denominaremos clases. 

Se define frecuencia simple de clase al número de veces que se repite cada clase.  

Se le identifica como fi, donde (f) se lee como frecuencia, y la (i) define el orden de las clases.
 
Frecuencia relativa simple: 
A la suma total de la frecuencia simple de clase le llamamos n.  

Cuando cada valor de la frecuencia simple de clase se divide entre el total de casos u observaciones a este cociente le denominamos frecuencia relativa simple. 

La suma de la frecuencia relativa simple siempre será igual a la unidad. 

Vamos a identificar la frecuencia relativa simple como hi.
 
Frecuencia acumulada: 
La suma de la frecuencia simple de clase es denominada como frecuencia acumulada. 

Al calcular la frecuencia acumulada en una distribución de frecuencia acumulada de la primera clase será igual a la frecuencia simple de la misma clase. 

La segunda acumulada es igual a la primera acumulada más la frecuencia simple de la segunda clase. 
El valor de la última frecuencia acumulada es igual al total de datos. 
La frecuencia acumulada se identifica como Fi.


 
Frecuencia relativa acumulada: 
Es el cociente que se obtiene al dividir cada frecuencia acumulada entre el total de observaciones.  
O la suma sucesiva de la frecuencia relativa simple. 
La frecuencia relativa acumulada se identifica como hi.




Presentación de datos

Constituye una forma de organizar datos en una o más direcciones. 
La presentación de datos estadísticos en sus diferentes modalidades constituye uno de los aspectos de mayor uso en la estadística descriptiva. 
En base ella podemos visualizar los datos estadísticos y el comportamiento de las variables.

Existen tres formas diferentes de presentar los datos estadísticos, que son:
   
Presentación tabular: 
 Cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma más exacta de presentar las informaciones. 

Una tabla consta de varias partes, las principales son las siguientes:

Titulo: Es la parte más importante del cuadro y sirve para indicar su contenido, la clasificación de los datos, la fecha o el periodo a que estos se refieren y el lugar o área geográfica a que pertenecen.
 
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada columna. Indica el contenido de cada columna.
 
Columna matriz: Es la columna principal del cuadro. Indica el contenido de las filas.
 
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla.

Fuente: Es necesario indicar de donde fueron extraídos los datos del cuadro.
 
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
 
Ejemplo de un cuadro estadístico.

                                               
Cooperativa de Ociosos
Miembros por sexo, según tiempo, Febrero 2008





Sexo

Tiempo
Varones
Hembras
Total




0  -  1
423
414
837
1  -  5
414
423
837
5  -  10
373
404
777
10  -  15
365
406
771
15  -  20
307
339
646
20  -  25
257
284
541
25 o más
20
23
43
TOTAL
2,163
2,296
4,459




Fuente: Registros de miembros, febrero 2008
Nota: Excluye los miembros que pertenecen también a otras cooperativas.
 
Presentación gráfica: 
 Proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una grafica es una expresión artística usada para representar un conjunto de datos.



Tipos de gráficos

De acuerdo al tipo de variable que vaya a representar, las principales gráficas son las siguientes:

Histograma:  
Es un conjunto de barras o rectángulos unidas una de otra, por tal razón se utiliza para representar variables continuas

Se usa para mostrar la distribución relativa de las frecuencias de los valores de una variable continua que esté agrupada en clases.






Polígono de frecuencias: 

Esta gráfica se usa para representar los puntos medios de clase en una distribución de frecuencias. Se usa para mostrar la distribución relativa de las frecuencias de los valores de una variable continua que este agrupada en clases.

Gráfica de barras:  
Es un conjunto de rectángulos o barras separadas una de la otra, en razón de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.




El gráfico de barras verticales se usa cuando la cantidad de barras no es muy numerosa o los nombres correspondientes a las barras no son muy largos. 
El gráfico de barras horizontales se utiliza cuando son muchas barras o los nombres correspondientes a las barras son muy largos.

Gráfica lineal: 
Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas. 
Se usa para ilustrar la tendencia o la evolución de los valores, una medida o la magnitud de una variable en tiempo.




Gráfica de barra 100%:  
Se usan especialmente para representar las partes en que se divide una cantidad total en consideración varias situaciones. 
Tambien permite la comparación de la distribución de los elementos de varios conjuntos de datos.










Grafico circular o de pastel.  
Se usa para mostrar la distribución relativa de las frecuencias de los valores de una variable cualitativa o discreta.



La ojiva: 
Es un grafico lineal, consiste en la representación de las frecuencias acumuladas de una distribución de frecuencias. 
Puede construirse de dos maneras diferentes; sobre la base “menor que” o sobre la base “o más”. Puede determinar el valor de la mediana de la distribución.







Ojiva



Presentación escrita: 
Esta forma de presentación de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.

2 comentarios:

El administrador se reserva el derecho de publicar los comentarios, por favor no use esta pagina para difamar ,insultar o decir malas palabras.