CREAMOS UN POSIBLE ESTUDIO DE MUESTREO
Una vez visto como queda nuestra inferfaz grafica, deberemos ver como se introducen los datos, organizamos las variables y los elementos factoriales.
Los datos del muestreo son al azar tomados de esta manera para una sencilla comprension de los resultados que desamos interpretar con esta herramienta.
Analizaremos
mean sd cv 0 % 25% 50% 75% 100% n
CASO1 16.57143 19.806204 1.1952020 0 1 2 3.5 45 7
CASO2 2.00000 1.527525 0.7637626 0 1 2 3.0 4 7
CASO3 15.14286 23.398209 1.5451648 1 1 2 23.0 55 7
CASO1 16.57143 19.806204 1.1952020 0 1 2 3.5 45 7
CASO2 2.00000 1.527525 0.7637626 0 1 2 3.0 4 7
CASO3 15.14286 23.398209 1.5451648 1 1 2 23.0 55 7
En este resumen numérico establecemos cual es la media como vemos en los tres casos he establecido un entero para ver la verdadera diferencia que se establece, con este dato podemos ver que por medias es mucho mas probable el CASO1 (16.57143), bien tenemos un primer dato puro pero no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución eso es la desviacion estándar vemos que el CASO3 puede fluctuar entre (+v-23.398209) con lo cual esta desviacion denota la posibilidad que surgan mas CASOS3 que CASO1 en situaciones puntuales.
En cuanto al coeficiente de variación tenemos que:
- El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
- Para su mejor interpretación se expresa como porcentaje.
- Depende de la desviación típica y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos.
El coeficiente de variacion se utiliza para comparar dispersiones que tienen escalas difierentes, pero como el coeficiente de varacion es una medida de dispersion relativa, en este caso, una posible interpretacion seria que a mayor porcentaje del coeficiente mayor heterogeneidad en los datos (o variabilidad) con o cual en el CASO2,aunque cercano a uno establecemos que entre los datos del mismo no hay tanta variabilidad (2 1 1 4 4 2 0) como en el resto de casos.
Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores son simples rangos de muestreo para una distribución.
En el ejercicio el ultimo factor es "n" que es el numero de variables estudiadas.
OTRO EJEMPLO DE INVESTIGACIÓN
SUPONGAMOS UNAS CIUDADES CON UNOS TRENES LO IMPORTANTE LAS SALIDAS DE TRENES DIARIOS EJEMPLO:
![]() |
| Un nuevo conjunto de datos generado con R-Commander |
Una vez analizado el conjunto de datos vemos unas variables como son salidas y días de la semana en nuestro ejemplo salidas no la tendremos en cuenta para los cálculos que queremos realizar ya que en si mismo es una variable no cuántica con lo cual no es relevante para lo que queremos investigar.
VAMOS A ANILIZAR LA DISTRIBUCION DE FRECUENCIAS
QUE ES LA FRECUENCIA
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente
"LA FRECUNCIA PUEDE SER LA REPETICION DE VALORES"
![]() |
| Tabla Viernes |
En este ejercicio le pedimos una distribucion de frecuencias de salidas del Viernes vemos que en la primera fila nos da unos valores de 100/1 a 90/1, esto nos determina que tan solo 100 trenes han salido de un sitio o salida en cambio si vemos el 12/4 analizamos que cuatro estaciones han tenido un mismo numero de salidas 12, en la segunda fila son los mismos resultados pero con porcentajes con respeto al numero de salidas.
Ahora vamos a ver un resumen de esta tabla en donde la variable salidas tiene un valor tan solo informativo y de caracter secundario:
Se establece una muestra summary, se ve donde dice el lunes por ejemplo 45 salidas de trenes se han dado en 3 estaciones o salidas, el viernes por ejemplo 10 salidas de trenes se han dado en 1estacion o salida.
Este ejercicio nos permite desde un simple muestreo de gestion a un posible calculo de elementos como por ejemplo medias diarias de trenes que necesita madrid con respecto a barcelona, con lo cual se pueden plantear ciertas inversiones en alguna de ambas zonas dependiendo de posibles resultdos estadisticos combinados entre si.
Se establece una muestra summary, se ve donde dice el lunes por ejemplo 45 salidas de trenes se han dado en 3 estaciones o salidas, el viernes por ejemplo 10 salidas de trenes se han dado en 1estacion o salida.
Este ejercicio nos permite desde un simple muestreo de gestion a un posible calculo de elementos como por ejemplo medias diarias de trenes que necesita madrid con respecto a barcelona, con lo cual se pueden plantear ciertas inversiones en alguna de ambas zonas dependiendo de posibles resultdos estadisticos combinados entre si.
![]() |
| Tabla domingo |
Se establece una muestra summary, se ve donde dice el lunes por ejemplo 45 salidas de trenes se han dado en 3 estaciones o salidas, el viernes por ejemplo 10 salidas de trenes se han dado en 1estacion o salida.
Este ejercicio nos permite desde un simple muestreo de gestion a un posible calculo de elementos como por ejemplo medias diarias de trenes que necesita madrid con respecto a barcelona, con lo cual se pueden plantear ciertas inversiones en alguna de ambas zonas dependiendo de posibles resultdos estadisticos combinados entre si.
Este ejercicio nos permite desde un simple muestreo de gestion a un posible calculo de elementos como por ejemplo medias diarias de trenes que necesita madrid con respecto a barcelona, con lo cual se pueden plantear ciertas inversiones en alguna de ambas zonas dependiendo de posibles resultdos estadisticos combinados entre si.





No hay comentarios:
Publicar un comentario