NOCIONES BÁSICAS DE LA ESTADÍSTICA
Son
los conceptos esenciales que permiten la comprensión y aplicación de métodos
estadísticos para el análisis de datos. Estas nociones incluyen
Población
Es el
conjunto completo de individuos o elementos que se estudian. Ejemplo:
Todos los estudiantes de una universidad.
Muestra
Es un
subconjunto representativo de la población. Ejemplo: un grupo de 200
estudiantes seleccionados de la universidad.
Tipos de Variables
Las
variables representan las características o atributos que se miden en un
estudio. Estas pueden ser:
Variables cuantitativas
Son aquellas variables numéricamente medibles o cuantificables. Por lo tanto, operaciones aritméticas son posibles de llevar a cabo. Estas variables se subdividen en dos tipos:
- Continuas: Toman cualquier valor dentro de un rango específico. Ejemplos: cotidianos incluyen: altura, el peso y la temperatura.
- Discretas: Estas variables sólo pueden tomar valores específicos y generalmente enteros. Ejemplos: incluyen el número de hijos, el número de automóviles en una familia.
Variables cualitativas
También llamadas categóricas, describen características que no pueden ser medidas numéricamente, sino que se categorizan en diferentes grupos. Se dividen en dos tipos:
- Nominales: No tienen un orden intrínseco. Ejemplos: incluyen el género, el color de los ojos.
- Ordinales: Tienen un orden lógico. Ejemplos: incluyen los niveles de educación (básico, medio, superior).
Variable
Independiente
Esta variable es utilizada por el investigador para modificar, manejar y estudiar su influencia en otra variable. Las variables independientes se emplean como factores para clasificar información y detectar tendencias.
Variable Dependiente
Esta variable muestra el resultado o la respuesta en relación con los distintos niveles de la variable independiente. Por ejemplo, en el análisis del desempeño académico, las calificaciones de los estudiantes se consideran la variable dependiente.
Variable
Confusora
Es aquella que, no gestionada, tiene el potencial de afectar tanto la variable independiente como la dependiente, alterando su relación. Reconocer y modificar estas variables es fundamental para realizar un análisis preciso.
Variable Interviniente
Funciona como un intermediario que explica la influencia de una variable en otra. Por ejemplo, en el contexto del estudio sobre métodos de enseñanza, la tasa de participación en clase puede actuar como una variable interviniente que clarifica cómo influye el método de enseñanza en el desempeño académico.
Tablas de Frecuencia
Estas
muestran el número de veces que cada valor de una variable ocurre en un
conjunto de datos. Se
consideran una herramienta
fundamental en estadística que sirve para organizar y resumir datos.
Tipos de frecuencias
- Frecuencia Absoluta: La frecuencia absoluta de un valor es el número de veces que dicho valor aparece en el conjunto de datos. Además, esta suele representarse como fi,donde el subíndice indica cada uno de los valores y la suma de las frecuencias absolutas es igual al número total de datos, representado por N.
- Frecuencia Relativa: La forma de calcularla es mediante la división de la frecuencia de un valor particular por el número total de observaciones. La expresión usada para el cálculo es: hi=fi/N, donde hi es la frecuencia relativa, fi es la frecuencia absoluta y N es numero total de datos. Adicionalmente, esta frecuencia proporciona una idea clara de la importancia relativa de cada valor dentro de un conjunto de datos ya que expresa la proporción de veces que un valor específico ocurre en un conjunto de datos en comparación con el número total de observaciones.
- Frecuencia Acumulada: Es la suma de las frecuencias de todos los valores menores o iguales a un número determinado. Si se desea comprender la distribución de datos y/o crear gráficos acumulativos, este concepto es particularmente útil. Para calcular la frecuencia acumulada, se suman las frecuencias de cada categoría progresivamente a medida que se avanza a través del conjunto de datos. esta suele representarse como Fi.
- Frecuencia Relativa Acumulada: Para el cálculo de esta, se debe dividir la frecuencia acumulada entre el número total de datos, se representa por Hi.
Tablas de frecuencias con datos agrupados
Se utilizarán las tablas de frecuencias con datos agrupados cuando nuestra variable tome un gran número de valores o sea una variable continua. Para llevarlo a cabo, se agrupan los diferentes valores en intervalos de igual amplitud, a los cuáles denominaremos clases. Adicionalmente, necesitaremos otros parámetros importantes:
- Límite de clase: cada clase es un intervalo que va desde el límite inferior, hasta el límite superior.
- Marca de clase: Concretamente, es el punto medio de cada intervalo, y a su vez, representa a la clase para el cálculo de algunos parámetros.
- Amplitud de clase: Se denomina como, la diferencia entre el límite superior y el límite inferior.
Los
pasos para elaborar una tabla de frecuencias con datos agrupados son los
siguientes:
- Hallar el rango(R): R = Xmáx– Xmín
- Hallar el número de intervalos (K). Si el problema no indica cuántos intervalos usar, se recomienda usar la regla de Sturgues: K = 1 + 3,322.log(n) ; siendo n el número de datos.
- Determinar la amplitud de clase (A): A = R/K
- Hallar el límite inferior y superior de cada clase, así como las marcas de clase.
- Colocar los valores hallados en las columnas de la tabla de frecuencias, con el siguiente orden: clases (intervalos), marcas de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada. Además, se puede colocar la frecuencia porcentual y la frecuencia porcentual acumulada.
Representaciones
gráficas
Los
gráficos son recursos visuales que se utilizan para mostrar la distribución y
conexión de los datos. Dichos gráficos ayudan a la comprensión de los patrones,
tendencias y variabilidad presentes en un conjunto de datos. Las
representaciones más utilizadas abarcan histogramas, gráficos de barras,
diagramas de dispersión y gráficos circulares.
Histogramas
Representan
la distribución de una variable continua a través de barras, donde la altura
refleja la frecuencia de los datos en cada intervalo. Resulta práctica para
observar la estructura de la distribución de los datos, detectando elementos
como simetría, apuntamiento y valores atípicos.
Imagen 1: Ejemplo de Histograma
Tomado de
Gráficos
de Barras
Los
gráficos de barras representan datos categóricos con barras cuya longitud es
proporcional a la frecuencia o el valor de cada categoría. Son útiles para
comparar diferentes categorías entre sí.
Imagen 1: Ejemplo de Gráfico de barras
Tomado
Diagramas
de Dispersión
Estos
muestran la relación entre dos variables cuantitativas mediante el uso de
puntos en un plano cartesiano. Estos diagramas resultan muy útiles para identificar
correlaciones y patrones entre las variables.
Imagen 3: Ejemplo de Diagrama de
dispersión
Tomado de
Gráficos
de Sectores (Pastel)
Muestran
la proporción de cada categoría dentro de un conjunto de datos como segmentos o
partes de un círculo. Si se necesita representar datos categóricos y comparar
partes de un todo, este tipo de gráfico resulta muy útil.
Imagen 4: Ejemplo de gráfico tipo pastel
Tomado de
Comprensión sobre los
tipos de Medidas
Los
tipos de medidas pueden ser: medidas de tendencia central, medidas de
dispersión, medidas de posición no centrales; los cuales se desarrollará en el
presente trabajo de investigación; por otra parte, también hay las medidas de
forma, pero ese tipo de medida no es objeto de estudio del presente trabajo.
Medidas
de tendencia central
Estas medidas describen el centro de un conjunto de datos y su importancia dentro de la estadística yace en la proporción de un resumen conciso del conjunto de datos y también permitir comparar entre distintos grupos de ellos. Las tres medidas de tendencia central más comunes son la media, la mediana y la moda.
- Media: Concretamente es la suma de todos los elementos del conjunto de datos dividida por el número de valores o también llamado conjunto de observaciones, se expresa por x^-. Lo que dará como resultado, es una estimación del valor promedio. La expresión para el cálculo de esta medida en las diferentes formas es:
- Mediana: Se puede definir como el valor central de un conjunto de datos ordenado o también como el valor que separa dichos datos en dos mitades iguales, se expresa Me. La expresión para el cálculo de esta medida en las diferentes formas es:
Medidas
de Dispersión
Estas describen la variabilidad o la dispersión de un conjunto de datos. Además, proporcionan información sobre cuánto difieren los datos entre sí y con respecto a una medida central, como la media. Las más comunes son el rango, la varianza y la desviación estándar.
- Rango: Se define como la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos, se expresa por R.La expresión para el cálculo de esta medida en las diferentes formas es:
Para
datos no agrupados y agrupados
- Varianza: Esta mide la dispersión de los datos con respecto a la media y se calcula como el promedio de los cuadrados de las diferencias entre cada valor y la media, se expresa por o^2. La expresión para el cálculo de esta medida en las diferentes formas es:
- Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de dispersión en las mismas unidades que los datos originales. La expresión para el cálculo de esta medida en las diferentes formas es:
Medidas
de Posición No Centrales
Ofrecen
detalles acerca de la distribución relativa de los valores en un conjunto de
datos, sin hacer énfasis en la media o mediana. Estas medidas son especialmente
efectivas para detallar la dispersión y el patrón de distribución de los datos.
Las medidas de posición no central más utilizadas incluyen los cuartiles,
deciles y percentiles.
·
Cuartiles: Los
cuartiles dividen un conjunto de datos ordenados en cuatro partes iguales. Hay
tres cuartiles principales:
Ø Primer
Cuartil (Q1): O cuartil inferior, es el valor que separa el
25% inferior de los datos del 75% superior.
Ø Segundo
Cuartil (Q2): O mediana, es el valor que divide el conjunto
de datos en dos mitades iguales.
Ø Tercer Cuartil (Q3): O cuartil superior, es el valor que separa el 75% inferior de los datos del 25% superior.
La expresión para el cálculo de esta medida en las diferentes formas es:
·
Deciles: Los
deciles dividen un conjunto de datos ordenados en diez partes iguales. Los
deciles más importantes son:
Ø D1:
Primer decil, separa el 10% inferior del 90% superior.
Ø D5:
Quinto decil, es la mediana, el valor que divide los datos en dos partes
iguales.
Ø D9:
Noveno decil, separa el 90% inferior del 10% superior.
La expresión para el cálculo de esta medida en las diferentes formas es:
·
Percentiles: Los
percentiles dividen un conjunto de datos ordenados en cien partes iguales. Los
percentiles más comúnmente utilizados son:
Ø P1:
Primer percentil, separa el 1% inferior del 99% superior.
Ø P50:
Quincuagésimo percentil, es la mediana, el valor que divide los datos en dos
partes iguales.
Ø P99: Nonagésimo noveno percentil, separa el 99% inferior del 1% superior.
La expresión para el cálculo de esta medida en las diferentes formas es:
Referencia
- Ø /u/grupomate. (2021, enero 26). Medidas de posicion. GeoGebra. https://www.geogebra.org/m/f4byn8tk
- Ø De estudio según sus, L. I. R. la P. en P. Q. S. O. (s/f). Medidas de dispersión. Jica.go.jp. Recuperado el 8 de agosto de 2024, de https://www.jica.go.jp/Resource/project/elsalvador/004/materials/ku57pq00003uf5za-att/workbook_JS3_08.pdf
- Ø Hernández, S. A. (2020, junio 26). Estadística 9.- Cuartiles, Deciles, Percentiles. https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-semestre/estadistica/cuartiles-deciles-y-ercentiles.pdf
- Ø Manuel. (2021, mayo 7). Media Mediana y Moda para Datos Agrupados. Mates Fáciles. https://lasmatesfaciles.com/2021/05/07/media-mediana-y-moda-para-datos-agrupados/
- Ø Moore, D. S., McCabe, G. P., & Craig, B. A. (2018). Introduction to the Practice of Statistics. W.H. Freeman.
- Ø Sangaku S.L. (2024) Frecuencia absoluta, relativa, acumulada y tablas estadísticas. sangakoo.com. Recuperado de https://www.sangakoo.com/es/temas/frecuencia-absoluta-relativa-acumulada-y-tablas-estadisticas
- Ø Triola, M. F. (2018). Essentials of Statistics (6th ed.). Pearson.
- Ø Utts, J., & Heckard, R. (2014). Mind on Statistics (5th ed.). Cengage Learning.
- Ø Weiss, N. A. (2012). Introductory Statistics (9th ed.). Pearson.
- Ø Yañez Martín. (2022). Medidas de tendencia central. uDocz. https://www.udocz.com/apuntes/387136/medidas-de-tendencia-central
- Ø Yensi Mendez - Medidas de dispersión y forma. (s/f). TOMi.digital. Recuperado el 8 de agosto de 2024, de https://tomi.digital/es/255659/medidas-de-dispersion-y-forma?utm_source=google&utm_medium=seo
- Ø (S/f). Matemovil.com. Recuperado el 8 de agosto de 2024, de https://matemovil.com/tablas-de-frecuencias-ejercicios-resueltos/