Paso 3: Análisis de Correlación Lineal Simple


 

Midiendo la Conexión: Correlación

Aquí nos centramos en cómo cuantificar la fuerza y dirección de la relación. Los gráficos y el coeficiente de Pearson son los recursos clave.

"¿Qué Tan Fuertes Son? Entendiendo la Correlación"


Análisis de Correlación Lineal Simple


El análisis de correlación lineal simple es un método estadístico que mide la fuerza y dirección de la asociación lineal entre dos variables cuantitativas.

La correlación nos dice si dos variables se mueven juntas y con qué intensidad. ¡Ojo! No implica que una cause la otra, solo que hay una conexión.


Diagramas de Dispersión (¡El Recurso Visual Clave!)

Un diagrama de dispersión es un tipo de gráfico matemático que utiliza coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Cada punto en el gráfico representa un par de observaciones.

¿Qué son? Son simplemente gráficos donde cada punto es la combinación de los valores de tus dos variables. Son la primera parada obligatoria para ver la relación.

Un diagrama de dispersión no solo muestra los datos, sino que nos permite "leer" o "interpretar" la relación entre las variables con solo mirarlo. Es como si los puntos te contaran una historia visual.


Interpretación Visual:
  • Nube hacia arriba: Correlación positiva (ambas suben juntas).
  • Nube hacia abajo: Correlación negativa (una sube, la otra baja).
  • Nube sin patrón: Sin correlación lineal.
  • Puntos muy pegados a una línea: Correlación fuerte.
  • Puntos muy dispersos: Correlación débil.

Cuando digo "Interpretación Visual", me refiero a:

  • ¿Qué patrones o formas forman los puntos en el gráfico?
  • ¿Hacia dónde van los puntos?
  • ¿Qué tan "apretados" o "dispersos" están los puntos?

Interpretación Visual de los Diagramas de Dispersión: "Leyendo la Historia de Tus Datos"

Cuando miras un diagrama de dispersión (ese gráfico con muchos puntos), tu cerebro empieza a buscar patrones. La "Interpretación Visual" se trata de entender qué significan esos patrones:

  • Nube hacia arriba: Correlación Positiva

A qué me refiero: Imagina que los puntos en tu gráfico forman una especie de "nube" que va subiendo de izquierda a derecha. Es decir, a medida que la variable en el eje horizontal (X) aumenta, la variable en el eje vertical (Y) también tiende a aumentar.

Ejemplo Común: Si graficas Horas de Estudio (X) versus Calificación del Examen (Y), esperarías que, a más horas de estudio, la calificación sea más alta. La nube de puntos subiría.

Lo que significa: Hay una relación directa; cuando una cosa sube, la otra también sube.


  • Nube hacia abajo: Correlación Negativa

A qué me refiero: Los puntos en tu gráfico forman una "nube" que va bajando de izquierda a derecha. Esto indica que a medida que la variable X aumenta, la variable Y tiende a disminuir.

Ejemplo Común: Si graficas Horas Jugando Videojuegos (X) versus Horas de Sueño (Y), es posible que a más horas de videojuegos, menos horas de sueño tengas. La nube de puntos bajaría.

Lo que significa: Hay una relación inversa; cuando una cosa sube, la otra baja.


  • Nube sin patrón (o circular/dispersa): Sin Correlación Lineal

A qué me refiero: Los puntos en tu gráfico están esparcidos por todas partes, como una mancha o una nube sin forma definida (ni sube, ni baja, ni forma una curva clara). No hay una dirección o tendencia obvia.

Ejemplo Común: Si graficas tu Talla de Calzado (X) versus tu Coeficiente Intelectual (Y), lo más probable es que los puntos estén completamente dispersos. Que tu pie sea grande o pequeño no tiene relación lineal con tu inteligencia.

Lo que significa: No hay una relación lineal clara entre las dos variables. Es importante notar que podría haber otro tipo de relación (no lineal), pero para la regresión lineal, no hay conexión.


  • Puntos muy pegados a una línea: Correlación Fuerte

A qué me refiero: Ya sea que la nube suba o baje, los puntos están muy, muy cerca de la línea recta imaginaria que podrías dibujar a través de ellos. Parecen seguir esa línea de cerca, con poca desviación.

Ejemplo Común: Si graficas el Precio de un Artículo (X) versus la Cantidad Vendida (Y), y observas que casi siempre que subes un poco el precio, las ventas bajan casi la misma cantidad, los puntos estarían muy pegados a una línea descendente.

Lo que significa: La relación es muy consistente y predecible. Si sabes el valor de X, puedes predecir Y con mucha precisión.


  • Puntos muy dispersos: Correlación Débil

A qué me refiero: La nube de puntos puede tener una ligera tendencia a subir o bajar, pero los puntos están muy separados entre sí, lejos de cualquier línea recta imaginaria. Hay mucha "dispersión" o "ruido".

Ejemplo Común: Si graficas la Cantidad de Lluvia en tu Ciudad (X) versus el Número de Personas que Visitan el Parque (Y). Puede que haya una ligera tendencia a que menos gente visite el parque cuando llueve más, pero la variación de un día a otro (quizás por un evento especial o un día muy soleado inesperado) haría que los puntos estén muy dispersos alrededor de esa tendencia.

Lo que significa: Hay una relación, pero no es muy consistente o predecible. Conocer X te da una pista sobre Y, pero hay mucha incertidumbre.







El Coeficiente de Correlación Lineal de Pearson


El coeficiente de correlación lineal de Pearson (r) es una medida estandarizada de la fuerza y dirección de la asociación lineal entre dos variables, con un valor que oscila entre -1 y +1.

¿Qué es? Es un número mágico entre -1 y +1 que resume lo que vemos en el diagrama de dispersión.


Interpretación:

+1: Relación positiva perfecta (los puntos forman una línea recta perfecta hacia arriba).

-1: Relación negativa perfecta (los puntos forman una línea recta perfecta hacia abajo).

0: No hay relación lineal.

Valores intermedios (ej. 0.7, -0.5): Indican la fuerza de la relación. Cuanto más cerca de 1 o -1, más fuerte.


Videos





0 Comentarios