Published: December 8, 2025
2
40
119

La paradoja de Simpson es un fenómeno que esconde más de lo que uno podría creer y que condiciona totalmente la toma de decisiones en tu empresa (uses o no uses datos) Vamos allá 👇🏻

Como se ve en esta imagen, conforme haces más ejercicio tu colesterol baja. Lógicamente en diferentes niveles en función de la edad. Todo la mar de lógico, no?

Image in tweet by Ubaldo Hervás

Sin embargo, si dejamos de desglosar por edad y con los mismos datos la gráfica nos muestra que conforme más ejercicio hagamos más colesterol tendremos. Esta es la esencia de la paradoja de Simpson: la conclusión cambia según cómo estratificamos los datos.

Image in tweet by Ubaldo Hervás

Otro ejemplo: Hombres: fármaco es ok Mujeres: fármaco es ok Ambos: fármaco no es ok ¿Por qué? Porque género es una causa común de tomar el fármaco y de recuperarse. Como más mujeres lo toman y las mujeres se recuperan menos (por razones fisiológicas) el agregado se distorsiona.

Image in tweet by Ubaldo Hervás

Y aquí viene el verdadero aprendizaje de la paradoja de Simpson: 👉🏼 Hay que mirar los datos estratificados por la variable causal relevante ("género" en este caso) y no por cualquier dimensión que te pique por tu PARÁLISIS POR ANÁLISIS. Pero la cosa se complica. Seguimos

La misma tabla puede decirte que el fármaco ayuda o no. En la tabla, segmentar por presión arterial (BP) es un error: esa variable cambia por el fármaco (el tratamiento). 👉🏼 No siempre hay que dividir los datos. A veces dividir es lo que distorsiona.

Image in tweet by Ubaldo Hervás

En este caso BP (Blood pressure) es un mediador, ya que reducir BP hace que descienda el colesterol gracias al fármaco. La moraleja: - Si segmentas por género arreglas el sesgo. - Si segmentas por presión arterial después del tratamiento, introduces un sesgo nuevo.

Image in tweet by Ubaldo Hervás

El aprendizaje de verdad no es que en un caso toque desglosar o no, la clave no está en la estadística descriptiva, sino en la estructura causal.

Sin un planteamiento causal no sabes: - Cuándo estratificar - Cuándo no estratificar - Si una decisión es correcta. Tu análisis, tu diagnóstico de negocio... TODO, puede devenir en desastre.

La paradoja de Simpson no es solo una paradoja matemática. Es una característica a conocer si queremos evaluar qué decisión de negocio funcionó o incluso algo tan nimio como si debemos usar datos agregados o no. Gracias por leerme. Si te ha gustado este hilo2 RT+❤️ pliiiis

Se explica en el hilo. Probablemente se deba a que la variable: 1️⃣ No es la adecuada (mediator) 2️⃣ Sí es adecuada y lo erróneo es el agregado La clave es que tengas clara tu hipótesis y que los datos ayuden a responderla y no caer en la parálisis por análisis/tortura del dato.

Share this thread

Read on Twitter

View original thread

Navigate thread

1/11