Published: July 22, 2025
2
122
569

🔍¿Tienes una base de datos y no sabes por dónde empezar a analizarla? Te dejo una checklist pre-análisis: una guía paso a paso para revisar, limpiar y preparar tus datos antes del análisis 🧠Recuerda: antes de graficar o modelar... hay que inspeccionar, transformar y comprender.

Image in tweet by Rosana Ferrero 📈📊🙌

PARTE I. 🧰 1. Importa los datos a R 📌 Desde RStudio puedes usar una interfaz visual: En el panel “Environment” → Import Dataset → From Text (base). 🔢 2. Dimensiones de los datos ✅ ¿Cuántos datos tenemos? Obtén el número de filas y columnas con: dim(sales)

🧹 3. Limpia los nombres de las variables ✅ Los nombres de columnas deben ser limpios y consistentes, idealmente en formato snake_case. Utiliza janitor para limpiarlos: library(tidyverse) library(janitor) sales <- sales %>% clean_names() names(sales)

🔍 4. Estructura básica de los datos ✅ ¿Tienes metadatos o diccionario de datos? Es importante saber si estamos ante variables cualitativas (categóricas) o cuantitativas (numéricas) porque el tipo de análisis posterior dependerá de esto. Escribe: str(sales) # o glimpse(sales)

✅ ¿Los tipos de datos son correctos? Aquí es donde más errores se cuelan… A menudo vamos a necesitar transformar las variables a su tipo de dato correcto. 1️⃣ De texto a factor: de tipo caracter a factor. sales <- sales %>% mutate(across(where(is.character), as.factor))

2️⃣ Lectura de fechas (¡cuidado con esto!): Revisa que las fechas se lean adecuadamente, el formato recomendado es año-mes-día porque permite ordenar y manipular fechas fácilmente. Utiliza: library(lubridate) sales <- sales %>% mutate(date = mdy(date)) # o dmy(), ymd(), etc.

3️⃣ Crear nuevas variables: A partir de una fecha, puedes obtener el día del mes (con day()) o el día de la semana (con wday()). Utilizaa: library(lubridate) sales <- sales %>% mutate(day = day(date), # día del mes 1-31 wday = wday(date)) # día de la semana 1-7

📄 5. Resumen de datos ✅ Frecuencias absolutas para variables categóricas y estadísticos descriptivos para variables numéricas: summary(sales) Revisa que sean coherentes y válidos. Si faltan datos, se nos indicará el número de valores ausentes NA. 📍 Mañana Parte II. #stats

@RosanaFerrero Dra. Gracias por su aporte.

Share this thread

Read on Twitter

View original thread

Navigate thread

1/10