María Fernanda Pérez, egresada del programa AWS re/Start, ha diseñado e implementado una arquitectura de base de datos relacional en la nube orientada a optimizar el análisis financiero y la gestión del riesgo crediticio. Su propuesta técnica demuestra cómo estructurar datos financieros dispersos dentro de la capa gratuita de AWS, facilitando el trabajo de los analistas de negocio y garantizando la seguridad, trazabilidad y escalabilidad de la información.
¿De qué trata el proyecto?
El proyecto consiste en una solución de base de datos relacional gestionada para estructurar, almacenar y procesar datasets de riesgo crediticio. El sistema toma datos financieros crudos (como información demográfica, líneas de crédito, históricos de facturación, comportamientos de pago y variables de default), los organiza en un modelo relacional de cuatro tablas y habilita consultas analíticas automatizadas, simplificando la generación de métricas clave y la posterior conexión con herramientas de visualización como Power BI o Amazon QuickSight.
¿Qué problema viene a resolver?
En el sector financiero, las empresas suelen almacenar la información de riesgo de los clientes y sus movimientos mensuales en archivos locales aislados (como formatos CSV o Excel). Esta práctica provoca una pérdida crítica de trazabilidad, duplicidad de datos y severas dificultades para los analistas al momento de realizar consultas avanzadas o modelados. La falta de una infraestructura centralizada genera retrasos operativos y limita la capacidad de las instituciones para realizar análisis de scoring, segmentación de clientes y toma de decisiones basadas en datos.
¿Cuál es la solución?
La propuesta plantea la migración del almacenamiento local hacia una infraestructura en la nube centralizada y automatizada. Mediante la creación de un modelo de cuatro tablas interconectadas (Clientes, Límites de Crédito, Pagos/Facturación y Variable de Default), la solución permite realizar joins eficientes y consultas complejas en cuestión de segundos. Esto automatiza la obtención de métricas estratégicas —como el porcentaje de morosidad, los límites de crédito promedio por tipo de cliente y el atraso promedio por mes—, eliminando las tareas manuales de consolidación de archivos.
¿Cómo fue construido?
El proyecto fue edificado aprovechando la capa gratuita de Amazon Web Services (AWS) e integrando las siguientes tecnologías y componentes:
- Ingesta de Datos: Un bucket de Amazon S3 para el almacenamiento inicial y seguro de los archivos financieros crudos en formato CSV o Excel.
- Base de Datos Gestionada: Una instancia de Amazon RDS ejecutando SQL Server Express, configurada mediante grupos de seguridad (Security Groups) personalizados para controlar los accesos y proteger la información.
- Procesamiento y Carga de Datos: Implementación mediante scripts de Python en Jupyter Notebooks para la conexión e inserción en la base de datos, con la alternativa arquitectónica de usar funciones AWS Lambda para automatizar la limpieza, normalización y carga de los datos aprovechando su esquema serverless.
- Monitoreo y Observabilidad: Configuración de Amazon CloudWatch para habilitar métricas, alertas y un seguimiento continuo de la salud de la infraestructura.
- Entorno de Desarrollo: Uso de la herramienta DBeaver para la gestión del modelado relacional y la ejecución de consultas SQL (con compatibilidad para Azure o Visual Studio Code).
- Consumo Analítico: Preparado para la integración nativa con Amazon QuickSight o Power BI para el despliegue de dashboards ejecutivos y analítica de negocios.


