Blog
Ideas sobre sistemas en producción, bottlenecks y decisiones técnicas.
Lo que aprendemos resolviendo problemas reales — sin hype, sin abstracciones.
17 de marzo de 2026
El pool de conexiones que estaba costando $14K/mes en infraestructura
Un servicio con p99 de 4 segundos y 24 instancias. El problema no era falta de capacidad — era un pool de conexiones mal dimensionado que saturaba PostgreSQL.
17 de marzo de 2026
La serialización JSON que consumía el 65% del CPU en un servicio Python
Un servicio FastAPI con 18 instancias gastaba $12,420/mes. El 65% del CPU se iba en serializar JSON. Un módulo Rust de 300 líneas lo bajó a 6 instancias.
16 de marzo de 2026
Cuando el event loop de Node.js es el cuello de botella
12 instancias de Node.js donde el enrichment CPU-bound bloquea el event loop. Extraer el hot path a código nativo redujo las instancias a 3.
15 de marzo de 2026
100K conexiones WebSocket en 2 servidores — cuando el modelo de concurrencia importa más que el hardware
13 instancias para 100K conexiones WebSocket. El problema: cada conexión consumía 1MB en un thread. Un servidor async dedicado lo bajó a 2 instancias.
14 de marzo de 2026
Por qué agregar más instancias no resuelve tu problema de latencia
Un servicio con 16 instancias donde duplicar la capacidad solo mejora la latencia un 15%. El problema: el bottleneck no está en el cómputo, y escalar horizontalmente no puede eliminarlo.
11 de marzo de 2026
Cuánto cuesta un bottleneck que nadie toca — cómo calcularlo
Un bottleneck en producción tiene 4 componentes de costo. La mayoría de los equipos solo ven uno. Aquí está el framework para calcular los cuatro.
9 de marzo de 2026
Cómo un hot path en Java estaba causando pausas de 200ms cada 30 segundos
Un servicio de ingesta con 2,000 RPS tenía spikes de latencia cada 30 segundos. El problema no era la lógica de negocio — era la presión de GC por miles de objetos intermedios creados en cada request.