Blog

Ideas sobre sistemas en producción, bottlenecks y decisiones técnicas.

Lo que aprendemos resolviendo problemas reales — sin hype, sin abstracciones.

17 de marzo de 2026

El pool de conexiones que estaba costando $14K/mes en infraestructura

Un servicio con p99 de 4 segundos y 24 instancias. El problema no era falta de capacidad — era un pool de conexiones mal dimensionado que saturaba PostgreSQL.

postgresqlconnection-poolinginfraestructura

17 de marzo de 2026

La serialización JSON que consumía el 65% del CPU en un servicio Python

Un servicio FastAPI con 18 instancias gastaba $12,420/mes. El 65% del CPU se iba en serializar JSON. Un módulo Rust de 300 líneas lo bajó a 6 instancias.

pythonserializaciónrustcpufastapi

16 de marzo de 2026

Cuando el event loop de Node.js es el cuello de botella

12 instancias de Node.js donde el enrichment CPU-bound bloquea el event loop. Extraer el hot path a código nativo redujo las instancias a 3.

node.jsevent-looprustlatenciaanti-patrón

15 de marzo de 2026

100K conexiones WebSocket en 2 servidores — cuando el modelo de concurrencia importa más que el hardware

13 instancias para 100K conexiones WebSocket. El problema: cada conexión consumía 1MB en un thread. Un servidor async dedicado lo bajó a 2 instancias.

websocketrustconcurrenciainfraestructura

14 de marzo de 2026

Por qué agregar más instancias no resuelve tu problema de latencia

Un servicio con 16 instancias donde duplicar la capacidad solo mejora la latencia un 15%. El problema: el bottleneck no está en el cómputo, y escalar horizontalmente no puede eliminarlo.

escalamientolatenciaanti-patrón

11 de marzo de 2026

Cuánto cuesta un bottleneck que nadie toca — cómo calcularlo

Un bottleneck en producción tiene 4 componentes de costo. La mayoría de los equipos solo ven uno. Aquí está el framework para calcular los cuatro.

costosdiagnósticodecisión

9 de marzo de 2026

Cómo un hot path en Java estaba causando pausas de 200ms cada 30 segundos

Un servicio de ingesta con 2,000 RPS tenía spikes de latencia cada 30 segundos. El problema no era la lógica de negocio — era la presión de GC por miles de objetos intermedios creados en cada request.

jvmgcrustlatencia