Notas y telemetría real sobre cómo diseñar un sistema RAG resiliente usando el patrón Circuit Breaker y model cooldowns ante límites de cuota (429).