Plan maestro: smart home 2026 invisible y agent-managed¶
Síntesis ejecutiva de todas las decisiones del wiki. Punto de entrada único para "qué hago concretamente". Cada bullet linkea al análisis profundo donde se justifica. Si tenés 10 min y querés el TL;DR, esta página es lo que querés leer.
Meta operativa (norte del proyecto)¶
"Smart home que funcione. Ojalá invisible. No tinkering. Poderoso pero una vez configurado no falla. Manejado por agentes IA."
Constraint adicional: vivienda arrendada. Reversible everything, sin agujeros nuevos en paredes. Ver rental-constraints para el catálogo completo de qué cambia. Sweet spot: smart bulbs > smart switches, locks retrofit > replacement, battery cameras magnetic > wired, smart plugs > whole-house meter, MoCA/Powerline/mesh > Ethernet drops.
Arquitectura recomendada¶
HA Yellow (essentials, no se toca)
├── HAOS + HA Core (luces críticas, calefacción, seguridad)
├── Z2M add-on (Zigbee mesh actual)
└── Snapshots automáticos a NAS
Mini-PC (todo lo demás, donde vive el future)
├── Debian + Docker Compose
├── HA Container (twin / experimental / canary)
├── Prometheus + Loki + Grafana + Gatus (observability)
├── Agente AI (Claude Code + MCP + cron)
└── Repo git (Ansible + Compose + configs)
Por qué esa partición: install-method-decision-2026 + self-healing-adapted-to-user-setup.
Decisiones cerradas¶
| Decisión | Recomendación | Justificación |
|---|---|---|
| Install method essentials | HAOS Yellow (status quo) | ha-install-methods-2026 — HAOS soportado long-term, snapshots nativos, low-tinkering. |
| Install method experimental | HA Container en mini-PC | Control total, IaC-friendly, twin role. |
| k8s | OUT, definitivo | self-healing-adapted-to-user-setup — agrega tinkering sin retorno. |
| Stack Zigbee | Z2M (status quo) | zha-vs-z2m-2026 — migrar costs > beneficios. |
| Matter | Selectivo en devices nuevos | matter-vs-zigbee-2026 — no migrar lo que funciona; adoptar para federación cross-vendor (locks). |
| BLE | ESPHome BLE Proxies distribuidos (no native HA radio alone) | ../entities/bluetooth-le — para retrofit (SwitchBot) y devices nicho. |
| Voice assistants locales | OUT of scope | (no del wiki) — el usuario no lo pidió. |
| Stack observabilidad | Prometheus + Loki + Grafana + Gatus | q5-observability-stack-v1 — sin self-tinkering. |
| Stack agentes | Claude Code + ha-mcp + cron (opción 1) | q10-ai-tooling-strategy-v1 — empezar liviano; escalar a OpenClaw si valida. |
| IaC | Ansible (host) + Docker Compose pinned + git (configs) | q3-iac-strategy-v1 — sin Terraform, sin GitOps tools complejos. |
| Testing | 5 capas: static → unit → twin → smoke → multi-agent quarterly | q4-testing-strategy-v1. |
| Sensores nuevos | Local-first, Zigbee preferido, Matter selectivo, ESPHome para custom | sensor-recommendations-2026. |
Plan de 90 días (concreto)¶
Mes 1 — Foundation¶
| Semana | Tareas |
|---|---|
| 1 | Crear repo git. Committear config actual del Yellow. Setup .gitignore para secrets. Setup gaps.md y docs/inventory.md propios. |
| 2 | Bootstrap mini-PC: Debian fresh + Ansible inventory + Docker Compose para Loki/Prometheus/Grafana/Gatus. Verify accessible from Yellow's network. |
| 3 | HA Container desplegado en mini-PC como twin (mirror del Yellow vía MQTT bridge read-only). Channel beta para canary. |
| 4 | Agente AI mes 1: solo lee + reporta a Telegram. Sin acciones. Validar diagnostics. |
Mes 2 — Observability + agente operativo¶
| Semana | Tareas |
|---|---|
| 5 | Promtail + HA log forwarding configured. Primer dashboard Grafana funcional. |
| 6 | Gatus con 5-10 essentials health checks. Alertas a Telegram con severity tiers. |
| 7 | Agente AI mes 2: perímetro autónomo = restart containers no-críticos + cleanup logs. Documentación obligatoria. |
| 8 | CI básico en GitHub Actions: yamllint + ha check-config. |
Mes 3 — Tests + auditoría AI¶
| Semana | Tareas |
|---|---|
| 9 | Unit tests pytest para 3-5 automations críticas. CI corre los tests. |
| 10 | Integration test via MQTT injection en twin para 1-2 escenarios. |
| 11 | Multi-agent review patron (5 agentes) configurado. Primera corrida quarterly. |
| 12 | Retrospectiva: ¿días sin intervención? ¿qué se rompió? Iteración de la estrategia. |
Compras recomendadas en próximos 6 meses — versión rental¶
- Mini-PC (~$200-400) — estante, sin drilling. Prerequisito.
- Smart bulbs Hue/IKEA (5-10 unidades, $10-25 c/u) — reemplazo directo, reversible. La inversión rental-friendly más alta-ROI.
- 3-4 ESPHome BLE proxies USB-powered ($5-30 c/u) — outlets existentes, no Ethernet.
- Smart lock retrofit ($150-300) — Aqara U200/U300 o Yale Linus — retrofit del thumb-turn interior, reversible.
- 2-3 cámaras battery WiFi magnetic mount ($60-100 c/u) — Reolink Argus 4, Eufy SoloCam. RTSP-friendly para Frigate.
- 5-10 smart plugs (Aqara, Shelly Plug US) — energy monitoring per-appliance + automation control. Reemplaza el sub-meter del panel.
- Wireless switches Aqara/IKEA ($15 c/u, los que necesites) — botones físicos para tus smart bulbs sin tocar wall switches.
- Sensors Zigbee battery (motion, door, leak, temp) — adhesive 3M VHB.
- (Opcional) Coordinator Zigbee de prueba ($30) — SONOFF Dongle-E — para testing.
- (Si extender network) Powerline o MoCA adapter ($60-120) — antes de instalar mesh adicional o Ethernet drops.
Adicionalmente en rental (si tu lease lo permite, ver caveats en rental-constraints): - Shelly Plus 1 / 1PM / 2PM behind-switch — modules dentro del gang box existente, switch físico no cambia, reversible en minutos. Más económico que smart bulbs en fixtures con muchos bulbs.
NO comprar en rental (irreversibles): wired outdoor cameras, EV charger 240V dedicado, Ethernet drops in-wall, audio in-wall, HVAC zoning con dampers.
Decision tuya, no del wiki (reversible si sabés lo que hacés y tu lease lo permite): Shelly EM/Pro 3EM en panel eléctrico para whole-house energy data — el usuario lo hizo en lease anterior sin problema. Considerar skill electrical + lease wording + jurisdicción. Si dudás, fallback es smart plugs per-appliance. Ver rental-constraints para detalle.
Pendientes que no se cerraron en este wiki¶
| Gap | Por qué | Próximo paso |
|---|---|---|
| Sendspin (mencionado en SOTOH 2026) | No clarificado qué es | Buscar source secundario. |
| Inventario real del usuario | No documentado | El usuario debería listar devices actuales en docs/inventory.md. |
Templates concretos de agent/playbooks/*.md por failure mode |
Catálogo identificado, ejecutables por hacer | Escribir cuando el agente se deploye. |
docs/critical-sensors.yaml schema con sensores reales |
Pattern identificado, lista falta | El usuario lo provee. |
| Linter para detectar automation loops pre-deploy | Gap mencionado en failure-mode-automation-loop | Buscar herramienta o construir. |
| Q6 (custom from-scratch) | Descartado | Ver q6-custom-from-scratch-evaluated. No re-abrir salvo criterios objetivos. |
Pendientes RESUELTOS en iteración expansion (17-23)¶
- ✅ Failure modes catalog: 7 entradas (stuck HAOS, hardware cutoff, Z2M coordinator, HACS broken, recorder bloat, sensor stale, automation loop).
- ✅ Q7 LLM en runtime: estrategia v1 escrita con patrón "AI propone, determinista valida".
- ✅ Q6 custom from-scratch: evaluado y descartado con criterios objetivos para reabrir.
- ✅ BLE pattern: ESPHome bluetooth_proxy documentado con hardware/config canónico.
- ✅ Coordinator backup automated: script bash + cron + retention listo para copiar.
- ✅ Drift detection: técnica completa con políticas por tipo de drift.
- ✅ Agent system prompt template: skills file ready-to-copy bajo
agent/prompts/system-skills.md.
Linkos a las páginas accionables¶
- install-method-decision-2026
- ha-upgrade-reliability-strategy
- self-healing-adapted-to-user-setup
- q10-ai-tooling-strategy-v1
- q5-observability-stack-v1
- q4-testing-strategy-v1
- q3-iac-strategy-v1
- matter-vs-zigbee-2026
- zha-vs-z2m-2026
- sensor-recommendations-2026
- failure-mode-stuck-haos-update-mechanism
- failure-mode-hardware-support-cutoff
Citas que cierran la idea¶
-
"Smart home invisible, no tinkering, agent-managed" — usuario, 2026-05-20.
-
"If it's not in Git, it doesn't exist." — ../concepts/everything-is-code.
-
"AI as Operator, Not Owner." — ../concepts/ai-as-operator.
-
"The AI layer is the force multiplier — it turns your monitoring from alert-and-wait into detect-diagnose-and-fix." — ../sources/madebynathan-self-healing-2026-02.