u/Novel_Sky5264

Hay una palabra que aparece constantemente en las conversaciones sobre IA y el mundo físico: intención.

Decimos cosas como "la IA entendió mi intención" o "quiero que el sistema infiera el contexto". Pero cuando te sentas a construir algo real, una casa inteligente, un edificio automatizado, una fábrica, descubrís rápido que la mayoría de los protocolos no tienen el concepto de intención, tienen comandos. Y esa diferencia, que parece pequeña, es arquitectónica y cambia todo.

El modelo de comandos

Todos los protocolos de domótica que existen hoy fueron diseñados alrededor de un supuesto: un humano decide qué hacer, una app traduce esa decisión en una instrucción específica, y el dispositivo la ejecuta.

Humano → App → Comando → Dispositivo
lock.unlock()
light.set_brightness(80)
thermostat.set_temperature(21)

Funciona perfecto cuando el humano está en el loop. El problema empieza cuando lo sacás.

Lo que un agente de IA realmente produce

Cuando un sistema de IA observa el mundo, una cámara detectando una caída, un sensor registrando temperatura anormal, un modelo infiriendo que no hay nadie en casa, no produce un comando, produce una comprensión de una situación*: "Hay una emergencia"* "La persona que vive acá llegó a casa" "Algo está mal con la heladera".

Estos no son comandos, son descripciones semánticas del estado del mundo.

Para traducir esto a comandos de dispositivos, alguien tiene que escribir esa traducción manualmente, de antemano, para cada situación posible, para cada combinación de dispositivos. Si te olvidás un caso, el sistema no hace nada. Agregás un dispositivo nuevo y reescribís las reglas.

Este es el problema de la traducción. Y solo se hace visible cuando intentás agregar IA a un sistema físico.

Una intención semántica: un contrato diferente

Una intención semántica es una expresión estructurada de un objetivo, qué necesita lograrse, sin especificar cómo lograrlo.

Comparación:

json

// Comando (protocolos actuales)
{
  "device": "lock-frontdoor-01",
  "command": "unlock",
  "duration": 300
}

// Intención semántica
{
  "intent": "ensure_safety",
  "urgency": "emergency",
  "context": {
    "trigger": "fall_detected",
    "location": "dormitorio"
  }
}

El comando dice: desbloqueá esta cerradura específica por 5 minutos. La intención dice: hay una emergencia de seguridad en el dormitorio.

La diferencia no es solo sintáctica, es sobre quién tiene el conocimiento.

En el modelo de comandos, el conocimiento de qué dispositivos activar y cómo vive en la app, o en el motor de reglas, o en el código que alguien escribió el año pasado. Ese conocimiento es estático. No se adapta a nuevos dispositivos ni a nuevos escenarios.

En el modelo de intenciones, ese conocimiento vive en los propios dispositivos, en lo que declaran que pueden hacer. El sistema arma la respuesta en tiempo de ejecución, basándose en lo que está disponible.

Por qué esto importa más allá del hogar

El problema de la traducción no es exclusivo de la domótica. Aparece en cualquier lugar donde un sistema de IA necesite coordinar dispositivos físicos en respuesta a eventos del mundo real.

Una línea de fábrica detecta una anomalía en un componente crítico. La IA sabe que algo está mal. Con protocolos de comandos, un ingeniero tuvo que anticipar ese escenario exacto de antemano y escribir la respuesta. Si no lo hizo, el sistema no hace nada. Con un modelo de intenciones, cada dispositivo declara sus capacidades y el sistema coordina una respuesta adecuada, sin reglas pre-escritas para ese caso específico.

La misma lógica aplica a edificios inteligentes, hoteles, cualquier entorno donde la IA necesite actuar sobre el mundo físico.

El cambio más profundo

En el modelo de comandos, la IA es un control remoto. Conoce la secuencia exacta de botones a presionar. Se rompe cuando cambia un dispositivo, cuando aparece uno nuevo, o cuando no se anticipó un escenario.

En el modelo de intenciones, la IA es un coordinador. Expresa qué necesita pasar. Los dispositivos resuelven su rol. El sistema es resiliente al cambio porque el conocimiento está distribuido.

Esta no es una diferencia pequeña. Es la diferencia entre construir un sistema que funciona hoy y uno que puede crecer.

I built an open protocol called **DoSync** that solves a specific architectural problem: AI agents speak in goals, but every IoT protocol speaks in commands.

When an AI detects a fall, it knows there's an emergency. It doesn't know it needs to call `lock.unlock()` + `alarm.activate()` + `phone.call("911")`. Someone has to write that translation — manually, per device, per scenario. DoSync removes that layer entirely.

How it works:

Instead of commands, you fire a semantic intent:

```json

{ "intent": "ensure_safety", "urgency": "emergency" }

```

Every registered device reads its own Capability Manifest and decides its role automatically. No rules to write. Add a new device and it participates in every relevant scenario without any configuration.

What's running today (not a mockup):

- Raspberry Pi 5 running the hub 24/7

- 10 Philips WiZ bulbs controlled via UDP

- PIR motion sensor → fires emergency intent in real time

- SMS notifications via Twilio

- Home Assistant bridge (38 devices registered)

- Native MCP server — Claude and ChatGPT can control it directly

- TLS/mTLS with local PKI (Layer 2 of the spec)

- Resolver benchmark: p99 < 0.11ms on 38 real devices

Not just for the home. The same 5-layer architecture works in hospitals, hotels, factories — anywhere an AI needs to coordinate physical systems.

Demo video: https://youtu.be/2czAqoIrd08

GitHub: https://github.com/giulianireg-spec/dosync-protocol

Apache 2.0 — free to implement, extend, no royalties. Feedback and adapter implementations welcome.

La diferencia arquitectónica que nadie menciona cuando conectan IA a dispositivos físicos

DoSync — open protocol that lets AI agents control physical devices using semantic intent (Apache 2.0)