¿Aún pasas horas escribiendo firmware para tus proyectos de sistemas embebidos? Si usas un microcontrolador ESP32, es posible que ya no lo necesites, al menos en algunos casos. Espressif acaba de lanzar ESP-Claw, un framework de agente de IA para programar dispositivos IoT mediante chat. Simplemente flasheas el firmware de ESP-Claw en tu placa de desarrollo y la conectas a cualquier hardware adicional que necesites, luego envías un mensaje a ESP-Claw a través de una aplicación de mensajería como Telegram explicando cómo debería funcionar. En cuestión de segundos, simplemente funciona.

Los usuarios pueden definir el comportamiento del dispositivo mediante lenguaje natural, y el sistema genera dinámicamente scripts en Lua para controlar hardware como tiras LED, pantallas o motores. Una vez validados, esos scripts pueden almacenarse localmente, asegurando un funcionamiento confiable incluso sin conexión a los Large Language Models (LLMs) que los crearon. Este modelo híbrido —lógica generada por LLM combinada con ejecución determinista en Lua— ofrece tanto flexibilidad como estabilidad.

ESP-Claw está construido sobre una arquitectura orientada a eventos. En lugar de esperar comandos explícitos del usuario, los dispositivos pueden reaccionar de manera proactiva a disparadores del mundo real, como lecturas de sensores o eventos del sistema. Para aplicaciones sensibles al tiempo, las reglas locales se ejecutan en milisegundos, eludiendo cualquier necesidad de interacción con la nube. Si no aplica ninguna regla, el sistema puede escalar a un modelo de IA para un análisis más profundo o incluso descargar tareas complejas como el reconocimiento de imágenes.

A diferencia de los típicos asistentes de IA que pierden el contexto entre sesiones, ESP-Claw organiza los datos a largo plazo en categorías como preferencias del usuario, eventos del dispositivo y reglas de comportamiento. Estos se almacenan localmente con un etiquetado ligero, lo que permite al sistema recuperar el contexto relevante de manera eficiente sin la pesada carga de una base de datos. Con el tiempo, el dispositivo puede identificar patrones y sugerir nuevas automatizaciones.

La interoperabilidad se aborda a través de MCP, un protocolo unificado que permite a los dispositivos ESP-Claw actuar tanto como clientes como servidores. Esto habilita la comunicación directa entre dispositivos, servicios de software y herramientas en la nube sin depender de estándares fragmentados. Las capacidades de hardware se exponen como "herramientas" amigables para la IA, lo que facilita que los agentes comprendan e interactúen con los sistemas físicos.

Con el flasheo basado en el navegador, componentes modulares y soporte para periféricos comunes como cámaras y micrófonos, comenzar es sencillo. Los desarrolladores pueden extender la funcionalidad a través de componentes reutilizables, mientras que los principiantes pueden experimentar con el control interactivo basado en chat. Si te gustaría aprender más, hay mucha documentación disponible.

Vía Hackster.io.