Ya habíamos visto agentes de IA con un enfoque similar a OpenClaw orientados a plataformas ESP32, tales como Mimiclaw y PycoClaw, pero la compañía Espressif Systems ha lanzado de manera oficial su propio framework ESP-Claw destinado a la construcción de agentes de IA locales que son capaces de interactuar y ejecutar diversas acciones impulsadas por LLM directamente en dispositivos ESP32.

ESP-Claw permite a las placas de desarrollo ESP32 responder a eventos del entorno, trabajar con decisiones dinámicas impulsadas por LLM, retener contexto de forma útil y tomar acciones de manera totalmente local sin necesidad de mantener una conexión a la nube, a menos que sea estrictamente requerido. El agente puede controlar sensores y el estado del dispositivo, además de realizar acciones en el mundo real, como controlar una tira de luces LED RGB.

Framework ESP-Claw
Framework ESP-Claw

Algunos aspectos destacados de ESP-Claw incluyen:

  • Codificación por chat – Define el comportamiento del dispositivo mediante conversación natural. El LLM maneja decisiones dinámicas, y los scripts locales en Lua se ejecutan de forma determinista, incluso estando offline.
  • Tiempo de respuesta rápido – Los dispositivos reaccionan a eventos en tiempo real en lugar de hacer polling. Un bus de eventos local impulsa las reglas de Lua para sensores y disparadores, permitiendo respuestas con latencia de milisegundos con o sin conexión.
  • Plug and Play con MCP – ESP-Claw actúa tanto como Servidor y Cliente MCP, exponiendo el hardware a los agentes mientras llama a servicios externos.
  • Memoria privada en el chip – La memoria estructurada a largo plazo reside en el chip. Las preferencias y rutinas se extraen automáticamente de las conversaciones y los eventos nunca salen del dispositivo.
Demo inicial en chino con traducción al inglés de Espressif Systems.
Demo inicial en chino con traducción al inglés de Espressif Systems.

El sitio web del proyecto presenta varias demostraciones para controlar una tira de LED RGB, crear un juego para inflar globos soplando en un micrófono, operación online/offline, y más. También hay un tutorial detallado para comenzar. Ten en cuenta que ESP-Claw requiere al menos 8MB de Flash y 8MB de PSRAM, y actualmente solo soporta el microcontrolador ESP32-S3, pero el soporte para ESP32-P4 llegará pronto. Todo lo que necesitas hacer es conseguir una placa compatible, una protoboard y algunos componentes electrónicos, y flashear el firmware a través del Web Flasher, o si lo prefieres, puedes compilarlo desde el código fuente.

Configuración de hardware para el tutorial de ESP-Claw
Configuración de hardware para el tutorial de ESP-Claw

ESP-Claw soporta aplicaciones de mensajería como Telegram, QQ Bot, Feishu y WeChat ClawBot, así como Tavily para búsquedas web si es necesario. También necesitarás configurar un LLM, y las opciones actuales son OpenAI, Qwen, ChatGPT y "Custom" para usuarios avanzados. Una vez que todo esté configurado, puedes controlar la placa ESP32-S3 a través de tus aplicaciones de mensajería.

Fuentes de eventos y objetivos de acción
Fuentes de eventos y objetivos de acción

La demostración en video a continuación genera automáticamente el código para un efecto de arcoíris en una tira de LED RGB con 40 LEDs conectada al IO 14. La empresa propiedad de Espressif, M5Stack, también publicó su propio video de demostración de ESP-Claw para el hardware StickS3 y CoreS3.

Vía CNX Software.