La generación de video con IA es impresionante a nivel técnico, pero escribir un prompt en una caja de texto no se siente exactamente como trabajo creativo. El diseñador de interacción Hun Han se preguntó cómo hacer esa experiencia más colaborativa y terminó construyendo algo bastante notable: la caja Hush.

Hush es una lightbox pequeña y cerrada para fotografía. El usuario posa objetos inanimados dentro, los que se le ocurran (figuras de acción, modelos de arcilla, plantas), y cierra la tapa. Ahí ocurre la magia: Hush saca una foto de la escena dentro de la caja y la usa como prompt para un modelo de generación de video.

Render generado por Hush con objetos reales
Render generado por Hush con objetos reales

El resultado suele ser fantástico. Los modelos de IA están en un punto donde generan video realista de buena calidad, y en este caso ese video realista incorpora los objetos del mundo real puestos en la caja. Imaginate tus minifiguras de LEGO peleando contra un dragón de arcilla que vos esculpiste: exactamente ese tipo de video es el que Hush produce. Sos parte del proceso creativo eligiendo qué poner en la caja y cómo acomodarlo, además de controlar parámetros como el clima simulado y si la escena ocurre de día o de noche.

¿Cómo está construido?

El stack combina hardware accesible con servicios de IA en la nube:

  • Generación de video: Kling v2.5 Turbo hace el trabajo pesado, expuesto vía la API de Replicate AI.
  • Controlador físico: una placa Arduino conecta el dial de selección de clima y el sensor Hall que detecta el cierre de la tapa al PC. La misma placa controla las tiras LED que iluminan el interior de Hush.
  • Captura: el PC saca la foto de la escena con OpenCV y una webcam.
  • Display: el video renderizado se muestra en un iPhone 6 reciclado, visible a través de una mirilla en la parte superior de la caja.
Vista interior de Hush con iluminación LED y mirilla superior
Vista interior de Hush con iluminación LED y mirilla superior

¿Por qué importa?

Cuando se trata de fantasía y entretenimiento, esta podría ser una de las mejores aplicaciones recientes de IA generativa que circulan. La pieza es interesante para makers porque demuestra que combinar electrónica de hobby (Arduino, sensor Hall, tira LED, webcam USB) con APIs comerciales de generación de video puede producir interacciones físicas que no se sienten como "tipear un prompt". El proyecto está documentado en el sitio personal de Hun Han.