Ya no soy un mero ser humano. Soy un conducto de realidad, un medio de mensajes. Sostengo un cuchillo en la mano y corto un pepino orgánico, agachándome para que el iPhone atado a mi frente capture mis diez dedos. Tiro las rodajas en un bol de ensalada y termino la grabación. En algún lado, un baby robot es un poquito más inteligente.
Esta fue mi existencia durante una semana completa el mes pasado, mientras realizaba recolección de datos desde la comodidad de mi departamento, enseñándoles a robots humanoides a lavar platos, doblar ropa y servir bebidas, entre otras tareas menores. Si los robots alguna vez van a vivir con nosotros y ayudar en la casa, necesitan desarrollar motricidad fina. Hice mis tareas domésticas con orgullo y, además, me alegré de hacer algo de dinero.
¿Qué es la "egocentric data" y por qué la demandan los labs de IA?

Los videos en primera persona, grabados con una cámara montada en la cabeza o el pecho, son una necesidad creciente a medida que más empresas intentan construir robots y mejorar sus modelos de IA. Aunque internet está lleno de videos scrapeables, los clips hiperespecíficos —como miles de primeros planos de manos sirviendo agua en un vaso sin derramar— son críticos para afinar máquinas en tareas del mundo real. Este estilo de grabación, llamado egocentric data en la industria, está en tan alta demanda que algunos inversionistas estiman que las principales empresas comprarán cientos de millones de horas a proveedores externos en los próximos años.
"Quiero que cada persona del planeta se grabe lavando los platos", dice Avi Patel, fundador de Kled, una marketplace de recolección de datos. "Eso va a hacer un robot que te asegure que nunca más tengas que lavar los platos". La recolección de datos egocéntricos ya crece en países como India, donde generalmente los trabajadores autónomos ganan en promedio USD 125 al mes, y estos gigs de video en primera persona ofrecen tarifas similares.
A medida que el interés crece, más empresas de recolección de datos buscan expandirse a Estados Unidos, como la app Tasks de DoorDash lanzada este año.
Kled: 300.000 usuarios y un umbral de 100 uploads
El momento de quiebre para Kled llegó cuando Patel posteó un video en X este año, mostrando un fragmento del archivo de video de la empresa. El clip superó los 4 millones de visualizaciones y los compradores de datos empezaron a saturar el teléfono de Patel. "Todo lab y modelo fundacional importante me contactó pidiendo datos", cuenta.
Los datos de entrenamiento de robots son solo una porción de lo que Kled recolecta de sus más de 300.000 usuarios; la mayoría del tiempo la startup paga por que la gente suba toda su galería de fotos como datos de entrenamiento. Los usuarios eligen, de una lista, qué tarea quieren grabar.
Elegí "sacar la basura" como mi primera misión de entrenamiento en Kled. Está marcada como pago medio. Me puse el smartphone en la cabeza y filmé mientras amarraba la bolsa de la basura y la escoltaba al contenedor del callejón.
Completé nueve tareas en Kled antes de darme cuenta que la app requiere subir 100 piezas de contenido antes de poder cobrar nada. Algo molesto, decidí subir más de 90 fotos de mis vacaciones del año pasado para alcanzar el umbral. Mientras esperaba el pago, pasé a otras plataformas. Kled, dice Patel, se retiró recientemente de Nigeria porque cerca del 95% de los uploads eran duplicados inútiles o fraudulentos.
Luel: USD 6,60 por hora y un fundador de 18 años
Luel paga a usuarios de todo el mundo por datos. Su fundador, William Namgyal, tenía solo 18 años cuando su empresa entró a Y Combinator este año. La plataforma no divide los trabajos por tipo de tarea: ofrece simplemente un listado Record Any Hands-On Activity From a First-Person Perspective que paga USD 6,60 por una hora de video. Para comparar, el salario mínimo federal en Estados Unidos es de USD 7,25 por hora.
Subí un video de cinco minutos lavando platos a Luel; un día después fue rechazado. "Sus manos no fueron visibles en suficientes frames", decía la explicación. Días después, Luel revirtió la decisión: aunque la visibilidad de manos fue de solo 83% en los frames muestreados, había cumplido el resto de los requisitos. Me hice 55 centavos más rico.
Waffle Video: USD 25 por hora y datasets a la medida
Waffle Video fue mi favorita de las tres plataformas. A diferencia de Kled y Luel, se enfoca solo en datos de video de entrenamiento, y las missions que vi en la app —como atar zapatos y servir líquidos— pagaban USD 25 por hora de video.
Cada dataset que los usuarios crean es construido a medida para las empresas que compran los datos, así que las missions de Waffle están disponibles solo por tiempo limitado. La app además ofrece a los gig workers ingresos recurrentes —esencialmente una sindicación— si sus videos son relicenciados a empresas adicionales.
Waffle procesa cada video del usuario a través de algo llamado MAPLE (Media Asset Processing and Labeling Engine). "Todo se chequea por copyright. Todo se etiqueta, anota y estructura para estar listo para la ingesta de entrenamiento de IA", dice Joshua Mesnik, cofundador y COO de 34 años de Waffle. Pasé 125 uploads aprobados en pocos días de trabajo, ganando USD 20 por mi esfuerzo.
El miedo del fundador y la realidad del gig worker
Namgyal, fundador de Luel, se preocupa por el futuro del trabajo, a pesar de operar una empresa que entrena robots que algún día podrían reemplazar a trabajadores humanos. "Mi mayor miedo es que el desempleo suba extremadamente alto, más de lo que ya está", dice. Ve a Luel y al gig work en general como una vía rápida para que la gente haga algo de dinero, no como una panacea.
Patel cuenta orgulloso que uno de los top earners de Kled es un camionero que gana USD 8.000 al mes filmando con su dashcam y subiendo fotos de baches. Pero la experiencia de este usuario es claramente un outlier. La mayoría de quienes envían datos para entrenamiento de modelos no hacen este tipo de plata, aunque el hambre por datos de entrenamiento de video parece casi sin fondo.




