A medida que ha crecido el aprendizaje automático, uno de los principales cuellos de botella sigue siendo el etiquetado de las cosas para que la aplicación de aprendizaje automático comprenda los datos con los que está trabajando. datasaurio, miembro del lote Y Combinator Winter 2020, anunció hoy una inversión de $ 3.9 millones para ayudar a resolver ese problema con una plataforma diseñada para equipos de etiquetado de aprendizaje automático.
El anuncio de financiación, que incluye una cantidad previa a la inicialización de $1,1 millones del año pasado y una inicialización de $2,8 millones justo después de graduarse de Y Combinator en marzo, incluyó inversiones de Initialized Capital, Y Combinator y el CTO de OpenAI, Greg Brockman.
El fundador de la empresa, Ivan Lee, dice que ha estado trabajando en varios puestos relacionados con la IA durante siete años. Primero, cuando Yahoo! adquirió su startup de juegos móviles, Loki Studios. en 2013, y Lee finalmente fue trasladado al equipo de IA y, más recientemente, a Apple. Independientemente de la empresa, constantemente vio un problema en la organización de equipos de etiquetado de aprendizaje automático, uno que sintió que estaba en una posición única para resolver debido a su experiencia.
“He gastado millones de dólares [in budget over the years] y pasé innumerables horas recopilando datos etiquetados para mis ingenieros. Llegué a reconocer que esto era un problema en todas las empresas en las que he estado. Y simplemente estaban reinventando constantemente la rueda y el proceso. Entonces, en lugar de reinventar eso por tercera vez en Apple, mi empresa más reciente, decidí resolverlo de una vez por todas para la industria. Y es por eso que comenzamos Datasaur el año pasado”, dijo Lee a TechCrunch.
Creó una plataforma para acelerar el etiquetado de datos humanos con una dosis de IA, mientras mantenía a los humanos involucrados. La plataforma consta de tres partes: una interfaz de etiquetado; el componente de inteligencia, que puede reconocer cosas básicas para que el etiquetador no identifique lo mismo una y otra vez; y finalmente un componente de organización de equipos.
Él dice que el área está caliente, pero hasta este punto se ha involucrado principalmente en soluciones de consultoría de etiquetado, que subcontratan el etiquetado a los contratistas. Señala la venta de Figure Eight en marzo de 2019 y Scale, que obtuvo $ 100 millones el año pasado como ejemplos de otras nuevas empresas que intentan resolver este problema de esta manera, pero cree que su empresa está haciendo algo diferente al construir un software completo. solución basada.
Actualmente, la empresa ofrece una solución en la nube y local, según los requisitos del cliente. Tiene 10 empleados, con planes de contratar en el próximo año, aunque no compartió un número exacto. Mientras lo hace, dice que ha estado trabajando con un socio del inversor Initialized en la creación de una cultura positiva e inclusiva dentro de la organización, y eso incluye conversaciones sobre la contratación de una fuerza laboral diversa a medida que construye la empresa.
“Siento que esto es solo el discurso estándar de un CEO, pero eso es algo que valoramos absolutamente en nuestro embudo para el proceso de contratación”, dijo.
A medida que Lee desarrolla su plataforma, también le preocupan los sesgos incorporados en los sistemas de IA y el impacto perjudicial que podría tener en la sociedad. Dice que ha hablado con clientes sobre el papel del etiquetado en el sesgo y las formas de combatirlo.
“Cuando hablo con nuestros clientes, les hablo sobre el posible sesgo de sus etiquetadores y nuestro producto está integrado en la capacidad de asignar varias personas al mismo proyecto. Y les explico a mis clientes que esto puede ser más costoso, pero por experiencia personal sé que puede mejorar los resultados dramáticamente para obtener múltiples perspectivas sobre exactamente los mismos datos”, dijo.
Lee cree que los humanos seguirán estando involucrados en el proceso de etiquetado de alguna manera, incluso cuando partes del proceso se vuelvan más automatizadas. “La naturaleza misma de nuestra existencia [as a company] siempre requerirá humanos en el circuito, […] y en el futuro, creo que es muy importante que a medida que nos adentremos en más y más casos de uso prolongado de la IA, necesitaremos humanos para continuar educando e informando a la IA, y eso será una parte crítica de cómo esta tecnología se desarrolla.”
Source link