Datasaur obtiene una inversión de $ 3,9 millones para construir una plataforma inteligente de etiquetado de aprendizaje automático

Datasaur obtiene una inversión de $ 3,9 millones para construir una plataforma inteligente de etiquetado de aprendizaje automático

A medida que el aprendizaje automático ha crecido, uno de los principales cuellos de botella sigue siendo etiquetar cosas para que la aplicación de aprendizaje automático comprenda los datos con los que está trabajando. Datasaur, miembro del lote de Y Combinator Winter 2020, anunció hoy una inversión de $ 3.9 millones para ayudar a resolver ese problema con una plataforma diseñada para equipos de etiquetado de aprendizaje automático.

El anuncio de financiación, que incluye una cantidad previa a la semilla de $ 1.1 millones del año pasado y $ 2.8 millones de semilla justo después de graduarse de Y Combinator en marzo, incluyó inversiones de Initialized Capital, Y Combinator y Greg Brockman, director de tecnología de OpenAI.

El fundador de la empresa, Ivan Lee, dice que ha estado trabajando en diversas capacidades relacionadas con la inteligencia artificial durante siete años. Primero, cuando su startup de juegos móviles, Loki Studios fue adquirida por Yahoo! en 2013, y Lee finalmente se trasladó al equipo de inteligencia artificial y, más recientemente, a Apple. Independientemente de la empresa, siempre veía un problema en la organización de equipos de etiquetado de aprendizaje automático, uno que sentía que estaba en una posición única para resolver debido a su experiencia.

“He gastado millones de dólares [in budget over the years] y pasé incontables horas recopilando datos etiquetados para mis ingenieros. Llegué a reconocer que esto era un problema en todas las empresas en las que he estado. Y simplemente estaban reinventando constantemente la rueda y el proceso. Entonces, en lugar de reinventar eso por tercera vez en Apple, mi compañía más reciente, decidí resolverlo de una vez por todas para la industria. Y es por eso que comenzamos Datasaur el año pasado ”, dijo Lee a TechCrunch.

Construyó una plataforma para acelerar el etiquetado de datos humanos con una dosis de IA, mientras mantiene a los humanos involucrados. La plataforma consta de tres partes: una interfaz de etiquetado, el componente de inteligencia, que puede reconocer cosas básicas, por lo que el etiquetador no identifica lo mismo una y otra vez, y finalmente un componente de organización del equipo.

Él dice que el área está caliente, pero hasta este punto ha involucrado principalmente soluciones de consultoría de etiquetado, que distribuyen el etiquetado a los contratistas. Señala la venta de Figure Eight en marzo de 2019 y a Scale, que obtuvo $ 100 millones el año pasado como ejemplos de otras nuevas empresas que intentan resolver este problema de esta manera, pero cree que su empresa está haciendo algo diferente al construir un software completo. solución basada

Actualmente, la empresa ofrece una solución en la nube y local, según los requisitos del cliente. Tiene 10 empleados con planes de contratar el próximo año, aunque no compartió un número exacto. Mientras lo hace, dice que ha estado trabajando con un socio de Investor Initialized para crear una cultura positiva e inclusiva dentro de la organización, y eso incluye conversaciones sobre la contratación de una fuerza laboral diversa a medida que construye la empresa.

“Siento que esto es solo el lenguaje estándar de los CEO, pero eso es algo que valoramos absolutamente en nuestro embudo superior para el proceso de contratación”, dijo.

A medida que Lee construye su plataforma, también se ha preocupado por el sesgo incorporado en los sistemas de IA y el impacto perjudicial que podría tener en la sociedad. Dice que ha hablado con clientes sobre el papel del etiquetado en el sesgo y las formas de combatirlo.

“Cuando hablo con nuestros clientes, les hablo sobre el potencial de sesgo de sus etiquetadoras y, dentro de nuestro producto, está la capacidad de asignar a varias personas al mismo proyecto. Y les explico a mis clientes que esto puede ser más costoso, pero por experiencia personal sé que puede mejorar dramáticamente los resultados para obtener múltiples perspectivas sobre los mismos datos exactos ”, dijo.

Lee cree que los humanos continuarán involucrados en el proceso de etiquetado de alguna manera, incluso cuando partes del proceso se vuelvan más automatizadas. “La propia naturaleza de nuestra existencia [as a company] siempre requerirá humanos en el circuito, […] y en el futuro, creo que es realmente importante que a medida que nos adentramos en más y más casos de uso de la inteligencia artificial, necesitaremos humanos para continuar educando e informando a la inteligencia artificial, y eso será una parte fundamental de cómo esta tecnología se desarrolla “.


Source link