Galileo emerge del sigilo para agilizar el desarrollo de modelos de IA

A medida que el uso de la IA se vuelve más común en toda la empresa, aumenta la demanda de productos que faciliten la inspección, el descubrimiento y la corrección de errores críticos de la IA. Después de todo, la IA es costosa: Gartner predicho en 2021 que un tercio de los proveedores de tecnología invertirían $ 1 millón o más en IA para 2023, y la depuración de un algoritmo que salió mal amenaza con inflar el presupuesto de desarrollo. Un Gartner separado reporte descubrió que solo el 53 % de los proyectos pasan de los prototipos a la producción, presumiblemente debido en parte a errores, una pérdida sustancial, si se sumara el gasto total.

Harto de la alta tasa de fallas y del hecho de que las tareas menores (si son importantes) de preparación de datos, como cargar y limpiar datos, quieto ocupan la mayor parte del tiempo de los científicos de datos: Vikram Chatterji, Atindriyo Sanyal y Yash Sheth cofundaron galileo, un servicio diseñado para actuar como un sistema colaborativo de registro para el desarrollo de modelos de IA. Galileo monitorea los procesos de desarrollo de IA, aprovechando algoritmos estadísticos para identificar puntos potenciales de falla del sistema.

“No había herramientas de datos de aprendizaje automático especialmente diseñadas en el mercado, por lo que [we] inició Galileo para construir la pila de herramientas de datos de aprendizaje automático, comenzando con una [specialization in] datos no estructurados”, dijo Chatterji a TechCrunch por correo electrónico. “[The service] ayuda a los equipos de aprendizaje automático a mejorar sus conjuntos de datos… al mostrar cohortes críticas de datos que pueden estar subrepresentados o ser erróneos, al mismo tiempo que es una solución integral para alentar a los científicos de datos a realizar un seguimiento proactivo de los cambios de datos en la producción y mitiga los errores y las brechas en sus modelos por fugas al mundo real.”

Chatterji tiene experiencia en ciencia de datos, ya que trabajó en Google durante tres años como gerente de producto en el equipo de Android. Sanyal era ingeniero de software sénior en Apple, centrándose principalmente en productos relacionados con Siri, antes de convertirse en líder de ingeniería en el equipo de inteligencia artificial de Uber. En cuanto a Sheth, también trabajó en Google como ingeniero de software del personal, administrando Google Reconocedor de voz plataforma.

Con Galileo, que hoy salió de la clandestinidad con 5,1 millones de dólares en financiación inicial, Chatterji, Sanyal y Sheth se propusieron crear un producto que pudiera adaptarse a todo el flujo de trabajo de IA, desde el predesarrollo hasta la posproducción, así como a modalidades de datos como texto, habla y visión. Disponible en versión beta privada y diseñado para implementarse en un entorno local, Galileo tiene como objetivo sistematizar las canalizaciones entre los equipos mediante “registradores automáticos” y algoritmos que detectan problemas que rompen el sistema.

Encontrar estos problemas es a menudo un punto de dolor importante para los científicos de datos. Según uno reciente encuesta (de MLOps Community), el 84,3 % de los científicos de datos y los ingenieros de aprendizaje automático dicen que el tiempo necesario para detectar y diagnosticar problemas con un modelo es un problema para sus equipos, mientras que más de uno de cada cuatro (26,2 %) admite que les lleva una semana o más para detectar y solucionar problemas.

“La discusión sobre el aprendizaje automático dentro de la empresa ha cambiado de ‘¿Para qué uso esto?’ a ‘¿Cómo puedo hacer que mis flujos de trabajo de aprendizaje automático sean más rápidos, mejores y más baratos?’”, dijo Chatterji. “Galileo… impone el rigor necesario y la aplicación proactiva de técnicas respaldadas por la investigación en cada paso del camino en la producción de modelos de aprendizaje automático… [It] conduce a una mejora de orden de magnitud en la forma en que los equipos lidian con la tarea desordenada y aburrida de mejorar sus conjuntos de datos de aprendizaje automático”.

Galileo encaja en la práctica emergente de MLOps, que combina aprendizaje automático, DevOps e ingeniería de datos para implementar y mantener modelos de IA en entornos de producción. El mercado de servicios MLOps podría alcanzar los $4 mil millones para 2025, por uno Estimacione incluye nuevas empresas como Databricks, DataRobot, Algorithmia e titulares como Google Cloud y Amazon Web Services.

Si bien el interés de los inversores en MLOps va en aumento, el efectivo no se traduce necesariamente en éxito. Incluso las mejores plataformas de MLOps actuales no pueden resolver todos los problemas comunes asociados con los flujos de trabajo de IA, especialmente cuando los ejecutivos de negocios no pueden cuantificar el retorno de la inversión de estas iniciativas. La encuesta de la comunidad de MLOps encontró que convencer a las partes interesadas cuando un nuevo modelo es mejor, por ejemplo, sigue siendo un problema “al menos a veces” para más del 80 % de los profesionales del aprendizaje automático.

Chatterji señala la inversión del CEO de Kaggle, Anthony Goldbloom, en Galileo (Goldbloom codirigió la ronda inicial con The Factory) como una señal de la diferenciación de la empresa. Chatterji dice que Galileo actualmente tiene “docenas” de clientes que pagan, que van desde compañías Fortune 500 hasta nuevas empresas en etapa inicial, ingresos que Galileo planea aprovechar para triplicar el tamaño de su equipo de 14 personas para fin de año.

“Galileo se ha centrado en dar la vuelta a la laboriosa tarea de inspección de datos de aprendizaje automático, para que sea más fácil y proporcione conocimientos de datos inteligentes rápidamente”, dijo Chatterji. “El usuario solo tiene que agregar unas pocas líneas de código”.

Hasta la fecha, Galileo ha recaudado $5,5 millones en capital de riesgo total.

Source link