Los equipos de ciencia de datos se ven obstaculizados por la desorganización en sus empresas, lo que afecta los esfuerzos para implementar proyectos de inteligencia artificial y análisis oportunos. En una reciente encuesta de los “ejecutivos de datos” en empresas con sede en EE. UU., el 44 % dijo que no habían contratado a suficientes empleados, que estaban demasiado aislados para ser eficaces y que no se les habían asignado funciones claras. Los encuestados dijeron que lo que más les preocupaba era el impacto de una pérdida de ingresos o un impacto en la reputación de la marca debido a la falla de los sistemas de IA y una tendencia hacia inversiones ostentosas con beneficios a corto plazo.
Estos son, en última instancia, desafíos organizativos. Pero Piero Molino, cofundador de la plataforma de desarrollo de IA Predibasedice que las herramientas inadecuadas a menudo los exacerban.
“Los principales desafíos que vemos hoy en la industria son que los proyectos de aprendizaje automático tienden a tener un tiempo de valor prolongado y un acceso muy bajo en toda la organización. Como resultado, la mayoría de las tareas de aprendizaje automático en una organización tienen cuellos de botella en un equipo de ciencia de datos centralizado con exceso de solicitudes”, dijo Molino a TechCrunch por correo electrónico. “Dados estos desafíos, las organizaciones de hoy deben elegir entre dos enfoques defectuosos cuando se trata de desarrollar el aprendizaje automático. Pueden crear sus propios sistemas desde los datos hasta la implementación utilizando API de bajo nivel que les brindan la flexibilidad que las tareas de aprendizaje automático normalmente requieren a costa de la complejidad. O pueden optar por utilizar una solución ‘AutoML’ lista para usar que simplifica su problema a expensas de la flexibilidad y el control”.
De hecho, mientras que el gasto mundial en tecnologías de IA fue estimado con $ 35.8 mil millones en 2019, casi el 80% de las empresas han visto estancados sus proyectos de IA como resultado de problemas con la calidad de los datos y la falta de confianza en los sistemas de IA, según Alegion reporte. Como empresario (y vendedor), Molino afirma que su producto, Predibase, es una solución a esto, o al menos un paso hacia una.
Predibase, que hoy salió de la clandestinidad con 16,25 millones de dólares en financiación de la Serie A liderada por Greylock con la participación de Factory e inversores ángeles, permite al usuario especificar un sistema de IA como un archivo que le dice a la plataforma lo que quiere el usuario (p. ej., reconocer objetos en una imagen) y descubre una manera de satisfacer esa necesidad. Molino lo describe como un enfoque “declarativo” para el desarrollo de IA, tomando prestado un término de la informática que se refiere al código escrito para describir lo que un desarrollador desea lograr.
“Los proyectos de aprendizaje automático de hoy suelen tardar de seis meses a un año en la mayoría de las organizaciones con las que hemos trabajado. Queremos reducir drásticamente eso [by bringing] una herramienta de aprendizaje automático de código bajo pero de techo alto para las organizaciones”, continuó Molino. “Por lo general, la mayoría de las empresas se ven obstaculizadas por los recursos de ciencia de datos, lo que significa que los equipos de productos y analistas están bloqueados por un recurso escaso y costoso. Con Predibase, hemos visto a ingenieros y analistas construir y poner en funcionamiento modelos directamente”.
Predibase se basa en tecnologías de código abierto que incluyen Horovod, un marco para el entrenamiento de modelos de IA, y Ludwig, un conjunto de herramientas de aprendizaje automático. Ambos se desarrollaron originalmente en Uber, que hace varios años hizo la transición de la gobernanza de los proyectos al Fundación Linux.
Molino, quien se unió a Uber a través de la adquisición de la empresa emergente Geometric Intelligence, ayudó a crear Ludwig en 2019. El otro cofundador de Predibase, Travis Addair, fue el encargado principal de mantenimiento de Horovod mientras trabajaba como ingeniero de software sénior en Uber.
Para lanzar Predibase, Molino y Addair se asociaron con el ex gerente de productos de IA de Google Cloud, Devvret Rishi, y el profesor de informática de Stanford, Chris Ré, uno de los cofundadores de Lattice.io, una empresa de aprendizaje automático y minería de datos que Apple compró en 2017.
Predibase está diseñado para permitir a los desarrolladores definir canalizaciones de IA en solo unas pocas líneas de código mientras se amplía a petabytes de datos en miles de máquinas. Como lo explica Molino, usando la plataforma, un usuario puede crear un sistema de IA de análisis de texto en seis líneas de código que especifica los datos de entrada y salida. Si quieren iterar y personalizar ese sistema, Predibase les permite agregar parámetros en el archivo de configuración que ofrece un nivel de control más granular.
Predibase se integra con fuentes de datos que incluyen Snowflake, Google BigQuery y Amazon S3 para el entrenamiento de modelos. Los usuarios pueden entrenar modelos a través de la plataforma o mediante programación, según el caso de uso, y luego hospedar y servir o implementar esos modelos en entornos de producción locales.
“Además de reducir el tiempo de generación de valor, Predibase permite a los usuarios trabajar con diferentes modalidades de datos utilizando el mismo conjunto de herramientas. Con Predibase, hemos visto a los usuarios entrenar modelos en imágenes para clasificación, datos de texto como correos electrónicos para clasificación, datos tabulares para tareas de detección y regresión, e incluso conjuntos de datos de audio que habrían requerido una gran sofisticación interna sin las capacidades nativas en el plataforma”, dijo Molino. “Para muchos que trabajan en este espacio, Predibase proporciona una nueva capacidad neta al abordar casos de uso en datos no estructurados”.
En términos generales, las plataformas de desarrollo sin código están en el subiry varias empresas emergentes compiten directamente con Predibase, incluida la empresa emergente de orquestación de IA Union.ai y la plataforma de ingeniería de datos de bajo código Prophecy (sin mencionar SageMaker y IA de vértice). Pero la opinión de Molino es que, si bien los rivales satisfacen la demanda de soluciones simples en la empresa, lo hacen a costa de la flexibilidad, lo que lleva a los clientes a “tocar un techo y agotarse”.
“[L]Al igual que la infraestructura como TI de código simplificado, nuestra plataforma permite a los usuarios centrarse en el ‘qué’ de sus modelos en lugar del ‘cómo’, lo que les permite liberarse de los límites habituales de los sistemas de código bajo mediante una configuración ampliable… Proporcionamos modelo explicabilidad lista para usar para que los usuarios puedan entender qué características están impulsando las predicciones”, dijo. “[Our platform] se ha utilizado en empresas Fortune 500 como una empresa tecnológica líder de EE. UU., un gran banco nacional y una gran empresa de atención médica de EE. UU.”.
El lanzamiento impresionó lo suficiente a ángeles como el CEO de Kaggle, Anthony Goldbloom, y el ex COO de Intel AI, Remi El-Ouazzane, quienes invirtieron. Otros patrocinadores notables incluyen Kaggle CTO Ben Hamner y Zoubin Ghahramani, profesor de ingeniería de la información en Cambridge y científico investigador senior en Google Brain.
Molino dice que el capital fresco de la Serie A se utilizará para llevar el producto beta de Predibase a un mercado más amplio; actualmente es solo por invitación. También se destinará al crecimiento del equipo de ingenieros de aprendizaje automático de Predibase y la creación de una organización de comercialización, ampliando el equipo de 21 personas de la empresa.
Source link