Gantry se lanza sigilosamente para ayudar a los científicos de datos a mantener actualizados los modelos de IA

Validio, una plataforma de calidad de datos con sede en Suecia, emerge del sigilo con $ 15 millones

La calidad de los datos se ha ido configurando como una parte destacada y cada vez más crítica del mundo de la ciencia de datos: las empresas están sentadas sobre una creciente cantidad de información, pero solo es útil si podemos confiar en que sea precisa y utilizable. Con ese fin, Validio, una startup que crea herramientas para mejorar y garantizar la calidad de los datos, específicamente con herramientas que permiten a los usuarios limpiar los datos almacenados en almacenes de datos y en otros lugares, así como en tiempo real, anuncia una ronda semilla para marcar su salida del sigilo. La empresa con sede en Estocolmo ha recaudado 15 millones de dólares, financiación que planea utilizar para el desarrollo de productos y negocios, I+D y para contratar más talento.

Lakestar, el VC con sede en Londres que realizó inversiones tempranas en empresas como Facebook y Airbnb, pero que se ha centrado en gran medida en respaldar nuevas empresas prometedoras fuera de Europa (también respaldó a Skype, Spotify, Revolut y muchos otros), lideró esta ronda, con J12 y varias personas de alto perfil también participan.

(La lista incluye al futbolista Zlatan Ibrahimović, la CMO de Snowflake Denise Persson, el cofundador de MongoDB Kevin Ryan, el cofundador de Neo4j Emil Eifrem, el jefe de producto de DeepMind Mehdi Ghissassi y Kim Fai Kok y Dara Gill del colectivo de ángeles Framtide.)

Al igual que muchas nuevas empresas en sigilo en estos días, Validio ha estado utilizando el tiempo desde que se fundó en 2019 para trabajar en silencio en su producto y al mismo tiempo registrar clientes para implementaciones en vivo. Sus clientes se encuentran entre los sospechosos habituales en el juego de big data: aquellos en marketing y comercio, empresas de seguridad e inteligencia empresarial. Validio no revela muchos nombres, pero señala algunos: Budbee y Babyshop en el espacio de comercio electrónico; la empresa de patinetes eléctricos Voi; y la startup de electricidad Tibber.

El desafío que Validio ha identificado y está abordando es uno que el director ejecutivo y cofundador, Patrik Liu Tran, dijo que encontró al principio de su vida laboral. Un genio de las matemáticas y la informática, se graduó de la escuela a los 16 años y también aceleró su tiempo en la universidad, y comenzó a trabajar en 2014/2015 cuando aún era un adolescente que consultaba empresas en proyectos de IA. Todavía era un esfuerzo incipiente en la mayoría de los lugares (francamente, todavía lo es), y uno de los grandes problemas, además de tener pocos en el campo preparados para ir a las empresas a trabajar en sus problemas, fue la falta de integridad y calidad en los datos que estaban tratando de usar en sus modelos de aprendizaje automático, dijo.

“En todas las empresas a las que asesoraba, lo que me llamó la atención fue la falta de confianza en los datos, tanto que la gente hacía muy poco con ellos, y no había herramientas realmente para ayudar con eso”, dijo en una entrevista. . Agregó que los primeros esfuerzos para identificar el problema y tratar de solucionarlo (como el proyecto de código abierto Great Expectations, creado por las personas que están detrás de Superconductive), fueron prometedores pero no se enfocan tanto en la información en tiempo real como datos en almacenes.

“Pero el aprendizaje automático operativo y el uso de datos en muchos casos residen fuera de los almacenes de datos, como en los lagos de datos y las transmisiones en tiempo real”, dijo.

Más allá de eso, generalmente dependen demasiado de las reglas que los ingenieros y los científicos de datos necesitan establecer y monitorear y modificar regularmente.

El enfoque de Validio es crear herramientas de código no exactamente bajas. “Estamos construyendo para ingenieros de datos. Es muy técnico”, dijo Tran, ligeramente sorprendido por mi pregunta al respecto. “Pero nos estamos enfocando en una experiencia de usuario fluida”.

Eso incluye el uso de aprendizaje automático y análisis estadístico para “enseñar” al sistema de un usuario a encontrar y responder más rápidamente a los datos que llegan a través de la canalización; conjuntos de reglas que se crean automáticamente para que los utilice un ingeniero o para complementar con reglas personalizadas; umbrales automatizados y capacidades de resolución automática, y más.

“Queremos que sea lo más fluido posible para que los ingenieros de datos hagan su trabajo”, agregó.

La empresa no tiene un conjunto más amplio de reglas que aplicar en toda la plataforma, pero lo ha creado para que se adapte a las organizaciones individuales.

“La ‘calidad de los datos’ es difícil de definir. Lo que es bueno para una empresa puede ser malo para otra”, dijo Tran. “Los datos nunca son perfectos y las empresas también deben comenzar a aceptar eso”. Pero la lista de sus inversores (incluidos algunos de los vinculados a nombres estratégicos) es una señal de que otros bien pueden estar cantando la misma melodía con ese tipo de pensamiento y cómo Validio está construyendo específicamente para abordar eso: herramientas para mejorar la calidad de los datos pero construidas para el mundo real.

Hay algunas otras empresas que han identificado el mercado de la calidad de los datos y están construyendo para abordarlo, incluido el creador de Great Expectations, Superconductive, que recaudó $ 40 millones a principios de este año; junto con pesos pesados ​​como microsoft, S.A.S. y Talend — pero por ahora, el enfoque de Validio parece estar tocando la fibra adecuada, lo suficiente como para expandir las apuestas en lo que aún es un espacio joven.

“A medida que los equipos de datos están cambiando cada vez más su enfoque hacia la calidad de los datos, creemos que Validio está en una posición única para convertirse en el próximo gran actor de software global de Europa”, señaló Stephen Nundy, socio de Lakestar, en un comunicado. “Validio ha construido su plataforma con una arquitectura única, que permite la gestión de la calidad de los datos en almacenes, lagos y flujos de datos, tanto en los datos reales como en los metadatos en tiempo real. Esperamos poder apoyar al equipo estelar de Validio en su camino hacia la construcción de un líder mundial en infraestructura de datos”.


Source link