Cada vez más, las conversaciones sobre big data, aprendizaje automático e inteligencia artificial van de la mano con conversaciones sobre privacidad y protección de datos. Ahora, una startup que está creando herramientas para facilitar que los ingenieros implementen los dos simultáneamente está anunciando una ronda de financiamiento de crecimiento para continuar expandiendo sus operaciones.
Gretel AI, que permite a los ingenieros crear conjuntos de datos sintéticos anónimos basados en sus conjuntos de datos reales para usar en sus análisis y para entrenar modelos de aprendizaje automático, ha cerrado $ 50 millones en fondos, una Serie B que utilizará para llevar a la empresa a la siguiente etapa. de desarrollo. El producto, que está construido como un producto SaaS pero también se puede acceder a través de API, aún está en versión beta, pero apunta a estar abierto a disponibilidad general a finales de este año.
Anthos Capital lidera la ronda con la Sección 32 también participando junto a Greylock y Moonshots Capital. Greylock lideró la ronda anterior de la compañía en 2020, y la puesta en marcha ha recaudado 65,5 millones de dólares hasta la fecha.
Por lo que entendemos, esta última ronda sitúa la valoración de la empresa entre 320 y 350 millones de dólares.
La idea detrás del uso de conjuntos de datos sintéticos es que permite a una organización eliminar el riesgo de filtración de datos que puedan contener información personal u otros tipos de datos confidenciales. Existen otras soluciones para abordar el mismo problema relacionado con el cifrado de datos, aunque este puede ser un enfoque costoso, que requiere mucho tiempo y recursos y que enfrenta desafíos de escala.
La germinación de Gretel.ai surgió de las experiencias directas de los tres cofundadores en el trabajo que realizaron como especialistas en ciberseguridad en una variedad de organizaciones, incluidas IBM, AWS, Netscout y el ejército de EE. UU. Y a lo largo de los años.
“Siempre descubrimos que usar los permisos correctos con los datos era siempre el cuello de botella”, dijo Ali Golshan, director ejecutivo que cofundó la empresa con Alex Watson (CPO) y John Myers (CTO). Podían ver que el problema a largo plazo sería una necesidad y una prioridad cada vez mayores para la privacidad de los datos. “A medida que el mundo pasa de la web al mundo inmersivo de los sensores y la IOT, estamos pasando a un mundo en el que las personas compartirán sus datos de forma inconsciente o sin saberlo. Pero los humanos no están destinados a ser minados “.
Como ingenieros de datos, su prioridad es poder trabajar con datos de manera fácil y rápida, pero como ciudadanos del mundo, no estaban contentos con las implicaciones de protección de datos.
“Eliminar el cuello de botella de la computación es el problema que hemos resuelto y hemos creado un desarrollo de alta velocidad”, dijo. “Pero ahora nos encontramos con el cuello de botella de los datos. La IA está en curso de colisión con la privacidad. En este curso de colisión, deberíamos crear herramientas ”para arreglar eso.
La oportunidad de Gretel es una que muchas empresas que se dirigen al mercado empresarial han aprovechado en el mundo de la transformación digital: muchas organizaciones ahora tienen grandes operaciones de ingeniería trabajando en aplicaciones para ejecutar sus negocios, pero aún no tienen la potencia de fuego de las empresas de tecnología más grandes del mundo. Así que Gretel se propuso construir un conjunto de herramientas que permitiría a cualquier empresa crear conjuntos de datos anónimos para sí mismos, similar a lo que las grandes empresas de tecnología utilizan en su propio trabajo de datos.
La ventaja de los datos anónimos va más allá de la simple sustitución de un conjunto de datos sintéticos por uno real; también se pueden usar para aumentar un conjunto de datos o para llenar los vacíos donde los datos del mundo real pueden faltar. Ambos son componentes críticos, especialmente en los casos en los que los datos son necesarios para entrenar sistemas, como en el caso de los servicios autónomos, donde aparentemente nunca se pueden tener suficientes datos de enseñanza.
Watson había trabajado anteriormente en AWS (dato curioso: nos enteramos cuando Amazon adquirió su startup anterior, harvest.ai), y dice que hasta la fecha Gretel.ai ha asegurado a los primeros clientes en áreas como ciencias de la vida, servicios financieros y juegos. En casos de uso más básicos, puede tomar tan solo 10 minutos crear un conjunto de datos sintéticos. En aplicaciones más complejas, por ejemplo, en una base de datos genómica, podría llevar varios días.
En términos relativos, esto representa “una fricción muy baja” para los ingenieros, dijo Watson, tanto en comparación con otros enfoques como el cifrado de datos utilizando técnicas como el cifrado homomórfico, o de hecho el enfoque analógico de contactar a terceros y obtener permisos para usar conjuntos de datos. Este último puede llevar seis meses o más, demasiado en los casos en que el tiempo es esencial.
“Esta importante inversión de la Serie B es un reflejo directo de la ambiciosa visión, el rápido crecimiento y la fortaleza de la posición de Gretel en la industria de la inteligencia artificial como abanderada de herramientas que permiten la privacidad desde el diseño”, dijo Emily White, presidenta de Anthos Capital, en una declaración. “La facilidad de uso de Gretel, la capacidad de ampliación de sus servicios y la precisión y calidad superiores de sus datos sintéticos son soluciones muy necesarias para simplificar las barreras legales y técnicas extremadamente complejas que enfrentan las empresas debido a preocupaciones sobre la privacidad de los datos”.
“Gretel brinda a los equipos de datos que trabajan en cualquier marco o idioma las herramientas que necesitan para construir privacidad por diseño en sus flujos de trabajo y canalizaciones de datos existentes, simplificando enormemente este proceso”, agregó Sridhar Ramaswamy, socio de Greylock. “Una y otra vez escucho de ingenieros de software y científicos de datos sobre el valor que ofrece Gretel. Su enfoque de resolución de problemas de privacidad, basado en la tecnología y el desarrollador primero, es increíblemente valioso para todos los sectores empresariales “.
Source link