Betterdata utiliza datos sintéticos para mantener seguros los datos reales

Betterdata utiliza datos sintéticos para mantener seguros los datos reales

mejores datos, una startup con sede en Singapur que utiliza datos sintéticos programables para mantener seguros los datos reales, anunció hoy que ha recaudado 1,55 millones de dólares. La ronda inicial, que dice que tuvo un exceso de solicitudes, fue dirigida por Investible con la participación de Franklin Templeton, Xcel Next, la Universidad de Tecnología y Diseño de Singapur, Bon Auxilium, Tenity, Plug and Play y Entrepreneur First.

La startup fue fundada en 2021 por el Dr. Uzair Javaid, su director ejecutivo y el tecnólogo en jefe Kevin Yee, con el objetivo de hacer que el intercambio de datos sea más rápido y seguro a medida que aumentan las regulaciones de protección de datos en todo el mundo. Actualmente, la empresa tiene asociaciones de investigación y desarrollo con dos importantes universidades de Singapur y Estados Unidos (no puede revelar públicamente quiénes son) y entre sus clientes se incluye el Shanghai Pudong Development Bank.

Betterdata dice que es diferente de los métodos tradicionales de intercambio de datos que utilizan la anonimización de datos para destruir datos porque en su lugar utiliza inteligencia artificial generativa e ingeniería de privacidad.

Yee le explicó a TechCrunch que los datos sintéticos programáticos usan modelos generativos, como modelos de aprendizaje profundo, incluidos modelos antagónicos generativos usados ​​en deepfakes, transformadores usados ​​en ChatGPT y modelos de difusión usados ​​en difusión estable, para crear y aumentar nuevos conjuntos de datos.

Estos conjuntos de datos sintéticos tienen características y estructuras similares a los datos del mundo real sin revelar información confidencial o privada sobre las personas.

“La idea es crear una versión ficticia de un conjunto de datos real que se pueda usar de manera segura para una variedad de propósitos, incluida la protección de datos confidenciales, la reducción de sesgos y también la mejora de los modelos de aprendizaje automático”, dijo.

Los datos sintéticos programáticos ayudan a los desarrolladores de muchas maneras. Algunos ejemplos incluyen ayudarlos a proteger datos confidenciales, cumplir con las regulaciones de protección de datos como GDPR e HIPAA, aumentar la disponibilidad de datos entre equipos, crear más datos para entrenar, probar y validar modelos de aprendizaje automático y abordar problemas de desequilibrio de datos mediante la creación de más registros para grupos subrepresentados. o clases.

La financiación de Betterdata se utilizará en el lanzamiento de su producto y para mejorar su pila de tecnología de datos sintéticos programables, incluido el soporte para conjuntos de datos de una sola tabla, varias tablas y series temporales. Estas son diferentes variaciones de conjuntos de datos tabulares y Yee explica que las principales diferencias son sus estructuras y los problemas que se crearon para abordar.

Por ejemplo, los conjuntos de datos de una sola tabla se centran en tablas independientes, mientras que los conjuntos de datos de varias tablas están destinados a considerar las relaciones entre varias tablas, y los conjuntos de datos de series temporales se ocupan de los datos recopilados a lo largo del tiempo.

Betterdata también planea contratar a más personas, incluidos empleados de ventas y marketing, y expandirse más allá de Singapur a más de la región de Asia-Pacífico durante los próximos uno o dos años.

En una declaración sobre la inversión de Investible, el director Khairu Rejal dijo: “Betterdata resuelve uno de los mayores problemas que enfrenta la industria de la IA en la actualidad: la falta de datos de alta calidad que también cumplan con los requisitos de privacidad. A través de su poderosa plataforma, Betterdata genera datos sintéticos que imitan los datos del mundo real sin comprometer la calidad y la privacidad, ayudando a las empresas a cumplir con las leyes de privacidad y cumplimiento global a escala”.


Source link