El mercado de datos sintéticos es más grande de lo que piensas

“Para 2024, el 60% de los datos utilizados para el desarrollo de proyectos de inteligencia artificial y análisis se generarán sintéticamente”. Esta es una predicción de Gartner que encontrará en casi todos los artículos, presentaciones o comunicados de prensa relacionados con datos sintéticos.

Repetimos esta cita aquí a pesar de su ubicuidad porque dice mucho sobre el mercado total direccionable de datos sintéticos.

Desempaquemos: Primero, describir datos sintéticos que son “generados sintéticamente” puede parecer tautológico, pero también es bastante claro: Estamos hablando de datos que son artificiales/falsos y creados, en lugar de recopilados en el mundo real.

Luego, está el núcleo de la predicción: que los datos sintéticos se utilizarán en el desarrollo de la mayoría de los proyectos de inteligencia artificial y análisis. Dado que tales proyectos están en aumento, la correlación es que el mercado de datos sintéticos también crecerá.

Por último, pero no menos importante, está el horizonte temporal. En nuestro mundo de startups, 2024 es casi hoy, y la gente de Gartner ya tiene una predicción a más largo plazo: parte de su equipo publicó una investigación “Olvídese de sus datos reales: los datos sintéticos son el futuro de la IA”.

“El futuro de la IA” es el tipo de promesa que a los inversores les gusta escuchar, por lo que no sorprende que los cheques hayan estado fluyendo hacia las nuevas empresas de datos sintéticos.

Solo en 2022, PRINCIPALMENTE IA recaudó una ronda Serie B de $25 millones liderada por Molten Ventures; Gen de datos obtuvo una Serie B de $ 50 millones liderada por Scale Venture Partners, y IA de síntesis se embolsó una Serie A de $ 17 millones.

Las nuevas empresas de datos sintéticos que han recaudado cantidades significativas de fondos ya prestan servicios a una amplia gama de sectores, desde la banca y la atención médica hasta el transporte y el comercio minorista. Pero esperan que los casos de uso sigan expandiéndose, tanto dentro de nuevos sectores como en aquellos donde los datos sintéticos ya son comunes.

Para comprender lo que está sucediendo, pero también lo que sucederá si los datos sintéticos se adoptan más ampliamente, hablamos con varios directores ejecutivos y capitalistas de riesgo en los últimos meses. Aprendimos sobre las dos categorías principales de empresas de datos sintéticos, a qué sectores se dirigen, cómo dimensionar el mercado y más.

La punta del iceberg

Socio fundador de Quiet Capital, astasia myers, es uno de los inversores optimistas sobre los datos sintéticos y sus aplicaciones. Se negó a revelar si invirtió en este espacio, pero dijo que “hay mucho por lo que emocionarse en el mundo de los datos sintéticos”.

¿Por qué el entusiasmo? “Porque brinda a los equipos un acceso más rápido a los datos de manera segura a un costo menor”, dijo a TechCrunch.

Simplemente podemos decir que el TAM de datos sintéticos y el TAM de datos convergerán. Ofir Zuk (Chakón)

El acceso a grandes cantidades de datos se ha vuelto crítico para los equipos de aprendizaje automático, y los datos reales a menudo no están a la altura de la tarea, por diferentes razones. Esta es la brecha que las nuevas empresas de datos sintéticos esperan llenar.

Hay dos contextos principales en los que se enfocan estas startups: datos estructurados y datos no estructurados. El primero se refiere al tipo de conjuntos de datos que se encuentran en tablas y hojas de cálculo, mientras que el segundo apunta a lo que podríamos llamar archivos multimedia, como audio, texto y datos visuales.

“Tiene sentido distinguir entre empresas de datos sintéticos estructurados y no estructurados”, dijo Myers, “porque el tipo de datos sintéticos se aplica a diferentes casos de uso y, por lo tanto, a diferentes compradores”.

Source link