La disponibilidad de datos puede paralizar a una empresa y su esfuerzo por llevar al mercado productos y servicios centrados en software. Para resolver este problema, el inicio de datos de dos años Rendered.ai está generando datos sintéticos para las industrias de satélites, médica, robótica y automotriz.
En su forma más amplia, los datos sintéticos se fabrican en lugar de recopilarlos del mundo real. “Cuando usamos el término datos sintéticos, lo que realmente queremos decir es conjuntos de datos simulados diseñados y, en particular, nos centramos en una simulación basada en la física”, explicó el director ejecutivo de Rendered.ai, Nathan Kundtz, en una entrevista reciente con TechCrunch.
Kundtz recibió su doctorado en física de la Universidad de Duke y se inició en la industria espacial, al frente del desarrollador de antenas satelitales Kymeta Corporation. Después de dejar esa empresa, comenzó a trabajar con otras pequeñas empresas espaciales, cuando se dio cuenta de lo que llamó un problema de “la gallina y el huevo”.
Por ejemplo, imagine que una empresa desarrolla un nuevo tipo de sensor para un satélite y busca financiación para comercializarlo. La empresa tendría que demostrar a los inversores que el sensor podría generar información útil. Para generar estos conocimientos, la empresa necesitaría lanzar una constelación y comenzar a recopilar una gran cantidad de datos.
“Esta falta de acceso a los datos estaba obstaculizando la inteligencia artificial”, dijo.
Interés inversor
El enfoque de Rendered.ai para abrir ese acceso ha llamado la atención de los inversores. La compañía ha recaudado una ronda semilla de $ 6 millones liderada por Space Capital, con la participación de Tectonic Ventures, Congruent Ventures, Union Labs y Uncorrelated Ventures.
El uso de un enfoque basado en la física distingue a Rendered.ai de algunos de sus competidores, que utilizan métodos puramente generativos para crear datos sintéticos. Eso significa que estos competidores están tomando un conjunto de datos existente y están diseñando más. Generalmente, esto se logra utilizando redes generativas adversas (GAN), una técnica de inteligencia artificial que utiliza redes neuronales en competencia para simular y refinar datos sintéticos. Según Kundtz, eso es de utilidad limitada para las industrias emergentes, que a menudo tienen muy pocos o ningún dato para empezar.
Hay otros factores que pueden afectar la capacidad de una empresa para obtener datos. Puede ser un proceso costoso, difícil y que requiere mucho tiempo. Estos problemas empeoran con imágenes que no son RGB, como las generadas por un radar de apertura sintética.
Entonces, ¿cómo resuelve la física este problema de generar nueva información? “Podemos introducir nueva información en el proceso de creación de estos algoritmos a través de nuestro conocimiento de la física, a través de las ecuaciones que gobiernan, por ejemplo, cómo la luz interactúa con las cosas”, dijo Kundtz. “Entonces podemos simular cómo se verán las cosas en diferentes escenarios y luego usar eso para generar conjuntos de datos”.
Un juego de herramientas para desarrolladores
Rendered.ai ha desarrollado una plataforma que incluye una herramienta de configuración sin código y API para permitir a los clientes diseñar y ajustar los parámetros en un conjunto de datos, y un conjunto de herramientas para la introspección y el análisis de datos del conjunto de datos. La empresa también proporciona un código de inicio para aplicaciones específicas que interesan a los clientes, como imágenes de satélite. La empresa llama a esto “plataforma como servicio”.
Si bien un cliente de Rendered.ai necesita cierta cantidad de experiencia para usar el sistema, Kundtz dijo que esa cantidad está disminuyendo cada día; parte de la financiación se destinará a seguir reduciendo el conjunto de habilidades necesarias para utilizar la plataforma.
“Lo que estamos impulsando es que cualquiera que pueda hacer clic en un botón en un navegador puede generar datos sintéticos, y no solo datos sintéticos, sino que realmente puede controlar los tipos de datos sintéticos que quieren y pueden introducirlos en el resto de una máquina. flujo de trabajo de aprendizaje “.
Pero no sabe lo que no sabe: una empresa no necesariamente conocerá de antemano los parámetros necesarios para que un conjunto de datos sintéticos sea efectivo o que funcione un algoritmo. Rendered.ai adopta un enfoque iterativo y enfatiza la interactividad de su plataforma como una forma para que los clientes identifiquen las brechas en su algoritmo o comprendan mejor sus puntos ciegos.
Kundtz dice que no cree que los datos sintéticos reemplacen por completo a los datos del mundo real, pero que llegarán a representar una brecha cada vez más importante para las aplicaciones de inteligencia artificial. También tiene el potencial de quitarle incluso una pizca de poder a empresas como Google, que tienen acceso exclusivo a billones de imágenes y montañas de conjuntos de datos.
Rendered.ai ya ha atraído a un puñado de clientes a su plataforma, pero todavía está esencialmente en fase beta, por lo que la financiación se utilizará para ampliar el acceso a la plataforma, así como para invertir en tipos particulares de datos para verticales específicas.
Source link