Parallel Domain dice que la conducción autónoma no escalará sin datos sintéticos

Parallel Domain dice que la conducción autónoma no escalará sin datos sintéticos

Lograr una conducción autónoma segura requiere horas casi interminables de software de capacitación en cada situación que podría surgir antes de poner un vehículo en la carretera. Históricamente, las empresas de autonomía han recopilado hordas de datos del mundo real con los que entrenar sus algoritmos, pero es imposible entrenar un sistema sobre cómo manejar casos extremos basándose solo en datos del mundo real. No solo eso, sino que lleva mucho tiempo incluso recopilar, clasificar y etiquetar todos esos datos en primer lugar.

La mayoría de las empresas de vehículos autónomos, como Cruise, Waymo y Waabi, utilizan datos sintéticos para entrenar y probar modelos de percepción con velocidad y un nivel de control que es imposible con los datos recopilados del mundo real. Dominio paralelouna startup que ha construido una plataforma de generación de datos para empresas autónomas, dice que los datos sintéticos son un componente crítico para escalar la IA que impulsa los sistemas de visión y percepción y prepararlos para la imprevisibilidad del mundo físico.

La startup acaba de cerrar una Serie B de $ 30 millones liderada por March Capital, con la participación de los inversores de retorno Costanoa Ventures, Foundry Group, Calibrate Ventures y Ubiquity Ventures. Parallel Domain se ha centrado en el mercado de la automoción, proporcionando datos sintéticos a algunos de los principales fabricantes de equipos originales que están creando sistemas avanzados de asistencia al conductor y empresas de conducción autónoma que están creando sistemas de conducción autónoma mucho más avanzados. Ahora, Parallel Domain está listo para expandirse a drones y visión de computadora móvil, según el cofundador y director ejecutivo Kevin McNamara.

“Realmente también estamos duplicando los enfoques generativos de inteligencia artificial para la generación de contenido”, dijo McNamara a TechCrunch. “¿Cómo podemos usar algunos de los avances en IA generativa para traer una diversidad mucho más amplia de cosas, personas y comportamientos a nuestros mundos? Porque nuevamente, la parte difícil aquí es realmente, una vez que tienes un renderizador físicamente preciso, ¿cómo vas a construir el millón de escenarios diferentes que un automóvil necesitará encontrar?

La startup también quiere contratar un equipo para respaldar su creciente base de clientes en América del Norte, Europa y Asia, según McNamara.

Construcción de mundos virtuales

Una muestra de los datos sintéticos de Parallel Domain. Credito de imagen: Dominio paralelo

Cuando se fundó Parallel Domain en 2017, la startup estaba muy enfocada en crear mundos virtuales basados ​​en datos de mapas del mundo real. Durante los últimos cinco años, Parallel Domain se ha sumado a su generación mundial al llenarlo con automóviles, personas, diferentes momentos del día, clima y toda la gama de comportamientos que hacen que esos mundos sean interesantes. Esto permite a los clientes, de los cuales Parallel Domain cuenta con Google, Continental, Woven Planet y el Toyota Research Institute, generar datos dinámicos de cámara, radar y lidar que necesitarían para entrenar y probar sus sistemas de visión y percepción, dijo McNamara.

La plataforma de datos sintéticos de Parallel Domain consta de dos modos: entrenamiento y prueba. Durante la capacitación, los clientes describirán parámetros de alto nivel (por ejemplo, conducción en carretera con un 50 % de lluvia, un 20 % de noche y una ambulancia en cada secuencia) en los que desean entrenar su modelo, y el sistema generará cientos de miles de ejemplos para cumplir con esos parámetros.

En cuanto a las pruebas, Parallel Domain ofrece una API que permite al cliente controlar la ubicación de cosas dinámicas en el mundo, que luego se pueden conectar a su simulador para probar escenarios específicos.

Waymo, por ejemplo, está particularmente interesado en usar datos sintéticos para probar diferentes las condiciones climáticas, dijo la compañía a TechCrunch. (Descargo de responsabilidad: Waymo no es un cliente confirmado de Parallel Domain). Waymo ve el clima como una nueva lente que puede aplicar a todas las millas que ha recorrido en el mundo real y en simulación, ya que sería imposible recordar todas esas experiencias con arbitrariamente. las condiciones climáticas.

Ya sea que se trate de pruebas o capacitación, cada vez que el software de Parallel Domain crea una simulación, puede generar etiquetas automáticamente para corresponder con cada agente simulado. Esto ayuda a los equipos de aprendizaje automático a realizar pruebas y aprendizaje supervisado sin tener que pasar por el arduo proceso de etiquetar los datos ellos mismos.

Parallel Domain visualiza un mundo en el que las empresas autónomas utilizan datos sintéticos para la mayoría, si no todas, de sus necesidades de capacitación y prueba. Hoy en día, la proporción entre datos sintéticos y del mundo real varía de una empresa a otra. Las empresas más establecidas con los recursos históricos para haber recopilado una gran cantidad de datos están utilizando datos sintéticos para alrededor del 20 % al 40 % de sus necesidades, mientras que las empresas que se encuentran en una etapa más temprana de su proceso de desarrollo de productos confían en un 80 % en el mundo sintético versus un 20 % en el mundo real. Según McNamara.

Julia Klein, socia de March Capital y ahora miembro de la junta directiva de Parallel Domain, dijo que cree que los datos sintéticos desempeñarán un papel fundamental en el futuro del aprendizaje automático.

“Obtener los datos del mundo real que necesita para entrenar modelos de visión por computadora a menudo es un obstáculo y hay retrasos en términos de poder ingresar esos datos, etiquetarlos, prepararlos en una posición en la que realmente puedan ser utilizado”, dijo Klein a TechCrunch. “Lo que hemos visto con Parallel Domain es que están acelerando ese proceso considerablemente, y también están abordando cosas que quizás ni siquiera obtenga en conjuntos de datos del mundo real”.


Source link