Kooply aprovecha $ 18 millones de Microsoft y más para una plataforma de desarrollo de juegos móviles aún en sigilo

Adept tiene como objetivo construir una IA que pueda automatizar cualquier proceso de software

En 2016 en TechCrunch Disrupt New York, varios de los desarrolladores originales detrás de lo que se convirtió en Siri dio a conocer viv, una plataforma de IA que prometía conectar varias aplicaciones de terceros para realizar casi cualquier tarea. El lanzamiento fue tentador, pero nunca se realizó por completo. Más tarde, Samsung adquirió Viv, incorporando una versión reducida de la tecnología a su asistente de voz Bixby.

Seis años después, un nuevo equipo afirma haber descifrado el código de un asistente de IA universal, o al menos haberse acercado un poco más. En un laboratorio de productos llamado Adept que surgió de la clandestinidad hoy con $ 65 millones en fondos, están, en palabras de los fundadores, “construyendo[ing] inteligencia general que permite a los humanos y las computadoras trabajar juntos creativamente para resolver problemas”.

Son cosas elevadas. Pero los cofundadores de Adept, el CEO David Luan, el CTO Niki Parmar y el científico en jefe Ashish Vaswani, reducen su ambición a perfeccionar una “superposición” dentro de las computadoras que funcione con las mismas herramientas que la gente. Esta superposición podrá responder a comandos como “generar un informe de cumplimiento mensual” o “dibujar escaleras entre estos dos puntos en este plano”, afirma Adept, todo usando software existente como Airtable, Photoshop, Tableau y Twilio para hacer el trabajo. .

“[W]Estamos entrenando una red neuronal para usar todas las herramientas de software del mundo, aprovechando la gran cantidad de capacidades existentes que las personas ya han creado”. Luan le dijo a TechCrunch en una entrevista por correo electrónico. “[W]Con Adept, podrás concentrarte en el trabajo que más te gusta y preguntar a nuestro [system] para asumir otras tareas… Esperamos que el colaborador sea un buen estudiante y altamente capacitado, volviéndose más útil y alineado con cada interacción humana”.

Según la descripción de Luan, lo que Adept está creando suena un poco como la automatización robótica de procesos (RPA), o robots de software que aprovechan una combinación de automatización, visión por computadora y aprendizaje automático para automatizar tareas repetitivas como llenar formularios y responder correos electrónicos. Pero el equipo insiste en que su tecnología es mucho más sofisticada que la que ofrecen actualmente los proveedores de RPA como Automation Anywhere y UiPath.

“Estamos construyendo un sistema general que ayuda a las personas a hacer cosas frente a su computadora: un colaborador de IA universal para cada trabajador del conocimiento… Estamos capacitando una red neuronal para usar todas las herramientas de software del mundo, aprovechando la gran cantidad de las capacidades existentes que la gente ya ha creado”, dijo Luan. “Creemos que la capacidad de la IA para leer y escribir texto seguirá siendo valiosa, pero poder hacer cosas en una computadora será significativamente más valioso para la empresa… [M]Los modelos entrenados en texto pueden escribir una gran prosa, pero no pueden realizar acciones en el mundo digital. no puedes preguntar [them] para reservarle un vuelo, extender un cheque a un proveedor o realizar un experimento científico. La verdadera inteligencia general requiere modelos que no solo puedan leer y escribir, sino que actúen cuando las personas les pidan que hagan algo”.

Adept no es el único que explora esta idea. En un artículo de febrero, los científicos de DeepMind, respaldado por Alphabet, describen lo que ellos llaman un enfoque “basado en datos” para enseñar a la IA a controlar computadoras. Por tener Una IA observa los comandos del teclado y el mouse de las personas que completan tareas informáticas de “siguiendo instrucciones”, como reservar un vuelo, los científicos pudieron mostrar al sistema cómo realizar más de cien tareas con una precisión de “nivel humano”.

No tan casualmente, el cofundador de DeepMind Mustafa Suleyman recientemente se asoció se unió al cofundador de LinkedIn, Reid Hoffman, para lanzar Inflection AI, que, al igual que Adept, tiene como objetivo utilizar la IA para ayudar a los humanos a trabajar de manera más eficiente con las computadoras.

El diferenciador aparente de Adept es un grupo de expertos de investigadores de IA provenientes de DeepMind, Google y OpenAI. Vaswani y Parmar ayudaron a ser pioneros en Transformer, una arquitectura de IA que ha ganado una atención considerable en los últimos años. Desde 2017, Transformer se ha convertido en la arquitectura elegida para tareas de lenguaje natural, demostrando una aptitud para resumir documentos, traducir entre idiomas e incluso clasificar imágenes y analizar secuencias biológicas.

Entre otros productos, el GPT-3 generador de lenguaje de OpenAI se estaba desarrollando utilizando la tecnología Transformer.

“Durante los siguientes años, todo el mundo se amontonó en el Transformador, usándolo para resolver muchos problemas de hace décadas en una rápida sucesión. Cuando dirigí ingeniería en OpenAI, escalamos el Transformador a GPT-2 (el predecesor de GPT-3) y GPT-3”, dijo Luan. “Los esfuerzos de Google para escalar los modelos de Transformer produjeron [the AI architecture] BERT, impulsando la búsqueda de Google. Y varios equipos, incluidos los miembros de nuestro equipo fundador, entrenaron a Transformers que pueden escribir código. DeepMind incluso demostró que el Transformador funciona para el plegamiento de proteínas (AlphaFold) y Starcraft (AlphaStar). Los transformadores hicieron tangible la inteligencia general para nuestro campo”.

En Google, Luan fue el líder tecnológico general de lo que él describe como el “esfuerzo de modelos grandes” en Google Brain, una de las divisiones de investigación más importantes del gigante tecnológico. Allí, entrenó a Transformers cada vez más grandes con el objetivo de construir eventualmente un modelo general para potenciar todos los casos de uso de aprendizaje automático, pero su equipo se topó con una clara limitación. Los mejores resultados se limitaron a modelos diseñados para sobresalir en dominios específicos, como analizar registros médicos o responder preguntas sobre temas particulares.

“Desde el comienzo del campo, hemos querido construir modelos con una flexibilidad similar a la de la inteligencia humana, que puedan funcionar para una variedad diversa de tareas… [M]El aprendizaje automático ha progresado más en los últimos cinco años que en los 60 anteriores”, dijo Luan. “Históricamente, el trabajo de IA a largo plazo ha sido competencia de las grandes empresas de tecnología, y su concentración de talento y computación ha sido impecable. Mirando hacia el futuro, creemos que la próxima era de avances en IA requerirá resolver problemas en el corazón de la colaboración entre humanos y computadoras”.

Cualquiera que sea la forma que tome su producto y modelo de negocio, ¿puede Adept tener éxito donde otros fracasaron? Si puede, la ganancia inesperada podría ser sustancial. De acuerdo a a Markets and Markets, el mercado de tecnologías de automatización de procesos empresariales (tecnologías que agilizan las cargas de trabajo administrativas y de atención al cliente de las empresas) crecerá de $9800 millones en 2020 a $19600 millones en 2026. One 2020 encuesta por el proveedor de automatización de procesos Camunda (una fuente sesgada, por supuesto) encontró que el 84% de las organizaciones anticipan una mayor inversión en automatización de procesos como resultado de las presiones de la industria, incluido el aumento del trabajo remoto.

“La tecnología de Adept suena plausible en teoría, [but] hablar de que los Transformers necesitan ser ‘capaces de actuar’ se siente un poco como una mala dirección para mí”, dijo Mike Cook, investigador de IA en el colectivo de investigación Knives & Paintbrushes, que no está afiliado a Adept, a TechCrunch por correo electrónico. “Los transformadores están diseñados para predecir los siguientes elementos en una secuencia de cosas, eso es todo. Para un transformador, no importa si esa predicción es una letra en algún texto, un píxel en una imagen o una llamada a la API en un fragmento de código. Por lo tanto, esta innovación no parece más probable que conduzca a la inteligencia artificial general que cualquier otra cosa, pero podría producir una IA que sea más adecuada para ayudar en tareas simples”.

Es cierto que el costo de entrenar sistemas de inteligencia artificial de vanguardia es más bajo que antes. Con una fracción de la financiación de OpenAI, las nuevas empresas, incluidas AI21 Labs y Cohere, han logrado construir modelos comparables a GPT-3 en términos de sus capacidades.

Mientras tanto, las innovaciones continuas en la IA multimodal (IA que puede comprender las relaciones entre imágenes, texto y más) colocan un sistema que puede traducir las solicitudes en una amplia gama de comandos de computadora dentro del ámbito de la posibilidad. Entonces funciona como OpenAI InstruirGPTuna técnica que mejora la capacidad de los modelos de lenguaje como GPT-3 para seguir instrucciones.

La principal preocupación de Cook es cómo Adept entrenó sus sistemas de IA. Señala que una de las razones por las que otros modelos de Transformer han tenido tanto éxito con el texto es que hay una gran cantidad de ejemplos de texto para aprender. Un producto como el de Adept presumiblemente necesitaría muchos ejemplos de tareas completadas con éxito en aplicaciones (por ejemplo, Photoshop) junto con descripciones de texto, pero estos datos no ocurren de forma tan natural en el mundo.

En el estudio DeepMind de febrero, los científicos escribieron que, para recopilar datos de capacitación para su sistema, tenían que pagar a 77 personas para que completaran más de 2,4 millones de demostraciones de tareas informáticas.

“[T]Los datos de entrenamiento probablemente se crean artificialmente, lo que genera muchas preguntas sobre a quién se le pagó para crearlos, qué tan escalable es esto a otras áreas en el futuro y si el sistema entrenado tendrá el tipo de profundidad que tienen otros modelos de Transformer. ”, dijo Cook. “Su [also] no es un ‘camino a la inteligencia general’ de ninguna manera… Podría hacerlo más capaz en algunas áreas, pero probablemente será menos capaz que un sistema entrenado explícitamente en una tarea y aplicación en particular”.

Incluso las hojas de ruta mejor diseñadas pueden encontrarse con desafíos técnicos imprevistos, especialmente en lo que respecta a la IA. Pero Luan está poniendo su fe en el talento sénior fundador de Adept, que incluye al ex líder de la infraestructura de producción de modelos de Google (Kelsey Schroeder) y uno de los ingenieros originales en el modelo de reconocimiento de voz de producción de Google (Anmol Gulati).

“[W]Si bien la inteligencia general a menudo se describe en el contexto del reemplazo humano, esa no es nuestra estrella polar. En cambio, creemos que los sistemas de IA deben construirse con personas en el centro”, dijo Luan. “Queremos brindarles a todos acceso a herramientas de IA cada vez más sofisticadas que los ayuden a capacitarse para lograr sus objetivos en colaboración con la herramienta; nuestros modelos están diseñados para trabajar mano a mano con las personas. Nuestra visión es que las personas permanezcan en el asiento del conductor: descubriendo nuevas soluciones, permitiendo decisiones más informadas y dándonos más tiempo para el trabajo que realmente queremos hacer”.

Greylock y Addition codirigieron la ronda de financiación de Adept. La ronda también contó con la participación de Root Ventures y ángeles, incluido el fundador de Behance, Scott Belsky (fundador de Behance), el fundador de Airtable, Howie Liu, Chris Re, el líder del piloto automático de Tesla, Andrej Karpathy y Sarah Meyohas.


Source link