Lleno de nuevo efectivo, AssemblyAI busca hacer crecer su negocio de IA como servicio

Lleno de nuevo efectivo, AssemblyAI busca hacer crecer su negocio de IA como servicio

Los modelos de aprendizaje automático a gran escala están en el corazón de las tecnologías que acaparan los titulares como DALL-E 2 de OpenAI y LaMDA de Google. Son impresionantes, sin duda, capaces de generar imágenes y texto lo suficientemente convincentes como para pasar por el trabajo de un ser humano. Pero desarrollar los modelos tomó una enorme cantidad de tiempo y poder de cómputo, sin mencionar el dinero en efectivo. Solo DALL-E 2 se entrenó en 256 GPU durante 2 semanas, lo que equivale a un costo de alrededor de $ 130,000 si se entrenó en instancias de Amazon Web Services, según uno estimar.

Las empresas más pequeñas luchan por mantenerse al día, razón por la cual muchas recurren a proveedores de “IA como servicio” que manejan el desafiante trabajo de crear modelos y cobran por acceder a ellos a través de una API. Uno de esos proveedores es AsambleaAIque se centra específicamente en los servicios de análisis de texto y de voz a texto.

AssemblyAI anunció hoy que recaudó $ 30 millones en una ronda de la Serie B dirigida por Insight Partners con la participación de los cofundadores de Y Combinator y Stripe, John y Patrick Collison, Nat Friedman y Daniel Gross. Hasta la fecha, AssemblyAI ha recaudado $ 64 millones, que el fundador y director ejecutivo, Dylan Fox, le dice a TechCrunch que se están invirtiendo en el crecimiento de los equipos de investigación e ingeniería de la compañía y en la capacitación del modelo de inteligencia artificial de capacidad del centro de datos.

Fox fundó AssemblyAI después de un período de 2 años en Cisco, donde trabajó en aprendizaje automático para productos de colaboración. Antes de eso, fundó YouGive1, una organización que trabajaba con empresas para recompensar a los clientes con ofertas de productos a cambio de donaciones sin fines de lucro.

“Estaba buscando API de reconocimiento de voz y procesamiento de lenguaje natural (NLP) para proyectos anteriores, y comencé AssemblyAI después de ver cuán limitadas y de baja precisión eran las opciones disponibles en 2017”, dijo Fox a TechCrunch en una entrevista por correo electrónico. “El objetivo de la empresa es investigar e implementar modelos de IA de vanguardia para NLP y reconocimiento de voz, y exponer esos modelos a los desarrolladores en kits de desarrollo de software muy simples y API que son gratuitos y fáciles de integrar”.

AssemblyAI ofrece servicios basados ​​en API impulsados ​​por IA en más de 80 idiomas para la transcripción automática, la detección de temas y la moderación de contenido, así como “capítulos automáticos”, que dividen los archivos de audio y video en “capítulos” con resúmenes para cada uno. Usando la plataforma, los desarrolladores pueden llamar a varias API para realizar tareas como “identificar a los oradores en esta conversación” o “verificar este podcast en busca de contenido prohibido” a un costo relativamente bajo, desde $ 0.00025 por segundo de audio.

Créditos de imagen: AsambleaAI

“Estamos entrenando modelos masivos de IA en cientos de GPU, con miles de millones de parámetros”, dijo Fox. “Parámetros” se refiere al tamaño de los modelos; en términos generales, los modelos más grandes son más sofisticados. “Aprovechando los avances en la investigación de IA, continuamos mejorando drásticamente la precisión de todos nuestros modelos de IA y lanzando otros nuevos”, continuó. “Nuestra función ‘AutoTrain’ permite que la API aprenda de una muestra aleatoria de los datos de un cliente para mejorar automáticamente con el tiempo”.

AssemblyAI no es el único jugador en el bullicioso sector de la IA como servicio. NLPCloud proporciona modelos de PNL listos para usar a través de API, mientras que Sayso creó una API para cambiar el inglés acentuado de un acento a otro casi en tiempo real. No en vano, Amazon, Google y Microsoft tienen una gran cantidad de productos de IA basados ​​en API dirigidos a aplicaciones como análisis de texto, reconocimiento de imágenes, texto a voz, voz a texto y más.

Pero Fox dice que AssemblyAI continúa creciendo a un ritmo acelerado, impulsado por la pandemia y, por extensión, el aumento del trabajo remoto. El audio y el video se están incorporando a un número cada vez mayor de productos, señala, como videoconferencias e incluso aplicaciones de citas. Eso llevó a los equipos de productos a buscar formas de crear funciones adicionales y de alto valor además de los datos de audio y video.

“Estas funciones parecen equipos de confianza y seguridad en las empresas de redes sociales que automatizan la moderación de contenido de publicaciones de audio, o plataformas publicitarias que identifican automáticamente los temas hablados en podcasts y videos, herramientas de colaboración que proporcionan transcripciones legibles, resúmenes y palabras clave para mensajes de video compartidos dentro de sus plataformas, y empresas de telefonía que construyen plataformas de centros de contacto más inteligentes y productos de inteligencia de ingresos que pueden analizar la atención al cliente y las llamadas telefónicas de ventas”, dijo Fox. “AssemblyAI se está convirtiendo rápidamente en la plataforma de API de acceso para que estos equipos de productos puedan enviar estas características infundidas con IA además de los datos de audio y video dentro de sus productos”.

Fox dice que AssemblyAI ahora tiene “cientos” de clientes que pagan entre sus más de 10,000 usuarios. Desde principios de 2022, la base de usuarios se triplicó, mientras que los ingresos, que Fox se negó a revelar, se triplicaron.

“[We’re] procesando millones de llamadas API todos los días”, dijo Fox. “Planeamos triplicar nuestro equipo de investigación de IA en los próximos seis meses e invertir millones de dólares en hardware de GPU para entrenar modelos de IA más grandes y complejos que superarán los límites”.

Fox cree que el crecimiento posicionará bien a AssemblyAI para el próximo año, independientemente de los obstáculos que puedan traer. En un momento en que los despidos se están convirtiendo en algo habitual y es difícil conseguir financiación, dice que AssemblyAI se opondrá a la tendencia casi duplicando el tamaño de su equipo de 52 personas para finales de año.

“Apenas habíamos echado mano de nuestra financiación de la Serie A, que cerramos hace solo unos meses en febrero de Accel, y no estábamos recaudando fondos activamente. Pero habíamos estado en contacto con Rebecca. [Liu-Doyle] de Insight por un tiempo, y sentí que ella, Insight en general, más el capital adicional, realmente nos ayudaría [spur] nuestro crecimiento aún más”, dijo Fox. “A medida que se desbloquea el mercado, debemos poder establecernos como el proveedor dominante en este espacio, así como también satisfacer las crecientes expectativas de los clientes, con modelos de IA más precisos que puedan respaldar las funciones y los productos que están creando. ”




Source link