La tecnología inteligente de supresión de ruido de Krisp, que silencia los sonidos ambientales y aísla tu voz para las llamadas, llegó justo a tiempo. La compañía se puso al frente del cambio global a la presencia virtual, convirtiendo la tracción temprana de nicho en clientes reales y atrayendo una nueva y brillante ronda de financiación de la Serie A de $ 5 millones para expandir y diversificar su oferta oportuna.
Conocimos a Krisp por primera vez en 2018 cuando surgió del acelerador Skydeck de UC Berkeley. La compañía fue una de las primeras en la gran oleada de nuevas empresas de IA, pero con un caso de uso sencillo y una tecnología obviamente efectiva, era difícil ser escéptico.
Krisp aplica un sistema de aprendizaje automático al audio en tiempo real que ha sido entrenado en lo que es y no es la voz humana. Lo que no es voz se elimina cuidadosamente incluso durante el habla, y lo que queda suena más claro. ¡Eso es practicamente todo! Hay muy poca latencia (15 milisegundos es el reclamo) y una sobrecarga computacional modesta, lo que significa que puede funcionar en prácticamente cualquier dispositivo, especialmente en aquellos con unidades de aceleración de IA como la mayoría de los teléfonos inteligentes modernos.
La empresa comenzó ofreciendo su software independiente de forma gratuita, con un nivel de pago que eliminaba los límites de tiempo. También se envió integrado en la popular aplicación de chat social Discord. Pero el verdadero negocio está, como era de esperar, en la empresa.
“Al principio, nuestros ingresos eran todos profesionales, pero en diciembre comenzamos a incorporar empresas. COVID realmente ha acelerado ese plan”, explicó Davit Baghdasaryan, cofundador y director ejecutivo de Krisp. “En marzo, nuestro principal cliente era una gran empresa de tecnología con 2000 empleados, y compraron 2000 licencias, porque todos son remotos. Gradualmente, la empresa se está haciendo cargo, porque estamos firmando bancos, centros de llamadas, etc. Pero creemos que Krisp seguirá siendo el consumidor primero, porque todos lo necesitan, ¿verdad?
Ahora se han sumado incluso más grandes empresas, incluido un centro de llamadas con unos 40.000 empleados. Baghdasaryan dice que la compañía pasó de 0 a 600 empresas que pagan, y de ingresos recurrentes anuales de $0 a $4 millones, en un solo año, lo que probablemente hace que la inversión, de Storm Ventures, Sierra Ventures, TechNexus y Hive Ventures, parezca bastante segura. .
Es una gran victoria para el equipo de Krisp, que se divide entre los EE. UU. y Armenia, donde se fundó la empresa, y una validación de un enfoque global para la dotación de personal: el talento de clase mundial no se encuentra solo en California, Nueva York. , Berlín y otros centros tecnológicos, pero en países más pequeños que no tienen el beneficio de la exageración local y la infraestructura de inversión.
La financiación es otra historia, por supuesto, pero tras haber recaudado dinero, la empresa ahora está trabajando para ampliar sus productos y su equipo. El próximo paso de Krisp es esencialmente monitorear y presentar los metadatos de la conversación.
“La próxima iteración no solo le informará sobre el ruido, sino que también le brindará información en tiempo real sobre cómo se está desempeñando como orador”, explicó Baghdasaryan. No exactamente en el sentido de los maestros de ceremonias, pero ¿nunca se ha preguntado cuánto habló realmente durante una llamada, o si interrumpió o fue interrumpido por otros, etc.?
“Hablar es una habilidad que la gente puede mejorar. Piense en Grammar.ly para voz y video”, aventuró Baghdasaryan. “Va a ser sutil acerca de cómo te da esa retroalimentación. Cuando alguien está hablando, es posible que no necesariamente quiera ver eso. Pero con el tiempo analizaremos lo que dices, te daremos pistas sobre el vocabulario y cómo mejorar tus habilidades para hablar”.
Dado que, desde el punto de vista arquitectónico, Krisp está al tanto de todo el audio que entra y sale, puede recopilar estos datos con bastante facilidad. Pero no se preocupe, al igual que los otros productos de la compañía, esto será completamente privado y en el dispositivo. No se requiere nube.
“Somos muy obstinados aquí: la nuestra es una empresa que nunca envía datos a sus servidores”, dijo Baghdasaryan. “Nunca estamos expuestos a eso. Tomamos medidas adicionales para crear y optimizar nuestra tecnología para que el audio nunca salga del dispositivo”.
Eso debería ser tranquilizador para los expertos en privacidad que sospechan que envían todas sus conversaciones a través de un tercero para que las analicen. Pero después de todo, el tipo de consejo que está considerando Krisp puede hacerse sin realmente “comprender” lo que se dice, lo que también limita su alcance. No lo guiará para convertirse en un Cicerón moderno, pero podría ayudarlo a hablar de manera más consistente o avisarle cuando esté tomando demasiado tiempo.
Sin embargo, para el futuro inmediato, Krisp todavía está enfocado en mejorar su software de supresión de ruido, que puedes descargar gratis aquí.
Source link