Ícono del sitio La Neta Neta

Krisp se expande de la cancelación de ruido a la transcripción en el dispositivo

Krisp se expande de la cancelación de ruido a la transcripción en el dispositivo

krisp comenzó como un servicio de cancelación de ruido impulsado por IA, pero ahora la puesta en marcha va más allá con la transcripción instantánea en el dispositivo de todas sus llamadas y reuniones y, por supuesto, ahora también integra ChatGPT para resúmenes rápidos. La beta abierta se pone en marcha hoy.

Mi experiencia de transcripción generalmente es una cuestión de descargar el video o el audio asociado con una reunión, siempre que alguien haya pensado en grabarlo (y sé quién era esa persona), luego cargar ese archivo en un servicio como Otter y esperar 10-15 minutos mientras procesa. En comparación con hace unos años, esto es muy conveniente, por supuesto, pero la cantidad de reuniones que realizamos en línea se ha multiplicado. Dondequiera que pueda afeitarme unos minutos o hacer clic fuera de mi flujo de trabajo, generalmente estoy interesado.

Krisp también ha mostrado una cierta determinación a lo largo de los años, centrándose en la reducción efectiva del ruido en muchos dispositivos y servicios. El avance que lo hizo posible fue básicamente entrenar el sistema para reconocer y aislar las voces humanas, que si bien son diversas, también son distintas y muy diferentes de los ladridos de perros, el ruido del tráfico, etc. Para mí, Krisp generalmente solo ha trabajado.

Entonces, cuando me dijeron que estaban comenzando con la transcripción, me alegró escucharlo: es una extensión natural de una plataforma centrada en la voz y, por supuesto, saben que pueden obtener una señal de voz limpia.

Krisp ya opera más o menos detrás de escena, actuando como un intermediario para las fuentes de audio. Así que no hay necesidad de la “Asistente de reuniones de IA” para integrarse con Google, Teams, Zoom o cualquier otra cosa, o ser un asistente fantasma: se ocupa estrictamente de su señal de audio antes de que se apague o antes de que la suya llegue a sus oídos. El agente de transcripción no necesita hablar con ningún servicio o API, solo identifica las voces que entran y salen, y las transcribe en su dispositivo.

La transcripción en el dispositivo es un diferenciador clave, por un lado porque es más simple que manejar archivos de audio y por otro porque el audio de su reunión nunca sale de su computadora. No estoy seguro de para qué modelos de amenaza es importante, pero sospecho que existen y solo se volverán más prominentes en los próximos años.

La transcripción en sí se envía directamente al servicio en la nube de Krisp, lo que de algún modo anula la ventaja de seguridad de la transcripción en el dispositivo. Pero si está dispuesto a confiar en otro transcriptor, ¿por qué no en este? Y de todos modos, pronto también habrá una opción para mantener sus transcripciones completamente en el dispositivo. El CEO y cofundador de Krisp, Davit Baghdasaryan, tiene una gran experiencia en seguridad y dijo que está ansioso por implementar esto. (Sospecho que es más fácil crear una aplicación web que agregar nuevas capacidades importantes a múltiples aplicaciones móviles y de escritorio).

¿Y cómo son las transcripciones? En mi experiencia, casi tan bueno como otros con tecnología de inteligencia artificial, es decir, mejor que mis notas, pero no del todo listo para publicar. Deshacerse del audio de inmediato anula una característica útil que ofrecen otros transcriptores, la verificación y edición rápidas: haga clic en una palabra sospechosa y salta a ese punto en el audio. Entonces, al menos por ahora, en entrevistas en las que necesita citar de manera precisa y extensa, puede que no sea la mejor opción.

Pero Krisp está posicionando esto como una herramienta de productividad, construyendo una plataforma para la extracción rápida de puntos clave de las innumerables reuniones que a veces nos encontramos programando. Con ese fin, la empresa le permite enviar rápidamente la transcripción para que ChatGPT la analice, lo que extrae el TL; DR, las acciones asignadas o cualquier otra cosa que deba extraerse de la reunión.

Francamente, nunca me han gustado estas características y nunca las uso, así que no puedo hablar de la calidad aquí. Probablemente sean tan buenos como cualquier otro servicio que haga esto, lo que significa que son útiles para las personas que encuentran útiles estas cosas. Intento olvidarme del contenido de una reunión lo más rápido posible, sin duda para disgusto de mis colegas, pero en mi defensa, lo recordaría mal. Las personas organizadas que tienen procesos para este tipo de trabajo pueden encontrar que el estilo Krisp les funciona bien o no.

También dudo en juzgar un servicio que es esencialmente una llamada API a otro servicio, que en sí mismo cambia constantemente. A medida que ChatGPT mejore, también lo harán las aplicaciones que dependen de él, lo mismo aquí que en otras cien plataformas que de repente desarrollaron la capacidad de comprender el lenguaje natural.

Krisp es gratuito si desea probarlo: la compañía gana dinero con suscripciones premium para empresas y, por supuesto, con el cálculo que se ejecuta en su dispositivo, es bastante simple de escalar.

Vale la pena tomarse un momento en su Mac o PC para asegurarse de que esté configurado correctamente, lo que significa que su transferencia funciona según lo previsto. Tuve algunos problemas extraños al principio, pero los solucioné comenzando desde cero y asignando solo aplicaciones de reunión y micrófonos para pasar por Krisp, para que no mezclara mi música. Es solo un puñado de diales e interruptores, así que tómese cinco minutos para hacerlo bien y pronto sus transcripciones aparecerán tan rápido que será un poco molesto.


Source link
Salir de la versión móvil