Ícono del sitio La Neta Neta

Reason8 es un asistente de inteligencia artificial para gerentes y reuniones

Reason8 es un asistente de inteligencia artificial para gerentes y reuniones

Gracias a la tecnología, hacer una grabación de audio de una reunión es una tarea trivialmente fácil en estos días. Si bien los servicios de voz a texto pueden ayudar a abordar el tedio de la transcripción, esto solo invita a una serie de nuevos problemas: la necesidad de limpiar y confirmar las transcripciones. Para verificar quién dijo qué. Sin mencionar tener que asegurarse de que todos hayan dado su consentimiento para ser grabados y obtener una copia oportuna de las actas de la reunión después.

Por el lado del valor agregado, un gerente también podría desear una manera fácil de generar un resumen de los puntos clave después de una reunión. Y una herramienta que puede enumerar automáticamente cualquier tarea para que no tengan que volver atrás y sacarlas de sus notas. Los análisis sobre la productividad de las reuniones también podrían ser útiles, ya que ayudan a responder preguntas como: ¿Mis reuniones se están ejecutando a tiempo? ¿Qué hablantes tienden a dominar? ¿Cuántas decisiones se están tomando y actuando?

Estos son los tipos de capacidades de asistencia que las empresas emergentes incorporadas en EE. UU. Motivo8 tiene en proceso su servicio de transcripción impulsado por IA, que se lanzará hoy en versión beta desde el escenario TechCrunch Disrupt Berlin.

Más adelante, el equipo considera que la tecnología también podrá ofrecer a los usuarios análisis lingüístico y de voz, con el potencial de actuar como un entrenador y ofrecer orientación individual para mejorar el rendimiento en la reunión.

“Las reuniones en persona son el campo menos digitalizado en las comunicaciones personales”, dice el cofundador Vlad Belyaev, discutiendo la idea detrás del producto. “Es un mercado enorme. Todos hacemos reuniones y tomamos notas de reuniones, escribimos resúmenes de reuniones, actas de reuniones.

“Nuestro primer nicho es enfocarnos en los gerentes que dedican una gran cantidad de tiempo a hacer actas de reuniones y a realizar un seguimiento de las tareas que asignan a sus empleados”.

El usuario objetivo de Reason8 es un gerente intermedio que tiene de tres a cuatro reuniones por día y, por lo tanto, dedica mucho tiempo a destilar aire caliente en resúmenes y tareas rastreables. “Estamos tratando de hacerles la vida más fácil y productiva”, es su resumen conciso del objetivo del producto.

Se requieren al menos dos teléfonos inteligentes para grabar cualquier reunión a través de la aplicación. Esto proporciona suficientes datos de entrada de audio para que trabaje la IA que separa a los oradores, y también significa que varios participantes de la reunión pueden participar en la captura del registro de la reunión si lo desean. Por lo tanto, también tiene como objetivo ayudar con el problema del consentimiento y la propiedad.

Belyaev dice que la idea de la aplicación surgió después de haber trabajado como secretario y asistente ejecutivo, y pasó mucho tiempo recopilando y compartiendo actas de reuniones. El desafío de mantener informados a los participantes de la reunión que estaban distribuidos en varias zonas horarias fue otro punto problemático que alimentó la idea de la aplicación.

El equipo se incorporó en Delaware en mayo de 2016 y en noviembre del año pasado recaudó 1,2 millones de dólares en financiación inicial de inversores informales rusos para ayudar a financiar el desarrollo de su MVP.

La aplicación es solo iOS por ahora, siendo más fácil calibrar micrófonos en el hardware de iPhone más homogéneo que en la diversa gama de dispositivos de Android. Pero se planea una versión de Android para el próximo año, dice Belyaev.

Reason8 está usando API de voz en la nube de Google para la conversión de voz a texto del audio de la reunión capturado a través de su aplicación, por lo que lo primero que debe tener en cuenta es que no está tratando de replicar la tecnología de reconocimiento de voz sólida y competitiva que ya está disponible en el mercado.

Más bien, se centra en hacer que la tecnología existente sea más útil en el contexto de las reuniones y los gerentes. Su salsa especial es un modelo de aprendizaje profundo entrenado para poder identificar diferentes voces y, por lo tanto, separar a los oradores dentro de una transcripción, lo que significa que el usuario no solo recibe un gran bloque de texto.

Esto funciona sin que los usuarios necesiten entrenarlo, según Belyaev, quien dice que la IA puede separar a los oradores desde la primera reunión. (Y una vez que los usuarios individuales se han identificado en la aplicación, pueden vincular su nombre con su huella de voz para incluir también su nombre real en las transcripciones de la reunión).

“Utilizamos el aprendizaje profundo para comprender mejor la huella digital de su propia voz”, señala. “Lo hacemos de una manera totalmente sin supervisión. Así que no necesitamos datos para aprender a distinguir a los hablantes entre sí”.

La segunda parte de la tecnología patentada de Reason8 es un motor de procesamiento de lenguaje natural que utiliza para identificar automáticamente las tareas específicas acordadas en la reunión.

Este motor, que el equipo entrenó utilizando conjuntos de datos abiertos, se desarrolló a partir de un producto anterior que implementaron en el mercado ruso, con el objetivo de ayudar a las empresas a mejorar el rendimiento de sus servicios de atención al cliente.

“Desarrollamos nuestro propio motor de comprensión del lenguaje natural. Una de las principales características de este motor fue y es que podemos trabajar con muy poca cantidad de datos”, dice, y agrega: “Muy pocas empresas tienen datos para entrenar el modelo. Por eso creamos la solución que es capaz de identificar el sentido de las frases.

“Podemos clasificar este significado e identificar, por ejemplo, tareas a partir de decisiones e ideas”.

¿Cómo evita el sistema confundirse con la palabra codificada ensalada que puede aparecer en las reuniones? Al centrarse en analizar frases en lugar de palabras individuales, dice sobre eso.

“No analizamos palabras exactas, analizamos las frases completas”, le dice a TechCrunch. “Por eso analizamos el significado de las frases. Hemos estado desarrollando nuestro motor de lenguaje natural durante el último año y esto nos dio la oportunidad de comprender mejor el significado de las frases exactas que menciona la gente”.

El enfoque inicial en la extracción de tareas también es una forma para que el equipo se reduzca y aborde el desafío del contexto lingüístico que está en el centro de lo que están tratando de hacer. “Las tareas tienen principalmente una intención muy clara, por lo que puedes mencionar que alguien tiene que hacer algo con una fecha límite actual y esto es más fácil de identificar”, dice. “Decidimos centrarnos en un problema muy limitado: identificar tareas y luego decisiones e ideas posteriores”.

La ambición es que el motor NLP sea lo suficientemente inteligente como para poder crear automáticamente resúmenes de reuniones también en el futuro. Para eso, otra característica actual de la aplicación es clave: un botón resaltado que los usuarios pueden tocar manualmente dentro de la aplicación para marcar secciones importantes de una reunión mientras se lleva a cabo. Esto le dice al técnico que tome nota. Cualquier parte resaltada se incorporará al informe de la reunión que entrega.

Pero estos aspectos destacados del manual también son una señal de aprendizaje para la tecnología. Belyaev dice que los está introduciendo en el modelo para ayudarlo a comprender mejor la entonación vocal durante los momentos importantes de las reuniones.

“Con esta información, podemos capturar conjuntos de datos que definen no solo el significado sino también la entonación, el contexto en el que dices algo importante”, explica. “Cuando digo algo importante trato de ser preciso, trato de hacer pausas y enfatizar la entonación.

“Entonces, con toda esta información de contexto, no solo del texto en el que ya tenemos una gran experiencia, sino también de los sonidos, podemos identificar mejor y dar una mejor calidad a nuestro motor de resumen”.

“Mirando más allá, nuestra visión es proporcionar a las personas una herramienta con la que puedan crear actas y resúmenes de reuniones fácilmente y una ruta habilitada digitalmente para recopilar estos conjuntos de datos autoejecutables”, agrega. “Entonces, si las personas usan nuestro producto, mejoran su productividad con borradores de actas de reuniones, luego crean sus propias actas de reuniones y las envían a sus colegas”.

Por ahora, el motor puede identificar tareas. Pronto, “en las próximas semanas”, también podrá clasificar “ideas y decisiones”. Pero aún no es capaz de ofrecer resúmenes de reuniones completos. En su lugar, los usuarios obtienen un breve informe con los resaltados manuales que activan.

Belyaev dice que el plan es agregar integraciones con otras herramientas de comunicación, como Google Hangouts, Zoom y Slack, para “capturar más información para mejorar nuestro motor de resumen”. Y están planeando en la primavera de 2018 para el lanzamiento de la función de resumen de reuniones impulsada por IA, agrega.

También planean integrarse con los sistemas de gestión de proyectos existentes para ampliar aún más la utilidad del producto. Entonces, por ejemplo, una tarea extraída automáticamente de la transcripción de una reunión también podría ingresarse automáticamente en un PMS.

“Una transcripción es excelente, pero para las reuniones de negocios en persona, las minutas y los resúmenes de las reuniones agregan más valor que solo una transcripción”, argumenta. “Porque, sí, una transcripción da más valor que solo un registro, pero lo que es aún mejor es una extracción automática de tareas resumidas y más integraciones con sistemas de gestión de proyectos como Asana o Jira… Así que crea tareas automáticamente en los sistemas de gestión de proyectos. Por lo tanto, sería realmente excelente para mejorar la productividad de los gerentes y creo que para muchos otros usuarios potenciales”.

Aunque también enfatiza que el sistema no será 100 por ciento perfecto en el contexto de análisis, por lo que tampoco podrá reemplazar completamente a los asistentes. Más bien pretende ser una ayuda para aumentar la productividad.

La función de transcripción separada del hablante funciona para cualquier idioma que ya sea compatible con la tecnología de voz a texto de Google, según Belyaev.

Pero los modelos preentrenados que impulsan la tarea y (pronto) la identificación de decisiones se han entrenado en el habla del idioma inglés, por lo que actualmente no son compatibles con otros idiomas. Aunque dice que planean entrenar modelos en conjuntos de datos en otros idiomas en el futuro para ampliar el soporte.

El primer impulso comercial del equipo para el producto se centra en el mercado estadounidense. El precio es freemium por ahora, con una versión básica de uso limitado de la aplicación y una suscripción profesional para aquellos que desean un uso ilimitado y todas las funciones.

El objetivo inicial son los primeros usuarios de B2C que pueden sentirse más cómodos al priorizar las ganancias de productividad por encima de las preocupaciones de privacidad asociadas con una tecnología que actualmente funciona mediante la transmisión de datos de audio a la nube para su procesamiento.

En el frente de la privacidad, el sitio web de Record8 afirma que está encriptando los datos en tránsito y afirma que no almacena ningún dato de la reunión. Pero aun así, existen importantes consideraciones y riesgos de privacidad dado que se están cargando grabaciones de reuniones de negocios privadas y potencialmente confidenciales en la nube. Riesgos que hacen que su oferta actual no sea adecuada para muchas empresas.

Belyaev dice que el equipo tiene la intención de abordar el mercado empresarial más amplio en el futuro, como ofrecer una versión de nube privada a medida del sistema, pero está comenzando con B2C y los consumidores primero para impulsar la tracción para verificar la demanda del mercado. También podrán usar los datos de los primeros usuarios para continuar perfeccionando sus modelos para mejorar el producto.

“En nuestros planes, en el próximo medio año, apuntamos a las empresas”, dice. “Si las empresas desean nuestra solución de pago, entonces les gustaría crear una solución de nube privada interna con análisis, recomendaciones y todas las funciones de nuestro producto, entonces estamos listos para proporcionarlo.

“Sabemos que las empresas de consultoría de gestión preferirían mantener toda la información en sus servidores o en alguna nube privada como Amazon, pero les gusta usar su propia solución por cuestiones de privacidad. Así que sí, podremos brindarlo, estamos interesados ​​en brindarlo, pero nos gustaría comenzar con el segmento B2C y con los clientes finales brindándoles una aplicación para resumir y transcribir reuniones”.


Source link
Salir de la versión móvil