El reconocimiento de voz activa divertidas pegatinas AR en la aplicación de video de Panda

El reconocimiento de voz activa divertidas pegatinas AR en la aplicación de video de Panda

by

in

Panda ha creado la próxima característica social tonta que Snapchat e Instagram querrán robar. Hoy la startup lanza su videomensajería aplicación que llena la pantalla con efectos de realidad aumentada basados ​​en las palabras que dices. Di “¿Quieres pedir pizza?” y una rebanada de pizza en 3D flota junto a tu boca. Di “Llevo mis gafas de sol por la noche” y de repente estás usando gafas AR con una luna colgando sobre tu cabeza. En lugar de distraerse teniendo que elegir efectos de un menú, aparecen en tiempo real mientras chatea.

Panda es sorprendente y agradable. También es un poco raro, creado por un equipo de cinco personas con menos de $ 1 millón en fondos. Construir una base de usuarios de la aplicación de chat de video desde cero en medio de toda la competencia será una lucha. Pero incluso si Panda no es la aplicación para popularizar la idea, inventó una forma inteligente de mejorar la comunicación visual que se mezcla con nuestro comportamiento natural.

Todo comenzó con una visión alucinante. El fundador de Panda, Daniel Singer, de 18 años, había creado algunas aplicaciones fallidas y trabajaba como gerente de producto en la empresa emergente de terapia entre pares Sensay en Los Ángeles. Cuando Alaska Airlines compró Virgin, Singer obtuvo un vuelo gratis y fue a ver a su amigo Arjun Sethi, un inversionista de Social Capital en SF. Ahí es cuando de repente “estoy alucinando que mientras hablo deben aparecer las cosas que estoy diciendo” me dice. Sethi cavó en la idea y acordó financiar un proyecto para construirlo.

Daniel Singer, fundador de Panda

Mientras tanto, Singer había pasado los últimos 6 años haciendo FaceTiming casi todos los días. Le encantaba contar historias con sus amigos más cercanos, pero el protocolo de chat de video de Apple se había quedado atrás de Snapchat e Instagram cuando se trataba de herramientas creativas. Entonces, hace un año, recaudó $ 850,000 de Social Capital y Shrug Capital, además de ángeles como Cyan (Banister) y David Byttow de Secret. Singer se propuso construir Panda para combinar el chat en vivo de FaceTime con el destello visual de Snapchat activado por voz.

Pero resulta que “el chat de video es difícil”, admite. Entonces, su pequeño equipo se conformó con permitir que los usuarios enviaran mensajes de video asincrónicos de 10 segundos como máximo. Aplicación iOS de Panda se lanzó hoy con alrededor de 200 calcomanías diferentes activadas por voz, desde balones de fútbol hasta Zzzzzs somnolientos y una barra de censura “&’%! #” que cubre tu boca cuando dices palabrotas. Tócalos y desaparecerán, y pronto podrás reposicionarlos. A medida que activa los efectos por primera vez, estos entran en una vitrina de trofeos que gamifica la experimentación con la voz.

Panda es divertido para jugar contigo mismo, incluso si no estás enviando mensajes de forma activa a tus amigos, lo que recuerda cómo los adolescentes juegan con los filtros faciales de Snapchat sin publicar siempre los resultados. Los efectos de reconocimiento de voz tendrán mucho más sentido si Panda finalmente logra resolver el desafío tecnológico del chat de video en vivo. Un día, Singer imagina a Panda ganando dinero vendiendo efectos cosméticos que lo hacen más atractivo o a la moda, u ofreciendo efectos patrocinados, de modo que cuando dice “gimnasio”, la diadema que aparece en usted tiene la marca Nike.

Desafortunadamente, la aplicación puede tener algunos errores y los efectos no siempre se activan, engañándote de que no estás diciendo las palabras correctas. Y podría ser difícil convencer a los amigos para que descarguen otra aplicación de mensajería, y mucho menos convertirla en un hábito habitual. Apple también está agregando una gran cantidad de avatares personalizados de Memoji y otros efectos a FaceTime en su próximo iOS 12.

Panda avanza en una de las búsquedas fundamentales de la tecnología: tomar las ideas confusas en su cabeza y traducirlas en significado para otros de maneras más claras que las que pueden ofrecer las palabras. Es la próxima ola de comunicación visual que no requiere que abandones la conversación.

Cuando pregunté por qué otras aplicaciones no podían simplemente copiar las pegatinas de voz, Singer insistió: “Esto tiene que ser nativo de voz”. Estoy totalmente en desacuerdo, y puedo imaginar fácilmente que toda su aplicación se convierte en un solo filtro en Snapchat e Instagram Stories. Eventualmente accedió a que “Es una nueva realidad que se intercambian fragmentos y piezas de tecnología de consumo. No me sorprendería si otros piensan que es una buena idea”.

Es una batalla cuesta arriba tratar de desbaratar a los gigantes sociales de hoy, que se apresuran a aprovechar cualquier idea que les dé una ventaja. Facebook racionaliza el robo de características de otras aplicaciones al priorizar lo que atraerá a sus miles de millones de usuarios por encima del orgullo de sus diseñadores. Las empresas emergentes como Panda se están convirtiendo en departamentos de I+D externalizados.

Aún, Panda se compromete a continuar (aunque sería prudente aceptar una oferta de compra). Singer entiende que su aplicación no curará el cáncer ni “hará del mundo un lugar mejor”, como lo ha satirizado Silicon Valley de HBO. “Vamos a hacer cosas realmente divertidas y hacerlos reír y sonreír y experimentar la emoción humana”, concluye. “Al final del día, no creo que haya nada de malo en generar entretenimiento y deleite”.


Source link