Cómo engañar a una IA que escucha a escondidas... con otra IA

Cómo engañar a una IA que escucha a escondidas… con otra IA

antena parabólica del oído

jonathan cocinaimágenes falsas

  • Un equipo de la Universidad de Columbia ha creado un sistema de inteligencia artificial (IA) que confunde de manera efectiva las herramientas de espionaje que también usan IA.
  • El nuevo sistema utilizó el aprendizaje automático en un entorno de laboratorio, pero los investigadores esperan que pueda emplearse en situaciones reales.
  • El sistema funciona mucho mejor que el simple ruido blanco para disfrazar conversaciones.

    ¿Puede una herramienta de inteligencia artificial ser más astuta que otra?

    Los científicos de la Universidad de Columbia en la ciudad de Nueva York creen que han ideado una IA que puede engañar de manera efectiva a un sistema automático de reconocimiento de voz que escucha a escondidas para que no transcriba su conversación privada. Entonces, en el futuro, es posible que no tenga que preocuparse de que alguien esté usando software espía para grabar sus llamadas telefónicas, o de que su Alexa esté escuchando cuando no debería.

    👾 Las nuevas tecnologías son increíbles. Vamos a nerd sobre ellos juntos.

    Su sistema Neural Voice Camouflage evita que los intrusos transcriban en secreto su conversación de audio al incorporar un ruido de tipo estático personalizado sobre su discurso. El ruido se configura al mismo volumen que el ruido de fondo normal, no más alto que una unidad de aire acondicionado de fondo normal, por lo que las personas con las que está hablando pueden entender fácilmente lo que está diciendo. Sin embargo, el sistema de reconocimiento de voz automático (ASR) que intenta escuchar a escondidas se confundirá y producirá una transcripción de Gobbledygook, como puede ver en la siguiente demostración:

    Este proceso de producir un ruido de fondo personalizado es más complicado de lo que parece. No es como abrir un grifo para producir ruido blanco, como lo haría un personaje en un programa de televisión para evitar que los micrófonos ocultos plantados por los malos capten lo que dicen.

    En cambio, los investigadores recurrieron al aprendizaje automático para entrenar su sistema para encontrar patrones en los datos de audio del habla de las personas y luego hacer predicciones sobre lo que dirían a continuación. Basado en las palabras predichas, el sistema generó los ruidos más efectivos para bloquear la comprensión por parte de una IA enemiga, líder del proyecto Mia Chiquier dice en un Ciencias artículo de noticias Los investigadores entrenaron el Neural Voice Camouflage con horas y horas de voz que grabaron durante el proyecto, que el sistema procesó continuamente, dos milisegundos a la vez. El equipo presentó su investigación en un documento de conferencia para revisión por pares en el Conferencia Internacional sobre Representaciones de Aprendizaje a finales de abril de 2022.

    La transmisión de audio presenta un desafío particular porque el software tiene que ser más astuto que una IA que escucha a escondidas en tiempo real. Las tasas de muestreo de audio (cuántas muestras de audio se graban cada segundo) son de al menos 16 kilohercios, según Página del proyecto de Chiquier, lo que significa que cualquier interrupción exitosa de la transmisión de audio debe ocurrir “en milisegundos, lo que actualmente es inviable”. Los investigadores también tenían que asegurarse de que el ruido de fondo perturbador fuera lo suficientemente fuerte como para llegar a los micrófonos que escuchaban a escondidas, para llegar a la misma distancia que la voz que intentaba camuflar.

    El arma de defensa del sistema es el uso de “ataques predictivos” para asegurar que cualquier palabra hablada en tiempo real esté lo suficientemente oculta para evitar que los sistemas ASR funcionen correctamente. El sistema tiene en cuenta lo que dice una persona para generar ruido confuso. Si bien no puede saber con certeza qué dirá el orador a continuación, el sistema predice algunas frases posibles.

    Por ejemplo, en una prueba, el hablante dice: “No dice, pero está en la frontera y en el mapa”, mientras que la IA de espionaje transcribe al hablante diciendo: “O no dice, pero está en el frente”. hir eser y en thelag.”

    El ruido blanco, con el que puede estar familiarizado como lluvia constante o el zumbido de un ventilador, es un sonido que contiene todas las frecuencias audibles. Tiende a enmascarar otros sonidos, pero no se compara con la alta tasa de errores de palabras que puede generar Neural Voice Camouflage en una IA de transcripción que escucha a escondidas. La misma oración es más comprensible cuando se usa ruido blanco: “Él no dice, pero está en el frente aquí y en el mapa”.

    La tasa de errores de palabras con el software del equipo de investigación fue del 80,2 por ciento, en comparación con el 11,3 por ciento con ruido blanco. Incluso un sistema de IA de espionaje que los investigadores entrenaron para transcribir el discurso de audio del Neural Voice Camouflage no funcionó bien, con una tasa de error del 52,5 por ciento.

    Chiquier espera ampliar su investigación para proteger todas las formas de privacidad que pueden verse amenazadas por la tecnología de inteligencia artificial, como el uso no autorizado de software de reconocimiento facial, dice. Ciencias. Y el componente predictivo de inteligencia artificial de la investigación del equipo podría usarse para automóviles autónomos, agrega, ya que requieren procesamiento en tiempo real, como anticipar y evitar peatones.

    Este contenido lo crea y mantiene un tercero, y se importa a esta página para ayudar a los usuarios a proporcionar sus direcciones de correo electrónico. Es posible que pueda encontrar más información sobre este y contenido similar en piano.io


Source link