Deep Science: aventuras de IA en artes y letras

Hay más noticias sobre IA de las que nadie puede seguir. Pero puede mantenerse bastante actualizado sobre los desarrollos más interesantes con esta columna, que recopila los avances en inteligencia artificial y aprendizaje automático de todo el mundo y explica por qué pueden ser importantes para la tecnología, las empresas emergentes o la civilización.

Para comenzar con una nota alegre: las formas en que los investigadores encuentran para aplicar el aprendizaje automático a las artes son siempre interesantes, aunque no siempre prácticas. Un equipo de la Universidad de Washington quería ver si un sistema de visión por computadora podía aprender a decir lo que se toca en un piano solo desde una vista aérea de las teclas y las manos del jugador.

me atrevo, el sistema entrenado por Eli Shlizerman, Kun Su y Xiulong Liu, ve un video de tocar el piano y primero extrae una secuencia simple de pulsaciones de teclas similar a un rollo de piano. Luego agrega expresión en forma de longitud y fuerza de las presiones y, por último, lo pule para ingresarlo en un sintetizador MIDI para la salida. Los resultados son un poco imprecisos pero definitivamente reconocibles.

Créditos de imagen: Shlizerman y col. Alabama

“Anteriormente se creía imposible crear música que suene como si se pudiera tocar en una actuación musical”, dijo Shlizerman. “Un algoritmo necesita descubrir las señales o ‘características’ en los fotogramas de video que están relacionados con la generación de música, y necesita ‘imaginar’ el sonido que está sucediendo entre los fotogramas de video. Requiere un sistema que sea a la vez preciso e imaginativo. El hecho de que logramos una música que sonaba bastante bien fue una sorpresa “.

Otra del campo de las artes y las letras es esta fascinante investigación sobre despliegue computacional de letras antiguas demasiado delicadas para manipularlas. El equipo del MIT estaba examinando cartas “bloqueadas” del siglo XVII que están tan intrincadamente dobladas y selladas que quitar la letra y aplanarla podría dañarlas permanentemente. Su enfoque fue tomar rayos X de las letras y establecer un algoritmo nuevo y avanzado para trabajar en el descifrado de las imágenes resultantes.

Diagrama que muestra vistas de rayos X de una letra y cómo se analiza para desplegarla virtualmente. Créditos de imagen: CON

“El algoritmo termina haciendo un trabajo impresionante al separar las capas de papel, a pesar de su extrema delgadez y los pequeños espacios entre ellas, a veces menores que la resolución del escaneo”, dijo Erik Demaine del MIT. “No estábamos seguros de que fuera posible”. El trabajo puede ser aplicable a muchos tipos de documentos que son difíciles de desentrañar por técnicas simples de rayos X. Es un poco exagerado categorizar esto como “aprendizaje automático”, pero era demasiado interesante para no incluirlo. Lea el documento completo en Comunicaciones de la naturaleza.

Créditos de imagen: Asensio, te. al

Llega a un punto de recarga de su coche eléctrico y lo encuentra fuera de servicio. Incluso puede dejar una mala crítica en línea. De hecho, existen miles de estas revisiones y constituyen un mapa potencialmente muy útil para los municipios que buscan expandir la infraestructura de vehículos eléctricos.

Omar Asensio de Georgia Tech entrenó un modelo de procesamiento del lenguaje natural en dichas revisiones y pronto se convirtió en un experto en analizarlas por miles y extraer información sobre dónde eran comunes las interrupciones, el costo comparativo y otros factores.

Source link