Axel Bueckert / EyeEmimágenes falsas
- Investigadores de la Universidad de Washington, Seattle, han encontrado una manera de recuperar imágenes del mundo que se reflejan en una bolsa de papas fritas.
- Mediante el uso de sensores RGB-D disponibles comercialmente, que también se utilizan en el sistema Kinect de Microsoft, el equipo recuperó información de profundidad sobre el entorno reflejado en la bolsa.
- Mediante el uso de estas reflexiones, los investigadores pudieron crear nuevas imágenes de los alrededores desde ángulos que no habían visto antes. Esto podría resultar útil para el diseño de juegos AR y VR. Su trabajo fue publicado en el servidor de preimpresión ArXiv a principios de este año.
Los espejos no son los únicos objetos brillantes que reflejan nuestro entorno. Resulta que una humilde bolsa de papas fritas puede lograr el mismo truco, ya que los científicos de la Universidad de Washington, Seattle, han hecho posible recrear imágenes detalladas del mundo a partir de los reflejos en el envoltorio brillante de la merienda.
Los científicos llevaron su trabajo un paso más allá al predecir cómo la apariencia de una habitación podría aparecer desde diferentes ángulos, esencialmente “explorando” el reflejo de la habitación en una bolsa de papas fritas como si realmente estuvieran presentes. Esto es análogo a un problema clásico en la visión por computadora y los gráficos: la síntesis de vistas o la capacidad de crear una nueva vista sintética de un sujeto específico basado en otras imágenes, tomadas en varios ángulos.
Hay información claramente detallada oculta en el destello de luz reflejada por un objeto brillante. Los científicos pueden deducir la forma, composición y condición del objeto, como si está húmedo o seco, redondo o plano, áspero o pulido, todo a partir de los patrones de esa luz. Por lo general, estas imágenes están tan distorsionadas para el ojo humano que es posible que ni siquiera note que están allí.
“Sorprendentemente, las imágenes de la bolsa brillante de chips contienen pistas suficientes para poder reconstruir una imagen detallada de la habitación, incluida la disposición de luces, ventanas e incluso objetos externos que son visibles a través de las ventanas”, señalaron los investigadores en un documento publicado en el servidor de preimpresión ArXiv a principios de este año.
Estos científicos se inspiraron en los investigadores del Instituto de Tecnología de Massachusetts, quienes demostraron en 2014 que es posible convertir objetos cotidianos, como una bolsa de papas fritas Utz Potato Crab, en “micrófonos visuales” mediante el uso de videos de alta velocidad para estudiar las vibraciones diminutas en el objeto. Esas vibraciones se extraen para recuperar parcialmente el sonido que las produjo.
Para crear las reconstrucciones ambientales, que los investigadores llaman “mapas de reflectancia especular” o SRM, utilizaron sensores de mano RGB-D para tomar videos de 360 grados de ciertos objetos vidriosos y reflectantes. Los sensores fusionan la información de profundidad grabada en cada píxel de la imagen con imágenes RGB regulares, que utilizan luz roja, azul y verde para crear una variedad de colores.
Un ejemplo de un sensor de consumo RGB-D reside en el sistema Kinect de Microsoft, que la compañía introdujo hace una década para su consola de juegos XBOX 360. The Kinect, que potencia juegos basados en el movimiento como Solo baila, permite a los jugadores “agarrar” elementos, realizar movimientos de baile o luchar contra oponentes a través de la percepción de profundidad.
En un caso, el equipo grabó imágenes de una bolsa de Corn Cho, un tipo de chips de maíz hinchados cubiertos de chocolate. Usando lo que han llamado un algoritmo de estimación SRM, los científicos convirtieron las reflexiones transformadas en aproximaciones de cómo podría ser el entorno real. Si bien las imágenes simuladas todavía están embarradas y distorsionadas, los investigadores pudieron recuperar grandes detalles, como la imagen de un hombre reflejada en una ventana.
El algoritmo de los científicos funciona en prácticamente cualquier objeto brillante. En otro escenario, usaron una estatua de gato de porcelana para recuperar la alineación de las luces fluorescentes en el techo. Al algoritmo le tomó un promedio de dos horas por objeto convertir las reflexiones en representaciones del entorno.
Sin embargo, este trabajo podría volverse potencialmente problemático. Los depredadores o acosadores infantiles podrían potencialmente descargar una imagen de un sitio web de redes sociales, como Instagram, sin el consentimiento del creador. Luego, podrían implementar el nuevo algoritmo para encontrar información privada sobre dónde vive el creador de la imagen. Afortunadamente, las imágenes de Instagram no contienen información de profundidad (todavía), por lo que este uso distópico del algoritmo no es probable en este momento.
En el diseño de videojuegos, particularmente en aplicaciones de realidad aumentada y realidad virtual, los objetos brillantes se ven un poco desviados porque es un desafío reproducir los reflejos desde todos los ángulos desde los que puede ver ese objeto. Los investigadores descubrieron que al deconstruir primero los reflejos, es más fácil crear representaciones realistas del objeto reflectante en entornos simulados. Entonces, la esperanza es ver mejores gráficos para juegos en el futuro.
Mientras tanto, para probar esta teoría, presta atención a los espejos, ventanas y otros objetos brillantes en los juegos que juegas. Existe una gran posibilidad de que sus reflejos no sean tan avanzados como los que se ven en una simple bolsa de papas fritas.
Source link