Deep Science: gigantes de la tecnología revelan avances en la cumbre de visión por computadora

Deep Science: gigantes de la tecnología revelan avances en la cumbre de visión por computadora

La cumbre de visión por computadora CVPR acaba de tener lugar (virtualmente) y, al igual que otras conferencias centradas en CV, hay bastantes artículos interesantes. Más de lo que podría escribir individualmente, de hecho, he recopilado las más prometedoras de las principales empresas aquí.

Facebook, Google, Amazon y Microsoft compartieron artículos en la conferencia, y otros también, estoy seguro, pero me quedo con los grandes bateadores de esta columna. (Si está interesado en los trabajos considerados más meritorios por los asistentes y los jueces, los nominados y premios se enumeran aquí.)

Microsoft

Redmond tiene los artículos más interesantes de este año, en mi opinión, porque cubren varias necesidades no obvias de la vida real.

Uno es documentar esa caja de zapatos que nosotros o quizás nuestros padres llenamos con viejas fotos de 3×5 y otras fotos de películas. Por supuesto, ya existen servicios que ayudan con esto, pero si las fotos están arrugadas, rasgadas o dañadas de alguna otra manera, generalmente solo obtiene un escaneo de alta resolución de ese daño. Microsoft ha creado un sistema para reparar automáticamente esas fotos y los resultados se ven muy bien.

Créditos de imagen: Google

El problema es tanto identificar los tipos de degradación que sufre una foto como corregirlos. La solución es simple, escriben los autores: “Proponemos una nueva red de traducción de dominios de tripletes aprovechando fotos reales junto con pares de imágenes sintéticas masivas”. ¡Increíble que nadie lo haya probado antes!


Source link