Poner una marca de agua en una imagen para marcarla como propia es algo que tiene valor en innumerables dominios, pero en estos días es más difícil que simplemente agregar un logotipo en la esquina. Steg.AI permite a los creadores insertar una marca de agua casi invisible mediante el aprendizaje profundo, desafiando las contramedidas habituales de “cambiar el tamaño y volver a guardar”.
La propiedad de activos digitales ha tenido algunos años complejos, con NFT y la generación de IA sacudiendo lo que antes era un campo de bastante baja intensidad. Si realmente necesita probar la procedencia de una pieza de medios, ha habido formas de codificar esos datos en imágenes o audio, pero estos tienden a ser fácilmente derrotados por cambios triviales como guardar el PNG como JPEG. Las marcas de agua más sólidas tienden a ser visibles o audibles, como un patrón o código claramente visible en la imagen.
Una marca de agua invisible que se puede aplicar fácilmente, detectar con la misma facilidad y que es resistente a la transformación y la recodificación es algo que muchos creadores aprovecharían. El robo de IP, ya sea intencional o accidental, abunda en línea y la capacidad de decir “mira, puedo demostrar que hice esto”, o que una IA lo hizo, es cada vez más vital.
Steg.AI ha estado trabajando en un enfoque de aprendizaje profundo para este problema durante años, como lo demuestra este documento CVPR de 2019 y la recepción de las subvenciones gubernamentales de la Fase I y II del SBIR. Los cofundadores (y coautores) Eric Wengrowski y Kristin Dana trabajaron durante años en investigación académica; Dana fue la asesora de doctorado de Wengrowski.
Si bien Wengrowski señaló que, aunque han logrado numerosos avances desde 2019, el documento muestra la forma general de su enfoque.
“Imagínese que una empresa de IA generativa crea una imagen y Steg la marca con agua antes de entregarla al usuario final”, escribió en un correo electrónico a TechCrunch. “El usuario final podría publicar la imagen generada por IA en las redes sociales. Las copias de la imagen implementada aún contendrán la marca de agua Steg.AI, incluso si la imagen se redimensiona, comprime, captura de pantalla o se eliminan sus metadatos tradicionales. Las marcas de agua de Steg.AI son tan sólidas que pueden escanearse desde una pantalla electrónica o imprimirse con la cámara de un iPhone”.
Aunque comprensiblemente no querían proporcionar los detalles exactos del proceso, funciona más o menos así: en lugar de tener una marca de agua estática que debe colocarse de manera incómoda sobre un medio, la empresa tiene un par de modelos de aprendizaje automático combinados. que personalizan la marca de agua a la imagen. El algoritmo de codificación identifica los mejores lugares para modificar la imagen de tal manera que las personas no la perciban, pero que el algoritmo de decodificación puede seleccionar fácilmente, dado que utiliza el mismo proceso, sabe dónde buscar.
La compañía lo describió como un código QR invisible y en gran medida inmutable, pero no dijo cuántos datos se pueden incrustar realmente en un medio. Si realmente se parece a un código QR, puede tener uno o tres kilobytes, lo que no parece mucho, pero es suficiente para una URL, hash y otros datos de texto sin formato. Los documentos de varias páginas o los marcos de un video pueden tener códigos únicos, lo que multiplica esta cantidad. Pero esto es solo mi especulación.
Steg.AI me proporcionó varias imágenes con marcas de agua para que las inspeccionara, algunas de las cuales puede ver incrustadas aquí. También me proporcionaron (y me pidieron que no compartiera) las imágenes coincidentes previas a la marca de agua; mientras que en una inspección cercana algunas perturbaciones eran visibles, si no hubiera sabido buscarlas, probablemente las habría perdido, o las habría descartado como artefactos JPEG ordinarios.
Sí, este tiene marca de agua.
Aquí hay otro, de la obra más famosa de Hokusai:
Créditos de imagen: Hokusai / Instituto de Arte de Chicago
Puede imaginar cómo una marca tan sutil podría ser útil para un proveedor de fotografía de archivo, un creador que publica sus imágenes en Instagram, un estudio de cine que distribuye copias previas al lanzamiento de una función o una empresa que busca marcar sus documentos confidenciales. Y estos son todos los casos de uso que Steg.AI está analizando.
No fue un jonrón desde el principio. Al principio, después de hablar con clientes potenciales, “nos dimos cuenta de que muchas de nuestras ideas iniciales de productos eran malas”, recordó Wengrowski. Pero descubrieron que la solidez, un diferenciador clave de su enfoque, era definitivamente valiosa y, desde entonces, han encontrado tracción entre “empresas donde existe un fuerte apetito de los consumidores por la información filtrada”, como las marcas de productos electrónicos de consumo.
“Realmente nos ha sorprendido el aliento de los clientes que ven un gran valor en nuestros productos”, escribió. Su enfoque es proporcionar integraciones SaaS de nivel empresarial, por ejemplo, con una plataforma de gestión de activos digitales; de esa manera, nadie tiene que poner una marca de agua antes de enviarlo; todos los medios se marcan y rastrean como parte del proceso de manejo normal.
Ilustración conceptual de una aplicación Steg.AI que verifica una imagen.
Se podría rastrear una imagen hasta su fuente, y posiblemente también se podrían detectar los cambios realizados en el camino. O, alternativamente, la aplicación o API podría proporcionar un nivel de confianza de que la imagen no ha sido manipulada, algo que muchos gerentes de fotografía editorial agradecerían.
Este tipo de cosas tiene el potencial de convertirse en un estándar de la industria, tanto porque lo quieren como porque puede ser necesario en el futuro. Las empresas de IA acordaron recientemente realizar investigaciones sobre la marca de agua del contenido de IA, y algo como esto sería un recurso provisional útil mientras se considera un método más profundo para detectar los medios generados.
Steg.AI ha llegado tan lejos con las subvenciones de NSF y la inversión ángel por un total de $ 1.2 millones, pero acaba de anunciar una ronda A de $ 5 millones dirigida por Paladin Capital Group, con la participación de Washington Square Angels, NYU Innovation Venture Fund y los inversores ángeles, Alexander Lavin. , Eli Adler, Brian Early y Chen-Ping Yu.
Source link