Ícono del sitio La Neta Neta

Dentro de la IA de Instagram que llena Explore con contenido fresco y jugoso

Dentro de la IA de Instagram que llena Explore con contenido fresco y jugoso

Instagram ha publicado un artículo que describe la maquinaria detrás de escena que llena la pestaña Explorar en Instagram con cosas nuevas e interesantes cada vez que la abres. Es un poco técnico, así que aquí hay cinco conclusiones.

Incluso Instagram y Facebook tienen recursos limitados

A diferencia del feed, que algunos aún preferirían que fuera simplemente cronológico, la pestaña Explorar debe ser manejada algorítmicamente. Pero comprender lo que está sucediendo en una red social basada en imágenes y recomendar nuevo contenido a las personas es un problema que es tan difícil como tú.

Si estas compañías tuvieran un poder de procesamiento y tiempo infinitos, probablemente se enfrentarían a la cuestión de Explorar de manera un poco diferente. Pero tal como están, deben atender a cientos de millones de personas con poca antelación y con solo enorme recursos informáticos Creo que ponen esto en la parte superior de la publicación para que la gente no se pregunte por qué están cortando esquinas.

También es más fácil experimentar e iterar cuando puedes cambiar cosas y ver resultados rápidamente, señalan.

Se trata de la cuenta, no de la publicación.

Se publica tanto en Instagram que sería prácticamente imposible realizar un seguimiento de cada foto individualmente, de todos modos con fines de recomendación. Es más simple y más eficiente rastrear cuentas, ya que las cuentas tienden a tener temas o temas, desde uno más amplio como "viajar" hasta algo altamente específico, como sellos redondos especialmente.

Si bien el hecho de que te guste una publicación de una cuenta no significa necesariamente que te gustará todo lo demás de esa cuenta, es un buen indicador de que al menos estás interesado en el tema de esa cuenta. Incluso si era esta publicación en particular de este gato en particular lo que querías sinceramente porque te recuerda a las viejas manoplas, si te gustan las imágenes de una cuenta que publica principalmente gatos, esa es información valiosa.

Hábitos complejos informan el algoritmo

En particular, no son solo las funciones de imagen las que utiliza Instagram para determinar qué cuentas están vinculadas por temas, aunque, por supuesto, ese tipo de cosas también se pueden detectar. También usan tu comportamiento.

Por ejemplo, cuando le gustan varias publicaciones seguidas, es más probable que estén vinculadas de alguna manera, incluso si los algoritmos de Instagram no pueden verlo:

Si un individuo interactúa con una secuencia de cuentas en la misma sesión, es más probable que sea tópicamente coherente en comparación con una secuencia aleatoria de cuentas del diverso rango de cuentas de Instagram. Esto nos ayuda a identificar cuentas tópicamente similares.

La gente tiende a buscar cosas de esa manera, pasando de una cuenta centrada en los viajes a la siguiente, o concentrándose en los animales porque necesitan que me recojan. Toda esa información es absorbida por el algoritmo e inspeccionada por relevancia. Por supuesto, las acciones deliberadas como "ver menos publicaciones como esta" y el bloqueo de cuentas también tiene mucho peso.

De "cuentas semilla" a un top 25

El proceso de pasar de un par de miles de millones de publicaciones a solo dos docenas puede ser bastante difícil, pero puede reducir el problema a un tamaño manejable al limitar la pestaña Explorar a cuentas vinculadas de alguna manera a cuentas que al usuario ya le han gustado o guardado publicaciones . Estas se llaman "cuentas semilla" porque todo lo demás en el proceso realmente surge de ellas.

Debido a cómo el sistema de aprendizaje automático representa las cuentas y sus temas dentro de sí mismo, es muy fácil encontrar un par de cientos de cuentas similares.

Imagínese si sabe que a alguien le gusta un mármol particular de color naranja rojizo y necesita encontrar algo más parecido. Si solo sumerges tu mano en un saco de canicas, es poco probable que encuentres una rápidamente. Incluso si los viertes en el piso, aún tendrás que buscar un poco. Pero si ya los ha organizado por color, todo lo que tiene que hacer es llegar a la vecindad general del mármol que le gusta y está casi garantizado que elija un ganador.

El modelo de aprendizaje automático hace eso al dar a todas estas cuentas una especie de ubicación en un espacio virtual, y cuanto más cerca están dos en ese espacio, más cerca están de forma tópica.

Entonces, la parte realmente difícil de reducir un conjunto de miles de millones a un conjunto de cientos básicamente ya se logra por la forma en que se clasifican las cuentas.

A partir de ahí, Instagram realiza tres pases con redes neuronales de complejidad creciente.

primero, un poco confuso, es una versión más simple y combinada de los siguientes dos procesos, que lo lleva de 500 a 150 cuentas. Esto es un poco extraño, pero piénselo de esta manera: esta red neuronal ha visto los pasos 2 y 3 suceder muchas veces y tiene un bonita Buena idea de lo que hacen. Algo así como si hubiera visto que las cookies se hacen suficientes veces como para adivinar una receta. Probablemente te acercarás, pero tampoco querrás publicarlo en cientos de millones de personas. Entonces, este paso solo hace las cosas obvias correctamente.

Segundo es una red neuronal computacionalmente barata que usa muchas más señales que la simple similitud tópica mencionada anteriormente. Aquí es donde entran en juego tus Me gusta individuales, así como los datos más detallados sobre las cuentas. Te gusta viajar, claro, pero en particular te gusta parejas viajar: ambas cosas con las que puede ayudar el algoritmo de clasificación de canicas anterior. Otros parámetros, como la popularidad general de una publicación, o en realidad su diferente de las otras publicaciones en la mezcla, figura también. Eso elimina otros 100 de la parte superior, dejando 50.

Tercero es una versión computacionalmente costosa de lo anterior, que hace otra transferencia a esos 50 y los reduce a la mitad, básicamente al mirar más de cerca y tomarse el tiempo para incluir, quizás, mil puntos de datos cada uno en lugar de cien.

Supongo que eso fue bastante largo para una "comida para llevar". No se preocupe, la próxima es rápida.

Y por supuesto, no ?

"Queremos asegurarnos de que el contenido que recomendamos sea seguro y apropiado para una comunidad global de muchas edades en Explore", escriben. "Usando una variedad de señales, filtramos el contenido que podemos identificar como no elegibles para ser recomendados".

Así que ahora sabes por qué no obtienes ninguno de ese en explorar.


Source link
Salir de la versión móvil