Google está perdiendo el control

Google está perdiendo el control

Google se tambalea. Después de años de adoración resuelta al asistente virtual del dios falso, la compañía está acelerando su estrategia de IA mientras sus competidores unen sus manos y levantan sus horcas. La ironía es que todo está sucediendo porque Google pensó que tenía acorralado el mercado de las horquillas.

Vea, en 2017, los investigadores de Google publicaron el artículo “La atención es todo lo que necesita”, presentando el concepto del transformador y mejorando enormemente las capacidades de los modelos de aprendizaje automático. No es necesario que conozca el aspecto técnico (y, de hecho, no seré yo quien se lo enseñe), pero ha sido enormemente influyente y fortalecedor; basta con decir que es la T en GPT.

Bien puede preguntarse, ¿por qué Google regaló esta maravillosa cosa libremente? Si bien en el pasado se ha criticado a los grandes equipos privados de investigación por retener su trabajo, la tendencia en los últimos años ha sido hacia la publicación. Esta es una obra de prestigio y también una concesión a los propios investigadores, que preferirían que su empleador no escondiera su luz bajo un bushel. Es probable que también haya un elemento de arrogancia: habiendo inventado la tecnología, ¿cómo podría Google dejar de explotarla de la mejor manera?

Las capacidades que vemos en ChatGPT y otros modelos de idiomas grandes hoy en día no siguieron de inmediato. Se necesita tiempo para comprender y aprovechar una nueva herramienta, y todas las empresas tecnológicas importantes se pusieron a trabajar para examinar lo que podría proporcionar la nueva era de la IA y lo que se necesitaba para hacerlo.

ayudar al asistente

No hay duda de que Google se estaba dedicando al trabajo de IA como todos los demás. Durante los siguientes años, hizo grandes avances en el diseño de hardware de cómputo de IA, creó plataformas útiles para que los desarrolladores probaran y desarrollaran modelos de aprendizaje automático y publicó toneladas de artículos sobre todo, desde ajustes de modelos esotéricos hasta cosas más reconocibles como la síntesis de voz.

Pero había un problema. Escuché esto de manera anecdótica de los empleados de Google y otros en la industria, pero hay una especie de aspecto feudal en la forma en que funciona la empresa: hacer que su proyecto esté bajo los auspicios de un producto importante existente, como Maps o Assistant, es una forma confiable para conseguir dinero y personal. Y así parece que, a pesar de haber acumulado a muchos de los mejores investigadores de IA del mundo, su talento se canalizó hacia las rutinas de la estrategia corporativa.

¿Vamos a ver cómo resultó eso? Aquí hay una pequeña línea de tiempo (ciertamente selectiva):

En 2018, mostraron mejoras incrementales en el flujo del Asistente de Google, Fotos (cosas como colorear imágenes monocromáticas), una pantalla inteligente con una “primera versión visual del Asistente” (¿lo has visto alguna vez?), Asistente en Maps, asistente de IA Google News y (para su crédito) MLKit.

En 2019, una pantalla inteligente renombrada y más grande, resultados de búsqueda AR, AR Maps, actualizaciones de Google Lens, Duplex para la web (¿recuerdas Duplex?), un Asistente de Google comprimido que hace más localmente, Asistente en Waze, Asistente en modo de conducción, en vivo subtítulos y transmisión en vivo (reconocimiento de voz) y un proyecto para comprender mejor a las personas con discapacidades del habla.

Sin duda, algunas de estas cosas son geniales! La mayoría, sin embargo, eran solo algo existente, pero con un impulso de la IA. Muchos se sienten un poco estremecidos en retrospectiva. Realmente ves cómo las grandes empresas como Google actúan esclavizadas por las tendencias y las impulsan.

Créditos de imagen: TechCrunch

Mientras tanto, en febrero de ese año también teníamos el titular: “OpenAI creó un generador de texto tan bueno que se considera demasiado peligroso para su lanzamiento”. Eso fue GPT-2. No 3, no 3.5… 2.

En 2020, Google hizo un clon de Pinterest impulsado por IA, luego, en diciembre, despidió a Timnit Gebru, una de las principales voces en ética de IA, por un artículo que señalaba los límites y peligros de la tecnología.

Para ser justos, 2020 no fue un gran año para muchas personas, con la notable excepción de OpenAI, cuyo cofundador Sam Altman tuvo que aplastar personalmente la exageración de GPT-3 porque había crecido más allá de los niveles sostenibles.

2021 vio el debut del modelo de lenguaje grande de Google, LaMDA, aunque las demostraciones realmente no lo vendieron. Presumiblemente, todavía estaban buscando una razón para que existiera más allá de hacer que el Asistente arrojara menos errores.

OpenAI comenzó el año mostrando DALL-E, la primera versión del modelo de texto a imagen que pronto se convertiría en un nombre familiar. Habían comenzado a demostrar que los LLM, a través de sistemas como ACORTAR, puede realizar más que tareas de lenguaje, y actuó más bien como un motor de interpretación y generación de uso múltiple. (Para ser claros, no me refiero a “inteligencia general artificial” o AGI, solo que el proceso funcionó para más de una colección preestablecida de comandos verbales).

En 2022, más ajustes en Assistant, más pantallas inteligentes, más AR en Maps y una adquisición de $100 millones de imágenes de perfil generadas por IA. OpenAI lanzó DALL-E 2 en abril y ChatGPT en diciembre.

En algún momento, sospecho que a principios de 2022, los ejecutivos de Google abrieron los ojos y lo que vieron los asustó muchísimo. me estoy imaginando escena en El señor de los anillos, donde Denethor finalmente observa a los ejércitos reunidos de Mordor. Pero en lugar de perder la cabeza y ser engañado por un mago, estos frenéticos vicepresidentes enviaron correos electrónicos preguntando por qué una empresa emergente estaba dando vueltas alrededor del líder mundial en IA. Especialmente después de que prácticamente inventaron los medios para hacerlo.

La evidencia de esto es la salida de Imagen un mes después de DALL-E 2, aunque como prácticamente cualquier otra investigación interesante de IA que Google publicitó, no estaba disponible para que nadie la probara, y mucho menos para conectarse a una API. Luego, después de que Meta lanzara Make-A-Video en septiembre, Google respondió con Imagen Video una semana después. Riffusion hizo olas para generar música, y un mes después, aquí viene MusicLM (que no puedes usar).

Pero seguramente fue ChatGPT lo que hizo que el liderazgo de Google pasara rápidamente de la ansiedad al sudor total.

Habría quedado claro para todos los involucrados que este tipo de IA conversacional era categóricamente diferente de los productos Asistente en los que Google había estado invirtiendo durante una década, y en realidad estaba haciendo lo que las pseudo-IA de todos los demás (efectivamente, solo interfaces de lenguaje natural para una colección de API) fingido. Eso es lo que se llama una amenaza existencial.

¿fortuna o previsión?

Créditos de imagen: Microsoft/Open AI

Ahora, ya era bastante malo que alguien más, algún advenedizo inmune a la adquisición, hubiera desencadenado la siguiente fase de la evolución del motor de búsqueda, y que lo hubiera hecho de una manera muy pública que capturó la imaginación de todos, desde los líderes de la industria hasta el evitador de la tecnología. El verdadero giro de la navaja vino inesperadamente de Microsoft.

Llamar a Bing un “rival” de la Búsqueda de Google es quizás demasiado generoso: con aproximadamente el 3% de la búsqueda global en comparación con el 92% de Google, Bing es más un tábano adinerado. Microsoft parece haber abandonado cualquier ilusión sobre la capacidad de Bing para mejorar su posición y buscó ayuda fuera de su propia casa. Ya sea que su inversión en OpenAI fuera una previsión sobrenatural o una casualidad afortunada, en algún momento quedó claro que habían apostado por un caballo veloz.

Quizás en alguna habitación llena de humo, Satya Nadella y Sam Altman conspiraron para excluir a Google de su nuevo orden mundial, pero en público la conversación tomó la forma de dinero, y mucho. Cualquiera que sea la historia de fondo, Microsoft había asegurado su lealtad con el recién llegado innovador y con él la oportunidad de poner su tecnología a trabajar donde haría el mayor bien.

Si bien hemos visto algunas ideas interesantes sobre cómo la IA generativa puede ayudar en la productividad, la codificación e incluso la gestión, aún no se han probado, ya sea debido a problemas de derechos de autor o a la tendencia de la IA a ser demasiado “creativa” en sus respuestas. Pero con las barandillas adecuadas, claramente fue muy bueno para sintetizar información para responder a casi cualquier pregunta, desde consultas simples sobre hechos hasta preguntas filosóficas complejas.

Search combinó la necesidad de Microsoft de innovar para salir adelante con una competencia central de grandes modelos de lenguaje, que por buena casualidad o sentido común acababa de alinear al creador más importante del mundo como socio. El movimiento para integrar el último modelo GPT (algunos lo llaman GPT-4, pero sospecho que OpenAI reservará ese apodo para su propio modelo propio) con Bing y Edge es una especie de avemaría forzada, su última y mejor jugada en el mundo de los buscadores.

Google, claramente inquieto, intentó una campaña de spoiler con una publicación de blog vacía el día antes de que Microsoft programara su gran evento para anunciar el Bing impulsado por OpenAI. Bard, aparentemente el nombre del competidor ChatGPT basado en LaMDA de Google, se dio a conocer ahora de manera típicamente sobria. Promesas de capacidades y sin fechas duras ni planes de acceso.

Este intento de anuncio parece haberse hecho con tanta prisa que su contenido apenas se mencionó en el evento “Búsqueda e IA” de Google dos días después y, de hecho, también escapó del tipo de verificación de hechos que le gustaría hacer si anunciaban el futuro del gráfico de conocimiento. La imagen utilizada para ilustrar a Bard contenía un error no trivial, que decía que el telescopio espacial James Webb “tomó las primeras imágenes de un planeta fuera de nuestro sistema solar”. Esto no es cierto, y el hecho de que esta cacareada inteligencia artificial se equivocó, y que nadie en Google se dio cuenta o se preocupó lo suficiente como para comprobarlo, parece haber asustado a los inversores.

ChatGPT ciertamente tiene problemas y, de hecho, inmediatamente después del lanzamiento de Bing mejorado de Microsoft, TechCrunch pudo obtener la IA supuestamente segura y apropiada para improvisar un ensayo de Hitler y luego regurgitar la información sobre vacunas que una versión anterior de sí mismo escribió el mes pasado. Pero estas son imperfecciones en un registro establecido que incluye miles de millones de indicaciones y conversaciones atendidas, para la abrumadora satisfacción de sus usuarios.

Google apresurando su tiro y tropezando tan visiblemente habla de una falta de preparación incluso a un nivel experimental limitado, y mucho menos de un lanzamiento global como el que Microsoft ya ha comenzado.

En su llamada a inversores, el CEO Sundar Pichai dijo: “Creo que veo esto como una oportunidad para repensar, reimaginar e impulsar la Búsqueda para resolver más casos de uso para nuestros usuarios también. Son los primeros días, pero nos verás ser audaces, sacar cosas, recibir comentarios e iterar y mejorar las cosas”. ¿Eso suena como un hombre con un plan?

Es comprensible que Google no quiera sacrificar a la gallina de los huevos de oro al fusionar prematuramente la Búsqueda con cualquier LLM de uso general a medio cocinar que tengan sentado. Se han convertido en expertos en implementar modelos de tareas de IA altamente especializados que hacen una o dos cosas. Pero cuando se trata de hacer un gran movimiento, su cómoda posición los ha cargado de inercia.

¿Es la caída de Google? Por supuesto que no, seguirá siendo la corporación predeterminada y fabulosamente rentable, algo ridícula para el futuro inmediato. Pero la confianza de los inversores se ha visto afectada, ya que resulta que el fracaso de Google para innovar significativamente en los últimos años podría no haber sido por sabiduría y confianza, sino por reticencia y orgullo. (La FTC y Justice, que intentan otra oportunidad con su negocio publicitario, tampoco pueden ayudar).

Sin embargo, este giro del gusano es solo en sus primeros grados, y no debemos especular demasiado cuando la tecnología en cuestión aún no ha demostrado ser tan valiosa como todos quieren creer que es. Si no es así, toda la industria tecnológica se enfrentará a las consecuencias, no solo Google.




Source link