Anthropic cree que la 'IA constitucional' es la mejor manera de entrenar modelos

Anthropic lanza una versión mejorada de su LLM de nivel de entrada

by

in

Anthropic, la startup de IA cofundada por exejecutivos de OpenAI, ha liberado una versión actualizada de su modelo de generación de texto más rápido y económico disponible a través de una API, Claude Instant.

El Claude Instant actualizado, Claude Instant 1.2, incorpora las fortalezas del modelo insignia recientemente anunciado de Anthropic, Claude 2, que muestra ganancias “significativas” en áreas como matemáticas, codificación, razonamiento y seguridad, según Anthropic. En las pruebas internas, Claude Instant 1.2 obtuvo un 58,7 % en un punto de referencia de codificación en comparación con Claude Instant 1.1, que obtuvo un 52,8 % y un 86,7 % en un conjunto de preguntas de matemáticas frente al 80,9 % de Claude Instant 1.1.

“Claude Instant genera respuestas más largas y estructuradas y sigue mejor las instrucciones de formato”, escribe Anthropic en una publicación de blog. “Instant 1.2 también muestra mejoras en la extracción de citas, capacidades multilingües y respuesta a preguntas”.

Claude Instant 1.2 también tiene menos probabilidades de alucinar y es más resistente a los intentos de fuga, afirma Anthropic. En el contexto de los modelos de lenguaje grande como Claude, la “alucinación” es cuando un modelo genera un texto incorrecto o sin sentido, mientras que el jailbreak es una técnica que utiliza indicaciones escritas inteligentemente para eludir las funciones de seguridad colocadas en los modelos de lenguaje grande por sus creadores.

Y Claude Instant 1.2 presenta una ventana de contexto que es del mismo tamaño que la de Claude 2: 100,000 tokens. La ventana de contexto se refiere al texto que el modelo considera antes de generar texto adicional, mientras que los tokens representan texto sin formato (p. ej., la palabra “fantástico” se dividiría en los tokens “fan”, “tas” y “tic”). Claude Instant 1.2 y Claude 2 pueden analizar aproximadamente 75 000 palabras, aproximadamente la extensión de “El gran Gatsby”.

En términos generales, es menos probable que los modelos con grandes ventanas de contexto “olviden” el contenido de las conversaciones recientes.

Como informamos anteriormente, la ambición de Anthropic es crear un “algoritmo de próxima generación para el autoaprendizaje de IA”, como lo describe en una presentación a los inversores. Dicho algoritmo podría usarse para crear asistentes virtuales que puedan responder correos electrónicos, realizar investigaciones y generar arte, libros y más, algunos de los cuales ya hemos probado con GPT-4 y otros modelos de lenguaje grandes.

Pero Claude Instant no es este algoritmo. Más bien, tiene la intención de competir con ofertas similares de nivel de entrada de OpenAI, así como con nuevas empresas como Cohere y AI21 Labs, todas las cuales están desarrollando y produciendo sus propios sistemas de IA de generación de texto y, en algunos casos, de generación de imágenes.

Hasta la fecha, Anthropic, que se lanzó en 2021, dirigido por el ex vicepresidente de investigación de OpenAI, Dario Amodei, ha recaudado $ 1.450 millones con una valoración de miles de millones de un solo dígito. Si bien eso puede parecer mucho, está muy por debajo de lo que la compañía estima que necesitará (5 mil millones de dólares en los próximos dos años) para crear su chatbot previsto.

Anthropic afirma tener “miles” de clientes y socios actualmente, incluido Quora, que brinda acceso a Claude y Claude Instant a través de su aplicación de IA generativa basada en suscripción Poe. Claude impulsa la herramienta DuckAssist lanzada recientemente por DuckDuckGo, que responde directamente a consultas de búsqueda sencillas para los usuarios, en combinación con ChatGPT de OpenAI. Y en Notion, Claude es parte del backend técnico de Notion AI, un asistente de escritura de IA integrado con el espacio de trabajo de Notion.


Source link