Replicate quiere eliminar el dolor de ejecutar y alojar modelos ML

Replicate quiere eliminar el dolor de ejecutar y alojar modelos ML

Reproducir exactamente, una startup que ejecuta modelos de aprendizaje automático en la nube, se lanzó hoy de forma sigilosa con $ 17.8 millones en respaldo de capital de riesgo; $ 12,5 millones del total provinieron de una Serie A dirigida por Andreessen Horowitz con la participación de Y Combinator, Sequoia e inversores ángeles, incluido el CEO de Figma, Dylan Field, y Guillermo Rauch de Vercel, mientras que el resto provino de una ronda inicial no revelada anteriormente.

La empresa fue cofundada por Ben Firshman, quien dirigió los esfuerzos de productos de código abierto en Docker, y Andreas Jansson, anteriormente ingeniero de aprendizaje automático en Spotify. Tal como lo cuenta Firshman, él y Jansson se dieron cuenta de que la IA se estaba acelerando a un ritmo “absurdo”, pero que las barreras técnicas se interponían en el camino de la adopción masiva.

Ingrese a Replicate, que ofrece una biblioteca de modelos de código abierto que los desarrolladores de software pueden ejecutar con unas pocas líneas de código. La plataforma puede generar automáticamente un servidor API para modelos de aprendizaje automático personalizados, implementados en un gran grupo de GPU.

“Si obtiene una tonelada de tráfico, escalamos para manejar la demanda. Si no obtiene tráfico, lo reduciremos a cero y no cobraremos nada”, explicó Firshman. “Solo le cobramos por el tiempo que se ejecuta su código. La alternativa suele ser implementar modelos usted mismo en Amazon Web Services. Por lo general, tendría que luchar con servidores, Kubernetes, GPU, servidores API, escalado automático y más”.

Core to Replicate es Cog, una herramienta de código abierto que permite a los desarrolladores empaquetar modelos de aprendizaje automático en un formato de contenedor estándar listo para producción. Firshman y Jansson desarrollaron Cog, que se ejecuta en cualquier máquina macOS, Linux o Windows 11 más nueva.

“Actualmente, la IA es demasiado difícil de usar para los ingenieros de software y tienes que ser un ingeniero de aprendizaje automático para usarla”, dijo Firshman. “Las empresas y la industria en general se ven frenada por la falta de expertos en aprendizaje automático. Estamos haciendo posible que los ingenieros de software utilicen el aprendizaje automático sin experiencia, con solo unas pocas líneas de código, para que puedan crear productos con IA y aplicarlos a los problemas comerciales”.

Replicate alberga miles de modelos listos para usar, incluidos modelos de texto a imagen e imagen a texto (a la Stable Diffusion). Créditos de imagen: Reproducir exactamente

Replicate no es el único que hace esto. La startup compite con proveedores como Hugging Face y OctoML (y hasta cierto punto Runway ML), que colectivamente han recaudado cientos de millones en capital de riesgo. Google, Amazon y Microsoft también podrían considerarse rivales, ya que ofrecen sus propias soluciones para desarrollar, lanzar y mantener modelos de aprendizaje automático en la nube. (Consulte SageMaker, AutoML y las herramientas de aprendizaje automático sin código de Azure).

Entonces, ¿qué distingue a Replicate? Firshman afirma que la experiencia del desarrollador es “mucho mejor”, lo que, por supuesto, aún está por verse; después de todo, Replicate es completamente nuevo. Sin embargo, un punto claro de diferenciación es la amplitud de la biblioteca de IA de Replicate. La plataforma ofrece modelos de difusión que incluyen Stable Diffusion, modelos para crear y editar videos, modelos de ampliación para imágenes y varios modelos de imagen a texto y de texto a imagen.

El despliegue rápido e indoloro es el enfoque. El sitio web de Replicate promete: “Con Replicate y herramientas como Next.js y Vercel, puedes despertarte con una idea y verla llegar a la portada de Hacker News antes de irte a la cama”.

El marketing parece estar resonando con la comunidad de desarrolladores, que ha acogido con entusiasmo Replicate en los últimos meses, al menos según Firshman. Dice que la plataforma ha experimentado un crecimiento mensual del 149 % en usuarios activos y un crecimiento del 125 % en llamadas API desde mediados del año pasado. Los clientes empresariales incluyen Character.ai, Labelbox y Unsplash.

“Hemos estado indexando efectivamente el crecimiento de la IA generativa”, dijo Firshman. “Los fundadores están creando toneladas de nuevos productos, los inversores están invirtiendo en ellos y los usuarios claman por todas estas cosas nuevas”.

Inclinarse hacia la IA generativa es sin duda una sabia decisión por parte de Replicate. El segmento, bajo el cual caen tecnologías como ChatGPT y Stable Diffusion, ha visto un aumento masivo en la inversión en los últimos años. PitchBook (a través de Bezingá) informa que los capitalistas de riesgo canalizaron un 425 % más de dólares hacia la IA generativa en 2022 en comparación con 2020, y el espacio alcanzó los 2100 millones de dólares de capital total prometido en 2022.

Firshman ve que el crecimiento continúa y que Replicate se beneficia.

“Aún no ha entrado en la conciencia de la empresa cuánto IA generativo va a cambiar tantas partes de su negocio: atención al cliente, marketing, ventas, creación de contenido y probablemente otras cosas que aún no hemos anticipado”, dijo. “Muy pronto, la atención al cliente será en su mayoría automatizada y extremadamente buena, no los terribles chatbots del pasado. La creación de activos para marketing estará mayormente automatizada. La mayoría de los anuncios que ve se generarán y personalizarán automáticamente. La creación de activos para videojuegos estará mayormente automatizada. Y esto es con la tecnología que tenemos hoy”.


Source link