El Run.AI de Tel Aviv, una startup que está construyendo una nueva plataforma de virtualización y aceleración para un aprendizaje profundo, está saliendo del sigilo hoy. Como parte de este anuncio, la compañía también anunció que ahora ha recaudado un total de $ 13 millones. Esto incluye una ronda inicial de $ 3 millones de TLV Partners y una ronda de $ 10 millones de Serie A liderada por Haim Sadger´s S Capital y TLV Partners.
No es ningún secreto que la construcción de modelos de aprendizaje profundo requiere una gran cantidad de potencia de GPU o acceso a chips AI especializados. Run.AI sostiene que las capas de virtualización que funcionaron tan bien en el pasado no son suficientes para la capacitación de los modelos de AI de hoy.
"Creemos que solo estamos arañando la superficie de todo el potencial del aprendizaje profundo", me dijo el CEO y cofundador de Run.AI, Omri Geller. “Pero las necesidades de infraestructura computacional del aprendizaje profundo son un juego de pelota totalmente diferente. […] El aumento del aprendizaje profundo está desencadenando una nueva era de cómputo ".
Tradicionalmente, argumenta Geller, la virtualización consistía en ser generoso y compartir los recursos de una sola máquina para cargas de trabajo que normalmente solo se ejecutan durante un breve período de tiempo o utilizan una pequeña cantidad de recursos. Las cargas de trabajo de aprendizaje profundo, sin embargo, son muy diferentes y son esencialmente egoístas, ya que quieren hacerse cargo de todos los recursos informáticos disponibles de una máquina determinada. Estas sesiones de entrenamiento también suelen durar horas o días. En su esencia, lo que ofrece Run.AI es una nueva capa de virtualización para tareas de aprendizaje automático distribuido que puede realizar en una gran cantidad de máquinas.
"Construimos una capa de abstracción de cómputo que cierra la brecha entre la nueva forma de cargas de trabajo y el nuevo hardware que está evolucionando", dijo Geller. "Al utilizar esta capa de abstracción, podemos lograr un cálculo 100 veces más rápido utilizando la computación distribuida. Podemos duplicar la utilización de recursos del hardware y podemos llevar a las empresas el control sobre el tiempo y el costo en relación con el aprendizaje profundo ". Eso es 100 veces más rápido que usar un solo recurso, aunque eso es un poco ambicioso, ya que Geller también me dice que el equipo está viendo una aceleración de 10x en la producción en este momento, aunque confía en que el equipo llegará a 100x con el tiempo. De todas formas, la promesa aquí es que el servicio le permitirá optimizar la utilización de sus cargas de trabajo de aprendizaje profundo.
Sin embargo, esa es solo una parte de la solución de la compañía. Además, las herramientas de la compañía también analizan el modelo para dividirlo en modelos más pequeños que luego pueden ejecutarse en paralelo a través de estos servidores. Con eso, el servicio puede comprender cuántos recursos necesitaría una carga de trabajo y a qué máquinas enviar mejor las cargas de trabajo dadas. Al hacer esto, el sistema tiene en cuenta todo, desde los recursos informáticos disponibles hasta el ancho de banda de la red, así como el tamaño y el flujo de datos.
La compañía también sostiene que esto le permite entrenar modelos grandes que son más grandes que la capacidad de memoria de GPU individual de una sola máquina.
También hay un aspecto financiero en esto, porque los usuarios pueden determinar si quieren que el servicio priorice los ahorros en costos por encima de la velocidad de capacitación, por ejemplo. La plataforma es compatible con despliegues de nube privada y pública. En las nubes privadas, el ahorro de costos es obviamente un factor menos importante, pero la premisa de una mayor utilización de la inversión en hardware existente probablemente será un atractivo para muchos de estos usuarios.
La empresa, que fue fundada por Geller, el Dr. Ronen Dar y el Prof. Meir Feder, fue fundada en 2018. Mientras todavía estaba en secreto, firmó a varios clientes tempranos y abrió una oficina en los Estados Unidos.
Source link