OctoML, una startup fundada por el equipo detrás de la Apache TVM proyecto de pila de compilador de aprendizaje automático, anunció hoy que ha recaudado una ronda Serie A de $ 15 millones liderada por Amplify, con la participación de Madrona Ventures, que lideró su ronda inicial de $ 3.9 millones. La idea central detrás de OctoML y TVM es utilizar el aprendizaje automático para optimizar los modelos de aprendizaje automático para que puedan ejecutarse de manera más eficiente en diferentes tipos de hardware.
“Ha habido bastante progreso en la creación de modelos de aprendizaje automático”, me dijo el director ejecutivo de OctoML y profesor de la Universidad de Washington, Luis Ceze. “Pero gran parte del dolor se ha trasladado una vez que tienes un modelo, ¿cómo haces un buen uso de él en el borde y en las nubes?”
Ahí es donde entra en juego el proyecto TVM, que fue lanzado por Ceze y sus colaboradores en la Escuela de Ciencias de la Computación e Ingeniería Paul G. Allen de la Universidad de Washington. Ahora es un proyecto de incubación de Apache y debido a que ha visto un poco de uso y apoyo de las principales empresas como AWS, ARM, Facebook, Google, Intel, Microsoft, Nvidia, Xilinx y otras, el equipo decidió formar una empresa comercial a su alrededor. que se convirtió en OctoML. Hoy en día, incluso la detección de palabras de activación de Amazon Alexa funciona con TVM.
Ceze describió TVM como un sistema operativo moderno para modelos de aprendizaje automático. “Un modelo de aprendizaje automático no es un código, no tiene instrucciones, tiene números que describen su modelado estadístico”, dijo. “Hay bastantes desafíos para hacer que funcione de manera eficiente en una plataforma de hardware dada porque hay literalmente miles y miles de millones de formas en las que puede asignar un modelo a objetivos de hardware específicos. Elegir el correcto que funcione bien es una tarea importante que generalmente requiere la intuición humana”.
Y ahí es donde OctoML y su producto SaaS “Octomizer”, que también anunció, entran hoy. Los usuarios pueden cargar su modelo en el servicio y lo optimizará, comparará y empaquetará automáticamente para el hardware que especifique y en el formato que desee. . Para usuarios más avanzados, también existe la opción de agregar la API del servicio a sus canalizaciones de CI/CD. Estos modelos optimizados se ejecutan significativamente más rápido porque ahora pueden aprovechar al máximo el hardware en el que se ejecutan, pero lo que tal vez a muchas empresas les importe aún más es que estos modelos más eficientes también cuestan menos para ejecutarlos en la nube, o que pueden use hardware más barato con menos rendimiento para obtener los mismos resultados. Para algunos casos de uso, TVM ya da como resultado ganancias de rendimiento de 80x.
Actualmente, el equipo de OctoML consta de unos 20 ingenieros. Con esta nueva financiación, la compañía prevé ampliar su equipo. Esas contrataciones serán en su mayoría ingenieros, pero Ceze también enfatizó que quiere contratar a un evangelista, lo cual tiene sentido, dada la herencia de código abierto de la compañía. También señaló que, si bien Octomizer es un buen comienzo, el objetivo real aquí es construir una plataforma MLOps con más funciones. “La misión de OctoML es construir la mejor plataforma del mundo que automatice MLOps”, dijo.
Source link