Las empresas se basan en una gran cantidad de datos no estructurados y, a menudo, no tienen las capacidades para sacar mucho provecho de ellos.
Ahora imagine tener una forma de almacenar datos y poder hacerles preguntas, por ejemplo, “¿Cuándo firmó ABC Company su primer contrato con nosotros?” o “Muéstrame videos que contengan cielos azules”.
Eso es lo que Tecnologías SemiMI está construyendo con Weaviate, un motor de búsqueda de vectores. Es un tipo único de base de datos de inteligencia artificial que utiliza modelos de aprendizaje automático que generan vectores, también conocidos como incrustaciones, de ahí el nombre de motor de búsqueda de vectores, dijo Bob van Luijt, director ejecutivo y cofundador de SeMI.
Explicó que los motores de búsqueda de vectores no son nuevos: la Búsqueda de Google es un ejemplo de una solución construida sobre un motor de búsqueda de vectores. Sin embargo, el objetivo de SeMI es comercializar esta tecnología y tiene un modelo comercial de código abierto para que cualquiera pueda usarlo.
Van Luijt le dio a mi colega, Alex Wilhelm, un vistazo bajo el capó de la tecnología el año pasado al crear un motor de búsqueda semántica que responde preguntas sobre los artículos de Techcrunch de 2021.
“Todos pueden usar la tecnología, y tenemos herramientas y servicios para aquellas empresas que lo necesitan”, agregó van Luijt. “No creamos ni distribuimos los modelos reales; esto es algo que hacen empresas como Huggingface u OpenAI, o las empresas fabrican modelos ellos mismos. Pero tener los modelos es una cosa, usarlos para potenciar sus sistemas de búsqueda y recomendación en producción es otra, y esto es exactamente lo que resuelve Weaviate”.
Desde que fundó la empresa en 2019 con el CTO Etienne Dilocker y el COO Micha Verhagen, van Luijt ha visto cómo la tecnología de SeMI inspira más de 100 casos de uso, incluidas nuevas empresas, como Keenious o Zencastr, creando nuevos negocios basados en las nuevas posibilidades que les brinda un motor de búsqueda vectorial. y usos en los que los resultados proporcionados por Weaviate ayudan directamente a las personas, por ejemplo, en medicina.
Algunos de los favoritos personales de van Luijt fueron los que dijo que eran más “esotéricos”, incluida la vectorización y la búsqueda a través del genoma humano, el mapeo de todo el mundo en vectores, o las llamadas incrustaciones de gráficos, que se pueden buscar fácilmente a través de con Weaviate, como un manifestación SeMI creado en incrustaciones de gráficos de Meta Researches.
SeMI recaudó una semilla de $ 1.2 millones en agosto de 2020 de Zetta Venture Partners e ING Ventures y desde entonces ha estado en el radar de las empresas de capital de riesgo. Desde entonces, su software se ha descargado casi 750.000 veces, un crecimiento de alrededor del 30% mensual. Van Luijt no dio detalles sobre las métricas de crecimiento de la empresa, pero dijo que la cantidad de descargas puede correlacionarse con las ventas de licencias empresariales y servicios administrados. Además, el aumento en el uso y la comprensión del valor agregado de Weaviate ha provocado que todas las métricas de crecimiento aumenten y que la empresa agote su financiación inicial.
Aunque la financiación inicial se había ido, la empresa no buscaba activamente nuevos fondos. Sin embargo, cuando los cofundadores de SeMI mantuvieron conversaciones con Cortical Ventures, un nuevo fondo de exfundadores de Datarobot y New Enterprise Associates (NEA), van Luijt dijo que las empresas les mostraron cómo apoyarían el negocio.
“Fue realmente asombroso ‘pellizcar mi brazo’”, agregó. “Todo lo que han hecho en el pasado, los equipos que nos están apoyando, era exactamente lo que estábamos buscando, y puedo decir, aunque con una experiencia muy reciente, que todas las increíbles historias son ciertas”.
Esas conversaciones llevaron a NEA y Cortical a liderar conjuntamente una nueva ronda de financiamiento de $16 millones en dólares de la Serie A.
SeMI tiene la intención de implementar la nueva financiación para contratar talento estadounidense y europeo y duplicar su comunidad de código abierto para Weaviate y la búsqueda de vectores en general. También aumentará su enfoque en la comercialización y los productos en torno al núcleo de código abierto, y dará los primeros pasos en la investigación donde el aprendizaje automático se superpone con la informática.
Mientras tanto, van Luijt cree que estamos viendo la próxima ola de tecnología de bases de datos que comenzó con la ola SQL que marcó el comienzo de grandes ganadores, como Oracle y Microsoft, seguida de una segunda ola fue la ola de bases de datos sin SQL, con ganadores como MongoDB. y Redis.
“Ahora estamos al borde de una nueva generación de bases de datos, aquellas que priorizan la IA, y Weaviate es un ejemplo de esto”, agregó. “Necesitamos educar al mercado no solo sobre Weaviate, sino también sobre las bases de datos de búsqueda de vectores, o las primeras bases de datos de IA. Esto es algo extremadamente emocionante porque el aprendizaje automático trae algo excepcionalmente asombroso a la mesa. Por ejemplo, hacer que su base de datos responda preguntas en lenguaje natural sobre millones, o incluso miles de millones, de documentos, o ‘comprender’ lo que contienen millones de fotos o videos”.
Source link