La base de datos vectorial Pinecone ahora puede manejar búsquedas híbridas de palabras clave y semánticas

La base de datos vectorial Pinecone ahora puede manejar búsquedas híbridas de palabras clave y semánticas

Cuando Piña anunció una base de datos vectorial a principios del año pasado, estaba construyendo algo diseñado específicamente para el aprendizaje automático y dirigido a científicos de datos. La idea era que pudieras consultar estos datos en un formato que las máquinas entiendan, haciéndolo mucho más rápido.

Originalmente, esto implicaba búsquedas semánticas en las que los usuarios podían buscar en función del significado en lugar de palabras específicas. Sin embargo, resulta que a medida que la gente puso a trabajar a Pinecone, hubo casos de uso en los que importaban palabras clave específicas, y hoy la compañía anunció que ahora es posible realizar búsquedas que combinen búsquedas semánticas y de palabras clave, lo que el fundador y director ejecutivo de la compañía, Edo Liberty, llama búsqueda híbrida.

“Hemos investigado mucho sobre este tema y descubrimos que, de hecho, la búsqueda híbrida termina siendo mejor [in many cases]. Es mejor en el sentido de que si puede combinar ambas búsquedas semánticas, esta es la codificación profunda de oraciones de PNL que obtiene el contexto y el significado, etc., pero también puede infundir eso con palabras clave específicas… la combinación de esos dos termina siendo significativamente mejor”, dijo Liberty a TechCrunch.

De hecho, dice que los dos se complementan bien, especialmente en los casos en los que importan los términos específicos de la industria. Esto podría ser algo así como un médico que busca palabras clave relacionadas con una enfermedad específica. En esos casos, el contexto médico puede arrojar mejores resultados al combinar una pregunta y algunas palabras clave específicas en torno a una enfermedad determinada.

Él dice que las palabras clave nunca tienen prioridad sobre la pregunta semántica que hace el usuario, pero brindan información adicional para ayudar a obtener resultados más significativos.

“Es posible que sepa exactamente lo que está buscando y que pueda proporcionar un impulso adicional cuando hace que su búsqueda semántica tenga en cuenta las palabras clave, y eso realmente ayuda mucho. Así que no quiero tirar las partes buenas de la búsqueda de palabras clave. [by relying completely on semantic search]. No quiero que las palabras clave estén en el asiento del conductor, pero tampoco quiero ignorarlas por completo”, dijo.

Como Liberty nos dijo en el momento de la Serie A de $ 28 millones de la compañía el año pasado, la búsqueda se ha convertido en un gran caso de uso para la compañía.

“El uso predominante de las bases de datos vectoriales es para búsqueda, y búsqueda en el sentido amplio de la palabra. Es buscar a través de documentos, pero se puede pensar en la búsqueda como recuperación de información en general, descubrimiento, recomendación, detección de anomalías, etcétera”, dijo en ese momento.

Pinecone se lanzó en 2019 y ha recaudado $ 38 millones, por Crunchbase.


Source link