NLPCloud.io ayuda a los desarrolladores a agregar inteligencia de procesamiento de idiomas a sus aplicaciones

Si bien las herramientas visuales ‘sin código’ están ayudando a las empresas a sacar más provecho de la informática sin la necesidad de ejércitos de técnicos internos para configurar el software en nombre de otro personal, el acceso a las herramientas tecnológicas más poderosas: en el carbón de inteligencia artificial de ‘tecnología profunda’ cara – todavía requiere ayuda de un experto (y / o experiencia interna costosa).

Aquí es donde arrancar la startup francesa, NLPCloud.io, está realizando un intercambio en MLOps / AIOps, o ‘plataforma informática como servicio’ (ya que ejecuta las consultas en sus propios servidores), con un enfoque en el procesamiento del lenguaje natural (NLP), como su nombre indica.

Los desarrollos en inteligencia artificial, en los últimos años, han llevado a avances impresionantes en el campo de la PNL, una tecnología que puede ayudar a las empresas a escalar su capacidad para lidiar de manera inteligente con todo tipo de comunicaciones mediante la automatización de tareas como el reconocimiento de entidades nombradas, análisis de sentimientos, texto clasificación, resumen, respuesta a preguntas y etiquetado de parte del discurso, lo que libera al personal (humano) para que se concentre en trabajos más complejos / matizados. (Aunque vale la pena enfatizar que la mayor parte de la investigación de PNL se ha centrado en el idioma inglés, lo que significa que es allí donde esta tecnología es más madura; por lo que los avances de IA asociados no se distribuyen universalmente).

Los modelos de PNL listos para la producción (previamente entrenados) para inglés están fácilmente disponibles “listos para usar”. También hay marcos de código abierto dedicados que ofrecen ayuda con los modelos de entrenamiento. Pero las empresas que quieran aprovechar la PNL aún necesitan tener los recursos y las habilidades de DevOps para implementar modelos de PNL.

NLPCloud.io está dirigido a empresas que no se sienten a la altura del desafío de implementación por sí mismas, ofreciendo “API NLP lista para producción” con la promesa de que “no se requieren DevOps”.

Su API se basa en Hugging Face y espacio modelos de código abierto. Los clientes pueden optar por utilizar modelos previamente entrenados y listos para usar (selecciona los “mejores” modelos de código abierto; no construye los suyos propios); o pueden cargar modelos personalizados desarrollados internamente por sus propios científicos de datos, lo que dice que es un punto de diferenciación frente a los servicios SaaS como Google Natural Language (que usa los modelos ML de Google) o Amazon Comprehend y Monkey Learn.

NLPCloud.io dice que quiere democratizar la PNL ayudando a los desarrolladores y científicos de datos a entregar estos proyectos “en poco tiempo ya un precio justo”. (Tiene un escalonado modelo de precios basado en solicitudes por minuto, que comienza en $ 39 p. m. y varía hasta $ 1,199 p. m., en el extremo empresarial, para un modelo personalizado que se ejecuta en una GPU. También ofrece un nivel gratuito para que los usuarios puedan probar modelos a baja velocidad de solicitud sin incurrir en un cargo).

“La idea surgió del hecho de que, como ingeniero de software, vi fallar muchos proyectos de IA debido a la fase de implementación a producción”, dice el único fundador y CTO Julien Salinas. “Las empresas a menudo se enfocan en construir modelos de IA precisos y rápidos, pero hoy en día hay más y más modelos excelentes de código abierto disponibles y están haciendo un trabajo excelente… por lo que el desafío más difícil ahora es poder usar estos modelos de manera eficiente en producción. Se necesitan habilidades de IA, habilidades de DevOps, habilidades de programación … por eso es un desafío para tantas empresas, y por eso decidí lanzar NLPCloud.io “.

La plataforma se lanzó en enero de 2021 y ahora tiene alrededor de 500 usuarios, incluidos 30 que pagan por el servicio. Mientras que la startup, que tiene su sede en Grenoble, en los Alpes franceses, es un equipo de tres por ahora, más un par de contratistas independientes. (Salinas dice que planea contratar a cinco personas para fin de año).

“La mayoría de nuestros usuarios son empresas emergentes de tecnología, pero también comenzamos a tener un par de empresas más grandes”, le dice a TechCrunch. “La mayor demanda que veo es tanto de ingenieros de software como de científicos de datos. A veces proviene de equipos que tienen habilidades en ciencia de datos pero que no tienen habilidades de DevOps (o no quieren dedicar tiempo a esto). A veces proviene de equipos de tecnología que quieren aprovechar la PNL de forma inmediata sin contratar a todo un equipo de ciencia de datos “.

“Tenemos clientes muy diversos, desde fundadores de startups en solitario hasta empresas más grandes como BBVA, Mintel, Senuto… en todo tipo de sectores (banca, relaciones públicas, investigación de mercado)”, añade.

Los casos de uso de sus clientes incluyen la generación de clientes potenciales a partir de texto no estructurado (como páginas web), a través de la extracción de entidades nombradas; y clasificar los tickets de soporte según la urgencia mediante la realización de análisis de sentimientos.

Los especialistas en marketing de contenido también están utilizando su plataforma para la generación de titulares (a través de un resumen). Mientras que las capacidades de clasificación de texto se utilizan para la inteligencia económica y la extracción de datos financieros, según Salinas.

Dice que su propia experiencia como CTO e ingeniero de software que trabaja en proyectos de PNL en varias empresas de tecnología lo llevó a detectar una oportunidad en el desafío de la implementación de la IA.

“Me di cuenta de que era bastante fácil construir modelos aceptables de PNL gracias a excelentes marcos de código abierto como spaCy y Hugging Face Transformers, pero luego me resultó bastante difícil usar estos modelos en producción”, explica. “Se necesitan habilidades de programación para desarrollar una API, sólidas habilidades de DevOps para construir una infraestructura robusta y rápida para servir modelos de PNL (los modelos de IA en general consumen muchos recursos) y también habilidades de ciencia de datos, por supuesto.

“Traté de buscar soluciones en la nube listas para usar para ahorrar semanas de trabajo, pero no pude encontrar nada satisfactorio. Mi intuición era que una plataforma de este tipo ayudaría a los equipos de tecnología a ahorrar mucho tiempo, a veces meses de trabajo para los equipos que no tienen perfiles de DevOps sólidos “.

“La PNL ha existido durante décadas, pero hasta hace poco se necesitaban equipos completos de científicos de datos para construir modelos aceptables de PNL. Durante un par de años, hemos logrado un progreso asombroso en términos de precisión y velocidad de los modelos de PNL. Cada vez más expertos que han estado trabajando en el campo de la PNL durante décadas están de acuerdo en que la PNL se está convirtiendo en una ‘mercancía’ ”, continúa. “Los marcos como spaCy hacen que sea extremadamente sencillo para los desarrolladores aprovechar los modelos de PNL sin tener conocimientos avanzados de ciencia de datos. Y el repositorio de código abierto de Hugging Face para modelos de PNL también es un gran paso en esta dirección.

“Pero tener estos modelos en producción sigue siendo difícil, y tal vez incluso más difícil que antes, ya que estos modelos nuevos son muy exigentes en términos de recursos”.

Los modelos que ofrece NLPCloud.io se seleccionan por su rendimiento, donde “mejor” significa que tiene “el mejor compromiso entre precisión y velocidad”. Salinas también dice que están prestando atención al contexto, dado que la PNL se puede usar para diversos casos de usuarios, por lo que propone una cantidad de modelos para poder adaptarse a un uso determinado.

“Inicialmente comenzamos con modelos dedicados solo a la extracción de entidades, pero la mayoría de nuestros primeros clientes también solicitaron otros casos de uso, así que comenzamos a agregar otros modelos”, señala, y agrega que continuarán agregando más modelos de los dos marcos elegidos. – “para cubrir más casos de uso y más idiomas”.

Mientras tanto, SpaCy y Hugging Face fueron elegidos para ser la fuente de los modelos ofrecidos a través de su API en función de su historial como empresas, las bibliotecas de PNL que ofrecen y su enfoque en el marco listo para la producción, con la combinación que permite a NLPCloud.io ofrecemos una selección de modelos que son rápidos y precisos, que funcionan dentro de los límites de las respectivas compensaciones, según Salinas.

“SpaCy es desarrollado por una empresa sólida en Alemania llamada Explosion.ai. Esta biblioteca se ha convertido en una de las bibliotecas de PNL más utilizadas entre las empresas que desean aprovechar la PNL en la producción “de verdad” (a diferencia de la investigación académica únicamente). La razón es que es muy rápido, tiene una gran precisión en la mayoría de los escenarios y es un marco de trabajo obstinado que lo hace muy simple de usar por parte de científicos que no son científicos de datos (la compensación es que ofrece menos posibilidades de personalización) ”, dice.

“Hugging Face es una empresa aún más sólida que recientemente recaudó $ 40 millones por una buena razón: crearon una biblioteca disruptiva de PNL llamada ‘transformadores’ que mejora mucho la precisión de los modelos de PNL (la compensación es que consume muchos recursos) . Brinda la oportunidad de cubrir más casos de uso como análisis de opiniones, clasificación, resumen … Además de eso, crearon un repositorio de código abierto donde es fácil seleccionar el mejor modelo que necesita para su caso de uso “.

Si bien la IA avanza a un ritmo dentro de ciertas pistas, como NLP para inglés, todavía existen advertencias y posibles trampas asociadas a la automatización del procesamiento y análisis del lenguaje, con el riesgo de equivocarse o empeorar las cosas. Se ha demostrado, por ejemplo, que los modelos de IA entrenados en datos generados por humanos reflejan sesgos y prejuicios incrustados de las personas que produjeron los datos subyacentes.

Salinas está de acuerdo en que la PNL a veces puede enfrentar “problemas de prejuicios”, como el racismo y la misoginia. Pero expresa confianza en los modelos que han seleccionado.

“La mayor parte del tiempo parece [bias in NLP] se debe a los datos subyacentes utilizados para entrenar los modelos. Muestra que debemos tener más cuidado con el origen de estos datos ”, dice. “En mi opinión, la mejor solución para mitigar esto es que la comunidad de usuarios de PNL debe informar activamente algo inapropiado cuando se usa un modelo específico para que este modelo pueda pausarse y arreglarse”.

“Incluso si dudamos de que exista tal sesgo en los modelos que proponemos, alentamos a nuestros usuarios a que nos informen de tales problemas para que podamos tomar medidas”, agrega.

Source link