Cómo elegir e implementar modelos de IA específicos de la industria

Cómo elegir e implementar modelos de IA específicos de la industria

DJ que es el fundador y CEO de Datos de ThirdEye, una empresa que transforma empresas con aplicaciones de IA. Un emprendedor en serie y paralelo, DJ también es un inversor ángel en varias startups centradas en datos en Silicon Valley.

A medida que la inteligencia artificial se vuelve más avanzada, anteriormente de vanguardia, pero genérica, los modelos de IA se están volviendo comunes, como Google Cloud IA de visión o Reconocimiento de Amazon.

Si bien son efectivas en algunos casos de uso, estas soluciones no se adaptan a las necesidades específicas de la industria desde el primer momento. Las organizaciones que buscan los resultados más precisos de sus proyectos de IA simplemente tendrán que recurrir a modelos específicos de la industria.

Cualquier equipo que busque expandir sus capacidades de inteligencia artificial debe primero aplicar sus datos y casos de uso a un modelo genérico y evaluar los resultados.

Hay algunas formas en que las empresas pueden generar resultados específicos de la industria. Una sería adoptar un enfoque híbrido: tomar un modelo genérico de inteligencia artificial de código abierto y capacitarlo aún más para alinearlo con las necesidades específicas de la empresa. Las empresas también pueden buscar proveedores externos, como IBM o C3, y acceder a una solución completa lista para usar. O, si realmente lo necesitaran, los equipos de ciencia de datos podrían construir sus propios modelos internamente, desde cero.

Analicemos cada uno de estos enfoques y cómo las empresas pueden decidir cuál funciona para sus distintas circunstancias.

Los modelos genéricos solos a menudo no son suficientes

Los modelos genéricos de IA como Vision AI o Rekognition y los de código abierto de TensorFlow o Scikit-learn a menudo no producen resultados suficientes cuando se trata de casos de uso específicos en industrias como las finanzas o el sector energético. Muchas empresas tienen necesidades únicas y los modelos que no tienen los datos contextuales de una industria determinada no podrán proporcionar resultados relevantes.

Construyendo sobre modelos de código abierto

En ThirdEye Data, trabajamos recientemente con una empresa de servicios públicos para etiquetar y detectar defectos en postes eléctricos mediante el uso de inteligencia artificial para analizar miles de imágenes. Comenzamos usando la API de Google Vision y descubrimos que no podía producir los resultados deseados, con la precisión y los valores de recuperación de los modelos de IA completamente inutilizables. Los modelos no pudieron leer los caracteres dentro de las etiquetas en los postes eléctricos el 90% del tiempo porque no identificaron la fuente no estándar y los colores de fondo variables utilizados en las etiquetas.

Por lo tanto, tomamos modelos básicos de visión por computadora de TensorFlow y los optimizamos según las necesidades precisas de la empresa de servicios públicos. Después de dos meses de desarrollar modelos de IA para detectar y descifrar etiquetas en los postes eléctricos, y otros dos meses de entrenar estos modelos, los resultados muestran niveles de precisión de más del 90%. Estos continuarán mejorando con el tiempo con iteraciones de reentrenamiento.

Cualquier equipo que busque expandir sus capacidades de inteligencia artificial debe primero aplicar sus datos y casos de uso a un modelo genérico y evaluar los resultados. Los algoritmos de código abierto con los que las empresas pueden comenzar se pueden encontrar en marcos de AI y ML como TensorFlow, Scikit-learn o Microsoft Cognitive Toolkit. En ThirdEye Data, usamos algoritmos de red neuronal convolucional (CNN) en TensorFlow.

Luego, si los resultados son insuficientes, el equipo puede extender el algoritmo entrenándolo más con sus propios datos específicos de la industria.


Source link