En los últimos años, el servicio de observabilidad que cotiza en bolsa, New Relic, comenzó a agregar más herramientas basadas en aprendizaje automático a su plataforma para la respuesta a incidentes asistida por inteligencia artificial cuando las cosas no salen según lo planeado. Hoy, está ampliando este conjunto de funciones con el lanzamiento de una serie de nuevas capacidades para lo que llama su “Servicio de inteligencia aplicada New Relic”.
Esta expansión incluye un servicio de detección de anomalías que incluso está disponible para usuarios gratuitos, la capacidad de agrupar alertas de múltiples herramientas cuando los modelos piensan que es un solo problema el que activa todas estas alertas y un nuevo análisis de causa raíz basado en ML para ayudar a eliminar algunas. de las conjeturas cuando ocurren los problemas. También es nueva (y en versión beta pública) la capacidad de New Relic para detectar patrones y valores atípicos en los datos de registro que se almacenan en la plataforma de datos de la empresa.
La idea principal aquí, me dijo el director de marketing de productos de New Relic, Michael Olson, es facilitar que las empresas de todos los tamaños obtengan los beneficios de las operaciones mejoradas con IA.
“Ha pasado aproximadamente un año desde que presentamos al mercado nuestro primer conjunto de capacidades de AIops con New Relic Applied Intelligence”, dijo. “Durante ese tiempo, hemos visto un crecimiento significativo en la adopción de las capacidades de AIops a través de New Relic. Pero una de las cosas que hemos escuchado de las organizaciones que aún tienen que incursionar en la adopción de las capacidades de AIops como parte de su práctica de respuesta a incidentes es que a menudo encuentran que cosas como curvas de aprendizaje empinadas y largos tiempos de implementación y capacitación, y a veces la falta de confianza o conocimiento de la inteligencia artificial y el aprendizaje automático, a menudo se interponen en el camino “.
La nueva plataforma debería poder detectar problemas emergentes en tiempo real, sin que el equipo tenga que preconfigurar las alertas. Y cuando lo haga, agrupará inteligentemente todas las alertas de New Relic y otras herramientas para reducir el ruido de alerta y permitir que los ingenieros se concentren en el incidente.
“En lugar de una tormenta de alertas cuando ocurre un problema en varias herramientas, los ingenieros obtienen un problema procesable con alertas agrupadas automáticamente en función de cosas como el tiempo y la frecuencia, según el contexto que pueden leer en los mensajes de alerta. Y ahora, con este lanzamiento, también podemos analizar los datos de las relaciones en sus sistemas para agrupar y correlacionar alertas de manera inteligente ”, explicó Olson.
Sin embargo, quizás lo más destacado para los equipos de operaciones que utilizarán estas nuevas funciones es la capacidad de New Relic para identificar la causa raíz probable de un problema. Como me dijo Guy Fighel, gerente general de inteligencia aplicada y vicepresidente de ingeniería de producto en New Relic, la idea aquí no es reemplazar a los humanos sino aumentar los equipos.
“Brindamos una experiencia que no es de caja negra para que los equipos elaboren las decisiones, la correlación y la lógica en función de su propio conocimiento e infundan el sistema con su propio conocimiento”, señaló Fighel. “Por lo tanto, puede ser muy específico en función de su entorno y sus necesidades. Y por eso y porque vemos una gran cantidad de datos provenientes de diferentes herramientas, todas ingresando a New Relic One como plataforma de datos, nuestra causa raíz probable es muy precisa. Habiendo dicho eso, todavía es un probable causa principal. Entonces, aunque tenemos opiniones al respecto, nunca te diremos, ‘oye, arregla eso, porque estamos 100% seguros de que ese es el caso’. Tú eres el humano, tienes el control “.
El sistema de inteligencia artificial también solicita comentarios a los usuarios, de modo que el modelo también se refina con cada nuevo incidente.
Fighel me dice que las herramientas de New Relic se basan en una variedad de métodos de análisis estadístico y modelos de aprendizaje automático. Algunos de ellos son exclusivos para usuarios individuales, mientras que otros se utilizan en toda la base de usuarios de la empresa. También enfatizó que todos los ingenieros que trabajaron en este proyecto tienen experiencia en ingeniería de confiabilidad del sitio, por lo que están íntimamente familiarizados con los problemas en este espacio.
Con el lanzamiento de hoy, New Relic también está agregando una nueva integración con PagerDuty y otras herramientas de administración de incidentes para que el estado de un problema dado se pueda sincronizar bidireccionalmente entre ellos.
“Queremos encontrarnos con nuestros clientes donde están y ser realmente independientes de la fuente de datos y permitir que los clientes obtengan datos de cualquier fuente, donde luego podamos enriquecerlos, reducir el ruido y, en última instancia, ayudar a nuestros clientes a resolver problemas más rápido”, dijo Olson.
Source link