Gremlin lleva la ingeniería del caos como servicio a Kubernetes

Gremlin lleva la ingeniería del caos como servicio a Kubernetes

La práctica de Chaos Engineering se desarrolló en Amazon y Netflix hace una década para ayudar a esas empresas de escala web a probar sus sistemas complejos para los peores escenarios antes de que ocurrieran. Gremlin fue iniciado por un ex empleado de ambas compañías para facilitar la realización de este tipo de pruebas sin un equipo de ingenieros de confiabilidad del sitio (SRE). Hoy, la compañía anunció que ahora admite pruebas de estilo de ingeniería de caos en clústeres de Kubernetes.

La compañía hizo el anuncio al comienzo de KubeCon, la conferencia de Kubernetes que tendrá lugar en San Diego esta semana.

Duendecillo El cofundador y CEO Kolton Andrus dice que la idea es poder probar y configurar clústeres de Kubernetes para que no fallen, o al menos reduzcan la probabilidad. Él dice que para hacer esto es fundamental realizar pruebas de caos (pruebas de sistemas de misión crítica bajo coacción extrema) en entornos en vivo, ya sea que esté probando Kubernetes grupos o cualquier otra cosa, pero también es un poco peligroso hacer esto. Él dice que para mitigar el riesgo, las mejores prácticas sugieren que limite el experimento a la prueba más pequeña posible que le brinde la mayor cantidad de información.

"Podemos entrar y decir que voy a tratar solo con estos grupos. Quiero causar un error aquí para entender lo que sucede en Kubernetes cuando estas piezas fallan. Por ejemplo, poder ver qué sucede cuando pausa el programador. El objetivo es ayudar a las personas a comprender este concepto del radio de explosión y guiarlas de manera segura para que realicen un experimento ”, explicó Andrus.

Además, Gremlin está ayudando a los clientes a fortalecer sus grupos de Kubernetes para ayudar a prevenir fallas con un conjunto de mejores prácticas. "Claramente tenemos las herramientas que las personas necesitan (para realizar este tipo de pruebas), pero también hemos aprendido a través de muchas, muchas interacciones con los clientes y experimentos para ayudarlos a sintonizar y configurar sus clústeres para que sean tolerantes a fallas y resistentes". dijo.

La interfaz de Gremlin está diseñada para facilitar este tipo de experimentación dirigida. Puede marcar las áreas en las que desea aplicar una prueba y puede ver gráficamente qué partes del sistema se están probando. Si las cosas se salen de control, hay un interruptor de apagado para detener las pruebas.

Pantalla de prueba de Gremlin Kubernetes. Captura de pantalla: Gremlin

Gremlin se lanzó en 2016. Su sede se encuentra en San José. Ofrece tanto un producto freemium como de pago. La compañía ha recaudado casi $ 27 millones, según datos de Crunchbase.


Source link