Chaos Monkey es un soft que mata al azar de instancias en aws (servidores virtuales en la nube de Amazon), donde corre el soft -distribuído – que mantiene Netflix andando.

La idea de fondo es que hacer esto siempre con los teams de soporte online, así pueden ir descubriendo qué tan bien se aguanta la infraestructura los fallos provocados por Chaos Monkey, ir arreglandolos y también encontrando “sorpresas” por el camino (que también arreglan).

Fuente: http://sysnotas.blogspot.com.ar/

Básicamente permite testear en vivo la fiabilidad y la resiliencia de la arquitectura, a la vez que moviliza las acciones correctivas proactivamente, en vez de reactivamente, que es lo que serían si tuvieran que ser implementadas en respuesta a una falla real. Al actuar proactivamente, las fallas y las soluciones se aplican en un ambiente controlado, que es muy positivo vs. hacer lo mismo inesperadamente y en un escenario impredecible (por ejemplo: un viernes a la noche en pleno pico de alquiler y streaming de
películas).

De un comentario en uno de los posteos del blog de Netflix:
“Al correr Chaos Monkey  a mitad del día de trabajo, en un ambiente cuidadosamente monitoreado y con ingenieros a la espera para hacerse cargo de cualquier problema, podemos todavía aprender lecciones acerca
de debilidades de nuestro sistema, y construir mecanismos de recuperación automáticos para tratar con ellas. Así, la próxima vez que una instancia falle a las 3 de la mañana un domingo, ni siquiera nos vamos a dar cuenta.”

Hay mucho más relacionado con Chaos Monkey como pueden leer en los links de abajo. Mientras tanto, su código fuente ya está disponible en Gibthub para bajar y usar.
http://techblog.netflix.com/2012/07/chaos-monkey-released-into-wild.html
http://techblog.netflix.com/2011/07/netflix-simian-army.html
http://techblog.netflix.com/2010/12/5-lessons-weve-learned-using-aws.html

Sldos.
“The dark triad will sink down any team: psychopathy, narcissism, and
Machiavellianism.”

yaco

yacoInternetLa NubeArquitectura,SysAdminChaos Monkey es un soft que mata al azar de instancias en aws (servidores virtuales en la nube de Amazon), donde corre el soft -distribuído - que mantiene Netflix andando.La idea de fondo es que hacer esto siempre con los teams de soporte online, así pueden ir descubriendo qué...comunidad virtual para compartir y difundir: información, conocimiento y experiencias relacionadas con las Tecnologías de la Información y la Comunicación.