söndag 18 september 2011

Göra Facebook Self Healing

Intressanta nyheter på url:http://rss.slashdot.org/~r/Slashdot/slashdot/~3/9shqwZZ2ypM/Making-Facebook-Self-Healing:
Nya inlämnare djeps skriver "Jag brukade uppnå en viss grad av automatiserad problemlösning med Nagios skript Händelse Handler och RabbitMQ, men Facebook har gjort det i mycket större skala än min gamla dagar sysadmin citat:." När din infrastruktur är storleken på Facebooks, det finns alltid trasiga servrar och bitar av programvara som har gått ner eller är allmänt missköter sig. I de flesta fall är våra system utformade så att dessa frågor orsakar liten eller ingen inverkan på personer som använder sajten. Men ibland små avbrott kan bli större avbrott, vilket orsakar fel eller dåliga resultat på webbplatsen. Om en pjäs av trasiga mjukvara eller hårdvara inte påverka platsen, då är det viktigt att vi fixa det eller ersätta det så snabbt som möjligt. ... Vi var tvungna att hitta ett automatiskt sätt att hantera dessa typer av frågor så att den mänskliga ingenjörer skulle kunna fokusera på att lösa och förebygga de större, mer komplexa avbrott. Så jag började skriva manus när jag hade tid att automatisera fixar för olika typer av trasiga servrar och bitar av programvara. "

Läs mer om denna historia på Slashdot.


Inga kommentarer:

Skicka en kommentar