Sysadmin rant (part 1 si ceva)

Nu, n-am uitat ideea inceputa acum ceva vreme, dar nu mi-am cristalizat-o inca suficient de clar sa vin cu o continuare. Saptamana asta insa au aparut doua lucruri legate de aceleasi concepte.

Mai devreme un articol share-uit de Lorin pe Google Reader (care by the way, mi se pare o unealta exceptionala, mai ales cand incepi sa faci schimb de articole cu apropiatii) care incearca si el sa defineasca (cam tot prin aglomerare in coltul camerei, ca si mine) conceptul de "Critical Thinking", sau cum sa identifici o alegere corecta acolo unde nici macar nu s-a intrezarit posibilitatea unei alternative (si implicit decizii). Pare sa semene cu ideea pe care o clocesc si eu.

In paralel, citesc una din cartile aterizate saptamana trecuta din ultima mea comanda de la Amazon: Blueprints for High Availability, pe care recunosc ca o cumparasem cu niste asteptari mai tehnice, de genul unor studii de caz pentru implementarea de clustere HA sau alte jucarii similare. Am fost surprins ca este mult mai mult decat atat, e un fel de aripa mai tehnica a "Bibliei" lui Tom Limoncelli, The Practice of System and Network Administration (carte pe care am citit-o din scoarta in scoarta in 3 exemplare hard-copy diferite si pe care as da-o ca lectura obligatorie oricui isi doreste sa faca serios administrare de sistem). Well, BHA e ceva mai condensata si mai concreta decat TPOSANA, dar e la fel de plina de invataminte. Vreau sa dau in continuare 2 citate:

Primul paragraf al cartii:

"Despite predictions in the 1970s (and extending into the 1980s) that computers would make everyone's lives easier and give us more leisure time, just the opposite seems to be taking place. Computers move faster, thanks largely to faster and faster CPUs, yet as fast as computers are, the business world seems to move even faster. Computers are expected to be operational and available 7 days a week, 24 hours a day. Downtime, even for maintenance, is no longer an option."

Si cele 20(!) de "key HA design principles":

20: Don't be cheap
19: Assume nothing
18: Remove single points of failure
17: Enforce security
16: Consolidate your servers
15: Watch your speed
14: Enforce change control
13: Document everything
12: Employ Service Level Agreements
11: Plan ahead
10: Test everything
9: Separate your environments
8: Learn from history
7: Design for growth
6: Choose mature software
5: Choose mature, reliable hardware
4: Reuse configurations
3: Exploit external resources
2: One problem, one solution
1: K.I.S.S. (Keep it simple, stupid!)

Ca toate invataturile intelepte, nimic nemaipomenit, dar cu o concentratie ridicata de Zen. Sau poate doar ma entuziasmez eu degeaba... Anyway, back to reading.

Comments are closed.