martedì, ottobre 02, 2007

24x7

L'impegno per ottenere un uptime elevato è veramente difficile. Ovviamente mi riferisco all'uptime vero non quello dei report. Infatti grazie ad Excel e a PowerPoint vedo molto spesso delle cose inverosimili. A volte sono così distanti dalla realtà che mi verrebbe voglia di chiedere spiegazioni ma so che è meglio astenersi.

In passato ho fatto molte battaglie per dimostrare che quei dati erano decisamente falsi, ma ora lascio saggiamente perdere. Una volta ero responsabile del sito web della mia grande azienda e venivo continuamente attaccato per l'inefficienza del sito web rispetto alla granitica robustezza dei servizi di back end avviati nei favolosi anni 60.

Mi confrontavo con direttori che ricordavano quei favolosi anni in cui nonostante quantità di memoria 1000 volte inferiori ad un normale chiavetta usb, riuscivano a fare meraviglie e ora noi che con tutte quelle risorse scontentavamo i nostri clienti!

A questo punto non rimaneva che ribadire che il web prendeva proprio i dati da quei sistemi e quei sistemi non rispondevano. Dopo lo stupore uscivano prontamente dai cassetti quei report con quel 99.8 di uptime.

E allora? Quale era il problema? Diciamo che i fattori determinanti erano 2:
  • Nessuno controllava quei dati
  • Bisognava controllare gli asterischi (*)
Prima del web chi si accorgeva se il sistema non funzionava? Qualche poveraccio sul terminale poteva imprecare contro tutta la classe dirigente, ma le maledizioni non venivano calcolate dal sistema.

Invece ora magari tutti i comuni mortali potevano verificare l'efficienza dei sistemi.
Ricordo categorie pericolossime come i giornalisti (che poi lo dicevano in giro o nei loro articoli) oppure gli amici dell'amministratore delegato, oppure compagni di golf del vicepresidente insomma gente molto più importante dell'operatore di terminale.

Il secondo problema è comune a tante pubblicità. Se c'è scritto "la tua auto con 1 euro al giorno" vai a caccia dell'asterisco che ti spiega dov'è il trucco. La stessa cosa devi fare quando leggi un uptime sopra (o uguale) a 98%.

Insomma nell'era del web tutti potevano vedere se il sistema funzionava e lo facevano seguendo un criterio ovvio e semplice. Un sito web può avere due stati: funzionante e non funzionante.

All'utente non interessava un "il database non risponde ma non è fermo perchè sta facendo la reorg" (il che nei calcoli di excel lo faceva risultare come "up and running") oppure un "il sistema è attivo ma è la rete che non funziona" (sempre nella colonna del "va tutto bene").

Insomma il web rendeva palese che per anni quei sistemi non avevano mai funzionato al 99% e quindi era meglio andare avanti a dire che "..era tutta colpa del web"

Etichette: