Settimana corta, oggi è venerdì e non sembra, ma io sono convinto di aver lavorato tutti e cinque i giorni. Dormo poco e male, forse il caldo o forse le troppe cose per la testa, dopotutto ho un esame tra un mese e il libro è ancora sulla mensola, chiuso.
Arrivo al lavoro, in auto perchè il tempo è brutto, alle 7.30, come al solito. Le porte che si aprono con i badge a prossimità non funzionano e siamo chiusi fuori, in più la centralina dell’antincendio fischia in modo anomalo. Faccio il giro dello stabilimento ed entro dal magazzino, in modo da aggirare l’accesso che non funziona. Qualcosa non va. Mentre percorro lo stabilimento per andare ad aprire ai colleghi accendo il telefono. Bling! una mail. Sarà quella dei backup terminati. Bling! An’altra mail. Sarà quella del server che si riavvia tutte le notti. Bling! Ancora? Bling! Bling! Bling! No, qualcosa non va.
Apro il telefono e leggo il primo oggetto “SMTP server offline”. Il secondo “Ping fallito”. Il terzo “EMC alert”. Non mi piace per niente, proprio per niente
Apro ai colleghi e mi dirigo verso la sala server. Eì tutto acceso, compresi i cilmatizzatori, bhe, dai non è male. Accedo al server che lascio con la sessione sempre aperta in modo da far girare il programma che verifica lo stato dei dispositivi di rete. Disconnesso. Ma porc’! Faccio il logon e mi si presenta il calssico messaggio di Windows 2003 che mi chiede “Perchè mi sono riavviato inaspettatamente?” io penso “E che ne so! Dovresti dirmelo tu!”. Avvio il programma che controlla i ping e risultano 4 dispositivi assenti.
Faccio il logon su tutti i server e tutti si sono spenti inaspettatamente. Gli UPS hanno le batterie cariche solo per 3/4. Blackout!
Ok, calma. Molta calma. La rete è su, gli indirizzi sono assegnati correttamente. Bene. provo uno ad uno tutti gli applicativi. Funziona quasi tutto. Due riavvii (un server ESXi con 4 server virtuali e un server web con Tomcat) e tutto torna su. Il backup ancora no, i dischi della VTL sono in rebuild. Non è critico, possono andare avanti anche tutto il giorno, per il resto gli utenti non sono fermi.
Uno dei 3 backup si è fermato, ma per fortuna ho le Shadow Copies. Alle 10.00 è tutto di nuovo sotto controllo. Nessun guasto hardware (certo che capitano i guasti hardware nei blackout! Da sempre, ad ogni blackout segue un intervento per cambiare qualche pezzo). Caffè!
Alle 13.20 arrivano 6 mail di fila. “Power failed” sul sistema di backup. Di corsa di nuovo in dala server. Il fischio (fastidiosissimo) della condizione d’errore si sente già dal corridoio. Un gruppo di continuità ha deciso di trasformarsi in albero di Natale Tutti i LED lampeggianti e fornitura di alimentazione bloccata. Adoro le doppie alimentazioni sui server, non si è spento niente, ma il gruppo rimasto soffre: troppo carico. E adesso?
Il supporto mi manda una mail chiedendomi (letteralmente) “Have you been playing with the power lines today?“. “No!! E’ la corrente che si prende gioco di me!“.
Riprendiamo il problema: ho un UPS morto, un fine settimana in arrivo e nessun UPS da mettere al suo posto. Nel rack vicino ci sono due server vecchi, solo loro, e un UPS da 3000 VA. Vai di prolunga! Solo che mi servono i connettori tipo quelli dei PC (avete presente? Con 3 lamelle verticali, a forma di rettangolo con gli angoli smussati da un lato), Cerco se in magazzino ho una di quelle ciabatte da rack. No. Allora chiedo al magazzino aziendale se hanno due ciabatte normali. No. ne recupero due in giro, tolgo il cavo e ci metto quello con il connettore che mi serve. Poi 12 cavi di alimentazione per PC e il gioco è fatto. Il rack è alimentato da un UPS “a distanza”. Sperando che il nuovo UPS arrivi in tempi rapidi, molto rapidi.
Sono a casa e per ora nessuna mail di alert pare essere arrivata, speriamo in bene!
Nota importante, da leggere prima di commentare
Questo è un blog scritto per passione, non fornisco quindi risposte di tipo professionale, se avete bisogno di un aiuto tecnico rivolgetevi ad un professionista di fiducia, non offendetevi se mi astengo dal rispondere. Vi ringrazio per la comprensione.