Se avete la pazienza di leggere questo post sino alla fine, vi spiego per filo e per segno come mai la rete di Istituto è morta giovedì pomeriggio e magari insieme troviamo la quadra perchè non succeda più.
Venerdì mattina , ore 7.30 arrivano i primi whatsapp "la rete non funziona" , "manca internet" e una pletora di altri messaggi più o meno incerniati sul fatto che una giornata senza rete avrebbe generato cataclismi che in confronto Katrina e tutte le sue colleghe uragano erano una brezza marina.
Incomincio a pensare a cosa ho fatto il giorno prima , al fatto che spesso un esperto è una persona che evitando tutti i piccoli errori punta dritto alla catastrofe.... Poi mi rassereno, io non sono un esperto ;.)
Arrivo a scuola, mi precipito sul server e scopro che una delle interfacce ethernet che erogano servizi verso la rete didattica ha un tempo di "ping" superiore ai due secondi (una eternità visto che di solito si misura in millisecondi)...
Non rimane che smontare la baracca , serverone pesante come un macigno incastrato in un armadio rack che per toglierlo senza fare disastri ci vuole una specializzazione di artificiere... il tutto con un viavai di gente che ripete come nemmeno il tantum ergo sacaramentum sa essere così tedioso una nenia tipo "Quando torna internet"?
Smonto cambio scheda, rimonto e .... stessa latenza del ping ... Mannaggia allora non è la scheda ma lo switch a cui è collegato.... che strano, è nuovo e pure di qualità e i led di diagnostica non segnalano anomalie....
Allora sonto lo switch ( 24 cavi piu 4 fibre ottiche) , ne cerco uno vecchio e rimonto tutto... Ormai la lucidità, già scarsa, è ridotta ai livelli di un teenager all' uscita di un rave party... lavorare sotto pressione non fa per me...
Comunque... riavvio e .... il ping è sempre lì , lento come non mai.
Mi prende lo sconforto ma non mi arrendo, devo trovare il problema ... smonto una dorsale alla volta dell' Istituto e che scopro ???
Che scollegando un armadio che porta verso la rete del pian terreno tutto si riprende...(naturalmente per la legge di murphy il cavo incriminato è stato l'ultimo che ho tolto, mica capita una volta che il caso aiuta....)
Adesso rimane il secondo passo, passare all' armadio dopo e staccare tutte le 22 derivazioni e attaccarne una ad una per capire da dove arriva il problema. Ovviamente il problema, sempre per la legge di murphy non si palesa all' istante, ma bisogna aspettare circa due minuti per ogni collegamento per vedere se succede qualcosa...
Naturalmente l'operazione fatta con sottofondo della processione degli utenti che mi allietano il lavoro con discorsi più o meno filosofici, teorie sulle reti, critiche e consigli che vanno dal dedicarmi al giardinaggio ad usare strumenti che costano come tutta la nostra rete...
Finalmente isolo il troncone incriminato e che ti scopro??
Laboratorio XXX, sono stati acquistati alcuni pc e il numero, essendo salito non permette a tutti di collegarsi alle due prese a muro.
Soluzione applicata : Acquistato uno switch da otto porte di quelli che si comprano al carrefour vicino alla corsia delle bici con cambio shimano, tanto per non farsi mancare niente, messo un access point pure collegato lì , a un paio di metri da quello di Istituto....
Ma non basta, evidentemente presi dallo spot virale "due gusti is meglio che uan" il suddetto switch era stato collegato con due porte alle due prese a muro generando un loop micidiale che mandava in circolo tutti i pacchetti e li ripeteva (broadcast) su tutta la rete mandando a pallino tutto.
A dirla tutta questa cosa era già successa un annetto prima, in un altro laboratorio e quello che avevo pensato di fare era quello di mettere switch nei laboratori più intelligenti, in grado di autoproteggersi da queste cose , attivando una roba che si chiama "spanning tree" .
Purtroppo gli switch layer 3 costano e ne stavamo acquistando qualcuno alla volta e quell' area della scuola era ancora sguarnita.
Ora vi invito a due riflessioni:
Quando si ha a che fare con una rete che eroga connettività per circa 1600 dispositivi al giorno, generando circa 1 TERAbyte di traffico al giorno, non sarebbe il caso di rispettare le più elementari regole di progettazione delle reti? Oppure il primo che passa si attacca quello che vuole come se la rete fosse un grande sudoku con cui giocare?
Posso capire che servivano punti rete, ma tanto per fare un esempio, ma mia macchina ibrida di vecchia generazione fa solo pochi km in modalità elettrica e supponiamo per assurdo che ne voglio fare di più ; se andassi dal tabacchino a comprare una carriola di pile per il walkman e poi le butto nel baule e le attacco con dei cavi facendo attenzione che il colore del cavo faccia "pendant" con la tappezzeria del baule, credete che poi posso lamentarmi con la toyota se la macchina non parte?
E se dopo aver messo in corto circuito la scuola (giovedi pomeriggio) mi accorgo che non funziona più nulla, non sarebbe il caso di farsi un paio di domande?
Adesso ci sono ancora molti dispositivi che sono andati in protezione e devo finire il giro per fare il reboot affichè ritornino in vita.
Era il caso? Se qualcuno venisse nel vostro laboratorio e attacca a caso qualcosa sui macchinari, come reagireste?
Anche gli accesspoint, se messi così a caso senza curarsi del canale, della banda passante e tante altre cose, generano onde elettromagnetiche nello stesso spettro di quelle di istituto, così poi tutto è lento e funziona male.
Io ho già i miei mille limiti, potrei sicuramente fare meglio e soprattutto ci può essere qualcuno più bravo di me, ma proprio per questo, vi prego, non uccidete un uomo morto con queste esperienze di "networking creativo".
Grazie , senza rancore ma con la speranza che insieme miglioriamo la nostra splendida scuola
Ivan Bertotto