Il troubleshooting, o “risoluzione dei problemi”, in informatica è un metodo, diviso in più fasi, per consentire di risolvere un problema, sia esso hardware che software, consentendo quindi il pieno ripristino delle funzionalità di un programma, o del server aziendale, senza perdere troppo tempo e soldi. Il troubleshooting segue alcune fasi ben precise, chi deve gestire questo ciclo è un tecnico IT esperto, il “troubleshooter”, che sia in grado di fare le domande giuste, trovare una soluzione valida, grazie alle varie risposte ottenute, e applicarla in modo che il difetto riscontrato non ricapiti più o almeno non così spesso.
Vediamo quindi come fare un buon Troubleshooting
La raccolta informazioni
Il primo passo di questo ciclo è raccogliere quante più informazioni sul problema riscontrato.
Un conto è avere un computer che non si accende più, si cambia l’alimentatore e lo si risolve. Invece se è un malfunzionamento, anche grave, ma saltuario, bisogna parlare con la persona che lo ha riscontrato e farsi dare tutte le informazioni possibili.
Non basta dire che il programma, o il computer, non risponde come dovrebbe, bisogna sapere quando è successo e cosa si stava facendo in quel momento, per essere in grado, si spera, di riprodurre il difetto, diagnosticarne le cause e trovare una soluzione perché non succeda più.
Da qualche anno mi dedico all’assistenza informatica da remoto e devo dire che la raccolta delle informazioni è, spesso, la parte più difficile. Se trovi l’utente poco esperto, come capita il più delle volte, che ha difficoltà anche solo a scrivere un indirizzo Web, o trovare la cartella dei download, diventa poi difficile anche avere le informazioni corrette per risolvere il problema.
Spesso mi trovo a parlare con persone molto agitate, che temono di perdere la giornata di lavoro, e quindi bisogna calmarli, spiegarli cosa succede e cosa succederà, senza usare termini troppo tecnici che non capirebbero. Quando proprio non si ottiene la loro collaborazione, solo la “minaccia” di farli rientrare in sede, così da essere aiutati dal collega che la gestisce, li rende più disponibili.
L’essere invece davanti al computer guasto, e poter vedere direttamente il difetto software/hardware, rende più semplice, almeno per me, l’individuazione del problema e la sua risoluzione.
Il fare le domande giuste è fondamentale, ma se quando chiedi “Quale browser utilizza?” ti rispondono “Google”, oppure domandi se le luci del modem sono accese e i cavi sono collegati, ottieni solo un “Ma ha sempre funzionato e io non ho fatto niente.”, salvo poi scoprire che avevano smontato tutto il giorno prima e non ricollegato qualcosa, capisci che sarà una assistenza lunga e complicata. Besti.it ci scherza sopra, ma casi del genere succedono molto più spesso di quanto si possa pensare.
Quando poi non sono in grado di leggere i messaggi d’errore che compaiono, ricevere una immagine dello stesso, vale più di mille parole.
C’è sempre una soluzione
Il secondo passo, una volta ottenute le informazioni necessarie, è decidere cosa fare per risolvere il problema.
Il tecnico IT/troubleshooter deve scegliere il modo migliore per eliminare, possibilmente una volta per tutte, il difetto riscontrato.
Dopo aver eseguito le prime prove più ovvie, come il classico spegni e riaccendi il sistema, oppure verificare che tutti i cavi siano collegati, bisogna decidere se cambiare una scheda madre, eseguire gli aggiornamenti di Windows, oppure reinstallare il sistema operativo.
In questa fase, in particolare quando si deve sostituire un hard disk, o reinstallare il sistema operativo, la cosa più importante è fare un backup dei dati dell’utente.
In caso di problemi software, o collegabili a qualcosa di non ancora ben definito, si può decidere di applicare la soluzione scelta a un numero limitato di computer in modo da vedere se si risolve e non si creano ulteriori malfunzionamenti.
Il terzo passaggio consiste nell’applicare la soluzione scelta e qui, oltre alle competenze, bisogna disporre degli strumenti più adatti e delle componenti hardware necessarie in caso di guasto per riparare un computer.
Se non è possibile ottenere subito una risoluzione definitiva del problema, si può ricorrere a un workaround temporaneo che permetta di riprendere a lavorare nel più breve tempo possibile.
Per esempio un computer/server con più banchi di memoria RAM, di cui uno guasto, piuttosto che lasciarlo inutilizzato, si toglie il componente difettoso e si riprende ad utilizzarlo, con meno memoria di sistema, riducendo il fermo macchina al minor tempo possibile e rinviando la riparazione definitiva alla notte, o di domenica, quando lo stabilimento è fermo. Se una periferica collegata ad un computer provoca delle instabilità di qualsiasi tipo, la si toglie e poi si cercano dei driver aggiornati o una qualsiasi altra soluzione definitiva.
Anche nei casi più disperati, una soluzione la si deve trovare e applicare.
La conclusione
L'ultima fase di questo processo consiste nel verificare che quanto è stato fatto abbia risolto il problema e non ne causi altri.
Pensiamo all’installazione degli aggiornamenti di Windows, oppure a una modifica nel programma di contabilità o di quello del computer che controlla le spedizioni. Si può rischiare di correggere un errore, ma creare nuovi problemi magari peggiori. Quindi bisogna osservare e valutare se è tutto a posto.
In particolare nelle aziende più grosse, tutto questo processo viene tracciato attraverso dei ticket, o trouble ticketing, in modo da tenere conto di quanto tempo è stato impiegato, di quali azioni sono state fatte e delle risorse utilizzate per risolvere il problema.
Tutto questo può essere poi analizzato per creare delle procedure standard che velocizzino le riparazioni e stabiliscano anche dei metodi di manutenzione preventiva in modo da evitare/ridurre i guasti.
Pensate solo se si blocca il computer che gestisce la pesatura dei camion in uscita da uno stabilimento, oppure a quello che prepara la merce imballata, un guasto del genere provoca una serie di altri problemi, e tempo di inattività, che causano un ulteriore aumento dei costi. L’azienda può quindi decidere di dotarsi di sistemi di backup che permettano la ripresa del lavoro nel giro di pochi minuti.
Dopo l’analisi di una serie di guasti dovuti alla polvere presente nei computer, come mi succede troppo spesso di trovare in particolari ambienti di lavoro, l’azienda può decidere di adottare misure di manutenzione preventiva in modo da ridurre i possibili guasti gravi o anche il semplice riavvio del computer dovuto a un suo surriscaldamento. Non è possibile azzerare tutti i guasti hardware, ma si può provare almeno a limitarne il numero.
"Un centesimo risparmiato è un centesimo guadagnato."
Io ho sintetizzato, e riunito, alcuni passaggi del processo, ma li potete vedere spiegati in maniera più ampia nella seguente immagine. Come vedete, ci sono momenti in cui il tecnico IT può, e deve, decidere di non avere abbastanza informazioni per risolvere il problema e quindi tornare a fare domande. Oppure non avere le competenze necessarie e quindi “passare la palla” ad un altro gruppo di supporto che le abbia o sia in grado di fornirle.
Fonte immagine bucarotechelp.com.