Nell'epoca degli agenti AI che sanno interagire con i browser (Proxy di Convergence, LINK, Operator di OpenAI, etc.) e dei browser con agenti AI integrati (Comet, Opera Neon, Genspark, DIA, etc.), nonostante non siano ancora perfezionati né privi di rischi, può sembrare a prima vista anacronistico usare un programma di automazione che crei dei bot "stupidi".
In realtà ci sono alcuni casi d'uso in cui tali automazioni "vecchio stile" possono risultare ancora preferibili, almeno per alcuni motivi:
- l'indipendenza dall'installazione di specifici browser
- la non necessità di usare profili e account
- il non utilizzo di risorse in cloud, chiavi API o server esterni
- il controllo totale sui flussi di automazione, senza il rischio di iniziative o "deviazioni" non gradite o imprevedibili
- l'assenza di limitazioni legate a token o prove gratuite
- un uso relativamente poco impattante sulle risorse (non serve avviare altri programmi, IDE, container, server MCP, etc.).
Ovviamente se si preferiscono automazioni più versatili, più semantiche che deterministiche, meno rigide e meno tecniche (detto altrimenti: si preferisce solo scrivere un buon prompt e attendere), le soluzioni con AI integrata rimangono le più adeguate, come ad esempio Stagehand oppure Browser Use (v. ultimo paragrafo).
Per la nostra automazione, mirata a creare un web report contenente immagini e testi prelevati da siti a scelta, useremo Browser Automation Studio e l'integrazione del suo bot in uno script PowerShell; vediamoli meglio uno alla volta.
Browser Automation Studio
Browser Automation Studio ("BAS", da qui in poi) è un programma estremamente ricco di funzioni e potenzialità, gratuito e open source, piuttosto leggero (richiede circa 2,5 GB di spazio e usa poche risorse) che consente di automatizzare facilmente e senza codice né AI la raccolta di informazioni in rete. Ha anche un piano a pagamento, ma con quello gratuito l'utente medio ha già tutto quello che desidera, e probabilmente anche di più; qui trovate un confronto fra i piani.
Una sua peculiarità sicuramente interessante è che, a differenza ad esempio di Selenium o Puppeteer, BAS consente di creare automazioni portabili in formato exe, quindi eseguibili anche su dispositivi che non hanno installato BAS né Chrome (BAS include un suo Chrome engine), potendo così esportare dei bot totalmente autonomi, condivisibili e fruibili anche da chi non sa nemmeno cosa sia un bot (il che significa anche, di conseguenza, che è estremamente rischioso eseguire un bot che non si ritiene perfettamente affidabile oppure che sia proveniente da fonte poco attendibile; non accettate bot dagli sconosciuti).
Chiaramente se ci sono impostazioni particolari hardcoded (scritte direttamente nel codice), come percorsi assoluti, nomi di file da gestire, etc. l'eseguibile del bot esportato non può aggiornare tali impostazioni. Ad esempio, se l'automazione prevede di salvare i risultati ottenuti online in un file al percorso "C:\Utenti\Io\Documents", quando l'eseguibile viene avviato in un dispositivo in cui tale percorso non esiste (perché non c'è l'utente "Io"), non avverrà il salvataggio previsto.
Il primo avvio di un eseguibile generato da BAS può risultare un po' lento, con la percentuale del launcher che stenta a completarsi.
Ciò accade perché vengono scritti circa 2 GB di dati nella cartella del progetto che contiene l'eseguibile, sebbene sia comunque possibile salvare l'engine di BAS nella cartella AppData
: a seconda della scelta fatta durante la creazione dell'eseguibile, in questo secondo caso si risparmiano quasi 900 MB per ogni ulteriore progetto avviato come standalone. Si tratta in entrambi i casi di dati necessari a rendere l'automazione portabile anche su dispositivi in cui non è installato BAS, oppure su cui è installato e si vuole automatizzare la sua esecuzione senza aprirne l'interfaccia manualmente (come ci farà comodo nel caso dello script che vedremo a breve).
Da considerare che quando viene installata una nuova versione di BAS viene creata una nuova cartella di default per i progetti; è quindi necessario aprire con Open
il progetto su cui si stava lavorando (che solitamente compariva già all'avvio di BAS) e poi eseguire la facile procedura guidata di aggiornamento che renderà il progetto aggiornato.
Lo script WebJournal_maker
Si tratta di un semplice script in PowerShell, scaricabile da GitHub, dove viene spiegato che «lo scopo generale è disporre di uno script che produca automaticamente (principalmente grazie a programmi esterni di automazione) un giornale web personalizzato che contiene i dati e le immagini che l'utente cerca tutti i giorni (o quasi). Una specie di "quotidiano digitale su misura" che può mostrare pagine dei preferiti, previsioni meteo, news di economia, risposte di chatbot AI, citazioni motivazionali, aggiornamenti di cybersecurity, etc. senza che l'utente debba navigare e cliccare su ognuno di questi siti».
Per integrare lo script e il bot di BAS è necessario inserire alcuni percorsi all'inizio del codice; per farlo basta seguire i commenti presenti nello script e disponibili in italiano nel file WebJournal_maker-ITA.ps1. Una volta completato con le informazioni mancanti, eseguire lo script comporterà l'esecuzione del bot di BAS e la successiva creazione di un file di report in HTML con tutti i dati raccolti.
Per vedere in pratica come usare BAS, come preparare lo script e qual è il "prodotto finale", avete a disposizione il sottostante video di YouTube (in italiano).
Prima di passare alle immagini, ecco alcune accortezze (che risulteranno più chiare dopo aver visto il video) a cui prestare attenzione nell'uso dello script WebJournal_maker:
- nel salvare i file immagine per lo slideshow, ricordarsi di nominarli in ordine alfabetico (ad esempio: a-xxx, b-xxx, c-xxx, etc. o diciture simili), così che lo script, quando "sfoglia" la cartella in ordine di nome, inserisca le immagini nell'HTML con la sequenza desiderata. Se si usassero i numeri, ad esempio fino a 12, l'ordine risulterebbe: 10xxx, 11xxx, 12xxx, 1xxx, 2xxx, etc. con i numeri dopo il 10 che verrebbero considerati prima, poiché il secondo carattere è un numero che alfabeticamente, in Windows, viene considerato prima delle lettere.
- il file con la lista dei siti viene letto una riga alla volta; può essere quindi lasciata una riga vuota nel file quando si vuole inserire un'immagine senza un link. Per lo stesso motivo vanno evitate, o almeno usate con cognizione, eventuali righe vuote all'inizio o alla fine dei file di testo usati dallo script.
VIDEO con dimostrazioni e troubleshooting
Programmi alternativi a BAS
Per lo scraping dei siti è chiaramente possibile usare anche altri programmi, come ad esempio Stagehand, Automa, Puppeteer, Selenium, Cheerio più Node.js, Playwright, UI.vision, Power Automate, Bytebot, etc. l'importante è saper ottenere immagini e testi necessari al proprio report finale.
Per il formato del file di report, PowerPoint sarebbe stato una valida alternativa, ma l'aggiornamento automatico delle immagini ha mostrato qualche "giro a vuoto" e comunque sarebbe rimasto il vincolo di dover avere già installato il programma (lo stesso dicasi per Word), limitando la portabilità dei risultati, mentre nel caso dell'HTML è sufficiente un browser qualsiasi in un qualunque sistema operativo.