Dopo i chatbot e le AI generative, la nuova frontiera varcata dall'intelligenza artificiale è quella degli "agenti" o "operatori", ossia applicazioni in grado di interagire autonomamente con i siti quasi come fossero utenti umani: compilano campi di testo, interpretano immagini, fanno spesa online, postano sui social, etc. sempre seguendo le istruzioni (ed eventualmente usando le credenziali) fornite dall'utente.
Il principale vantaggio che ne consegue è quello che da sempre alimenta lo sviluppo della tecnologia: poter automatizzare processi noiosi in modo che l'utente possa con poca fatica (e pochi click) ottenere buoni risultati in modo efficiente; così mentre l'utente si dedica a qualcosa di più piacevole, più creativo o che semplicemente comporta un miglior uso del suo tempo e della sua intelligenza, l'agente AI fa da maggiordomo e svolge in autonomia le faccende di routine o quelle più "meccaniche" (e magari umanamente "alienanti").
Proxy
Se avete sentito parlare di Operator di OpenAI ma siete stati frenati dal fatto che sia per ora a pagamento, o non volete usare le chiavi API richieste da Browser Use o OWL o Cuak, o siete troppo impazienti per attendere gli agenti di Opera e di Perplexity, allora troverete interessate un agente con un piano gratuito, interfaccia intuitiva e già pronto da usare online: Proxy di Convergence, che mette a disposizione di chi si registra tramite mail, 5 attività (task) in tempo reale al giorno (più un'attività programmata al giorno).
Su GitHub trovate anche una versione Lite, che richiede qualche competenza tecnica e un po' di "manodopera" in più rispetto alla versione online, ma può essere interessante se volete approfondire o "diversificare" l'utilizzo di Proxy.
Il punto di forza di Proxy (versione online) più evidente è la semplicità: per usarlo non è necessario scaricare o installare programmi, né avere una buona potenza di calcolo, né tantomeno avere competenze di automazione dei browser; è sufficiente saper scrivere, anche in italiano, richieste (prompt) chiare a avere qualche minuto di pazienza, per compiti che comunque richiederebbero altrettanto tempo (se non di più) anche se svolti da un umano.
Su YouTube potete già trovare video in cui Proxy fa tranquillamente acquisti online, posta su LinkedIn, cerca e organizza contenuti informativi, (v. qui ad esempio); nei nostri test lo vedremo quindi affrontare prompt più "cattivelli" e gli proporremo "missioni" volutamente ai limiti dell'impossibile, perché richiedono un'"agentità" (agency), ossia una capacità di sostituirsi all'agire dell'utente, non ancora disponibile (almeno fino ad oggi). Lo scopo non è certo di mettere in cattiva luce Proxy, ma di vedere come reagisce ad uno "stress test": compiti ardui, prompt ricchi ma non troppo facilitanti, azioni che richiedono una interazione "umanizzata" con i siti, etc.
Per vedere all'opera Proxy, approfondire la sua funzionalità Template e scoprire come sono andati i sei test effettuati, potete visionare il video YouTube a fondo pagina.
Spoiler: soprattutto se finora si è usata l'AI solo come alternativa ai motori di ricerca, probabilmente si resterà stupiti dall'intraprendenza di Proxy, specialmente se si considera che è un servizio ancora molto recente e gratuito (seppur con i suddetti limiti). Chiaramente non è ancora un "maggiordomo perfetto", ma la sua capacità di interagire con la pagine web è già ad un buon livello, per cui più che la sua attuale efficacia è affascinante il potenziale che mostra di avere.
Funzionamento
Per usare Proxy è sufficiente creare un account gratuito usando una mail e collegarsi al suo indirizzo, dove troveremo il classico campo testuale per la ricerca, in cui poter digitare il nostro prompt contenente le istruzioni opportune e i risultati che vogliamo ottenere.
Proxy, come il nome lascia intendere, non usa il nostro browser locale per la sua navigazione, quindi in termini di privacy e dati salvati nel nostro browser non rappresenta un rischio. Va anche considerato che non è possibile interagire direttamente con il "browser virtuale", ossia il pannello sulla destra (v. immagine sotto), che ci mostra in diretta le interazioni di Proxy nel web; quindi sembra esserci un buon isolamento fra il nostro host e la navigazione di Proxy (anche se non va certo usato come una sandbox per visitare siti poco raccomandabili).
Il "punto di contatto" fra il nostro dispositivo e Proxy è comunque il browser, nel senso che Proxy può salvare documenti in una cartella temporanea del browser (ad esempio quando scarica un file a seguito di una nostra richiesta) e le sue notifiche compaiono come notifiche da parte del nostro browser (ad esempio quando ha terminato un task).Trattandosi di un'AI non ha problemi a parlare in italiano, ma dobbiamo ricordarci di specificare che la risposta deve essere in italiano, altrimenti userà la sua lingua di default che è l'inglese.
Per indagare meglio sull'"identità" e la configurazione del browser usato da Proxy, gli abbiamo proposto questo prompt.
Degno di nota il fatto che non riuscendo a collegarsi a DnsLeakTest, Proxy ha autonomamente cercato su Google altri siti per l'analisi del DNS, ha trovato BrowserLeaks e ha eseguito il test DNS. Questo il suo report finale:
Per quanto riguarda BrowserAudit, Proxy non ha atteso fino al termine del test o lo ha erroneamente considerato concluso dopo soli 73 elementi analizzati (solitamente sono più di 200), anche se non è da escludere che ci siano state interruzioni di rete o limiti di attesa per pagina preimpostati.
Da ricordare che gli "agenti AI" stanno iniziando a muovere i primi passi solo da qualche mese (e già questo è sorprendente se consideriamo il basso livello d'interazione che l'AI proponeva solo due o tre anni fa) e in questo caso stiamo parlando persino di un servizio gratuito, pur con limiti di utilizzo. Chiaramente se gli avessimo proposto compiti più semplici e spiegati più in dettaglio (come andare su Amazon e mettere nel carrello un'elenco di prodotti già scelti da noi), sarebbe forse risultato impeccabile (è da valutare se non sia stato pensato soprattutto per task di quel tipo), ma non è da escludere che fra non molto possa essere in grado di districarsi anche con richieste più "crudeli", come quelle che gli abbiamo proposto (e a cui, bisogna riconoscere, ha reagito comunque bene).
Nel frattempo, se lo provate (al momento il consiglio è quello di tenerlo ancora ben lontano da carte di credito, dati sensibili, account importanti, etc.), fateci sapere nei commenti com'è andata e quali sono le vostre impressioni.