Fra i numerosi programmi multipiattaforma per la gestione dei PDF, PDFgear è sicuramente uno di quelli che merita attenzione poiché, come vedremo, ha funzionalità e integrazioni decisamente interessanti. Fra i numerosi strumenti fruibili dopo l'installazione (e disponibili anche online sul suo sito), quello più "contemporaneo" è di certo l'interazione con l'AI, che prende forma nella presenza di un Copilot, pronto ad assistere l'utente nelle operazioni più tipiche rivolte ai PDF, dimostrandosi interlocutore efficiente anche in italiano.
L'AI utilizzata, tramite API, è ChatGPT 3.5 e chiaramente è necessario essere online per poter fruire del suo supporto, mentre tutte le altre funzionalità resteranno parimenti efficaci nell'uso offline del software. Per quanto riguarda la privacy dell'interazione con l'AI, il sito dichiara: "PDFgear dà priorità alla tua privacy e sicurezza, implementando crittografia a livello aziendale e protocolli protetti durante la trasmissione dei dati e non archiviamo mai i dati dell'utente" (fonte). C'è forse un limite quantitativo nelle interazioni con l'AI? In questa conversazione di circa nove mesi fa su Reddit, uno degli sviluppatori di PDFgear parlò di un limite di 50 domande al giorno, per quanto ad oggi né sul sito ufficiale né nella pratica (come vedremo) ci sia traccia di tale limitazione.
Iniziamo dunque a dare un'occhiata al programma; una volta avviato, l'interfaccia principale è questa:
Approfondire le tante funzionalità disponibili sarebbe probabilmente tedioso considerando la chiarezza e l'intuitività dell'interfaccia grafica; vedremo allora come si comportano solo le funzioni probabilmente più utili. Usando una macchina virtuale dalle performance decisamente modeste (così da avere il "peggiore dei casi" in termini di prestazioni), iniziamo dalla conversione da PDF a TXT.
Prima della conversione è possibile impostare anche la lingua del riconoscimento caratteri (OCR) e l'intervallo di pagine da convertire. La modalità avanzata converte il file usando il servizio online, ma comunque nel nostro test (7 pagine di un manuale di istruzioni di un frigorifero), la conversione offline è stata lo stesso istantanea e accurata. Visto che il test precedente è andato estremamente bene, proviamo ora ad alzare drasticamente l'asticella della difficoltà: l'agognata conversione da PDF a Word. Ci troviamo davanti un'interfaccia praticamente identica alla precedente e abbiamo a disposizione una rivista di circa 150 pagine, ricca di immagini e pubblicità. Dopo circa 8 minuti PDFgear viene "sconfitto" e ci comunica di non essere in grado di convertirla, chiedendo se si vuole ricorrere al servizio online e, successivamente, contattare l'assistenza.
Un secondo tentativo, disabilitando la funzione OCR per estrarre il testo dalle immagini, dopo 5 minuti e mezzo completa la conversione, producendo un Word di circa 64 MB (contro i circa 168 MB del PDF originale). Nonostante sia stato deselezionato l'OCR, molto del testo sovrapposto ad immagini e pubblicità è facilmente selezionabile, anche se a questo si associa un'alterazione delle immagini che vengono frammentate, staccate dallo sfondo e talvolta decolorate:
Il testo nelle immagini a sinistra (Word) è selezionabile e i volti sono estrapolabili come singole immagini, tuttavia la pagina nel complesso è graficamente ben differente rispetto all'originale di destra (PDF originale; collocazioni fra derivato ed originale che manterremo anche per gli esempi seguenti). In altre pagine è comparso un insolito sfondo grigio che, assieme ad un carattere divenuto più piccolo nella conversione, ostacola un po' la lettura:
Per dare a PDFgear un'opportunità di riscatto, gli diamo in pasto un altro PDF, ma stavolta di solo una cinquantina di pagine, dimensioni più ridotte (nemmeno 3 MB) e un lay-out grafico meno caleidoscopico. Il riscatto non tarda: dopo nemmeno una ventina di secondi il Word è pronto (quasi 4 MB) e, nonostante la difficoltà nel gestire alcune immagini di sfondo, stavolta il testo, seppur spaginato per dimensioni, oltre che selezionabile in alcune pagine ha anche un adeguato contrasto rispetto allo sfondo:
Curiosamente, a questo punto il programma ha cambiato la cartella di default per la destinazione in "PDFgaer" anziché la già creata ed utilizzata "PDFgear", ma venendo aperta in automatico al termine di ogni conversione, il bug quasi non si nota. Proseguendo con i test, la conversione in PNG della rivista da 150 pagine, richiede poco più di 6 minuti e il risultato sono circa 380 MB con un file PNG per ogni pagina, numerati in ordine crescente e dalla qualità grafica, a volte inalterata rispetto all'originale, ma in altri casi con problemi nel gestire lo sfondo:
Non ci dilungheremo sulle funzioni di OCR integrato al visualizzatore, che ci consente di estrapolare "al volo" il testo da un'immagine mentre sfogliamo il PDF (funzione probabilmente non presente in tutti i reader gratuiti), sulla compilazione e firma, sul ritaglio e la rotazione pagina, sulla protezione con password, sull'estrapolazione di pagine o l'unione di PDF, etc. che hanno funzionato tutte fluidamente e senza alcun intoppo (a parte uno "scivolone" nella traduzione in italiano: il "Clear" per ripulire la lista di file caricati, viene tradotto con "Chiaro").
Da segnalare la non scontata presenza della funzione di compressione PDF che, impostata sul livello medio, in poco meno di 5 minuti, ha convertito il precedente file di circa 170 MB in uno di soli 30 MB, con un vistoso calo della qualità grafica in qualche sfondo "saltato":
Con il PDF più piccolo e meno "decorato", usando la compressione massima, in circa 5 secondi si è ottenuto un PDF di circa 950 kB rispetto ai quasi 3 MB dell'originale. Stavolta a prima vista non ci sono differenze grafiche, sebbene, ad essere puntigliosi, fissando bene le immagini si possa notare qualche leggera "pixellatura", ma è un prezzo da pagare più che ragionevole per avere un documento che, per dimensioni, è un terzo dell'originale (più piccolo che se fosse stato compresso in formato "zip" o "7z", per intenderci). Questo è il risultato:
Ora riattiviamo la connessione ad Internet e passiamo finalmente al "fiore all'occhiello" di PDFgear, il Copilot basato sull'AI. Una volta aperto il PDF, per attivare il Copilot è necessario cliccare sull'icona rossa in basso a destra:
Dopo un breve caricamento (mentre in background partono i collegamenti web dell'API e all'immancabile analytics.google.com, che qualora venisse filtrato non comprometterebbe il funzionamento del programma), ci vengono subito suggerite alcune attività da applicare al testo:
Per confermare le nostre richieste è necessario premere "ctrl+invio
" (il solo "invio" manda a capo il cursore). Abbiamo scelto volutamente un testo non troppo comune, con orientamento in orizzontale a due pagine per foglio. La funzione di riassunto è sorprendentemente istantanea, così come quella per tradurre il testo, in inglese in questo nostro primo test. Al di là della buona performance, va detto che PDFgear non è riuscito tuttavia a tradurre l'ultima pagina, nonostante gli venisse richiesto più volte, perché gli risultava vuota o "priva di informazioni rilevanti per il contenuto del PDF"(cit.); potrebbe non essere un caso che si tratti di una pagina in orizzontale parzialmente vuota:
Insospettiti da questa gaffe, proviamo a fargli convertire in TXT un PDF con il testo in orizzontale, ma senza la doppia pagina per foglio e, salvando la sua reputazione, il programma la converte in TXT senza alcun problema.
Potrebbe essere dunque che avendo, in alcuni casi, troppo poco testo su una parte ridotta del foglio, PDFgear non riesca a gestirne la conversione; sebbene, in un successivo test in situazione simile, il programma riesce invece a convertire immediatamente le pagine in TXT.
Ma continuiamo a testare il Copilot passando ad altri documenti; gli diamo in pasto un PDF di 673 pagine e alla vaga domanda su "cosa sia" quel testo, in un attimo otteniamo un riassunto di una decina di righe con in nota i link alle pagine da cui ha preso le informazioni (come vedremo, sono i numeri in blu sotto la risposta, elemento fondamentale per poterne controllare la veridicità).
Nel muoversi nel testo, che è frutto di una scansione ottica quindi non perfettamente allineato, l'AI ha qualche difficoltà quando le richieste riguardano l'andare ad un determinato capitolo (chiamandolo per nome e non per numero di pagina) o visualizzare nel lettore il titolo del medesimo capitolo.
Con un testo graficamente più ordinato (non otticamente acquisito) l'AI sa invece muoversi a suo agio rispondendo a domande che chiedono di trovare informazioni nel testo, anche se queste riguardano pagine volutamente ruotate di 90 gradi rispetto al resto del documento.
Una criticità emerge durante i test: nel caso il documento abbia una pagina perlopiù bianca, l'AI tende ad ignorare le pagine successive anche se contengono del testo, sebbene, qualora gli venga chiesto di mostrarle, è in grado di farlo e, dopo una richiesta esplicita, sa comunque trattare il contenuto al loro interno.
Un'anomalia riscontrata è che quando gli è stato chiesto (un po' provocatoriamente) se avesse informazioni su alcuni numeri di telefono contenuti nel documento, l'AI ha risposto che tali numeri rientravano nelle "parole bandite". Interrogando Copilot in merito, la risposta è stata:
Questo significa che l'API ha delle più che ragionevoli restrizioni che impediscono di (ab)usare ChatGPT liberamente, ovvero a prescindere dal contenuto del PDF o esulando dalle funzioni testuali come ricerca, sintesi e traduzione.
Alla richiesta di tradurre il documento in francese, l'AI ha risposto in francese, supponendo impropriamente che il parlante, che pure gli aveva appena posto la domanda in italiano, capisse il francese:
Un altro documento (di 5 pagine) è stato invece rapidamente tradotto in francese senza esitazione, a dimostrazione di una certa aleatorietà di prestazioni del servizio. Dopo che il Copilot ha dimostrato di padroneggiare le istruzioni del frigorifero, trovando agevolmente codici di errori, soluzioni ed informazioni varie, passiamo alla ben più corposa e già utilizzata rivista, chiedendo un elenco dei nomi di persone citati nel testo e, notando poi che qualcuno evidentemente manca, chiediamo spiegazioni al riguardo, ottenendo risposte erronee:
Incalzando il Copilot con ulteriori domande su quella pagina, l'AI prima ne nega l'esistenza ("non esiste alcuna pagina 32"), poi, ad ulteriore domanda ma più generica, si corregge (riportando esattamente il totale delle pagine):
Ulteriori risposte confermano che Copilot ha realizzato l'esistenza delle pagine oltre la 32. Questi apparenti "vicoli ciechi" e il possibile '"effetto sblocco" dell'approcciare la stessa domanda da un altro "lato", non stupiranno chi ha avuto modo di interagire un po' con le varie AI gratuite. Chiedendogli altre informazioni annidiate più avanti nel PDF, Copilot riesce repentinamente a trovarle, anche se a volte la ricerca incappa in parole sconvenienti e vietate come... "fontana":
Come ultimo test, più "concettuale", Copilot ha dovuto affrontare un racconto ed è stato in grado di individuare agevolmente i personaggi e non solo esplicitare il significato metaforico di alcune espressioni, ma anche elencare correttamente le metafore presenti nel testo.
Per quanto concerne i temuti limiti di utilizzo, nel complesso abbiamo interrogato il Copilot con più di una sessantina di richieste relative a 7 file differenti (alcuni dei quali non proprio piccoli), senza ricevere avvisi e senza che il servizio si sospendesse.
Considerazioni
Per quanto riguarda la GUI, la mancanza di un "dark theme" stona con la notevole premura messa nel consentire all'utente di regolare la luminosità del PDF scegliendo fra: "modalità giorno", "modalità notturna" (sfondo grigio chiaro), "modalità protezione degli occhi" (tonalità verde tenue) e "sfondo giallo" (luminosità "calda", simile a "night light" di Windows).
Sulla funzionalità operativa, bisogna riconoscere che, se avessimo testato solo le funzioni di uso quotidiano per l'utente medio, questo sarebbe stato un articolo più breve e di sole conferme di quanto PDFgear sia un'ottima soluzione a costo zero per gestire i PDF.
Avendo scelto invece di fare un piccolo "stress test" per le potenzialità del programma, inevitabilmente sono emersi alcuni intoppi e bug, anche se gli ultimi dei quali, ad onor del vero, sono imputabili più alle capacità di ChatGPT che al Copilot in quanto "front-end".
Per valutare appieno la qualità di PDFgear, non ci resta allora che aprire il nostro PDF reader di fiducia e sottoporlo a test simili; siamo sicuri che abbia altrettanti strumenti e sappia fare di meglio?