In una rete che cresce e si modifica costantemente, riuscire a trovare in tempi brevi le informazioni volute può non essere facile; per questo i motori di ricerca sono fondamentali e quando le ricerche per semplici parole chiave non danno il risultato sperato, diventa importante poter contare su appositi filtri. Per calibrare meglio i risultati del motore di ricerca per antonomasia, Google, è possibile ricorrere anche ai cosiddetti "dorks", operatori e parametri che consentono di applicare selezioni personalizzate per setacciare meglio l'oceano di informazioni disponibili (alcuni di loro possono funzionare anche su altri motori di ricerca: DuckDuckGo, Yahoo, Bing, Yandex, Shodan, etc.).

Prima di dare un'occhiata ai dorks veri e propri, è doveroso ricordare un simbolo che ci viene in aiuto per allargare la ricerca o sopperire a vuoti di memoria: l'asterisco. Proprio come accade anche in altri contesti, funge da carattere jolly complessivo (numero indefinito di caratteri, diversi o uguali fra loro) nella posizione in cui viene posto. Ad esempio, consideriamo i differenti risultati se cerchiamo «cruci», «cruci*»:

Come migliorare ricerche Google dorks

L'asterisco comunica a Google di completare a piacere la parte finale della parola; per cui l'algoritmo l'associa ad una ricerca piuttosto comune come «cruciverba». Come vedremo in seguito, l'asterisco può fungere da "segnaposto generico" anche per nomi di dominio e altri elementi da lasciare indefiniti.

Operatori logici e ricerca letterale

Nelle ricerche su Google, l'operatore logico di default fra i termini inseriti è AND, per cui cercare «x y z» equivale a «x AND y AND z», ovvero verrà data la "precedenza algoritmica" alle pagine che contengono tutti e tre i termini. Da considerare che l'ordine delle parole condiziona il risultato della ricerca; ad esempio, se cerchiamo «mare piatto» e «piatto mare», otteniamo due elenchi di risultati differenti. Qualora l'AND non dia abbastanza risultati, solitamente subentra in automatico l'OR e ciò significa che verranno individuati i risultati che contengono almeno uno dei due termini chiave, con Google stesso che ci segnalerà le parole mancanti.

Come migliorare ricerche Google dorks

Per usare volutamente l'OR, è sufficiente esplicitarlo (in maiuscolo), «x OR y», oppure usare il pipe «x | y». Ad esempio, se cerchiamo «commercialista OR apotropaico», Google non ci segnalerà alcuna parola mancante, "accontentandosi" di trovare almeno una delle due:

Come migliorare ricerche Google dorks

Vi è mai capitato di cercare qualche parola o espressione preceduta dal trattino e non riuscire a trovarla nei risultati di ricerca? Questo è inevitabile, poiché il trattino equivale al NOT, ovvero la parola che lo segue viene esclusa dalla ricerca. Ad esempio, se cerchiamo «-outvariable», Google va in crisi e non riesce a darci risultati:

Come migliorare ricerche Google dorks

perché gli abbiamo chiesto di escludere dai risultati la parola «outvariable», ma non gli abbiamo comunicato cosa cercare (e non intende certo porgerci tutte le pagine Internet che non hanno quella parola).

Questo "filtro negativo" può essere utile se vogliamo disambiguare una ricerca escludendo parole rilevanti che intasano i risultati. Ad esempio se vogliamo cercare informazioni sulla parola «matrix» senza essere inondati da risultati relativi all'omonima serie di film, possiamo utilizzare una ricerca del tipo: «matrix -movie -film», il risultato è questo:

Come migliorare ricerche Google dorks

Tuttavia, come fare allora per cercare una parola composta o un'espressione che contiene il trattino? Per farlo è necessario utilizzare la "ricerca letterale" (con risultati ancor più esatti rispetto al filtro "Verbatim" in "Strumenti"), ovvero inserendo fra virgolette ciò che si intende cercare. Così facendo il trattino non sarà interpretato come NOT, ma semplicemente come trattino. Ad esempio, se ripetiamo la stessa ricerca di prima, ma usando le virgolette («"-outvariable"»), otteniamo:

Come migliorare ricerche Google dorks

La ricerca letterale abbinata a parole chiave senza virgolette, spinge Google a trovare le pagine che hanno sempre la parola o frase fra virgolette e possibilmente, ma non necessariamente, anche le altre. Ad esempio, se cerchiamo «"dollaro" spaghetti sottomarino», tutti i risultati conterranno la parola "dollaro" e, possibilmente tutte o almeno una delle altre due:

Come migliorare ricerche Google dorks

Dorks

«IN...» E «ALLIN...»

Come anticipato, per ricerche ancora più mirate è possibile usare i dorks sotto forma di parametri, da usare solitamente con la sintassi [parametro]:[testo], facendo attenzione a non lasciare lo spazio dopo i due punti. Poche righe sopra, abbiamo già visto un modo implicito di usare due parametri: usare parole o frasi fra le virgolette («"x" "y"»), equivale infatti ad usare il parametro allintext («allintext:x y»), mentre una parola singola virgolettata a quello intext («intext:x»). Entrambi questi parametri cercano nel testo delle pagine le parole indicate, usando come operatore prioritario AND.

Similmente, sono utilizzabili i parametri «intitle:» «allintitle:» che ristringono la ricerca solo ai titoli delle pagine. Se ad esempio siamo interessati a tutte le pagine che citano nel titolo «normacap» useremo la ricerca «intitle:normacap»; da non confondere con la ricerca «"normacap"» che cerca la parola esatta in tutta la pagina, né con la ricerca «normacap» che consente a Google di derogare dallo spelling che gli abbiamo fornito, per proporci suggerimenti ritenuti più plausibili (anche separando «norm» e «cap»). Ecco le differenze fra ricerca standard, ricerca nel titolo e ricerca esatta:

Come migliorare ricerche Google dorks

La freccia rossa indica come sia stata inserita nei risultati una pagina che non contiene «normacap» nel titolo (a differenza dei risultati successivi), ma è stata comunque indicizzata come rilevante contenendo la parola esatta nel testo.

Sempre seguendo la differenza fra «in...» e «all...» è possibile cercare anche solo nell'URL con «inurl:» e «allinurl:». Se ad esempio vogliamo trovare pagine il cui URL contenga le parole «phishing», «poste» e «euro», ci basterà usare la ricerca «allinurl:phishing poste euro».

Come migliorare ricerche Google dorks

Anche se i titolo sono troncati dai puntini di sospensione, ciascuno di loro contiene le parole ricercate.

Meno intuitivo e decisamente più settoriale l'uso di «inanchor:» «allinanchor:». Per "anchor" si intende il testo che funge da link verso un'altra pagina (anche di un altro sito) e i suddetti parametri cercano appunto solo il testo linkato contenente le parole scelte.

«site:»

Passiamo ora ad un parametro molto utile, specialmente per i siti che non forniscono agli utenti sistemi di ricerca interna. Digitando «site:[sito] [parola]» possiamo ristringere la ricerca di Google per quella parola a quello specifico sito. Ad esempio, cercando «site:turbolab.it dorks» (va citato solo il dominio, senza protocollo né eventuale «www») non abbiamo trovato nulla prima di pubblicare questo articolo; ma se lo cercate ora, dovreste (aggiornamento dei crawler di Google permettendo) trovare il link per tornare qui.

Come migliorare ricerche Google dorks

Chiaramente è possibile cercare anche più parole e restringere la ricerca ad un indirizzo più specifico: ad esempio con «site:restoreprivacy.com/password-manager/reviews/ zero-knowledge» avremo nei risultati le recensioni di password manager, del sito restoreprivacy, in cui si parla di zero-knowledge.

«cache:»

Il parametro "cache:" non fa altro che emulare la funzione di Google che consente di consultare la versione memorizzata di una pagina nei suoi database e magari non più disponibile online. Un tipico caso può essere quello di prodotti non più venduti online, ma che può far comodo consultare per avere un'idea su prezzo o caratteristiche; oppure pagine non più reperibili, ma comunque forniteci dall'elenco dei risultati di Google. Se ad esempio avete cercato e trovato "USPS Scott 3369 FDC 1999 New Year's Eve Baby Y2K Clocks Time Lincoln NE" su eBay (link in viola)

Come migliorare ricerche Google dorks

ma quando provate ad aprire la pagina di riferimento vi viene comunicato che quella pagina non è più disponibile

Come migliorare ricerche Google dorks

potete (in alternativa al metodo più veloce, ossia cliccare sui tre punti a destra del link e poi su «cached») anche digitare nella barra «cached:[indirizzo]», ricordando di inserire l'indirizzo completo con il protocollo HTTP(S). Per reperire l'indirizzo "scaduto" è sufficiente cliccare con il destro sul nome del risultato della ricerca e selezionare "copy link address".

Come migliorare ricerche Google dorks

Verrà così visualizzata la pagina memorizzata da Google in precedenza (similmente a quanto accade con WayBackMachine, di cui ci siamo già occupati qui).

Come migliorare ricerche Google dorks

«filetype:» e «ext:»

Due dorks tanto potenti quanto utili sono quell che ci consentono di filtrare i risultati per tipo di file ed estensione: «filetype:[estensione]» o «ext:[estensione]», ricordando che l'estensione va scritta senza essere preceduta dal punto. Un caso pratico potrebbe essere la necessità di ritrovare un manuale in PDF sul sito di un prodotto; possiamo usare la ricerca «site:[sito] filetype:pdf [nome prodotto]». Ad esempio: «site:acer.com filetype:pdf intitle:manuale "aspire 7"»:

Come migliorare ricerche Google dorks

Una differenza sottile fra i due parametri è che «filetype:» si riferisce al file caricato nella pagina, mentre «ext:» all'indirizzo URL, ma all'atto pratico si sono dimostrati praticamente intercambiabili nelle ricerche rivolte alle principali tipologie di file.

«before:» e «after:»

Google ci dà la possibilità di impostare l'intervallo di date da filtrare cliccando su "Strumenti / Intervallo date", tuttavia è possibile impostare i filtri per data anche direttamente dalla barra delle ricerche e, cambiando per un attimo il tema del discorso, è possibile utilizzare questi filtri anche su YouTube, che invece non consente nativamente di impostare i filtri data. La sintassi è «before:anno-mese-giorno» e «after:anno-mese-giorno». Non è obbligatorio impostare la data completa, è anche possibile limitarsi al solo anno o utilizzare solo «before:», come nell'esempio «pandemia before:2018»:

Come migliorare ricerche Google dorks

«AROUND()»

Per una ricerca attenta alla vicinanza delle parole fra loro, è possibile utilizzare l'operatore «AROUND()» (in maiuscolo) indicando fra parentesi il numero massimo di parole che possono separare i due termini ricercati, dando la priorità all'ordine esatto in cui sono immessi. Ad esempio, se cerchiamo «record AROUND(3) euro», otterremo:

Come migliorare ricerche Google dorks

Intervallo di numeri

Se abbiamo bisogno di fare una ricerca che comprenda un intervallo di numeri troppo lungo da cercare un numero alla volta, possiamo utilizzare una apposita sintassi per esplicitare l'intervallo in questione, fissando i due estremi (valore massimo e minimo) fra due punti (orizzontali), senza spazi: «x..y». Ad esempio, se intendiamo cercare i nomi delle montagne comprese fra gli 8000 e i 9000 metri, possiamo usare la stringa: «montagne 8000..9000 metri» e Google considererà da cercare tutti i numeri compresi fra 8000 e 9000 accompagnati dai termini «montagne» e «metri»:

Come migliorare ricerche Google dorks

Chiaramente combinando questi parametri fra loro, si possono impostare ricerche molto restrittive e mirate; come ad esempio: «-site:*.it -inurl:https intitle:classifica filetype:pdf before:2020 corse» che cerca nei siti non .it e non in https, i documenti .pdf che contengano nel titolo la parola «classifica» e nel testo online la parola «corse» restringendo le date disponibili a prima del 2020.

Da tenere inoltre presente che l'uso ripetuto di ricerche con i dork, può portare Google a chiedervi di confermare di non essere un robot (per combattere il web scraping selvaggio e automatizzato):

Come migliorare ricerche Google dorks

In questo articolo abbiamo presentato solo un'assaggio delle potenzialità dei principali dorks (ce ne sono anche altri, alcuni meno utili per l'utente medio, potete trovarli qui) e in rete abbondano numerose "cheatsheet" di riepilogo, progetti per automatizzare la ricerca e varie raccolte tematiche (alcune anche in ambito OSINT e "hacking").