Quando si fa la ricerca di qualcosa, prima di iniziare a scrivere un nuovo articolo, mi sembra, almeno dalla scritta che compare dopo, che sia limitata al titolo dell'articolo.
Se io cerco, per esempio, un cmdlet di powershell difficilmente lo avrei inserito nel titolo stesso, ma solo nel testo dell'articolo e quindi non lo troverei mai con questo tipo di ricerca, così potrei fare un articolo duplicato.
Per trovarlo dovrei fare una ricerca nel forum.
Se si può migliorare la ricerca sarebbe meglio.
la sezione "Risultati forniti da Google" mostra i risultati della ricerca effettuata con Google su TurboLab.it - questo è quello che abbiamo sempre avuto anche su TLI 1.0
la sezione " Articoli che contengono le parole cercate nel titolo" sono invece il risultato di query SQL sul nostro database. Qui dobbiamo limitare al titolo, altrimenti esce sempre troppa roba, spesso irrilevante
Ho notato solo ora che c'è un problema per cui Google non trova niente: devo verificare se dipende da un errore di integrazione mio (probabile) oppure dal fatto che, effettivamente, Google non ha indicizzato nulla per quelle parole. Vado a lavorarci fra un attimo.
Frattanto, tornando alla tua segnalazione originale: potremmo (forse) migliorare le cose attivando ElasticSearch, Sphinx o simili, ma non sono sicuro che farebbero davvero meglio di Google su un sito di contenuti come il nostro. Per il momento manteniamo la configurazione attuale, ma mantengo sicuramente aperta la segnalazione per valutare, in futuro, l'uso di ElasticSearch o Sphinx.
Non concordo del tutto ma per il momento mi adeguo.
Cercando "nirsoft", per esempio, non mi trova nulla, però di articoli sui programmi nirsoft ne abbiamo tanti.
La prima legge della dietetica sembra essere: se il sapore è buono, a te fa male.
Hai ragione, grazie per avermelo fatto notare. Finisco quello che sto facendo e poi passo subito a questa cosa: ho trovato https://www.meilisearch.com/docs/home , che sembra molto più pratico da integrare rispetto ad ElasticSearch e promette buoni risultati.
Non vorrei fare il primitivo che scopre l'acqua calda, ma per evitare doppioni solitamente uso il "google dork": site:turbolab.it ParolaChiave1 "Espressione a più parole" (con o senza virgolette a seconda di quanto devo essere preciso); mentre per la ricerca nei titoli: site:turbolab.it intitle:ParolaChiave (o inurl come ulteriore ricerca).
E se li integrassimo nella ricerca del sito? Oppure si fa prima ed è più efficace usare altre applicazioni ad hoc?
Il problema di fondo è che le API gratuite per la ricerca di Google che avevo implementato in precedenza permettevano solo 100 richieste al giorno, quindi si esaurivano già all'ora di colazione, lasciando funzionante solo la ricerca via SQL di backup che, come notato da crazy.cat, cercava solamente nel titolo
gira in locale (come piace a me), senza dipendenze da servizi cloud esterni
open source, senza limiti
funziona già piuttosto bene, secondo me, senza impazzire con mille configurazioni
piuttosto tollerante anche agli errore di digitazione
mi sembra piuttosto leggero (0.5 GB di RAM e disco)
Fatemi sapere cosa ve ne pare
Zigul ha scritto: dom set 21, 2025 11:25 am
E se li integrassimo nella ricerca del sito?
In precedenza, su TLI1, avevamo ESATTAMENTE l'integrazione che citi. Il problema è che è poco flessibile, motivo per cui, per TLI2, avevo provato ad usare le API dello stesso servizio... che però sono molto limitate.
Fai una prova con il nuovo motore e fammi sapere cosa te ne pare.
Inserendo un messaggio, dichiari di aver letto e accettato il regolamento di partecipazione.
Nello specifico, sei consapevole che ti stai assumendo personalmente la totale responsabilità delle tue affermazioni, anche in sede civile e/o penale,
manlevando i gestori di questo sito da ogni coinvolgimento e/o pretesa di rivalsa.
Dichiari inoltre di essere consapevole che il messaggio sarà visibile pubblicamente, accetti di diffonderlo con licenza
CC BY-NC-SA 3.0 (con attribuzione a "TurboLab.it") e rinunci ad ogni forma di compensazione (economica o altro).
Rinunci inoltre esplicitamente a qualsiasi pretesa di cancellazione del messaggio.