Successivo » « Precedente

Ancora Google

Mi rendo conto di essere un po' noioso e ripetitivo a parlare sempre di Google, ma poiché viene spesso citato dai nostri clienti come esempio di riferimento (in modo proprio o, anche più spesso, improprio), ho pensato in questo caso di parlarne per illustrare alcuni punti importanti sulla complessità reale di un motore di ricerca (e far capire che non esistono sistemi o tecnologie perfette).

Se provate a fare questa ricerca:

criteri di visibilità

dovreste ottenere un risultato sorprendente e chiaramente sbagliato (dico “dovreste” perché ormai Google dà risultati diversi in momenti diversi a persone diverse in base a una serie di fattori non sempre facili da decifrare).

Criteri di visibilità, ricerca Google 
Tutti i primi dieci risultati visualizzati, infatti, si riferiscono a un tema che sicuramente Google considera molto più rilevante del mio (criteri di divisibilità) ma che non ha nulla a che fare con quanto scritto e desiderato.

Questo risultato è il perfetto esempio del fatto che le tecniche di machine learning (apprendimento automatico), anche se applicate a volumi spaventosi come quelli giornalieri di Google, hanno limiti e difetti ben precisi: con query molto semplici e ripetitive, tipiche di Google, spesso aiutano ma possono anche portare completamente fuori strada.

La soluzione in questo caso è semplice, perché basta mettere un “più” davanti alla parola “visibilità”. Non so però se in effetti sia così facile per la maggior parte degli utenti aggirare bug di questo tipo. Sarei curioso di scoprirlo e di capire qual è la reazione più comune dinanzi a questo tipo di problemi.

Commenti

La mia reazione istintiva, prima di continuare a leggere l'articolo e quindi di vedere la soluzione da lei suggerita, è stata di ripetere la query digitando "criteri di visibilità -divisibilità", che sostanzialmente porta agli stessi risultati di "criteri di +visibilità".

Ma effettivamente anch'io sarei curioso di sapere cosa farebbe la maggior parte degli utenti....

Credo che alcuni notino la scritta in fondo ai risultati e clicchino lì ma sono convinto che tanti altri non sappiano bene cosa fare in questi casi

Interessante. Però il motore non è stato usato propriamente. Penso infatti che anche l'utente meno smaliziato avrebbe cercato "criteri di visibilità" (con le virgolette, perché è proprio quella espressione che si sta cercando non la somma logica di tre termini, o meglio 2 + 1 stopword) e quindi ricevuto un elenco di risultati pertinente. O faccio l'utente base troppo "smart"?



Se si utilizzano le virgolette ("criteri di visibilità") il risultato cambia: Google va alla ricerca di quella stringa e la trova, senza interessarsi alla "divisibilità".

Se cerco "criteri di bisibilità" (il typo è voluto) Google dice "forse cercavi... criteri di visibilità".

La stringa corretta digitata senza le virgolette non fa apparire l'alert ("forse cercavi...") del motore: Google sembra scegliere direttamente quella che per lui è la cosa più probabile che volevi cercare.

Altra cosa che ho notato: se si fa caso a quel "sistema di suggerimenti" (non so come chiamarlo, ma lo trovo assurdo) che esegue una query per ogni carattere digitato, tra i suggerimenti c'è "criteri di visibilità", ma nessun accenno alla "divisibilità".

E' così rilevante ? A me sembra che questa dialettica keywords - semantica sia come la battaglia tra vhs e betamax. alla fine vince la semplicità e una soluzione per keyword la può sviluppare chiunque anche se il risultato è di qualità (apparentemente) inferiore a quella semantica.

Bah, in realtà in questo specifico post criticavo più che altro i limiti del machine learning lasciando da parte la semantica per una volta :-)

Scrivi un commento