Successivo » « Precedente

Quanta strada hanno fatto i motori di ricerca?

I motori di ricerca per Internet ne hanno fatta di strada in questi anni, dai primi successi di Altavista e Lycos fino allo strapotere (giustificato dai risultati migliori di tutti gli altri) di Google. Negli ultimi due o tre anni, però, Google stesso ha raggiunto una sorta di plateau dove le innovazioni che fanno la differenza sono sempre meno e la concorrenza (Bing in particolare) si avvicina molto più rapidamente che in passato.

La tecnologia a keyword (integrata da una serie di elementi statistici come il famoso PageRank) ha avuto l’enorme vantaggio di essere semplice, facilmente applicabile a tante lingue e molto veloce, cioè tutte caratteristiche fondamentali nei primi anni del Web (dove investimenti e potenze di calcolo erano molto più ridotti) ma che ora non sono più così importanti. Applicata al Web, la tecnologia a keyword ha anche sfruttato il lavoro assolutamente gratuito e volontario di centinaia di milioni di persone che ogni giorno, facendo delle ricerche e cliccando su uno o più risultati, forniscono ai produttori una quantità enorme di informazioni di inestimabile valore per ordinare i risultati delle ricerche in modo ottimale (in un certo senso, questo volontariato è il prezzo che gli utenti pagano per usare servizi che sono gratuiti: invece di soldi, lavoro).

Nonostante tutto ciò, è ormai tempo che questa tecnologia sia affiancata da qualcosa di nuovo: non bisogna assolutamente buttare via quanto fatto (in molti casi, i risultati delle ricerche sono già adesso molto buoni) ma aggiungere tecnologie in grado di migliorare i risultati delle ricerche attualmente problematiche e di rendere più semplice trovare le informazioni desiderate anche alle persone che non sanno come comporre una ricerca ottimizzata, ma che sanno benissimo come chiedere la stessa cosa a una persona.

 

Occorre non avere paura di sporcarsi le mani e buttarsi nel cuore della lingua e della cultura di ogni paese: fino ad ora, si è preferito un approccio molto “asettico” che non entrava nel merito ma lavorava a livello simbolico. Per comprendere il significato, invece, bisogna scendere al livello sottostante, capire che un testo è un insieme di frasi, concetti, attributi e relazioni che vanno analizzate nel loro insieme (anche culturale) per riuscire a cogliere tutti gli aspetti importanti del contenuto e rispondere in maniera puntuale alle ricerche degli utenti.

 

Servono investimenti significativi (ogni lingua è complessa di per sé e diversa dalle altre ed è spesso inscindibile dalla cultura di un paese), più lavoro manuale e meno automatico e più potenza di calcolo rispetto ad ora. Questi aspetti accelereranno ancora di più la polarizzazione già in corso, che porterà ad avere sostanzialmente solo due player nel mercato dei motori di ricerca per Internet, cioè Google e Yahoo!

 

Realtà più piccole, esistenti da tempo o start-up, potranno dare il loro importante contributo per aspetti tecnologici innovativi o su contesti verticali, ma molto difficilmente potranno competere su larga scala con questi due giganti. La semantica è una tecnologia ancora giovane e con molti spazi di crescita, nessuno però si aspetti miracoli o rivoluzioni in tempi brevi: il sentiero da seguire è lungo e tortuoso ma la ricompensa in fondo alla strada è potenzialmente molto grande.

Commenti

Marco ha ragione.
Penso che forse questi post necessiterebbero di analisi più approfondite, e di meno spazi auto-pubblicitari e auto-referenziali.
Inolte l'autore non dovrebbe avere paura di entrare maggiormente nei dettagli degli algoritmi, delle tecnologie e delle problematiche.

Scusate. Nel commento precedente intendevo dire "Mauro ha ragione", riferendomi all'autore del primo commento.

@nullpointer: penso di essere stato frainteso. Cioè, per "avere ragione" bisogna affermare qualcosa. Io ho solo passato un link a Marco attraverso il blog: insomma, l'ho postato più per condividere qualcosa con Marco e con i lettori che per rispondere in maniera più o meno diretta al contenuto del post originale.

Can't withhold comments.

>di rendere più semplice trovare le informazioni
>desiderate anche alle persone
>che non sanno come comporre una ricerca ottimizzata,
I would say there are enough cases when people simply don't know what do they want in the first place. This renders the formulation of search query impossible, until they are educated about what they want to know.

>ma che sanno benissimo come chiedere la stessa cosa a una persona.
And continuing the case where people don't know what do they want (or have it in a very vague form), but know how to ask somebody, I think you're (intentionally?) leaving out of discussion an important difference, which arises when you have another person - the discussion. The fact of asking another person and exchanging a couple of sentences creates a discussion, a dialogue. And as I would speculate, rarely in this case it is only 2 sentences, namely, a question and an answer. In most cases, another person first gives the one who's asking some additional information about the domain in question (educational function). This new knowledge about the domain makes it possible for the requestor to formulate the query. Let me illustrate:


- I want the frame... hm... um... this way (makes a gesture).
- This is called diamond shape frame. They are bla-bla-bla...
- OK, I want a diamond shape frame, black with gold inlays at the corners.


>entrava nel merito ma lavorava a livello simbolico.
>Per comprendere il significato,
>invece, bisogna scendere al livello sottostante,
>capire che un testo è un insieme di frasi,
>concetti, attributi e relazioni che vanno
> analizzate nel loro insieme (anche culturale) per
>riuscire a cogliere tutti gli aspetti importanti
> del contenuto e rispondere in maniera
>puntuale alle ricerche degli utenti.
And more than that! It's not enough just go to the concept level, although this and this alone is hard enough. Namely, going back to the illustration above, I would say that the step you're (intentionally?) leaving out of the discussion is the illustrated "synchronisation" of the knowledge of the asking party and responding party. That is, I talk here about the more and more frequent cases where for the asking party to understand the answer, it first needs to learn some concepts, to learn the terms in which the answer will be formulated.

>Questi aspetti accelereranno ancora di più
>la polarizzazione già in corso, che porterà ad
>avere sostanzialmente solo due player
> nel mercato dei motori di ricerca per Internet,
>cioè Google e Yahoo!
Not having such a profound market knowledge as you do, I'll risk just saying that I didn't use Yahoo for years. Only testing it once in a while when they unveil something.


>Realtà più piccole, esistenti da tempo o start-up,
>potranno dare il loro importante
>contributo per aspetti tecnologici
>innovativi o su contesti verticali, ma molto
Just to enough to be swallowed and digested by one of the two, you mean? :)

@Aliaksandr
A volte queste situazioni vengono risolte "con l'aiuto della grafica", come amano dire in qualche TG o trasmissione sportiva. Ad esempio: se non hai mai sentito nominare una "diamond shape frame", c'è la possibilità di cercare unicamente 'frame' in un contesto in cui l'output è costituito da sole immagini (vedi Google Images o altri servizi): tra i risultati della ricerca, c'è la possibilità che qualcuno di questi corrisponda a ciò che cerchiamo (e magari nella sua descrizione troviamo "diamond shape frame", cosa che ci aiuta ad affinare la ricerca, come nell'esempio del dialogo).

@Marco
All'inizio del post non capisco se parli in generale (in merito allo stato raggiunto da Google negli ultimi due o tre anni) o ti riferisci unicamente alla ricerca. Dico questo perché Wave mi pare abbastanza interessante, ad esempio.

Mauro, hai ragione. Il metodo da te indicato è uno dei possibili, infatti, può essere anche il primo metodo usato, empiricamente. Però, vorrei indicare che usando questo metodo il richiedente esplora il dominio e deve strutturarlo da zero (creare l'ontologia nella sua mente). Al contrario dell'acquisto del dominio già strutturato dalla parte della sistema. Continuando l'esempio della nostra cornice, e come continuare con ".... Esistono anche nella forma di XXX, YYY e ZZZ". Guarda sulla "faceted search" che viene usato ad esempio sul sito Dell (a sinistra, le scelte tipo "per memoria", "per disco", ecc) per facilitare la scelta del portatile. Usandolo, l'utente viene educato e guidato nel campo.

Grazie per i commenti e i diversi spunti interessanti. Cercherò di rispondere e di approfondire l’argomento nei prossimi post

Scrivi un commento