Marco Varone -

« luglio 2007 | Principale | settembre 2007 »

agosto 2007

24/08/07

If only semantics...

Oggi i tipi di ricerca in Internet più comuni sono concettualmente molto limitati: “giochi”, “oroscopo”,  “riccardo scamarcio”, “sara tommasi”, “meteo bologna”, ecc.

Per trattare questo tipo di domande, non servono tecnologie più sofisticate di quelle che abbiamo già.
Anche se non è facile prevedere nel dettaglio come e quanto cambierà con la semantica la ricerca di informazioni nel Web, chi di solito cerca queste cose e non è contento dei risultati che ottiene non dovrà aspettarsi molti miglioramenti da questa tecnologia. Dovrà piuttosto cambiare mentalità e iniziare a formulare richieste più articolate invece che limitarsi ad usare una o due keyword.

Dove la semantica può fare invece la differenza è su domande precise e maggiormente complesse per la presenza di più dati, diversi e da considerare insieme (come nella domanda con “automobile” e “risparmio energetico” che ho già usato come esempio).

Altro effetto collaterale (positivo) sarà la grossa riduzione del problema dei risultati falsati dalle tecniche di ottimizzazione usate da chi crea le pagine Web per “ingannare” i motori di ricerca e garantire a un determinato sito le posizioni più alte nell’elenco dei risultati. Almeno fino a quando non verranno escogitati nuovi trucchi :-)

Nova100 tags: , , , ,

22/08/07

Change is good

Ho ripensato al commento al post sul Knowledge Management riguardo all’inerzia e alla difficoltà al cambiamento che sembra accomunare diverse realtà aziendali: in linea di principio è ben accettata da tutti l’idea del cambiamento (necessario perché senza non si progredirebbe) ma nella realtà il meccanismo spesso s’inceppa e fare una scelta diventa difficile.

Un perfetto esempio è quello dei motori di ricerca a keyword: sono prodotti basati su una tecnologia obsoleta, i cui risultati praticamente non soddisfano nessuno, eppure è lo stesso difficilissimo convincere le aziende a passare a una tecnologia migliore.
Il solo pensiero di doversi nuovamente occupare dell’installazione e della messa a punto del sistema sembra spaventare enormemente tutti e così si finisce per continuare ad usare una cosa che è inutile ma che non richiede altro lavoro: l’inerzia è semplicemente più forte della voglia di cambiamento e alla pressante necessità di migliorare spesso non fa poi riscontro alcuna azione decisiva, come se le cose potessero sistemarsi da sole e a un certo punto i problemi potessero adeguarsi alle tecnologie anziché il contrario.

L’inerzia però non risolve niente: per un’azienda per cui le classiche tecnologie per il KM sono inefficaci (magari all’inizio potevano andare bene ma con la crescita esponenziale dei dati la situazione ha finito con il precipitare) il costo del non fare nulla supera rapidamente il costo del cambiare.

Come rompere perciò questo circolo vizioso?

Una possibilità è montare in parallelo al sistema esistente il nuovo motore di ricerca (semantico naturalmente) e consentire ad un gruppo di utenti di usarli entrambi: se il nuovo prodotto fornisce risultati migliori (come capita quasi sempre), diventa molto più semplice vincere l’inerzia e convincere l’azienda che il costo del cambiamento è un investimento che sarà ripagato molto presto.

Nova100 tags: , , , , ,

08/08/07

Il Web e la semantica

Come accennato in diversi post, sono ormai tante le start up che stanno cercando di utilizzare una qualche forma di semantica  per migliorare il recupero di informazioni nel Web e vale la pena di elencarne alcune e di indicare qualche elemento interessante per ognuna.

Powerset è sicuramente quella che sta cercando il profilo più alto, perché si propone di battere Google consentendo agli utilizzatori di Internet di fare domande (solo in inglese almeno per ora)  e di ottenere risposte invece che fare ricerche (con solo parole chiave) e poi scorrere/leggere i risultati per trovare quanto desiderato: sarà molto difficile che riescano ma il tentativo è più che apprezzabile.

“SemanticRank” è il nome che ha scelto Hakia per l’algoritmo che dovrebbe consentire di ottenere risultati migliori per ogni tipo di query: quanto disponibile sul sito non mi pare troppo innovativo (anche se alcune cose sono utili a livello di metamotore) e anche le spiegazioni sull’uso che fanno della semantica sembrano molto raccolte di buzzword di moda più che approcci rivoluzionari (non scommmetto su di loro).

Anche Digger ha optato per una tecnologia ad “approccio semantico”: analizza il significato delle parole e nel caso di fraintendimenti (per esempio a causa di ambiguità create da vocaboli con più significati) consente di correggere la propria ricerca: molto pragmatico ma molto semplificato.

Ci sono anche esempi di motori specializzati in determinate aree.

Kosmix (che si definisce un’azienda del Web 3.0) basa la potenzialità del proprio motore sulla “salsa segreta” della categorizzazione e sull’organizzazione dei contenuti per determinate categorie (viaggi, politica, video games, salute, finanza, auto): in realtà, non so dire se usino tecnologie semantiche ma sicuramente sarebbero utili per la loro categorizzazione.

Un altro esempio è Spock, a cui Mario Mariani ha recentemente dedicato un post il cui titolo mi pare il modo più adatto per chiudere il discorso: è proprio vero che Internet non finisce mai di stupire!

Nova100 tags: , , , , , , ,

Nova100