Marco Varone -

« marzo 2008 | Principale | maggio 2008 »

aprile 2008

29/04/08

P.S. per “Pubblicità e semantica” e “Divagazioni”

A proposito di raccolta di informazioni per il contextual o semantic advertising e di analogie fra quello che è successo in Internet alla fine degli anni ’90 e quello che sta accadendo oggi, c’è anche l’aspetto dei servizi.

Ai tempi della (prima?) bolla, l’offerta era incentrata sugli account di e-mail, che praticamente erano l’unica cosa che si poteva regalare agli utenti per invogliarli a scegliere i propri servizi (e anche per iniziare a conteggiarli e capirli).

Oggi, oltre alle mail viene offerta la tecnologia, si regalano strumenti ricchi e facili da usare, come ad esempio le piattaforme per i blog e il social networking (oltre ad applicazioni on-line che rivaleggiano con Office).

Da un lato gli utenti hanno iniziato a popolare spontaneamente il Web di contenuti personali, dall’altro i fornitori hanno avuto a disposizione molti più dati e si sono concentrati sulla capacità di sfruttarli.

Anche questo spiega la frenetica corsa all’acquisto dei siti del Web 2.0 più promettenti (spesso per cifre folli) da parte dei grandi player di oggi:  la competizione si gioca anche sull’abilità di potenziare la raccolta e l’analisi delle informazioni sparse nei vari pezzetti della propria offerta.

Nulla di nuovo sotto il sole: anche nel Web la storia si ripete più di quanto ci si renda conto e malgrado si stia molto insistendo sulla contrapposizione fra l’era dell’ 1.0 e quella del 2.0 non ci sono novità in senso assoluto (come ad esempio i principi di collaborazione e condivisione che in realtà esistono da tempo) o differenze così sostanziali… a parte la banda (che rende possibili cose già pensate in passato ma non tecnicamente erogabili in precedenza) e il fatto che ci sono aziende che fanno soldi veri (nel Web 1.0, i soldi venivano solo spesi :-)

Nova100 tags: , , , , , , , ,

22/04/08

MITI e REALTÀ: i 5 passi nello sviluppo di un motore di ricerca semantico aziendale

I primi due passi necessari per implementare in azienda un motore di ricerca semantico (tipicamente fruibile via intranet) si svolgono in parallelo. Consistono nella valutazione del tipo di conoscenza da gestire e nella valutazione del modo secondo cui questa conoscenza verrà ricercata.

Per fare esempi concreti, possiamo prendere in considerazione due esigenze molto diverse:

  • rendere recuperabili le informazioni all'interno di un manuale d’uso, ad esempio di un'auto;
  • rendere fruibili le informazioni nel sito di una televisione (pur essendo ricercabili sul Web, sono comunque contenuti aziendali).

Quasi sempre le ricerche sulla manualistica saranno puntuali, molto precise (“come faccio a sostituire la lampadina del fanale posteriore?”) mentre quelle nella TV saranno in maggioranza generiche, probabilmente incentrate su nomi di personaggi, programmi o macro-argomenti (“Flavio Insinna”, “Matrix”, ecc. per cui anche una ricerca a keyword spesso può dare buoni risultati).

Il secondo passo consiste nell’analisi approfondita della conoscenza da gestire.

Con una tecnologia semantica, i concetti e le espressioni non noti possono essere facilmente individuati e inseriti all'interno della conoscenza del sistema.

Una parte di questo lavoro può essere fatta direttamente da chi implementa il motore di ricerca ma normalmente è sempre necessaria la collaborazione fra l’azienda-cliente e il fornitore: solo così, infatti, si possono fornire al sistema tutti gli elementi che servono per continuare a garantire un’analisi dei contenuti corretta ed efficiente.

Il terzo passo è la messa a punto del motore di ricerca. Consiste nel fare ricerche, cioè in pratica nel provare il motore e individuare rapidamente eventuali punti deboli che richiedono un intervento specifico.

Le ambiguità di significato delle parole, la specificità dei contenuti, l’uso di metafore non così comuni, ecc. possono creare dei problemi, per fortuna quasi sempre risolvibili in modo soddisfacente. Infatti, una delle prerogative più interessanti della tecnologia semantica è che la rete dei significati può essere arricchita di nuovi contenuti e di conseguenza possono aumentare anche i vari possibili legami fra le parole: con una piccola quantità di lavoro manuale (lasciando da parte il sogno di fare sempre e tutto in automatico), il motore può essere istruito in modo che “comprenda” bene e garantisca sempre un alto livello di precisione, correttezza e attendibilità.

Infine, c’è il rilascio all’azienda di una versione beta, cioè una versione di prova su cui si può iniziare a lavorare. Dopo alcuni giorni o settimane di test, i dati raccolti attraverso l’osservazione delle ricerche sottoposte al motore vengono analizzati in modo che si possano sistemare le ultime cose strettamente legate all'uso vero del motore visto che, piuttosto spesso, nell'utilizzo reale compaiono aspetti non ipotizzati in fase di analisi e primo test.

Nova100 tags: , , , ,

17/04/08

Cum grano salis, anche nel Web

Non c’è dubbio che per chi lavora con la conoscenza (knowledge worker, per usare un termine di moda) il Web sia una fonte informativa molto interessante, spesso irrinunciabile.
Se, ad esempio, pensiamo al marketing  vedremo che, a differenza di quello che accade con i tradizionali sistemi per le ricerche di mercato (questionari, dati di vendita su cui basare proiezioni, ecc.), il Web si basa sulla partecipazione delle persone: oggi si frequentano siti, soprattutto blog e social network, anche per confrontarsi e discutere spontaneamente di prodotti, aziende, persone, ecc.

Non per questo, però, il Web va sempre considerato come una fonte più completa o migliore delle altre. In diversi casi, infatti, per estrarre conoscenza significativa e di valore è fondamentale selezionare le fonti e applicare la giusta metodologia:  analizzare un sacco di siti (blog, forum, social network... ) sperando che una quantità enorme possa in qualche modo portare alla qualità è un vicolo cieco (ma ciò nonostante, molti addetti ai lavori seguono proprio questa strada).

Le elezioni politiche appena svolte sono una buona dimostrazione di quello che può accadare nel Web.

Qualche giorno prima delle elezioni, ho fatto un esperimento usando uno dei nostri software per l’analisi delle informazioni non strutturate.
(Naturalmente non si tratta di una prova scientificamente inattaccabile, ma di un modo concreto per dimostrare che non bisogna pensare al Web come a una fonte di informazioni assoluta e universale.)

Ho selezionato alcune migliaia di blog e forum fra quelli più dinamici (cioè dove gli utenti scrivono e commentano di più) dedicati a discussioni politiche (ma anche ad altri argomenti assortiti) e ho estratto in automatico le indicazioni relative al gradimento espresso nei confronti dei due principali schieramenti (mi sono concentrato solo sui due gruppi di Berlusconi e Veltroni per semplicità).

Ho così scoperto una significativa maggioranza di commenti, confronti e indicazioni a favore di Veltroni. Il dato, se considerato in senso assoluto e in maniera acritica, avrebbe fatto pensare a un successo per il centro sinistra (o, comunque, ad un ottimo risultato) mentre le cose , come tutti sappiamo, sono andate diversamente e il centrodestra ha stravinto.

Quello che occorre fare è prima di tutto capire quanto il Web è rappresentativo per la conoscenza che si vuole trattare (e come ho già scritto recentemente ci sono molti contesti in cui il Web è una fonte perfetta e fondamentale per comprendere quello che sta succedendo).

Una volta stabilito questo, bisogna scegliere con attenzione le fonti da monitorare in modo da assicurare un buon bilanciamento e una buona copertura alla conoscenza cui si è interessati: fatto questo, i risultati sono assicurati (e spesso sorprendenti anche per gli scettici :-).

Nova100 tags: , , , , , , , , , , ,

10/04/08

MITI e REALTÀ: la ricerca

La confusione legata ai tipi di motori di ricerca ha generato in ambito aziendale il mito che un motore vale l’altro e che il tipo di conoscenza (o di contenuti) da gestire non fa molta differenza.

Poiché il motore di ricerca per definizione (quello per il Web) deve trattare bene un po' tutti i contenuti (come abbiamo detto più volte, anche questa insieme con la velocità di implementazione in qualsiasi lingua è una ragione per cui nel Web prevale ancor oggi l’indicizzazione e il recupero dei contenuti per keyword), per molti diventa naturale estendere il ragionamento anche quando così non è.

La conoscenza aziendale, infatti, è un tipo di conoscenza e quindi non è vero che per qualsiasi azienda un motore vale l’altro. Questo non vuol dire che i motori tipici di Internet siano sempre sbagliati per le aziende (chi sostiene incondizionatamente questa tesi non dà una visione corretta del problema) ma che dipende dai casi, dalle necessità di lavoro, dalla quantità dei contenuti e dall’importanza che si dà (o si è costretti a dare) alle attività di ricerca.

Visto che abbiamo già parlato delle differenze tra i motori di ricerca per Internet e quelli per le aziende, ci soffermeremo sulle fasi che si attraversano quando si decide di sviluppare un motore di ricerca semantico per contenuti aziendali.

Anche in questo caso, si può partire da un mito e cioè che per implementare un motore semantico aziendale servono più o meno il tempo e le risorse necessari a costruire la Basilica di San Pietro ;-)

Si tratta di un falso mito perché anche se l'implementazione richiede più lavoro di quello necessario per installare un motore a keyword (spesso pochissimo di più), la qualità dei risultati ripaga abbondantemente il maggior costo iniziale già dopo poche settimane o mesi di utilizzo, rendendo conveniente l'operazione anche dal punto di vista economico. L'unica condizione da rispettare è quella di affidarsi a fornitori esperti della materia che abbiano fatto parecchie implementazioni in precedenza e che utilizzino una tecnologia di qualità.

Parleremo delle fasi di implementazione nei prossimi post.

Nova100 tags: , , , ,

03/04/08

A ciascuno il suo (motore di ricerca)

Chi mi segue dai tempi del blog Cogito, sa che il tema dei motori di ricerca ad uso interno (tipicamente in azienda) mi è caro, forse perché la maggior parte delle persone tende a pensare che gli unici motori esistenti siano quelli per Internet (e, nello specifico, che ci sia solo Google :-).

I motori di ricerca per aziende (oltre ad esistere ;-)) consentono di fare ricerche all’interno dei diversi archivi e cartelle aziendali che contengono il grosso della conoscenza, esplicita e implicita, utile nel lavoro di tutti i giorni: a differenza dei motori per Internet, possono sfruttare anche tecnologie diverse da quella a keyword: statistiche, linguistica superficiale e semantica.

Visto che in passato ho già parlato di approccio, struttura e differenze fra i due tipi di motori, vorrei ora soffermarmi solo su un paradosso: i motori a keyword tipici di Internet sono i più diffusi nelle aziende, malgrado siano i meno adatti a soddisfare le attività di ricerca che tipicamente si svolgono per lavoro (a dir la verità, le cose un po’ hanno iniziato a cambiare e sono sempre di più le organizzazioni che, vincendo l’inerzia e accettando la sfida del cambiamento…, chiedono strumenti più funzionali).

I motori di ricerca su Internet, infatti, sono in grado di dare in media buoni risultati perché sfruttano due elementi peculiari del Web:

- un'enorme ridondanza dei contenuti: la stessa cosa è scritta in così tanti posti e in così tanti modi che una ricerca, per quanto formulata in termini diversi, riesce quasi sempre a restituire qualcosa di sensato anche con un puro match di parole chiave;

- la ricerca di macro cose: molto spesso su Internet si cerca un sito o un'area per poi navigarlo a mano per individuare l'informazione esatta.

Quando si cerca invece all'interno della conoscenza aziendale, la ridondanza è molto ridotta e siamo interessati ad un dato/documento specifico e non c'è tempo per leggersi velocemente il contenuto di N risultati per trovare quello che serve (spesso sto cercando quello specifico documento o dato e non altri): per questi motivi (e per altri che tratterò in seguito), un motore di ricerca "alla Internet" all'interno dell'azienda è sicuramente meglio di niente ma, altrettanto sicuramente, si può fare molto meglio con altre tecnologie.

Nova100 tags: , , , ,

Nova100