Marco Varone -

« settembre 2007 | Principale | novembre 2007 »

ottobre 2007

23/10/07

Ma allora Google ha davvero un lato oscuro?

Ho scelto per caso il titolo “Il lato oscuro di Google” quando ho scritto quel post in cui ho riportato la vicenda di quei ladri impacciati che, per scoprire come scassinare una cassaforte, hanno pensato bene di usare un motore di ricerca nel bel mezzo della rapina.

Poi mi è capitato fra le mani il libro “Luci e ombre di Google. Futuro e Passato dell’industria dei metadati.” in cui l’autore

(Ippolita, cioè “un gruppo di ricerca composto da hacker e agitatori sociali, un server e una comunità di “scriventi”, un crocevia per condividere strumenti e competenze tra i linguaggi del digitale e i linguaggi della scrittura”)

offre già nell’introduzione un’analisi dei principali elementi che hanno portato Google a diventare il motore di ricerca più usato e famoso del mondo E, guarda caso, il sito in cui i vari capitoli del libro sono disponibili on line si chiama proprio the dark side of Google.

I vari capitoli del libro sono già disponibili da tempo on-line nel wiki del sito di Ippolita “The Dark side of Google”.

Non ho ancora avuto il tempo di leggere il tutto, ma la coincidenza era simpatica ed è incoraggiante vedere che un libro viene contemporaneamente reso disponibile nel modo classico e anche sul web.

Nova100 tags: , ,

17/10/07

Gli innumerevoli nomi delle tecnologie per la gestione delle informazioni

Recentemente un giornalista mi ha chiesto come mai è così varia la terminologia per definire la gestione delle informazioni all'interno delle aziende (e poi è uscito questo articolo).

Il problema è sempre quello (trovare e sfruttare la conoscenza quando serve) eppure ci sono tanti modi per indicarlo, anche secondo attività specifiche: search/ricerca, document categorization/classification, classificazione/categorizzazione, clustering, information o data retrieval, taxonomy creation, entity extraction, text mining, text analytics, content management...

Gartner parla di "information access technology" mentre IDC di "content access tools": pazienza se la varietà della terminologia è opera della fantasia dei giornalisti oppure della creatività dei vari uffici di comunicazione, ma fa riflettere che nemmeno i due maggiori analisti del mondo IT raccolgano sotto la stessa etichetta l'insieme delle tecnologie e delle soluzioni disponibili sul mercato.

Si tratta di un settore (e di un mercato) in evoluzione in cui le vecchie tecnologie non sono più sufficienti, ma anche se hanno fatto il loro tempo stentano a lasciare il campo a quelle più innovative che, per essere applicate facilmente e con efficacia in ogni contesto, devono però essere ancora perfezionate. Sarebbe meglio che a questa fase di cambiamenti non si aggiungesse la confusione creata da tanti nomi diversi per indicare tante attività riconducibili alla stessa macro-area. Un po' più di chiarezza e un'unica etichetta aiuterebbe tutti:

- le aziende che vivono il problema dell'ingovernabilità delle informazioni perché non farebbero così fatica a capire che cosa offre davvero il mercato

- chi lavora nel settore perché convergendo su un unico tema con i vari interlocutori potrebbe finalmente concentrarsi su quello che conta veramente:  migliorare la propria tecnologia per risolvere  i problemi reali degli utenti.

Nova100 tags: , , , , , , ,

10/10/07

Spie come noi

Nell’immaginario collettivo i Servizi Segreti evocano perlopiù un mondo misterioso, dove la tecnologia è ai confini della realtà e tutti gli strumenti sono evoluti, lontanissimi da quelli a cui normalmente siamo abituati.
È perciò tutt’altro che immediato un parallelo fra le attività che noi svolgiamo ogni giorno nelle nostre aziende (ma anche nel tempo libero) e quelle che pensiamo siano più tipiche di una spia.

Forse, però, con l’Intelligence abbiamo in comune molto più di quello che immaginiamo, almeno stando all’ambito della gestione delle informazioni: oltre alla necessità di reperire i dati e gli indizi più giusti, c’è anche l’esigenza di condividere la conoscenza acquisita diffondendola nel modo migliore e più veloce possibile.

Non so se avete già sentito parlare di “A-Space”, un progetto di social networking promosso dall’Intelligence Community (Stati Uniti) con l’obiettivo di migliorare la qualità dell’intelligence e promuovere la condivisione delle informazioni.

La “A” sta per “Analisti” (cioè gli agenti segreti) e “Space” rappresenta la variante di uno dei siti più famosi e tipici del Web 2.0: MySpace.

Per A-Space è prevista la partecipazione ad Intellipedia (un insieme di 3 Wiki top-secret il cui nome è nato sulla falsariga di Wikipedia), i cui membri provengono da 16 diverse agenzie segrete. A poco più di un anno e mezzo dalla sua creazione, Intillepedia raccoglie più di 29.000 articoli con un media di 114 pezzi nuovi creati ogni giorno e oltre 4.800 modifiche a materiale già esistente.

È interessante e positivo se alcuni degli strumenti del Web 2.0 possono contribuire alla risoluzione dei problemi legati alla condivisione delle informazioni (anche a livello globale) utili all’Intelligence. Ma quello che ha fatto davvero notizia è stata l’associazione dell’Intelligence con siti come Facebook e MySpace, molto semplici e tipicamente giovanili:

“Logged In and Sharing Gossip, er, Intelligence”, New York Times

“Spies and teenagers normally have little in common but that is about to change as America’s intelligence agencies prepare to launch “A-Space”, an internal communications tool modelled on the popular social networking sites, Facebook and MySpace”, Financial Times

Il problema della difficoltà nella ricerca e poi nella gestione integrata delle informazioni causato dai limiti delle tecnologie è lo stesso per tutti: agenti e servizi segreti, aziende, persone.
Cambiano le esigenze, gli obiettivi, naturalmente anche i rischi e la complessità delle situazioni da affrontare. Cambiano di conseguenza anche la velocità e la concretezza con cui si tenta di dare una risposta al problema.

Penso che tornerò presto sull’argomento.

Nova100 tags: , , , , , , , , , ,

05/10/07

THESEUS e la nuova era di Internet: Web 2.0 + Semantics = Web 3.0

A proposito della forte presenza della parola semantica in THESEUS (v. descrizione nel sito e in alcuni articoli come questo) mi è stato chiesto in più occasioni un parere: ma si tratta proprio di semantica oppure è uno di quei casi d’uso/abuso per intendere una tecnologia un po’ meno rozza di quella a keyword?

Per giudicare, bisognerà attendere maggiori dettagli: ancora non sono state sviluppate le tecnologie alla base del progetto e non sono stati definiti tutti gli standard. Anzi, per ora le informazioni disponibili sono piuttosto superficiali e si alternano a slogan scarsamente tecnici (cose tipo “Web 3.0 = Web 2.0 + semantics”).


Da quello che si può vedere, il filo di Theseus non sarà semantico, e non c’è ragione perciò per supporre che ci si districherà meglio di ora nel labirinto del Web: sembra proprio l’ennesimo caso di spreco di soldi pubblici in progetti senza né capo né coda, fatti solo per far campare i soliti enti parassitari (che evidentemente abbondano in tutta Europa), quando invece sarebbe molto meglio utilizzare questi soldi per sostenere il normale sviluppo di imprese private.

L’unica nota positiva è che, almeno per ora, l’Italia è rimasta fuori da questo carrozzone.

Nova100 tags: , , , ,

02/10/07

Mail, quanto mi costi!

Quanti messaggi utili si ricevono via mail? Circa 30 al giorno, con una tassa di 1 o 2 ore di lavoro per gestirli, almeno stando alle stime di questo articolo che mi è ricapitato sotto mano.

Al lavoro necessario per smaltire la posta in arrivo, bisogna poi aggiungere quello per recuperare i dati a distanza di tempo. Infatti, tendiamo a tenere tutto (anche solo per memoria storica) e così, 30 messaggi ieri 30 oggi e 30 domani…

Non è facile riuscire a controllare la situazione. I dati continuano a crescere rendendo impossibile la lettura manuale e anche se ci si organizza bene, con diverse cartelle e sotto-cartelle, le cose si complicano per la trasversalità dei contenuti e lo sparpagliamento di nessi e tasselli: dove  ho messo quel mail del collega con cui lavoriamo nel tal progetto per conto di quella azienda? Nella cartella che si chiama come lui oppure in quella del progetto o del cliente?

La funzione di “search” per keyword (l’unica di solito disponibile) può aiutarci solo se sappiamo qual è la cartella in cui cercare e se ci ricordiamo almeno l’autore del messaggio e una parola precisa (e non troppo comune) del testo. In genere, però, quello che ricordiamo è solo un’idea di massima e così procediamo per tentativi spesso senza concludere nulla o addirittura cercando in Internet quello che siamo certi di avere già!

Pur tenendo conto che non si tratta di un’impresa facile per la specificità estrema di molte informazioni (più personali che standard e oggettive), la semantica può fare molto per questo tipo di ricerche. Un esempio è la possibilità di incrociare automaticamente più dati anche estendendo una ricerca a tutti i concetti e sotto-concetti attinenti.
Per
“Cerco il fatturato del tal Concorrente”
non solo si possono recuperare i messaggi con “Concorrente + fatturato” ma anche quelli con
“Concorrente +  vendite”, “Concorrente + ricavi”, “Concorrente + giro d’affari”…
e anche con
“Prodotto 1+Concorrente+fatturato”, “Prodotto 2+Concorrente+ ricavi”, ecc.

Il tutto con la stessa facilità della ricerca a keyword.

Nova100 tags: , , , , ,

Nova100