Marco Varone -

Opinioni brevi

19/06/08

L'informatica all'università

Nei primi anni di lavoro, ho dedicato parecchio tempo alla selezione del personale.

Allora, stiamo parlando dei primi anni Novanta, l’azienda era agli inizi, le risorse si potevano contare sulle dita di una mano e di certo non potevamo permetterci un ufficio con un responsabile delle risorse umane (tanto per la cronaca: in realtà, quello che a quei tempi non potevamo permetterci era un ufficio in generale… tant’è che la nostra prima sede è stata un garage come nella migliore tradizione delle start-up americane).

Adesso ho una bravissima responsabile del personale ma continuo a fare i colloqui chiave per decidere quali tecnici assumere (sviluppatori, analisti, PM...) perché sono queste persone che in una software house possono fare la differenza.

Fra il 1990 e il 1995 il nostro settore attirava veri e propri talenti: chi sceglieva certi indirizzi di studio e poi certe professioni di solito era molto motivato e la formazione universitaria era ancora di buon livello (e quando non lo era, le persone compensavano per proprio conto).  L’informatica e la programmazione avevano qualcosa di magico e non sembravano esserci limiti alle potenzialità di quest'area.

Pian piano, però, a partire dagli ultimi anni ’90 la qualità dei neolaureati ha iniziato a peggiorare nonostante sia cresciuto tantissimo il numero degli atenei che propongono percorsi attinenti all’informatica e siano esplosi facoltà, indirizzi di studio e immatricolazioni (aumentando la quantità dell’offerta ma peggiorando sempre più la qualità della stessa).

La situazione attuale è decisamente deprimente:  i neolaureati che si rivolgono a noi per cercare un primo lavoro sono pochissimo preparati, poco coinvolti e decisamente di livello molto inferiore rispetto al passato (ovviamente ci sono eccezioni a questa regola ma sempre meno).

È triste vedere che qualcosa che in passato funzionava abbastanza bene (la formazione universitaria su questi argomenti) sia così peggiorata: speriamo che si tocchi presto il fondo così almeno l’unica cosa possibile sarà risalire.

Nova100 tags: , ,

13/06/08

MITI e REALTÀ: comunicazioni interrotte

Lo scambio e la condivisione delle informazioni sono sempre citati fra i principali vantaggi del social networking. Mantenersi aggiornati sui temi d'interesse scambiando dati di qualsiasi tipo con la propria cerchia di amici, infatti, pare essere uno dei motivi principali per cui tante persone usano quotidianamente i vari Facebook e MySpace.

Visto che il problema del recupero delle informazioni nel Web è un tema costante di questo blog e che abbiamo anche già rilevato quanto i siti tipici del Web 2.0 complichino la situazione, oggi poniamo l’attenzione su un altro aspetto: l’interruzione della comunicazione determinata proprio dalla proliferazione di blog e social network.

È un paradosso, se si pensa che l’obiettivo dei social media dovrebbe essere esattamente il contrario, eppure succede proprio così.

Si scrive un testo (un post di un blog ad esempio) che si condivide subito con Facebook, si salva in del.icio.us, magari si mette in forma ridotta e con una foto su Flickr, ecc.
Amici e colleghi aggiungono un commento oppure dicono qualcosa via Twitter o avvertono altri amici e colleghi scrivendo a loro volta un post citando quello di partenza.
Senza dubbio chi scrive per primo può entrare in contatto con un pubblico immenso e da questo punto di vista la potenza dei blog e dei vari siti per il social networking non è in discussione. Come risultato, però, c’è anche un’interruzione nella conversazione che può anche finire in niente.

Non è facile (spesso è impossibile) recuperare tutta la conoscenza che si genera attorno a un certo argomento e una volta tanto non si tratta solo di un fallimento delle tecnologie per il recupero delle informazioni. Anche se i problemi tecnologici ci sono (come abbiamo già sottolineato più volte, non è vero che oggi ci basta aprire il browser e usare un qualsiasi motore di ricerca per arrivare a tutte le informazioni che ci servono), in questo caso sono coperti da un altro fallimento: la frammentarietà di riferimenti e commenti fa sì che, con estrema facilità, una conversazione s’interrompa perché viene sparpagliata chissà dove, facendo fallire l’idea stessa alla base dei social media.

Non tutte le novità vengono per migliorare :-)

Nova100 tags: , , , , , , ,

10/04/08

MITI e REALTÀ: la ricerca

La confusione legata ai tipi di motori di ricerca ha generato in ambito aziendale il mito che un motore vale l’altro e che il tipo di conoscenza (o di contenuti) da gestire non fa molta differenza.

Poiché il motore di ricerca per definizione (quello per il Web) deve trattare bene un po' tutti i contenuti (come abbiamo detto più volte, anche questa insieme con la velocità di implementazione in qualsiasi lingua è una ragione per cui nel Web prevale ancor oggi l’indicizzazione e il recupero dei contenuti per keyword), per molti diventa naturale estendere il ragionamento anche quando così non è.

La conoscenza aziendale, infatti, è un tipo di conoscenza e quindi non è vero che per qualsiasi azienda un motore vale l’altro. Questo non vuol dire che i motori tipici di Internet siano sempre sbagliati per le aziende (chi sostiene incondizionatamente questa tesi non dà una visione corretta del problema) ma che dipende dai casi, dalle necessità di lavoro, dalla quantità dei contenuti e dall’importanza che si dà (o si è costretti a dare) alle attività di ricerca.

Visto che abbiamo già parlato delle differenze tra i motori di ricerca per Internet e quelli per le aziende, ci soffermeremo sulle fasi che si attraversano quando si decide di sviluppare un motore di ricerca semantico per contenuti aziendali.

Anche in questo caso, si può partire da un mito e cioè che per implementare un motore semantico aziendale servono più o meno il tempo e le risorse necessari a costruire la Basilica di San Pietro ;-)

Si tratta di un falso mito perché anche se l'implementazione richiede più lavoro di quello necessario per installare un motore a keyword (spesso pochissimo di più), la qualità dei risultati ripaga abbondantemente il maggior costo iniziale già dopo poche settimane o mesi di utilizzo, rendendo conveniente l'operazione anche dal punto di vista economico. L'unica condizione da rispettare è quella di affidarsi a fornitori esperti della materia che abbiano fatto parecchie implementazioni in precedenza e che utilizzino una tecnologia di qualità.

Parleremo delle fasi di implementazione nei prossimi post.

Nova100 tags: , , , ,

03/04/08

A ciascuno il suo (motore di ricerca)

Chi mi segue dai tempi del blog Cogito, sa che il tema dei motori di ricerca ad uso interno (tipicamente in azienda) mi è caro, forse perché la maggior parte delle persone tende a pensare che gli unici motori esistenti siano quelli per Internet (e, nello specifico, che ci sia solo Google :-).

I motori di ricerca per aziende (oltre ad esistere ;-)) consentono di fare ricerche all’interno dei diversi archivi e cartelle aziendali che contengono il grosso della conoscenza, esplicita e implicita, utile nel lavoro di tutti i giorni: a differenza dei motori per Internet, possono sfruttare anche tecnologie diverse da quella a keyword: statistiche, linguistica superficiale e semantica.

Visto che in passato ho già parlato di approccio, struttura e differenze fra i due tipi di motori, vorrei ora soffermarmi solo su un paradosso: i motori a keyword tipici di Internet sono i più diffusi nelle aziende, malgrado siano i meno adatti a soddisfare le attività di ricerca che tipicamente si svolgono per lavoro (a dir la verità, le cose un po’ hanno iniziato a cambiare e sono sempre di più le organizzazioni che, vincendo l’inerzia e accettando la sfida del cambiamento…, chiedono strumenti più funzionali).

I motori di ricerca su Internet, infatti, sono in grado di dare in media buoni risultati perché sfruttano due elementi peculiari del Web:

- un'enorme ridondanza dei contenuti: la stessa cosa è scritta in così tanti posti e in così tanti modi che una ricerca, per quanto formulata in termini diversi, riesce quasi sempre a restituire qualcosa di sensato anche con un puro match di parole chiave;

- la ricerca di macro cose: molto spesso su Internet si cerca un sito o un'area per poi navigarlo a mano per individuare l'informazione esatta.

Quando si cerca invece all'interno della conoscenza aziendale, la ridondanza è molto ridotta e siamo interessati ad un dato/documento specifico e non c'è tempo per leggersi velocemente il contenuto di N risultati per trovare quello che serve (spesso sto cercando quello specifico documento o dato e non altri): per questi motivi (e per altri che tratterò in seguito), un motore di ricerca "alla Internet" all'interno dell'azienda è sicuramente meglio di niente ma, altrettanto sicuramente, si può fare molto meglio con altre tecnologie.

Nova100 tags: , , , ,

20/03/08

MITI e REALTÀ: semantica e Semantic Web

La semantica è un tipo di tecnologia e non è il Semantic Web o Web semantico.

Il falso mito che siano la stessa cosa è nato perché la semantica è la tecnologia più promettente per dare concretezza al sogno del Semantic Web: con la semantica, infatti, si sta passando dalla teoria del Semantic Web (2001) alla pratica, anche se sarebbe più corretto parlare di forme di sperimentazione e non di Semantic Web in assoluto (l’implementazione non sta avvenendo su larga scala, vera utopia, ma attraverso determinati tool o servizi/siti particolari).

Il Semantic Web è dunque UNA delle possibili applicazioni della tecnologia semantica. Riguarda sempre la gestione automatica delle informazioni (i contenuti on-line) di cui potrebbe sfruttare tutti e tre i processi fondamentali: ricerca, categorizzazione, estrazione.

La tecnologia semantica abilita sia l’identificazione e il processo di estrazione dei concetti presenti nei contenuti sia la categorizzazione per argomenti. Per concetti s’intende il significato espresso attraverso le frasi a partire da una corretta comprensione del senso di ciascuna parola. Ogni concetto estratto viene etichettato, sempre in automatico: non è l’utente che sceglie le tag (come capita adesso nella maggior parte dei casi sul Web) ma il sistema stesso.

Detta così, sembra una cosa facile, anzi per noi persone è davvero un’operazione banale ma per un computer è un traguardo complesso, impossibile da raggiungere senza la semantica.

Nova100 tags: , , , , , , , ,

21/02/08

Solo fumo e niente arrosto?

A distanza di mesi da quella rivoluzione troppo annunciata di cui ho parlato a proposito della semantica, è interessante notare che la moda ha continuato a imperversare: ormai sembra proprio che non sia più possibile parlare di conoscenza e ricerca nel Web o di qualunque altro argomento correlato senza usare la parola magica “semantica” (ho perfino letto da qualche parte che anche con Google adesso è possibile fare ricerche semantiche ;-)).

Per chi come me lavora da sempre in quest’ambito, il fenomeno ha senz’altro assunto dimensioni significative: fino a un paio di anni fa era difficilissimo riuscire a diffondere l’uso della tecnologia semantica per risolvere i tanti problemi legati alla gestione delle informazioni, mentre oggi sono le aziende che vanno a cercare i fornitori di semantica e che desiderano capire che cosa c’è di vero in questo “elisir” miracoloso. A noi ad esempio qualche tempo fa è capitato che una delle più grandi software house al mondo ci chiedesse di organizzare una presentazione ai livelli più alti: eppure, per diversi anni, da loro le nostre proposte erano state snobbate.

Come spesso accade, fenomeni di questo tipo sono un po’ effimeri, anche perché si crea tanto interesse nei confronti di qualcosa senza che però dietro ci sia una reale evoluzione dell’offerta. 

Infatti, nonostante la moda per la semantica non sia diminuita, non ci sono stati cambiamenti ma piuttosto dei camuffamenti, dei rimaneggiamenti di cose da tempo già esistenti.

Probabilmente sarà necessario attendere che passi la moda (anche se speriamo non del tutto…) perché la semantica possa diventare realmente una tecnologia pervasiva e concreta. Un po’ come è capitato in Internet quando nella prima fase, quella terminata con lo scoppio della bolla, si puntava ad avere un sacco di utenti (le famose eyeballs) che però nessuno era in grado di monetizzare. Poi è arrivato Google (e altri a seguire) ed è stato finalmente possibile trasformare gli utenti in soldi grazie alla pubblicità.

Per prima cosa e nel frattempo, comunque, è indispensabile che le aziende interessate alla semantica capiscano che non si tratta di una soluzione magica ma che occorre investire tempo e risorse per ottenere i risultati auspicati.

Nova100 tags: ,

03/01/08

Ma quanto è attuale il Knowledge Management oggi?

Come mi capita di dire spesso, non esiste una definizione di Knowledge Management che metta tutti d’accordo e perciò forse non c’è un’unica risposta per la domanda del titolo, molto dipende dal punto di vista da cui si considera il problema e anche dal tipo di conoscenza cui ci si riferisce.

Negli ultimi 2-3 anni, ad esempio, si è sviluppato molto interesse nell’ambito della gestione della conoscenza utile ai processi decisionali più strategici: Marketing Intelligence e Competitive Intelligence (di cui ad esempio si parla in questo post).

Inoltre, se si considera la conoscenza in senso lato, le informazioni utili per un’azienda non si esauriscono nelle informazioni interne, già acquisite e assodate, ma coinvolgono anche tutto ciò che diventa via via disponibili nelle fonti più tradizionali, tipo la stampa, e nei nuovi siti Web.

Ancora una volta e comunque s’intenda il Knowledge Management, la tecnologia si pone tra i fattori di maggior criticità perché gli strumenti più comuni sono inadeguati e non servono a molto quando la mole di informazioni da trattare è considerevole e sempre in evoluzione (ad esempio a causa dell’estremo dinamismo tipico dei siti del Web 2.0).

C’è però da dire che le aziende, pur avendo maturato una discreta consapevolezza della situazione, hanno iniziato solo di recente a considerare con la giusta priorità il problema della gestione globale di tutte le informazioni (a maggior ragione quelle espresse nel Web spontaneamente, per esempio nei commenti dei post dei blog).

Forse perché la difficoltà a controllare tutti i dati potenzialmente interessanti induce ad accantonare il problema piuttosto che ad affrontarlo (è un paradosso, ma in molti casi sembra proprio che accada così).

Nova100 tags: , , , ,

18/12/07

Ma che “TECNOLOGIA & SCIENZA”?

Non so se avete letto qualche giorno fa “Google? Funziona come il cervello. Cerca informazioni in modo simile”. È uscito su Repubblica, nella sezione “TECNOLOGIA & SCIENZA”…

Io l’ho letto ma più che “strambo”, come lo ha definito un lettore del mio blog, lo definirei la solita paccottiglia.

Non è un approfondimento tecnologico né tanto meno scientifico: assomiglia piuttosto a un “traduci, modifica un po’ e pubblica non importa tanto cosa”.

Basta dare un’occhiata qui (e se decidete di farlo, magari date una letta veloce anche ai commenti…) oppure qui. C’è da dire che il pezzo di Repubblica si distingue dal resto per la chiusura originale, dedicata a un motore di ricerca per immagini… ma su questo tema mi sono già espresso (Visual search? Ma per piacere…).

Nova100 tags: ,

28/11/07

“Inventors turn ideas into reality. Innovators turn problems into solutions.”

Volevo andare a Trento per l’Italian Architecture Summit, ma alla fine non sono riuscito per altri impegni.

Ho saputo da amici e colleghi che è stato tutto interessante e ho anche visto che Gianluca Salvatori ha già citato l’evento in questo post.

Per compensare la mancata trasferta, ho cercato l’intervento di apertura di Eric Reiss (il titolo che ho scelto è una sua frase) e ho trovato una sorta di riassunto del suo intervento.

Non mi sembrano del tutto condivisibili i punti (o leggi) di cui Reiss ha parlato a proposito d’innovazione ma bisogna anche considerare che lui si riferiva anche a casi specifici (almeno questa è l’idea che mi sono fatto leggendo quello che hanno scritto altri), cioè a problemi tipici solo dell’architettura delle informazioni.

In linea di massima mi pare che la posizione sia in generale più che condivisibile: innovare è sempre fare qualcosa di utile (di “furbo” ;-)) e la soluzione di un problema deve essere il punto, l’unico, e sia di partenza sia di arrivo.

Nova100 tags: , , , ,

07/11/07

Una nuova, vecchia sfida

Avevo letto all'epoca questo post di Antonio Dini e prima ancora un'intervista rilasciata dall’autore del libro): "The cult of amateur" il cui argomento coincide con il sottotitolo "How today internet is killing our culture" e volevo leggere il libro e poi esprimere qualche commento.

Visto che il tempo per leggere manca sempre, ho pensato di evidenziare lo stesso un aspetto interessante e cioè che anche la ricerca sul Web è impattata in modo negativo da questo fenomeno, come se non bastassero i numerosi problemi di cui ho scritto più volte in passato :-)

Tutti i motori di ricerca, infatti, si basano sull’evoluzione dell’idea iniziale di Google e cioè sul considerare più importanti quelle pagine che sono molto linkate da altre pagine:  se i contenuti di qualità vengono sommersi da un’infinità di contenuti scritti da dilettanti, il valore di questi link incrociati si diluisce e disperde in molti più rivoli (è molto difficile per le persone sapere fino a che punto l’informazione appena letta sia veritiera e completa).

Se il trend continuerà in questa direzione, assisteremo ad un risultato paradossale: il proliferare di informazioni di dubbio valore renderà meno trovabili le informazioni di qualità che, mai come ora, sono facilmente disponibili per tutti il più delle volte a costo zero (non si tratta ovviamente di un fenomeno nuovo, gli economisti sanno da secoli che la moneta cattiva tende a scacciare la moneta buona): magari da questo risultato nascerà un’ulteriore opportunità per la tecnologia semantica applicata alla ricerca.

Nova100 tags: , , , ,

17/10/07

Gli innumerevoli nomi delle tecnologie per la gestione delle informazioni

Recentemente un giornalista mi ha chiesto come mai è così varia la terminologia per definire la gestione delle informazioni all'interno delle aziende (e poi è uscito questo articolo).

Il problema è sempre quello (trovare e sfruttare la conoscenza quando serve) eppure ci sono tanti modi per indicarlo, anche secondo attività specifiche: search/ricerca, document categorization/classification, classificazione/categorizzazione, clustering, information o data retrieval, taxonomy creation, entity extraction, text mining, text analytics, content management...

Gartner parla di "information access technology" mentre IDC di "content access tools": pazienza se la varietà della terminologia è opera della fantasia dei giornalisti oppure della creatività dei vari uffici di comunicazione, ma fa riflettere che nemmeno i due maggiori analisti del mondo IT raccolgano sotto la stessa etichetta l'insieme delle tecnologie e delle soluzioni disponibili sul mercato.

Si tratta di un settore (e di un mercato) in evoluzione in cui le vecchie tecnologie non sono più sufficienti, ma anche se hanno fatto il loro tempo stentano a lasciare il campo a quelle più innovative che, per essere applicate facilmente e con efficacia in ogni contesto, devono però essere ancora perfezionate. Sarebbe meglio che a questa fase di cambiamenti non si aggiungesse la confusione creata da tanti nomi diversi per indicare tante attività riconducibili alla stessa macro-area. Un po' più di chiarezza e un'unica etichetta aiuterebbe tutti:

- le aziende che vivono il problema dell'ingovernabilità delle informazioni perché non farebbero così fatica a capire che cosa offre davvero il mercato

- chi lavora nel settore perché convergendo su un unico tema con i vari interlocutori potrebbe finalmente concentrarsi su quello che conta veramente:  migliorare la propria tecnologia per risolvere  i problemi reali degli utenti.

Nova100 tags: , , , , , , ,

05/10/07

THESEUS e la nuova era di Internet: Web 2.0 + Semantics = Web 3.0

A proposito della forte presenza della parola semantica in THESEUS (v. descrizione nel sito e in alcuni articoli come questo) mi è stato chiesto in più occasioni un parere: ma si tratta proprio di semantica oppure è uno di quei casi d’uso/abuso per intendere una tecnologia un po’ meno rozza di quella a keyword?

Per giudicare, bisognerà attendere maggiori dettagli: ancora non sono state sviluppate le tecnologie alla base del progetto e non sono stati definiti tutti gli standard. Anzi, per ora le informazioni disponibili sono piuttosto superficiali e si alternano a slogan scarsamente tecnici (cose tipo “Web 3.0 = Web 2.0 + semantics”).


Da quello che si può vedere, il filo di Theseus non sarà semantico, e non c’è ragione perciò per supporre che ci si districherà meglio di ora nel labirinto del Web: sembra proprio l’ennesimo caso di spreco di soldi pubblici in progetti senza né capo né coda, fatti solo per far campare i soliti enti parassitari (che evidentemente abbondano in tutta Europa), quando invece sarebbe molto meglio utilizzare questi soldi per sostenere il normale sviluppo di imprese private.

L’unica nota positiva è che, almeno per ora, l’Italia è rimasta fuori da questo carrozzone.

Nova100 tags: , , , ,

26/09/07

Il tempo è galantuomo

È stato piuttosto divertente leggere su Nòva di giovedì scorso il pezzo “Chip di buonsenso”.

C’erano alcune dichiarazioni di Marvin Minsky, noto guru e strenuo sostenitore della cosiddetta “corrente forte” dell’Artificial Intelligence (per chi non ha tempo o voglia di consultare le pagine di Wikipedia, l’AI forte si basa sulla convinzione che si possa veramente dotare un computer della stessa intelligenza che contraddistingue l’uomo).

L’aspetto piacevole  della lettura è stata l’apparente conversione di Minsky verso un pensiero più simile a quello debole che a quello forte dell’AI, avvicinandosi a quello che io ritengo da sempre (e sono in buona compagnia a farlo) l’unico approccio sensato e realistico.

Leggendo tra le righe, sembra proprio che il buon Marvin abbia capito che il nostro cervello non è così semplice e che forse è meglio usare approcci meno ambiziosi ma più essenziali e concreti, realizzabili: che nessuna delle sue previsioni ottimistiche si sia ancora avverata a distanza di tanti anni di lavoro e ricerca evidentemente ha fatto sorgere anche in lui qualche dubbio sulla vera “forza” dell’AI.

Ho trovato quasi commuoventi le ultime righe dell’intervista dove, abbandonati i sogni utopici del passato, si propongono progetti sempre innovativi, ma più piccoli e pragmatici.

Peccato per tutte le risorse che sono state investite prima di questa conversione, ma meglio tardi che mai :-)

Nova100 tags: , , , , ,

22/08/07

Change is good

Ho ripensato al commento al post sul Knowledge Management riguardo all’inerzia e alla difficoltà al cambiamento che sembra accomunare diverse realtà aziendali: in linea di principio è ben accettata da tutti l’idea del cambiamento (necessario perché senza non si progredirebbe) ma nella realtà il meccanismo spesso s’inceppa e fare una scelta diventa difficile.

Un perfetto esempio è quello dei motori di ricerca a keyword: sono prodotti basati su una tecnologia obsoleta, i cui risultati praticamente non soddisfano nessuno, eppure è lo stesso difficilissimo convincere le aziende a passare a una tecnologia migliore.
Il solo pensiero di doversi nuovamente occupare dell’installazione e della messa a punto del sistema sembra spaventare enormemente tutti e così si finisce per continuare ad usare una cosa che è inutile ma che non richiede altro lavoro: l’inerzia è semplicemente più forte della voglia di cambiamento e alla pressante necessità di migliorare spesso non fa poi riscontro alcuna azione decisiva, come se le cose potessero sistemarsi da sole e a un certo punto i problemi potessero adeguarsi alle tecnologie anziché il contrario.

L’inerzia però non risolve niente: per un’azienda per cui le classiche tecnologie per il KM sono inefficaci (magari all’inizio potevano andare bene ma con la crescita esponenziale dei dati la situazione ha finito con il precipitare) il costo del non fare nulla supera rapidamente il costo del cambiare.

Come rompere perciò questo circolo vizioso?

Una possibilità è montare in parallelo al sistema esistente il nuovo motore di ricerca (semantico naturalmente) e consentire ad un gruppo di utenti di usarli entrambi: se il nuovo prodotto fornisce risultati migliori (come capita quasi sempre), diventa molto più semplice vincere l’inerzia e convincere l’azienda che il costo del cambiamento è un investimento che sarà ripagato molto presto.

Nova100 tags: , , , , ,

30/07/07

Come l’Araba Fenice

“If Hewlett Packard knew what Hewlett Packard knows, we would be three times more profitable”

È divertente (o preoccupante?) vedere che questa affermazione di Lew Platt (Presidente dell’HP negli anni Novanta) di qualche anno fa sia ancora attualissima e che faccia capire meglio di molte definizioni che sono state via via formulate che cosa dovrebbe essere il Knowledge Management.

Nel mondo delle aziende, il concetto di KM ha subito così tante trasformazioni ed è stato associato a così tante killer applications (content management, data- information management, e-learning, portali, content access via Intranet…)  da finire con l’essere paragonato all’Araba Fenice: sembra morire e invece riemerge dalle proprie ceneri, si trasforma e riacquista forza ;-)

Al di là di nomi e definizioni, l’unica certezza è che rimane il problema per cui il KM è nato.

Siamo sommersi da una quantità infinita di dati potenzialmente interessanti che non riusciamo però a sfruttare e quindi diventa sempre più difficile riuscire a controllare anche ciò che già abbiamo e sappiamo.

Nova100 tags: , , ,

12/07/07

E Yahoo è senza lato oscuro?

"Il direttore del ristorante iniziò a muovere il mouse sullo schermo nero e su una pagina di Yahoo apparve la scritta Come forzare una cassaforte"

Si conclude più o meno così un'altra notizia che mi hanno passato sulla scia di quella del post precedente: questa volta però al ladro non è riuscito il colpo ed è stato arrestato.

A parte tenere a mente che in Internet non possiamo trovare tutto (perché tutto naturalmente non c'è e non solo perché in alcuni casi non lo troviamo per un problema di tecnologie inadeguate) forse dovremmo anche iniziare/ricominciare semplicemente ad usarli i motori di ricerca invece che abusarne.

Nova100 tags: ,

11/07/07

Il lato oscuro di Google :-)

Mi hanno segnalato una notizia molto divertente che non solo conferma quanto siamo abituati ad usare i motori di ricerca ma anche l’impressione che alcune volte sembriamo finire per credere che il Web possa davvero contenere qualsiasi risposta.

Un furto si trasforma in una commedia degli errori: i ladri non riescono a forzare le casseforti e così, dopo aver perso più di un’ora in vani tentativi, invece di mollare vanno nella stanza accanto, accendono un PC e lanciano in Google una ricerca

“Come si scassina una cassaforte?”

Evidentemente il motore ha funzionato bene visto che dalle casse mancano 12 mila dollari e i ladri non sono stati ancora catturati.

Nova100 tags: ,

26/06/07

Questione di WILFING

Del Wilfing si è iniziato a parlare già da qualche mese, se non sbaglio a partire dal lancio di una notizia sui risultati di un sondaggio da cui poi è scaturita una reazione a catena da parte dei media  (la BBC, tanto per citare una fonte) e di molti blogger: What Was I Looking For?

S’inizia controllando la mail in ufficio o iniziando una ricerca in Internet, si guarda un video segnalato da qualcuno, se ne leggono i commenti, si finisce in un blog interessante e, post dopo post, link dopo link, ci si scorda che cosa si stava cercando e se non si sta attenti… si ricomincia il giro.

Niente da dire se si fa il wilfing per passare il tempo (anzi, esistono addirittura dei siti che offrono l’opportunità di un aiuto anche per questo: si sa mai che uno desideri ottimizzare anche la perdita del tempo ;-)) ma le cose cambiano se nel loop ci si trova non per scelta ma perché non si riesce a trovare quello che serve e oltre a cambiare peggiorano anche, se ci si chiede “ma che cos’è che stavo cercando?” alla fine di una lunga e inutile ricerca attivata per lavoro.

In questi casi direi proprio che sarebbe preferibile disporre di motori di ricerca in grado di funzionare nel miglior modo possibile :-)

Nova100 tags:

25/06/07

Capire per tradurre senza tradire

È possibile con la tecnologia realizzare un sistema di traduzione automatica che superi i tanti limiti dei sistemi esistenti, limiti che li rendono sostanzialmente inutilizzabili per qualsiasi applicazione pratica?

Io penso di sì ma occorre abbandonare l’idea che possibile farlo in modo semplice e veloce grazie alla scoperta di qualche formula magica statistica: servono invece comprensione semantica del contenuto, una grossa quantità di informazioni concettuali e molto, molto lavoro per ogni lingua da gestire.

Per capire a che punto (deludente) siamo attualmente, basta provare i due sistemi che meglio rappresentano gli approcci attuali:

- tecnologia statistica usata dai Google language tools (solo per quelle lingue che hanno di fianco la parola “BETA”; le altre lingue sono gestite dal buon, vecchio Systran)
- tecnologia linguistica (senza semantica), come per i software per la traduzione resi disponibile dall’azienda PROMT

Non so se vi è mai capitato di usare questi sistemi; io ne parlerò in un prossimo post  e può essere divertente fare qualche prova di traduzione prima di leggere quanto scriverò.

Nova100 tags: ,

14/06/07

Wiki Wiki

Il concetto fondamentale su cui si basa la produzione della conoscenza contenuta in Wikipedia è il NPOV, Neutral Point of View: chi scrive deve farlo in modo obiettivo perché lo scopo è far emergere fatti e non opinioni.

Al di là della contraddizione di fondo (un “punto di vista” non può essere “neutrale” altrimenti che punto di vista è) si tratta di una pretesa difficile da soddisfare e per questo esiste il patrolling, cioè la supervisione di nuove pagine o di nuove modifiche da parte di volontari.  Anche per questo i contenuti di Wikipedia sono tra i più mobili: l’efficienza dei controlli svolti dai patrollatori  è straordinaria se si pensa che gli atti di vandalismo (come gli insulti e le bestemmie) non rimangono on-line per più di qualche minuto e la frequenza degli aggiornamenti è altissima.
Se non avete idea del ritmo incalzante con cui sono ri-prodotte le voci/article e vi interessa approfondire, potete scegliere un pezzo a caso e poi clickare su cronologia/history.

Naturalmente l’ambiente di lavoro favorisce questa tendenza a produrre conoscenze molto velocemente (e anche senza difficoltà: non servono competenze tecniche per generare o modificare i testi). I wiki (effective tool(s) for mass collaborative authoring. Wikipedia è l’esempio più noto) sono nati proprio per agevolare globalmente una produzione standard della conoscenza e far sì che le varie pagine dell’enciclopedia appaiano sempre omogenee nell’aspetto e nella distribuzione di link e contenuti.

In pratica ogni nuova pagina su un argomento ne apre un’altra dedicata alla discussione tra gli utenti per arrivare alla pubblicazione definitiva cioè al famoso NPOV...

Ma allora siamo daccapo: perché, patrollatore o no, chi scrive esprime per forza un punto di vista. Fra tutti i punti di vista possibili... vince quello prevalente: quindi sarebbe più corretto dire che Wikipedia è espressione di PPOV, Punti di Vista Prevalenti, e non di NPOV.

Wikipedia mi piace e la trovo utilissima, ma c’è una bella differenza tra punto di vista prevalente e punto di vista neutrale.

Oltre al problema della stabilità e dell’oggettività dei contenuti, rimane poi sempre quello del recupero delle informazioni. Wikiwiki_4

I wiki saranno anche tra gli strumenti più comodi e veloci per generare oggi la conoscenza, ma rimane lo stesso il problema di come recuperarla.

Se vogliamo sapere quanti film hanno girato insieme Alberto Sordi e Sofia Loren probabilmente sceglieremo Wikipedia invece che Google o Yahoo! ma sapendo già in partenza che non troveremo subito la risposta.

Prima dovremo leggerci forse un po’ di biografia, percorrere le tappe della carriera (di entrambi), vedere l’elenco dei film, memorizzare titoli e incrociarli…

Nova100 tags: ,