Quando presento a una azienda le nostre soluzioni (basate su una tecnologia semantica che utilizza una rete semantica ricca e orizzontale), mi trovo inevitabilmente di fronte a un pubblico che, pur comprendendo in modo sempre più chiaro i vantaggi di questo approccio, presenta una serie di obiezioni e dubbi che complicano il processo decisionale e spesso spingono a valutare in modo decisamente sbagliato il ritorno sull’investimento.
Queste obiezioni, sollevate in egual misura sia dai responsabili IT o KM delle aziende sia dagli sviluppatori di applicazioni, si concentrano in due aree: i costi di creazione e mantenimento della rete semantica e i costi dell’infrastruttura necessaria per mantenere un livello di performance adatto a soddisfare le esigenze operative.
L’origine di queste obiezioni è multipla ma un paio di fattori sono stati sicuramente determinanti. Da una parte c’è stata e c’è l’ottima (anche se spesso non corretta :-) attività di comunicazione dei fornitori di sistemi basati su tecnologie a keyword, che è riuscita quasi a convincere il mercato che un problema complesso come la gestione delle informazioni fosse risolvibile con delle scorciatoie, completamente automatiche, e che qualsiasi alternativa fosse economicamente insostenibile. Dall’altra, c’è lo scetticismo di buona parte dei ricercatori di settore nei confronti dei sistemi puramente semantici. Ciò è dipeso soprattutto dalla incapacità di sviluppare un software che riuscisse a coniugare i vantaggi della maggiore comprensione dei testi con le performance richieste dall’utilizzo nel mondo reale (il che ha finito per rafforzare il messaggio dei concorrenti).
Visti i tanti progetti di successo fatti negli ultimi dieci anni implementando la nostra tecnologia semantica, penso che sia utile cercare di fare chiarezza, utilizzando dati reali derivanti dalla nostra esperienza di tutti i giorni; spero che così sia possibile riflettere sul fatto che, come spesso accade anche in altri settori, i preconcetti spingono spesso a fare scelte non razionali.
Costi di sviluppo
La rete semantica standard di Cogito consente la gestione di contenuti orizzontali in modo da ottenere precision e recall significativamente più alte di un sistema statistico senza la necessità di alcun lavoro di arricchimento. Muovendosi in implementazioni più verticali, è necessario considerare un investimento di start up necessario per arricchire la rete semantica standard con conoscenza di dominio (con un numero di concetti che non supera quasi mai i 5.000) con un costo di 20-30 giornate di lavoro da parte di un linguista.
Per rispondere a chi sostiene che “la lingua cambia continuamente ed è costoso aggiungere questi nuovi termini”, basta ricordare che anche le lingue più dinamiche, come l’inglese, aggiungono in media, per quanto riguarda l’uso comune non più di 100-200 nuovi termini all’anno e meno di un migliaio di espressioni con significato proprio (una decina di giornate di lavoro per ogni anno nel caso peggiore).
Molto spesso, chi critica la complessità della gestione di una rete semantica fa riferimento alla complessità nella gestione delle liste di entità (ovvero persone, luoghi, aziende, organizzazioni ecc.). Siccome i sistemi tradizionali riescono a riconoscere un’entità solo se è presente in qualche lista, si confonde questo aspetto con la gestione della rete semantica ma è sbagliato. Un buon motore semantico riconosce queste entità sulla base del ruolo semantico che svolgono all’interno del testo e non richiede perciò la creazione e manutenzione di liste. Nello stesso tempo, assicura il corretto riconoscimento anche di entità poco frequenti (che non sono inserite in lista per ovvi motivi).
Costi di infrastruttura
Cogito analizza più di 120KB di testo (circa 40 pagine di testo) al secondo con un comune server a singolo processore: questa velocità unita alla capacità di scalare linearmente, rende Cogito perfettamente utilizzabile, a costi contenuti, anche in situazioni in cui è richiesta l’analisi di grosse quantità di documenti (nell’ordine delle decine di milioni).
I costi di sviluppo e di gestione di una rete semantica sono significativamente inferiori a quanto comunemente si crede e i miglioramenti in termini di capacità di gestione delle informazioni (anche complesse) sono ormai evidenti anche ai meno esperti. Sono convinto che quando nel settore dell’accesso all’informazione si analizzeranno in modo oggettivo questi aspetti (invece di basarsi su miti o informazioni obsolete) un numero sempre maggiore di aziende sceglierà di adottare vere soluzioni semantiche.
CATEGORIE: Prima pagina, Web/Tecnologia
TAGS: Cogito, KM, rete semantica, software semantico, tecnologia a keyword, tecnologia semantica
©RIPRODUZIONE RISERVATA

Commenti
michele 10/dic/2009 17:19:09
Salvatore 12/dic/2009 22:57:24
Alessandro Oltramari 14/dic/2009 10:33:32
Marco Varone 14/dic/2009 11:19:33
Giovanna Capetti 21/dic/2009 10:36:07
Scrivi un commento