Successivo » « Precedente

Obiezioni

Quando presento a una azienda le nostre soluzioni (basate su una tecnologia semantica che utilizza una rete semantica ricca e orizzontale), mi trovo inevitabilmente di fronte a un pubblico che, pur comprendendo in modo sempre più chiaro i vantaggi di questo approccio, presenta una serie di obiezioni e dubbi che complicano il processo decisionale e spesso spingono a valutare in modo decisamente sbagliato il ritorno sull’investimento.

Queste obiezioni, sollevate in egual misura sia dai responsabili IT o KM delle aziende sia dagli sviluppatori di applicazioni, si concentrano in due aree: i costi di creazione e mantenimento della rete semantica e i costi dell’infrastruttura necessaria per mantenere un livello di performance adatto a soddisfare le esigenze operative.

L’origine di queste obiezioni è multipla ma un paio di fattori sono stati sicuramente determinanti. Da una parte c’è stata e c’è l’ottima (anche se spesso non corretta :-) attività di comunicazione dei fornitori di sistemi basati su tecnologie a keyword, che è riuscita quasi a convincere il mercato che un problema complesso come la gestione delle informazioni fosse risolvibile con delle scorciatoie, completamente automatiche, e che qualsiasi alternativa fosse economicamente insostenibile. Dall’altra, c’è lo scetticismo di buona parte dei ricercatori di settore nei confronti dei sistemi puramente semantici. Ciò è dipeso soprattutto dalla incapacità di sviluppare un software che riuscisse a coniugare i vantaggi della maggiore comprensione dei testi con le performance richieste dall’utilizzo nel mondo reale (il che ha finito per rafforzare il messaggio dei concorrenti).

Visti i tanti progetti di successo fatti negli ultimi dieci anni implementando la nostra tecnologia semantica, penso che sia utile cercare di fare chiarezza, utilizzando dati reali derivanti dalla nostra esperienza di tutti i giorni; spero che così sia possibile riflettere sul fatto che, come spesso accade anche in altri settori, i preconcetti spingono spesso a fare scelte non razionali.

Costi di sviluppo
La rete semantica standard di Cogito consente la gestione di contenuti orizzontali in modo da ottenere precision e recall significativamente più alte di un sistema statistico senza la necessità di alcun lavoro di arricchimento. Muovendosi in implementazioni più verticali, è necessario considerare un investimento di start up necessario per arricchire la rete semantica standard con conoscenza di dominio (con un numero di concetti che non supera quasi mai i 5.000) con un costo di 20-30 giornate di lavoro da parte di un linguista.

Per rispondere a chi sostiene che “la lingua cambia continuamente ed è costoso aggiungere questi nuovi termini”, basta ricordare che anche le lingue più dinamiche, come l’inglese, aggiungono in media, per quanto riguarda l’uso comune non più di 100-200 nuovi termini all’anno e meno di un migliaio di espressioni con significato proprio (una decina di  giornate di lavoro per ogni anno nel caso peggiore).

Molto spesso, chi critica la complessità della gestione di una rete semantica fa riferimento alla complessità nella gestione delle liste di entità (ovvero persone, luoghi, aziende, organizzazioni ecc.). Siccome i sistemi tradizionali riescono a riconoscere un’entità solo se è presente in qualche lista, si confonde questo aspetto con la gestione della rete semantica ma è sbagliato. Un buon motore semantico riconosce queste entità sulla base del ruolo semantico che svolgono all’interno del testo e non richiede perciò la creazione e manutenzione di liste. Nello stesso tempo, assicura il corretto riconoscimento anche di entità poco frequenti (che non sono inserite in lista per ovvi motivi).

Costi di infrastruttura
Cogito analizza più di 120KB di testo (circa 40 pagine di testo) al secondo con un comune server a singolo processore: questa velocità unita alla capacità di scalare linearmente, rende Cogito perfettamente utilizzabile, a costi contenuti, anche in situazioni in cui è richiesta l’analisi di grosse quantità di documenti (nell’ordine delle decine di milioni).

I costi di sviluppo e di gestione di una rete semantica sono significativamente inferiori a quanto comunemente si crede e  i miglioramenti in termini di capacità di gestione delle informazioni (anche complesse) sono ormai evidenti anche ai meno esperti. Sono convinto che quando nel settore dell’accesso all’informazione si analizzeranno in modo oggettivo questi aspetti (invece di basarsi su miti o informazioni obsolete) un numero sempre maggiore di aziende sceglierà di adottare vere soluzioni semantiche.

Commenti

Cosa intende esattamente per "implementazioni sempre più verticali"?

Grazie.

Per implementazioni verticali si intendono quel genere di applicazioni sviluppate "ad hoc", in maniera mirata per una realtà di mercato, aziendale o istituzionale, al fine di gestire un particolare aspetto, esigenza o problema di quella realtà. Si tratta in altre parole di soluzioni applicative sviluppate "su misura" del cliente.

Post come questi sono utili per entrare nel merito delle tecnologie semantiche, per capire "in res" di cosa si stia parlando anche in termini quantitativi (human effort, performance dei sistemi, etc.).

sì, semplicemente mi riferivo all'arricchimento del Sensigrafo che si fa quando si implementa una soluzione per un dominio specifico (ad esempio, farmaceutico o geologico o economico...)

Articolo molto interessante! Mi ha dato spunto per un articolo del mio blog che parla di semantica e SEO http://www.giovannacapetti.com/web-3-0/evoluzione-del-seo-verso-il-web-3-0/

Scrivi un commento