Pinocchio ridotto ai minimi termini

Pinocchio ridotto ai minimi termini INFORMATICA Pinocchio ridotto ai minimi termini Un programma per riassumere qualunque testo L B ESIGENZA di disporre di informazioni in forma compatta è diventata sempre più comune e impellente neghultimi de-conni. Basti pensare al successo di pubblicazioni come Selezione dal Reader's Digest o ai famosi manu'aletti Bignami. C'è ora un programma per Pc - una specie di Bignami elettronico - capace di ridurre ai minimi termini qualsiasi tipo di testo: articoli giornalistici, pagine Web e perfino una favola densa di significati come «Pinocchio». E' esattamente ciò che accade con il programma Abstract, di cui abbiamo parlato per la prima volta su «Tuttoscienze» del 12 marzo 1997. Una nuova e più potente versione di Abstract ha analizzato il primo capitolo di «Pinocchio» in due passaggi. Nel primo passaggio ha ridotto le frasi da 40 a 23, nel secondo da 23 a 11. Alla fine il testo originale di Collodi era stato ridotto al 27,5%, senza alcuna perdita di significato. - 0 dunque...? - direbbe mastro Ciliegia - io non lo posso credere. Cosa vuol dire «senza perdita di significato»? Non è facile rispondere a questa domanda, senza ricorrere ad una terminologia tecnica. Diciamo che Abstract è in grado di eliminare le frasi ridondanti, mantenendo inalterata la sintassi di tutte le altre e, dunque, preservando il significato complessivo del testo. Speciali algoritmi lavorano sul contenuto informativo, producendo un testo che contiene meno mfortu|zioni, rispetto all'originale, ma che contiene le più importanti (più che un riassunto, un «abstract», appunto).'Per spiegarla in un modo comprensibile anche a mastro Ciliegia : Abstract sottolinea i passi salienti, come un bravo studen¬ te alla vigilia degli esami. Il risparmio dello spazio-tempo di lettura rientra nella cosiddetta produttività individuale (relazioni, articoli, discorsi, pagine Web), ma crédo che un programma del genere possa dare i migliori risultati neU ambito della ricerca linguistica. Io stesso ho intrapreso un lavoro di questo genere sui testi poetici, con risultati interessanti. Ad esempio l'ode manzoniana II cinque Maggio, grazie agli algoritmi di cui sopra, si riduce ad un solo verso (scopritelo sul sitohttp://web.tin.it/eloisa/abstract). Potremmo allora chiederci che senso abbia, o quale utilità possa avere, la riduzione di un testo narrativo o addirittura poetico. Ebbene, qualunque sia il criterio seguito per selezionare un insieme di frasi, queste verranno por tate alla nostra attenzione, al di là delle intenzioni dell'autore. Poiché i poeti, e gli scrittori in generale, comunicano molto ad un livello subliminale o inconscio, vi è la possibilità di scoprire eventuali messaggi nascosti. Ammettiamo che il criterio di selezione sia prettamente statistico. In questo caso la frequenza delle espressioni (parale o gruppi di parole) è il veicolo di nuove informazioni, e Abstract se ne accorge. Per dovere di cronaca bisogna aggiungere che una funzione di riassunto fa già parte del blasonato programma di elaborazione dei testi Word 97. Mi pare però che Abstract abbia una marcia in più: quella di essere un componente software riutilizzabile, ossia un pezzo di legno - scusate, di software - che qualunque programmatore può inserire nelle proprie applicazioni. Francesco Lentini

Persone citate: Bignami, Collodi, Francesco Lentini