Provate con noi la Tv interattiva

Provate con noi la Tv interattiva IL CD-ROM «TUTTOSCIENZE 1997» Provate con noi la Tv interattiva In anteprima la tecnologia che rivoluzionerà il video IL Cd-rom che raccoglie «Tuttoscienze 1997» (da oggi potete chiederlo alla vostra edicola a 14.900 lire insieme con «La Stampa»), oltre all'annata del supplemento e a varie centinaia di indirizzi scientifici Internet, presenta alcuni esempi di cosa potremo fare con la futura televisione digitale interattiva. Sperimentateli ricordando che l'interazione che oggi avete con il Cd domani potrete averla con il televisore o il computer in rete, e che questi esempi illustrano solo alcune delle nuove possibilità offerte dalla tecnologia MPEG-4, l'ultima nata da quella ricerca internazionale che ha già sviluppato MPEG-1 e MPEG-2. Quali sono le basi tecnologiche per consentire all'interlocutore-spettatore di «dire la sua» durante una trasmissione audio-video? Per spiegarlo bisogna fare un po' di storia. In un secondo di televisione ci vengono presentate 25 schermate (quadri video), ciascuna composta da 576 righe con 720 punti elementari per ogni riga. Di ogni punto elementare dobbiamo dire il colore, la brillantezza e la luminosità e ciò comporta l'utilizzo di 16 bit per ogni punto. In più c'è il sonoro, che costa 1,5 milioni di bit al secondo. Fatte le moltiplicazioni, si arriva a 167,5 milioni di bit per ogni secondo. Pensiamo ora di voler trasmettere queste informazioni sulla rete che usiamo normalmente per telefonare o accedere a Internet. I modem oggi trasferiscono fino a 34.000 bit al secondo: per trasmettere informazioni di tipo televisivo avremmo bisogno di una velocità di oltre mille volte superiore. La ricerca si è quindi mossa in due direzioni: da un lato diminuire il numero di bit necessari per rappresentare l'informazione e dall'altro aumentare la velocità di trasmissione. Vediamo come. Abbiamo detto che uno spezzone televisivo della durata di un secondo si compone di una sequenza di 25 schermate, paragonabili a 25 fotografie. Prendiamo una di queste «fotografie» e scomponiamola in pezzettini. Ciascuno di questi viene codificato con un numero: alla fine avremo tanti numeri, uno di seguito all'altro. Con tecniche di compressione è possibile ridurre queste sequenze (ad esempio se si hanno 20 numeri uguali di seguito, perché rappresentano una striscia di azzurro di un cielo, possiamo ridurre i 20 numeri a 2: il valore da trasmettere e una indicazione che ci dice che il numero seguente va ripetuto 20 volte). Siamo quindi riusciti a ridurre (in genere di un terzo) la quantità dei numeri necessari. Ora immaginiamo di mettere queste fotografie una dietro l'altra, come in una pellicola cinematografica, e osserviamo le prime due. Sarà difficile notare differenze salienti. Questo è vero in generale se confrontiamo qualunque coppia di fotografie adiacenti. Possiamo allora trasmettere completamente la prima fotografia e trasmettere per la seconda solo le differenze rispetto alla prima. Dato che queste sono normalmente pochissime, si riduce notevolmente il numero di informazioni. Dopo un certo numero di foto il numero di differenze comincia ad essere significativo: un buon compromesso è rispedire una foto completa ogni 12, quindi 2 foto ogni secondo. Così si riduce ulteriormente il numero di «numeri» necessari, ma i ricercatori hanno ancora affinato questo sistema con l'introduzione della «telepatia». Se si osserva una sequenza di fotografìe, è possibile percepire delle variazioni di tipo continuo, dovute a un'auto che si sposta lungo una strada o a un pallone che rotola su un prato. Sulla base di ciò si può immaginare come possa essere l'immagine successiva. Quest'attività di previsione è effettuata sia dalla stazione trasmittente che da quella ricevente sulla base delle foto già inviate/ricevute. Quando la stazione trasmittente deve inviare la nuova foto, la confronta con quella che si era immaginata e trasmette le differenze rispetto a questa alla stazione ricevente, che, a sua volta, apporterà le modifiche alla foto immaginata, così come indicato dalla stazione trasmittente, e visualizzerà la foto risultante. Questo sistema di compressione del segnale, nato nel 1989 sotto la guida di Cselt (il Ct- itro di ricerca della Telecom, con sede a Torino), si chiama MPEG-1 (Moving Pictures Experts Groups) e rende possibile la visione di filmati tv codificati con una qualità simile a quella di un videoregistratore e con un trasferimento di informazioni di 1,5 milioni di bit al secondo (rispetto agli oltre 160 milioni richiesti in assenza di compressione). MPEG-1 è lo standard pensato per i Cd-rom, ma è anche adatto, e utilizzato, per brevi fumati su Internet. L'evoluzione di questo sistema è datata 1992, ed è il sistema di codifica MPEG-2, che consente una compressione del segnale audio/video adatta alla trasmissione della tv digitale via satellite e via cavo. La codifica di MPEG-1 e 2 si basa sulla scomposizione del¬ l'immagine in piccoli quadratini che poi vengono trasfonr 1 in numeri e compressi. Non si tiene cioè conto di come l'immagine sia composta, se ad esempio, contenga un'auto parcheggiata di fronte a una casa con un uomo che porta a passeggio un cane. Nel 1997 la ricerca e l'azione congiunta di industrie di tv, di computer e di telecomunicazioni (sempre presieduti da Cselt) ha portato a definire un nuovo standard, MPEG-4, che effettua la codifica a partire dagli oggetti di cui una immagine è composta. Questi oggetti sono fissati da chi crea l'immagine (ad esempio il regista) e mantengono la loro individualità sia nella fase di codifica sia in quella di rappresentazione finale. Diventa così possibile all'utilizzatore interagire con questi oggetti: usando il telecomando lo spettatore potrà sia far scomparire l'auto dalla scena per vedere meglio cosa fa l'uomo, sia ingrandire il cane. Potrà anche, nella trasmissione di una sinfonia, separare il flauto dagli altri strumenti per avere un assolo. La separazione degli oggetti di un'immagine può anche portare a una riduzione della banda di trasmissione necessaria. Infatti in una scena che contiene una casa sullo sfondo e un attore in primo piano sarà sufficiente trasmettere anche solo una volta la casa (che non cambia) e limitarsi a trasmettere i movimenti dell'attore. Non solo: con tecnologie matematiche come i frattali è possibile ricostruire oggetti, come l'immagine di una faccia, a partire da poche informazioni. Possiamo ansile, una volta trasmessa la faccia, animarla sulla base del flusso vocale associato, cioè possiamo far muovere le labbra ricostruendo il movimento a partire dalle parole che quella faccia deve pronunciare così come possiamo far muovere occhi e guance per esprimere gioia, rabbia, eccitazione. Se l'informazione è codificata in una serie di numeri, può essere facilmente manipolata; si può inserire un pezzo di un filmato in un altro, un testo in una foto e così via, ma così si viene a perdere l'informazione relativa alla proprietà: chi aveva prodotto una certa immagine che fa adesso parte del nostro fimi? Questo problema ha un'importanza fondamentale perché i diritti di proprietà intellettuale sono alla base di molti business. MPEG-4 è in grado di risolvere il problema con una tecnica (invisibile all'utilizzatore) che permette di marchiare le informazioni audiovisive (foto, filmati) per cui, comunque queste vengano elaborate e ovunque vengano inserite, è possibile. risalire all'origine (e quindi difenderne la proprietà). Quale sarà il passo successivo nello sviluppo delle tecnologie per la multimedialità? Sarà quello del riconoscimento automatico degli oggetti che costituiscono una immagine, passo fondamentale per poter realizzare una ricerca intelligente di informazioni. Ciò consentirà di selezionare, in un archivio au diovisivo, tutti gli spezzoni contenenti un'automobile ros sa a due porte, "o quelli in cui compare un aereo, o quelli in cui gli attori portano al polso un certo tipo dì orologio. Gian Paolo Balboni Politecnico di Torino e Cselt , ) p , qqueste vengano elaborate e ovunque vengano inserite, è possibile. risalire all'origine (e quindi difenderne la proprietà). Quale sarà il passo successivo nello sviluppo delle tecnologie per la multimedialità? Sarà quello del riconoscimento automatico degli oggetti che costituiscono una immagine, passo fondamentale per poter realizzare una ricerca intelligente di informazioni. Ciò consentirà di selezionare, in un archivio au diovisivo, tutti gli spezzoni contenenti un'automobile ros sa a due porte, "o quelli in cui compare un aereo, o quelli in cui gli attori portano al polso un certo tipo dì orologio. Gian Paolo Balboni Politecnico di Torino e Cselt L'Internet della ricerca Selezionati i 400 migliori siti scientifici IL Cd-Rom di «Tuttoscienze 1997» contiene anche alcune centinaia di indirizzi Internet di interesse scientifico. Come sono stati scelti tra le decine di milioni di siti che affollano la Rete? Proviamo a fornire qualche dato generale, e poi a dare una risposta. comunque è stato abbondantemente superato il tetto dei 100 mila navigatori abituali. Una ricerca sistematica e su vasta scala dei navigatori non è ancora stata fatta. Studi più generici indicano che, negli Usa, l'utente medio ha un buon livello scolastico, un reddito meI criteri di scelta per la nostra «bussola»: qalità

Persone citate: Gian Paolo Balboni

Luoghi citati: Cselt, Torino, Usa