DESCRIZIONE DEL PROGETTO per il corso di ESTRAZIONE DI INFORMAZIONI dal WEB

Periodo: Novembre 2003-Febbraio 2004

updated 18-11-03

Obiettivo

Il progetto prevede di costruire una applicazione nell’ambito dell’area web-learning (o e-learning). Uno degli obiettivi del web-learning consiste nello sfruttare gli strumenti informatici a disposizione per favorire forme di apprendimento personalizzato, migliorare la comunicazione fra docente e discenti, creare gruppi di interesse fra studenti, aiutare il docente nella preparazione del materiale didattico, aiutare gli studenti ad estendere le loro conoscenze attraverso ricerche mirate sul web, ecc..

Notizie e articoli su questa area applicativa possono essere reperite su: http://www.spingroup.com/htmdocs/resources/elearning.php

Lo studente Federico Fabrizio ha svolto una tesina introduttiva sull’argomento (pdf).

Il progetto prevede quanto segue:

-       Dato un corso on-line suddiviso in moduli,

o      identificare i concetti principali che vengono introdotti nel corso,

o      organizzare questi concetti in una ontologia

o      implementare l’ontologia in OWL, usando un ambiente di supporto per lo sviluppo di ontologie (si confronteranno KAON e PROTE’GE’)

o      correlare le occorrenze lessicali dei concetti  con le relative definizioni nell’ontologia

o      costruire una applicazione che consenta, visualizzando le pagine del corso, di identificare le occorrenze dei concetti, visualizzarne le definizioni, navigare nell’ontologia, identificare le occorrenze di uno stesso concetto nei vari moduli.

 

Work packages

Il progetto è suddiviso in due Workpackages principali ed uno di integrazione, a loro volta suddivisi in varie attività.

-       WP1: Indicizzazione del corso e costruzione dell’interfaccia

-       WP2: Definizione dell’ontologia e sua implementazione

-       WP3: System Integration and Evaluation

Gli studenti dovranno strettamente attenersi alle scadenze previste. Eventuali slittamenti dovuti a difficoltà impreviste vanno segnalati immediatamente al docente.

 

Descrizione WP1

Indicizzazione del corso e costruzione dell’interfaccia di navigazione.

 

Attività 1.1: Traduzione del materile del corso da HTML in XML. Prevede l’utilizzo di un traduttore html-xml ed il raffinamento manuale del risultato.

Risorse:

Il corso di Reti 1 di Giancarlo Bongiovanni, in formato html, scaricabile da:  http://cesare.dsi.uniroma1.it/~reti/Reti1_html/welcome.html

XML manuale: http://www.w3.org/XML/

XML download: ? da individuare un buon freeware.

HTML2XML  (esempio http://www.15seconds.com/Issue/010601.htm)  (trovate voi uno che vada bene..) oppure scricate questo file zippato è sufficiente unzipparlo e lanciarlo da dospassandogli come parametro il nome del file html da tradurre (per chiarimenti, http://download.com.com/3000-2048-2842572.html?tag=lst-0-1)

 

WP:    1   Activity: 1.1

Start date: 17 novembre

End Date: 12 dicembre

Responsible: Luigi Petrillo

Participants: Mancini, Samà

 

 

Deliverable

Rapporto  scritto e software (valutazione freeware XML, corso in XML) 12 dicembre

 

Attività 1.2: Costruzione di una interfaccia per la navigazione dell’ontolgia.

Descrizione: “cliccando” su un termine di dominio del corso ( i termini in rosso scuro nell’attuale versione HTML) , deve essere possibile selezionare, tramite menu,  fra le seguenti azioni:

            visualizzare una definizione del concetto

            visualizzare la prima occorrenza, nel testo del corso, di quel concetto

            navigare l’ontologia a partire da quel concetto

            visualizzare tutte le occorrenze del concetto nel corso

            da ogni concetto dell’ontologia, tornare alla sua prima occorrenza nel corso

Strumenti: JAVA + API OWL (??) http://wonderweb.semanticweb.org/owl/

 

 

WP:    1   Activity: 1.2

Start date: 17 novembre

End Date: 15 febbraio

Responsible: Sclano

Riferimento: Cristiano Cenci

Participants: Rossi Fossati, Carrabino, Giovannelli, Formica

 

 

 

 

Deliverable

Studio di fattibilità: 10 dicembre

Rapporto scritto e software: 15 febbraio

 

Descrizione WP2

Progetto e implementazione dell’ontologia.

 

Attività 2.1:

2.1.1 A partire dall’elenco dei termini tecnici utilizzati nel corso di Reti 1, e da un glossario on-line sul tema computer networks, identificare per ogni termine (in italiano e inglese) il corrispondente termine in inglese nel glossario (es: reti di elaboratori = computer network, elementi di commutazione=switching elements).

2.1.2 Organizzare i termini del glossario (utilizzati nel corso reti) in una struttura tassonomica, eventualmente includendo altri termini del glossario non contenuti nel corso di Reti 1. Si otterranno probabilmente una serie di sotto-alberi (es. protcol -> communication protocol->packet switching) radicati in un insieme di concetti più elementari (ad esempio network, protocol, component, ecc.). Per i concetti più generali dell’ontologia, scegliere i nodi corrispondenti di WordNet. (ad esempio, collegando il nodo network al concetto network#2 di WordNet).

 

Risorse:

-       l’elenco dei termini nel corso di Reti 1. Notate che nel corso di reti esistono termini in inglese e termini in italiano. Qualche volta c’è solo il termine inglese, a volte solo quello italiano, a volte ci sono tutti e due, appaiati. I seguenti files txt contengono le seguenti informazioni:

o      lista complessiva dei termini inglesi e italiani, parzialmente strutturata in sottoalberi sulla base di string inclusion. La traduzione inglese italiano è mostrata solo se diponibile nel testo.

o      lista dei termini in comune (sulla base di puro string matching) fra il corso di reti ed il glossario

-       Il corso di Reti 1 di Giancarlo Bongiovanni, in formato html, scaricabile da:  http://cesare.dsi.uniroma1.it/~reti/Reti1_html/welcome.html

-       Il glossario on-line computer networks: http://glossary.its.bldrdoc.gov/fs-1037/index.htm (potete cercare le definizioni mancanti in altri glossari, o ricavarla dallo stesso testo di reti. Inoltre, la traduzione italiano-inglse dovrebbe estendere la copertura)

-       WordNet: http://www.cogsci.princeton.edu/~wn/

-       Una organizzazione parziale in sotto-alberi del glossario computer networks, generata sulla sola base di string inclusion.

 

WP:    2   Activity: 2.1

Start date: 17 novembre

End Date: 12 dicembre

Responsible: Oliviero, Riferimento: Roberto Navigli

Participants: Pancotti, Angeletti Volpe

 

 

Deliverable

Una strutturazione formato txt della tassonomia, in cui ogni concetto sia affiancato dalla rispettiva definizione del glossario (o di WordNet per i concetti più generali): 12 dicembre

 

Attività 2.2

2.2.1 Scelta di un insieme minimo di relazioni descrittive da utilizzare nell’implementazione dell’ontologia (IS_A, PART_OF,PURPOSE..) che siano adatte a descrivere i concetti del dominio

2.2.2 Studi di fattibilità per l’utilizzo di KAON e PROTEGE’ come ambienti di sviluppo di una ontologia in OWL

2.2.3 Implementazione dell’ontologia

Strumenti:

KAON http://protege.stanford.edu//

PROTEGE http://kaon.semanticweb.org/

OWL http://www.w3.org/2001/sw/WebOnt/

PROTEGE’ supports for OWL http://protege.stanford.edu/plugins/owl/

KAON supports for OWL http://kaon.semanticweb.org/owl

Esempi di ontologie OWL: http://protege.stanford.edu/plugins/owl/owl-library/

Relazioni concettuali: vi aiuterà Roberto Navigli.

 

WP:    2   Activity: 2.2

Start date: 17 novembre

End Date: 15 febbraio

Responsible: ???

Riferimento:Pierluigi D’Amadio, RobertoNavigli

Participants: stessi di 2.1

 

Deliverable

2.2.1: Un documento con uno schema di definizione per i concetti:  5 dicembre

2.2.2 Studi di fattibilità su KAON e PROTEGE’+OWL: 12 dicembre

2.2.3 Ontologia in formato OWL : 15 febbraio

Descrizione WP3

System Integration

Attività 3.1: Tutti i moduli vanno integrati in una unica applicazione.

 

WP:    3   Activity: 3.1

Start date: 15 febbraio

End Date: 30 febbraio

Responsible: ?

Riferimento: Roberto Navigli

Participants: tutti

 

 

Deliverable

Integrazione dei WP 1 e 2  e valutazione dell’usabilità dell’interfaccia: 30 febbraio

 

 

Modalità di gestione

 

Una volta organizzati i gruppi, e stabilito un coordinatore (o due) per ogni attività, i gruppi dovranno trovare forme autonome di coordinamento (mailing list, riunioni presso i laboratori o la biblioteca del dipartimento, ecc.). Sono previsti due incontri  alla settimana in orario di lezione. (lunedì e venerdì aula alfa, con l’eccezione di lunedì 1 e lunedì 8), incontri che proseguiranno anche a gennaio e febbraio previo controlli sulla disponibilità dell’aula.

In ogni incontro tutti i gruppi dovranno brevemente relazionare sullo stato delle proprie attività.

Ci si aspetta che tutti partecipino.

 

Alle scadenze previste per ogni WP, i partecipanti dovranno presentare delle relazioni e fare un presentazione powerpoint.

 

Verrà creata una mailing list del progetto per inviare tempestive comunicazioni.


 

NOME E COGNOME

E-MAIL

ATTIVITA’

Luigi Petrillo

lupetril@tiscalinet.it

1.1  responsabile

Francesca Mancini

francyman@tiscali.it

1.1

Silvia Samà

picasicla@tiscalinet.it

1.1

 

 

 

Marco Volpe

marco volpe" <marcovolpe@email.it>

 

Andrea Pancotti

andrea.pan@tiscalinet.it

2.1 

Andrea Angeletti

Angel.and@tiscalinet.it

2.1

Massimiliano Oliviero

massifmr@tin.it

2.1 responsabile

 

 

 

 

 

 

Francesco Sclano

Francesco_sclano@yahoo.it

1.2 responsabile

Maori Rossi Fossati

Maori1980@yahoo.it

1.2

Danilo Carrabino

heavydany@inwind.it

1.2

Giovanni Giovannelli

g.giovannelli@fastwebnet.it

1.2

Matteo Formica

Zector2@hotmail.com

1.2

 

 

 

Andrea Pancotti

andrea.pan@tiscalinet.it

2.2 

Andrea Angeletti

Angel.and@tiscalinet.it

2.2

Massimiliano Oliviero

massifmr@tin.it

2.2 responsabile

Marco Volpe

marco volpe" <marcovolpe@email.it>

 

 

Referenti

Roberto Navigli (dottorando) navigli@dsi.uniroma1.it

Cristiano Cenci "Cristiano Cenci" colosso78@yahoo.it

Pierluigi D’Amadio damadio@iasi.cnr.it