riunione_baroni_guevara_zanchetta_24_2_2006

Il 24/2/2006 alle 14:00 si sono riuniti Marco Baroni, Emiliano Guevara e Eros Zanchetta.

Sono stati discussi i seguenti punti:

Verranno acquistati al più presto due server, entrambi con funzione di fornire servizi Web. Il primo server sarà collocato a Bologna, dove sarà usato per modernizzare l'infrastruttura esistente. L'altro verrà collocato a Forlì, e sarà utilizzato per l'inserimento (tramite una maschera apposita) e l'accesso al database sui composti prodotto dal progetto.

Eros Zanchetta nei prossimi giorni preparerà una proposta con preventivo per le due macchine.

I due server di cui al punto precedente saranno dedicati all'erogazione di servizi Web, e dunque non verrano utilizzati per l'attività di data mining richiesta dalla parte computazionale/statistica del progetto. Invece, tale attività sarà svolta su macchine che stanno venendo indipendentemente acquistate presso il dipartimento SITLEC di Forlì.

Una volta che tali macchine saranno pronte, i vari corpora da utilizzare nel progetto (almeno la Repubblica, la Stampa, itWaC, deWaC e BNC) saranno resi disponibili su tali macchine attraverso CWB/cqp. I partecipanti al progetto che ne faranno richiesta otterranno un account per lavorare sulle macchine in questione connettendosi via secure shell.

Si decide inoltre che su uno dei server in questione verrà creato un repositorio cvs, in modo da facilitare il lavoro collaborativo.

La possibilità di condurre ricerche sui corpora direttamente dal database Web dei composti verrà garantita dalla rapida connessione esistente tra macchine al SITLEC.

Si concorda che è un'assoluta priorità sviluppare delle specifiche precise riguardo a come sono al momento rappresentati i dati MorboComp, e decidere un formato esplicito per i dati CompoNet che permetta, da un lato, di integrare i dati MorboComp, dall'altra di permetterne l'espansione sia con nuovi dati raccolti manualmente, sia tramite l'interfaccia ai corpora, sia con la possibile aggiunta di dati estratti automaticamente (in ques'ultimo caso però i dati saranno marcati come “estratti automaticamente”).

E' importante, però, prima di iniziare il vero e proprio porting dei dati MorboComp verso la piattaforma CompoNet, stabilire in modo abbastanza definitivo il formato uniforme dei dati. In ogni modo, il lavoro finale potrà essere iniziato quando l'infrastruttura informatica sarà stata messa a punto.

  • riunione_baroni_guevara_zanchetta_24_2_2006.txt
  • Last modified: 2006/12/08 17:40
  • by 127.0.0.1