M-CAST
Sistema Agregador de Conteúdos Multilingues Baseado no Motor de Pesquisa TRUST
(projecto programa eContent n.º EDC 22249 M-CAST)
O objectivo do projecto é desenvolver uma infra-estrutura multilingue que permita aos produtores de conteúdos pesquisar, consultar e integrar recursos de vastas colecções multilingues de textos (e multimédia), tais como bibliotecas digitais, recursos de editoras, agências de notícias e bases de dados de publicações científicas.
Sistema
O Multilingual Content Aggregation System (M-CAST) permitirá o desenvolvimento de Bibliotecas Digitais agregando dados digitais disponíveis em vários formatos e locais. O sistema vai ser testado por duas bibliotecas, para as quais serão criados Multimedia Content Aggregation Portals (M-CAP), utilizando os seus portais e as infra-estruturas existentes. Os portais permitirão encontrar respostas a perguntas feitas em língua natural em grandes colecções digitais de dados multilingues. A interface de apresentação dos portais terá capacidades multimédia, permitindo a visualização de digitalizações de documentos antigos, documentos legais, partituras musicais, imagens e vídeos, apesar de apenas as suas descrições textuais serem indexadas.
Tecnologias Linguísticas
O M-CAST basear-se-á nos resultados do projecto TRUST - Multilingual Semantic and Cognitive Search Engine for Text Retrieval Using Semantic Technologies (IST-1999-56416) - co-financiado pelo 5.º Programa Quadro da União Europeia. O motor de pesquisa TRUST, desenvolvido para 4 línguas (francês, italiano, polaco e português), será convertido de um programa isolado para PC numa aplicação para servidores. Os recursos linguísticos TRUST serão utilizados e actualizados. A ontologia (taxonomia) utilizada no TRUST será convertida para ser compatível com a Classificação Decimal Universal (CDU), o standard utilizado nos sistemas de catalogação das bibliotecas em todo o mundo. Dois outros módulos de língua serão adicionados: o inglês - desenvolvido por um dos parceiros do TRUST - e o checo - que será desenvolvido durante o projecto M-CAST.
Metodologia
O sistema de agregação M-CAST será o elemento central do portal de agregação M-CAP e será desenvolvido seguindo a metodologia de desenho de aplicações de gestão de conteúdos preparada pela Infovide - Matrix S.A. num outro projecto do 5.º Programa Quadro - o ICONS - Intelligent Content Management System - IST-2001-32429.
Implementação
Os portais serão implementados e testados em duas bibliotecas públicas: a Biblioteca Polaca na Internet e a Biblioteca Nacional da República Checa, como forma de disponibilizar on-line os seus recursos digitais para permitir encontrar respostas em colecções multilingues digitais a perguntas em língua natural.
Aplicação
No fim do projecto estará disponível para comercialização um produto para gestão de conhecimento multilingue. Está prevista a exploração comercial dos resultados em bibliotecas (recuperação de informação, classificação e catalogação), gestão de colecções (aquisição e agregação de dados, estatísticas de circulação e filtragem), bases de dados bibliográficas, serviços de informação (disseminação selectiva de informação, personalização, descoberta de conhecimento) e redes semânticas de dados.
________________________________________________________________________________________
O projecto M-CAST é desenvolvido com o apoio financeiro da Comunidade Europeia no âmbito do programa comunitário multianual para estimular o desenvolvimento e utilização de conteúdos digitais europeus nas redes globais e para promover a diversidade linguística na sociedade de informação (2001-2005).
|