RNP - Rede Nacional de Ensino e Pesquisa

english | español


 

 
Notícias RNP 
 

Redes dão suporte à pesquisa avançada

Cientistas falam sobre e-ciência no 8º WRNP


A manhã do dia 29 de maio no 8º Workshop da Rede Nacional de Ensino e Pesquisa (WRNP) foi dedicada a palestras sobre e-ciência. Este novo modo de fazer pesquisa implica no uso de infra-estruturas eletrônicas, ou ciberinfra-estruturas, para a colaboração entre pesquisadores dispersamente localizados. Em outras palavras, são necessárias grandes capacidades de redes, de processamento computacional e de armazenamento de dados. Demandas das comunidades de físicos, astrônomos e meteorologistas, entre outros, têm levado o mundo na direção da e-ciência. Representantes do Instituto Nacional de Pesquisas Espaciais (Inpe), da North Carolina Research and Education Network (NCREN), do National Center for Supercomputing Applications (NCSA), da Universidade Federal Fluminense (UFF) e do Centro Brasileiro de Pesquisas Físicas (CBPF) falaram sobre o assunto.

Michael Stanton, Diretor de Inovação da RNP

Na definição de Vinod Rebello, do Instituto de Computação da UFF, a e-ciência trata da colaboração global em áreas-chave da ciência e da infra-estrutura de nova geração que permitirá essa colaboração. "A e-ciência procura pelo desconhecido em um grande volume de dados", disse Rebello durante a palestra "Grades e middleware: importância da interoperabilidade para e-ciência".

O diretor de Inovação da RNP, Michael Stanton, abriu a programação do dia citando alguns exemplos de projetos de e-ciência existentes pelo mundo. Ele disse que não existe uma coordenação planejada dos investimentos na área e que é necessária uma maior integração entre as iniciativas globais. Vinod Rebello disse que vários países já apresentam iniciativas coordenadas nacionalmente, mas que o Brasil é uma exceção. De fato, Stanton afirmou faltar uma iniciativa nacional e políticas públicas de apoio a projetos na área de e-infra-estrutura. "Uma possibilidade é fazer uso de recursos do MCT para a criação de redes de colaboração", concluiu.

Marcio Faerman, gerente de projetos da RNP, lembrou que, hoje em dia, grandes volumes de dados são gerados muito mais rapidamente do que podem ser analisados. Alguns exemplos são o novo acelerador de partículas do Centro Europeu de Pesquisa Nuclear (Cern, do nome em francês), que ao final de 2007 começará a gerar até 30 petabytes de dados por ano, e o projeto Large Synoptic Survey Telescope, que gerará cinco petabytes/ano a partir de 2013.

Esta nova realidade impõe desafios. Faerman alertou que "o que funciona normalmente num ambiente local, num cluster local, não vai funcionar quando você passa de uma escala de centenas de gigabytes para terabytes ou petabytes." É preciso garantir a integridade dos dados, mas, em escala de terabytes, falhas e corrupção de dados têm alta probabilidade de ocorrer. Também é preciso que o acesso aos dados seja rápido e possa ser feito de forma remota, por vários grupos. Por fim, Faerman avisou que o gerenciamento desta infra-estrutura distribuída e heterogênea é bastante complexa. "As abordagens tecnológicas não funcionam e precisam mudar", disse.

Grades como solução

Márcio Faerman disse que a resposta tecnológica aos desafios impostos é a integração de recursos de comunicação, computação, armazenamento e instrumentação em grades de computação (grids, em inglês). Michael Stanton citou como projetos de grades o Eela (e-infra-estrutura compartilhada entre Europa e América Latina) e o HepGrid. O primeiro é mais abrangente e pretende integrar projetos de e-ciência europeus e latino-americanos. O segundo destina-se à construção de uma grade específica para colaboração na área de física de altas energias.

Marcio Faerman, gerente de projetos da RNP

De acordo com Faerman, ainda ocorrem muitas falhas nos sistemas de e-ciência, apesar de sucessos excepcionais dos pioneiros. Os problemas comuns são: corrupção de dados; bugs em drivers e middlewares; mídias corrompidas; falhas de sincronização; congestionamento de rede; queda de enlaces; peculiaridades técnicas do protocolo TCP; e complexidade de gerência de incidentes em sistemas autônomos.

Vinod Rebello vai mais fundo: "é extremamente difícil para os usuários (cientistas com pouco conhecimento de sistemas) decidir que aplicação ou recurso é mais apropriado em seu caso." Isto se deve à heterogeneidade e instabilidade dos sistemas existentes. O professor da UFF alega que existem projetos de grades diferentes espalhados pelo mundo, com pouca integração, o que dificulta o desenvolvimento de aplicações. "Desenvolver para que tipo de grade?", ele pergunta.

Desafios e interoperabilidade

Rebello listou como desafios das grades sua popularização, a diversidade (de aplicações, de necessidades e de equipamentos), a ampla distribuição geográfica de recursos, e a variedade de sistemas autônomos e de comprometimento dos envolvidos nos projetos. A popularização das grades fará com que um número maior de aplicações concorram entre si por recursos. Desta forma, o uso eficiente da infra-estrutura será essencial para a boa performance da mesma.

Para aprimorar o funcionamento das grades, portanto, é preciso desenvolver um middleware de gerenciamento de rede que facilite o monitoramento, pois "aplicações e grades precisam dessa informação para decidir como alocar operações na infra-estrutura", explicou Márcio Faerman. O gerente de projetos da RNP contou que existe uma parceria entre o projeto Eela e o grupo de trabalho em Medições da RNP para monitorar a infra-estrutura de rede do Eela. Com isso, será possível otimizar o uso da grade do projeto, a partir de dados sobre banda disponível, atraso unidirecional, perda de pacotes e jitter, medidos ponto a ponto em segmentos internos da rede.

Rebello acrescenta ainda que as grades precisam conversar entre si para que o acesso seja mais simples e se disponha de mais recursos. Ele falou da necessidade de se interconectar as várias grades para se criar uma ciberinfra-estrutura global. Para isso, é importante a criação de padrões que permitam a comunicação entre as grades e a adaptabilidade das aplicações. Nas palavras de Rebello, são necessárias "aplicações que reajam e ajustem seus requisitos de sistema de acordo com suas reais necessidades e com as mudanças no ambiente de execução."

[RNP, 06.06.2007]

Consulta em noticias

 


Notícias coordenadas:

E-ciência, astronomia, clima, física e meio ambiente

Casos de uso de grades para a pesquisa científica