Exabytes de dades, repositoris científics (JOCS’09)

ImageAvui ha tingut lloc a la UAB la 9a edició de la Jornada de Supercomputació de Catalunya (JOCS’09) organitzada pel CESCA, on he tingut l’honor de fer-ne la cloenda. El tema, aquest cop, era Repositoris de Dades Científiques. He de confessar que hi he anat una mica a la babalà, conscient de ser inexepert en aquest tema. Però això em permet ara dir que n’he gaudit, que hi he après, i que ara sóc més conscient d’on som. Moltes gràcies a en Miquel Huguet, director del CESCA, per la idea i l’organització.

Per cert, recordo encara la meva participació a la primera edició de la JOCS, el 1992 (amb l’acrònim CATSUPERCOMP), a l’amfiteatre de la Facultat de Biologia de la UB.

Un centenar de persones hi han assistit, aquest matí. N’he fet alguns twitts, que recullo aquí (hashtag #jocs09)

  • Update @gonzalomerino #jocs09 Xerrada del Port d’Informació Científica http://www.pic.es Treballa amb l’LHC, que genera 50 petabyte per any
  • #jocs09 G Merino: Una conferènica sense cloud computing no és una conferència
  • #jocs09 Nou paradigma dels publicadors de mapes a Internet (gogole, bing,…) : just good enough is good enough
  • #jocs09 X. Luri: Data avalanche, però les dades astronòmiques són molt menors que les dades de les col.lisions de partícules
  • #jocs09 Carlos Alemán (UPC): ens parla dels aminoàcids no codificats, amb aplicacions a nanobiologia i nanotecnologia
  • #jocs09 Xerada del Port d’Informació científica http://www.pic.es Treballa amb l’LHC… que genera 50 petabyte per any
  • @jocs09 El nou problema amb els repositoris és més aviat què es pot llençar, no pas què cal guardar.
  • #jocs09 Millorar l’accés a la informació meteorològica i oceanogràfica serà també una obligació legal
  • #jocs09 Repositoris de dades científiques: Els investigadors han de ser la motivació central

Ha estat espectacular el volum de dades que generen els experiments de l’LHC de Ginebra: de l’ordre de l’exabyte (mil petabytes, un milió de gigabytes). En comparació, el astrònoms només generen informació de l’ordre del petabyte… i per això ja no es pot dir “una quantitat astronòmica d’informació”, sinó “una quantitat LHC d’informació”).

De bases de dades, d’emmagatzematge, d’anàlisi de dades, de transmissió de dades… Sembla que en el futur el més complicat serà l’anàlisi, ja que esperem que la capacitat d’arxivar sigui suficient, igual que la velocitat de transmissió.

Ens han parlat de dades meteorològique si oceanogràfiques, que són a la vegada 3D i funció del temps, i també de la cooperació i competició entre dades cartogràfiques-administratives i el Google Maps. Igualment hi ha hagut mencions sobre l’enorme quantitat d’informació que suposen les dades mèdiques (per exemple, radiografies).

S’ha parlat d’allau de dades (Data Avalanche), però no es veu com a amenaça, sinó com a opotunitat.

Una aportació interessant: Cal començar aviat al cicle de vida de la recerca, cal habilitats i coneixement d’àmbits: tècnics, gestió de la informació, científics, socials (legals, econòmics, etc). Els investigadors han de ser la motivació central.

Però com es va dir a ComCiRed abans d’ahir, cada cop hi ha menys diferència entre laboratori i món, entre científic i no científic, entre expert i no expert. Per això al Projecte Gaia hi ha tants d’enginyers com científics… si és que poden definir amb precisió “enginyer” i “científic”.

A l’inici de la reunió, en Joan Majó, Comissionat per a Universitats i Recerca, ha demanat al CESCA que els elements comuns de les institucions (universitats) siguin a un lloc neutre: si estan en un lloc, hi ha control.

A la cloenda, he comentat que el concepte de “ordinador” adquireix cada cop més una nova dimensió, més enllà de “computador”. Potser el CESCA haurà de passar a ser el “Centre de Superordinació de Catalunya“. Mentre tant, rellegiré una meva entrada sobre el perquè de tot plegat (arxiu personal)

A la revista Teraflop, editada pel CESCA, segur que se’n farà un bon resum. Naturalment les presentacions de les diferents intervencions seran posades online.

2 thoughts on “Exabytes de dades, repositoris científics (JOCS’09)

Comments are closed.