R�union du 19 mai 2003 au LIFO

GH: intro et information sur la journ�e d'Avril 2003 � Nice. On y a pr�sent� l'avancement du projet CARAML aux autre participants � l'ACI-GRID. Voir les transparents pr�sent�s � cet effet.

1. Expos�s individuels

Xavier Leroy

Avancement de caml. Polymorphisme de premi�re classe (types des champs d'enregistrements): Garrigue et R�my. Modules r�cursifs. Typage dynamique pour output-input value, pour le marshalling (J. Faruse GCaml). JoCaml: calcul et langage pour la mobilit� et la synchronisation. Travaux en cours, questions difficiles et ouvertes: mobilit� du code (difficile car les machines n'ont pas toutes le m�me code � priori). Mobilit� bas�e sur les fichiers *.cmo (unit� de compilation, modules). V�rif de type au moment de l'envoi des messages. Probl�me d'identit� des types abstraits. Mod�le de pannes.

Roberto DiCosmo

Etat de la biblioth�que ocamlP3L. Les primitives d�claratives exprimant du parall�lisme possible. Illustration graphique de ces "graphiques". Seq, Pipe, Fram, Loop, Map, Reduce. Choix de la strat�gie d'ex�cution laiss� au compilateur. Code utilisateur inchang� selon la biblioth�que qu'on utilise pour compiler: s�quentiel, parall�le (ou GRID ?), choix aussi d'une compilation pour graphisme. Tout ceci �tant s�mantiquement �quivalent. Relative facilit� de la v�rification de programmes: il suffit de prouver un programme applicatif fonctionnel (programmeur) + prouver l'implantation de chacune des primitives ocamlP3L (sp�cialiste). "Vrais" utilisateurs INRIA en simulation num�rique pour l'industrie p�troli�re. Solveurs sp�cifiques aux types de sols, il faut les combiner tout en les parall�lisant. Simplicit� d'int�gration de codes �crits en d'autres langages. En cours: int�gration de la syntaxe du placement des tableaux dans map avec les tableaux caml, compilation efficace.

Fr�d�ric Loulergue

Etat des travaux autour de BSMLlib � Cr�teil: v�rification formelle Coq de programmes BSMLlib, mod�le d'�valuation minimalement synchrone, nouvelle implantation CAML-MPI. Typage statique avec les sortes des deux niveaux. Implantation formellement v�rifi�e d'un sous-ensemble de Caml-light.

C�cile Germain

Mod�le des algorithmes asynchrone de Bertsekas. Utilit�, flexibilit� et d�terminisme mais �chec des mod�les de co�t data-parall�les usuels qui tombent alors dans le pire cas des d�lais de communication et synchro. Bertsekas a introduit un temps local virtuel, et mod�lise de mani�re rel�ch�e les entrel�cements de calcul local et de communication. Ces it�rations "chaotiques" font qu'on peut travailler avec des donn�es p�rim�es. Des conditions suffisantes assez larges impliquent la convergence sur la m�me valeur vectorielle qu'un calcul synchrone de r�f�rence. On travaille sur une meilleure formalisation du mod�le en �liminant la notion de temps local virtuel. Ce mod�le permettra de g�rer les impr�vus dans un contexte GRID, impr�vus dans les d�lais de communication.

Matthieu Exbrayat

Travaux au LIFO sur PDB. Ocaml doit appeler un syst�me d'�valuation parall�le de jointures (maintenant multi-jointures) �crit en C et MPI. On a essay� de faire du multi-thread mais trouv� que c'est sans int�r�t pour le moment. On a un analyseur syntaxique des requ�tes SQL. Fonctions CAML: lancer l'ex�cution, consulter le r�sultat ODBC. En dessous du code C+MPI on a MySQL. Ajout de directives � la requ�te SQL pour indiquer le placement des donn�es � l'entr�e et � la sortie ainsi que les processeurs � utiliser. Le compilateur g�n�re un plan parall�le. Fragmentation horizontale des tables (pas de r�p�tition). Strat�gie de pipelinage des diff�rentes phases d'une requ�te.

D�bat sur les probl�mes ouverts et les pistes � explorer durant le reste du projet (-> fin 2004)

On a isol� trois grandes directions de recherche qui ont servi de partition aux participants pour travailler en sous-groupes:

"BSP �largi" Extensions du mod�le de programmation BSP pour accomoder des fonctionnalit�s GRID
- "Annotations etc" M�ta-notations pour guider les biblioth�ques et syst�mes dans leur utilisation des ressources
"Suite de PDB" Optimisation dynamique des communications et calculs dans les requ�tes SQL parall�lis�es/globalis�es.

Les sous-groupes ont travaill� environ 45 minutes puis chacun a pr�sent� ses conclusion � l'ensemble du projet. Cette derni�re partie n'a pas donn� lieu � beaucoup de remous, on peut donc simplement r�sumer les conclusion de chaque sous-groupe. Veuillez excuser l'in�galit� de d�tail des commentaires puisque je participais moi-m�me � 2.2.

2.1 "BSP �largi" cela int�resse surtout Cr�teil

Le but est d'adapter le mod�le BSP � l'utilisation simultan�e de plusieurs grappes. On propose simplement d'ajouter un troisi�me niveau � la syntaxe et � la s�mantique de BSML. Les trois niveaux seront donc: processeur, machine parall�le, r�seau de machines parall�les. Primitives de communication � la BSML:

mkgrid (fun site -> mkpar (fun pid -> e(site,pid))) etc.

Question ouverte: et le mod�le de co�t ? Est-ce qu'on peut traiter g de mani�re homog�ne � travers les valeurs de la variable "site" ?

2.2 "Annotations etc" cela int�resse PPS, INRIA et Orl�ans

Il s'agit ici d'augmenter nos syst�mes avec des annotations servant d'estim� des ressources disponibles et de la consommation de ressource pr�vue par le programme. Le syst�me pourra utiliser ces annotations pour optimiser au mieux. Les irr�gularit�s pr�vues concernent donc i) les ressources disponibles et ii) la consommation de ces ressources en calcul et comm; cela se d�cline au niveau a) du processeur b) du site g�ographique (la machine parall�le, la grappe etc) et c) du temps car les bandes passantes auront tendance � varier de mani�re impr�visible et les processeurs seront eux-m�mes libres ou charg�s par d'autres applications.

Pour ocamlP3L on propose d'annoter la fonction map

map scol:[c1;c2;c3](f,3)

en donnant par ex ici le nombre 3 de processeurs pr�vus (ou d�sir�s?).

Pour BSML on pourra annoter la fonction put avec les volumes pr�vus des messages (valeurs h_i+ et h_i- pr�vues).

On pourra �crire des fichiers de configuration o� on d�clare les performances pr�vues des processeurs et d�clarer la bande passante entre des paires de processeurs. Toutes ces infos pourront �tre symboliques ou �num�ratives selon la quantit� disponible: inventer une syntaxe hybride.

Adapter cela � de la variabilit� dynamique des ressources ? On pourra faire �crire des fichiers de config dynamiquement avec des valeurs instantan�es et liss�es, mesur�es par des programmes moniteurs tournant en continu.

2.3 "Suite de PDB" cela int�resse Orl�ans (Bamha + Exbrayat)

Il reste beaucoup � faire sur l'outil PDB sur syst�me parall�le d�di�e et la principale difficult� est de ne pas pouvoir ouvrir le code (par manque de temps surtout) des SGBD appel�s. Il faudra aussi adapter l'outil PDB au contexte GRID. On propose pour cela deux grandes pistes, � explorer s�par�ment puis �ventuellement � combiner:

i. Soit que les donn�es ne sont pas g�ographiquement r�pliqu�es. Chaque site poss�de une base de donn�e distincte ou des tables distinctes de la m�me bd. Alors les calculs se feront selon la distribution initiale des donn�es. Les sous-requ�tes seront ex�cut�es en local sur chaque site => acc�l�ration parall�le. A voir: o� stocker les r�sultats s'ils sont volumineux, c-�-d volumes de communication � la sortie.

ii. Soit que les donn�es sont r�pliqu�es sur chaque site. On autorisera le d�coupage pour acc�l�rer les calculs en utilisant plusieurs sites. A suivre.

Ga�tan
mai 2003