PPN - Arrondi stochastique pour le calcul scientifique

Ce projet a été réalisé par Yutai Zhao, Lisa Taldir, Chun Qi et Yizhi Yang dans le cadre du Master Calcul Haute Performance et Simulation de l'université Versailles St-Quentin-en-Yvelines.

Nous comparerons ici les résultats expérimentaux obtenus en utilisant l’arrondi stochastique avec ceux obtenus en utilisant l’arrondi déterministe au plus près, pour différents algorithmes.

Pour cela, nous avons organisé ce dépot en plusieurs dossiers:

├──Algo&Tests
├──Exponentiation
├──Exponentiation_etudes_mantisse
├──Lorenz
├──Performance 1er_semestre
├──Performance AWS
├──Sommation
└──Sum_prod

dont le contenu et l'utilisation sera détaillé ci-dessous.

Prérequis

Installer Vérificarlo et python avec les librairies numpy et matplotlib.

Algo&Tests

Organisation

Ce dossier contient :

les algorithmes naïf récursif, itératif et rapide récursif, itératif (dans algo_lib/) que nous utiliserons durant tout notre projet
les tests unitaires (dans le fichier test.cpp) verifiant que nos algorithmes soient valides
les valeurs de références (dans test_data/) obtenues grace à des fonctions de Python.

Usage

Assurer d'abord que :

le répertoire Algo&Tests/build/ soit vide
le repertoire de travail (working directory) est Algo&Tests/build/

Pour les caluls d'exponentation ($x^{n}$) faire :

$ cmake ..
$ make
$ ./algo [x] [n]

Exponentiation

Organisation

Ce dossier contient nos travaux autour de l'algorithme d'exponentation (i.e calcul de $x^{n}$ pour n allant de 0 à 10000 et 10 valeurs différentes de x proches de 1). Il est organisé en trois parties : une partie principale où l'on retrouve notre code, un dossier (plots/) contenant les graphes obtenus et un dossier (results/) contenant les résultats bruts.

Concernant le code, on a :

run.sh : exécute le main sur 33 itérations pour une valeur de x fixée et stocke les données dans le dossier results/
algo.c : regroupe les algorithmes calculant $x^{n}$ en simple précision
reference.c : contient un algorithme calculant $x^{n}$ en double précision (on a choisi de garder l'algorithme naïf itératif comme référence pour nos calculs d'erreurs)
main.c : fichier principal dans lequel on retrouve nos calculs d'erreurs, prenant en arguments, dans l'ordre, [x] : valeur pour laquelle on va calculer $x^{n}$ et [ind] : indicateur pour savoir quelle version de la fonction d'exponentiation exécuter.
ind = 0 pour choisir la version naïve récursive
ind = 1 pour choisir la version naïve itérative
ind = 2 pour choisir la version rapide récursive
ind = 3 pour choisir la version rapide itérative
plots/plot.py : trace les graphes

Usage

Pour obtenir les graphes présents dans le dossier Exponentiation/plots/ faire, en se plaçant dans le répertoire Exponentiation/:

$ ./run.sh

pour générer les données (cela prend quelques minutes), qui seront ensuite stockées dans le dossier results/.

Puis faire :

$ cd plots
$ python3 plot.py

pour générer les graphes.

Exponentiation_etudes_mantisse

ATTENTION : LES RESULTATS DE CE DOSSIER NE SONT NI VERIFIES PAR LES ENCADRANTS NI INCLUS DANS LE RAPPORT

Organisation

Ce dossier contient :

Makefile : pour faciliter la compilation du programme
SR_main.c et UR_main.c : les fonctions principales (main) qui font les calculs en float32
ref_main.c : la fonction principale qui font les calculs en float64
experience.c et reference.c : les algorithmes de l'exponentiation en float32 et float64
erreur.c : pour calculer les erreurs
stat.c : pour calculer la fonction de densité des mantisses des erreurs
stat_distribution.c : pour calculer la distribution des mantisses des erreurs
stat_sign_bit.c : pour calculer la fonction de densité des mantisses significatives des erreurs
run.sh : le scirpt pour calculer les erreurs, puis pour ne garder que la mantisse de chaque erreur afin de calculer les fonctions de densité et les distributions.
plot/plot.gp : le script pour visualiser les résultats issus de stat.c
plot/plot_dist.gp : le script pour visualiser les résultats issus de stat_distribution.c
plot/plot_sig.gp : le script pour visualiser les résultats issus de stat_sign_bit.c
Les résultats bruts dans results/ et les graphes dans plot/

Usage

Pour obtenir les resultats présents dans le dossier results/ faire :

$ cd Exponentiation_etudes_mantisse
$ ./run.sh

Pour obtenir les graphes faire, en choisissant le script .gp souhaité:

$ cd Exponentiation_etudes_mantisse/plot
$ gnuplot plot.gp
$ gnuplot plot_dist.gp
$ gnuplot plot_sig.gp

Lorenz

Organisation

Ce dossier contient :

la résolution du système de Lorenz en float32 (dans lorenz_32.c ) et en float64 (dans lorenz_64.c)
Makefile : pour faciliter la compilation
run.sh : le scirpt pour compiler et executer le programme résolvant le système de Lorenz
plot.gp : le script pour dessiner les solutions
Les résultats bruts dans results/ et les graphes en .png

Usage

Pour obtenir les résultats présents dans le dossier results/ et les graphes faire :

$ cd Lorenz
$ ./run.sh
$ gnuplot plot.gp

Performance 1er_semestre

Organisation

Ce dossier contient :

les algorithmes dont les performances sont à évaluer (dans kernels.h)
le programme principal et une fonction benchmark pour l'évaluation et l'affichage des performances (dans main.c)
les définitions de quelques fonctions utilisées dans le programme principal (dans tools.c)
les définitions des types de valeurs exprimés autrement (dans types.h)
les résultats des performances des 4 algorithmes, les résultats sont obtenus en faisant varier les compilateurs gcc (dans gcc/) clang (dans clang/).
les scripts : un script pour la generation des resultats de performance (exe.sh), un script pour trier les resultats (pars.sh), un script pour la réalisation des graphes (dans graphe/graphee.Rmd).

Usage

Pour obtenir les resultats présents dans les dossiers gcc/ et clang/ faire :

$ cd Performance
$ ./exe.sh
$ ./pars.sh

Pour obtenir les graphes faire :

$ cd Performance/graphe
$ open graphe.Rmd

Puis cliquer sur Run All

Performance AWS

Organisation

Ce dossier contient :

log de AWS/ : contenant les messages affichés sur le terminal de Amazon EC2
timing_version1_1/ : Performance mesurée avec n=60 et x = 1.01~1.19 avec 50 exécutions et 500 repétitions, en prennant le temps moyen de ces repétitions par exécution
timing_version1_2/ : Performance mesurée avec n=1000 et x = 1.0001~1.01 avec 50 exécutions et 100 repétitions, en prennant le temps moyen de ces repétitions par exécution
timing_version2/ : Performance mesurée avec n=1000 et x = 1.0001~1.01 avec 33 exécutions et 22 repétitions, en prennant le temps de chaque repétition par exécution
timing_version3/ : NON utilisé. A completer.

Chaque dossier timing_version*/ contient :

README_PLZ : Une note dédiée pour chaque version
timing_UR/ et timing_SR/ : Les résultats de performance
performance.py : Faire les calculs, mesurer les temps du début et de la fin de chaque calcul, afficher les résultats
traitement_donnees.py : Calculer les temps d'exécutions à partir des temps début/fin
calcul.sh : Exécuter performance.py avec les variables d'environnement adéquates et enregistrer les résultats affichés
tri.sh : Garder que les messages d'affichage interessés (temps début/fin) et exécuter traitement_donnees.py
script.py : Calculer les min/max/moyenne/mediane/stddev des temps d'exécutions

Usage

Pour obtenir les temps d'exécutions faire :

$ cd 'Performance AWS'/[Une version souhaitée sauf la 3]/
$ ./calcul.sh
$ ./tri.sh

Pour obtenir les mesures faire ensuite :

$ ./script.py

Sommation

Organisation

Ce dossier contient nos travaux autour de l'algorithme de sommation (i.e calcul de $n * x$ pour n allant de 0 à 11000 et 3 valeurs différentes de x : 0.1, 1.1 et 1.2). Il est organisé en trois parties : une partie principale où l'on retrouve notre code, un dossier (plot/) contenant les graphes obtenus et un dossier (results/) contenant les résultats bruts.

Concernant le code, on a :

run.sh : exécute le main sur 33 itérations pour une valeur de x fixée et stocke les données dans le dossier results/
algo.c : contient un algorithme calculant $n * x$ en simple précision
reference.c : contient un algorithme calculant $n * x$ en double précision
main.c : fichier principal dans lequel on retrouve nos calculs d'erreurs, prenant en argument [x] : valeur pour laquelle on va calculer $n * x$.
plot/plot.py : trace les graphes

Usage

Pour obtenir les graphes présents dans le dossier Sommation/plot/ faire, en se plaçant dans le répertoire Sommation/:

$ ./run.sh

pour générer les données, qui seront ensuite stockées dans le dossier results/.

Puis faire :

$ cd plot
$ python3 plot.py

pour générer les graphes.

Sum_prod

Organisation

Ce dossier contient les fichiers utiles pour les études d'une fonction définie comme une analogie du produit scalalre de deux vecteurs : $\sum_{i=1}^{n} x_i^k$

On distinque deux cas : $x_i$ sont constantes de valeurs 1.000001, 0.99999987654321, 1.00010002, ou $x_i$ sont aléatoirement générés par le fichier vec_gen.c (dans l'intervalle $[0.9998, 1.0002]$).

algo.h, calcul.c et ref.c contiennent l'algorithme en précision floattante que l'on veut étudier (et la référence en précision double).
main.c le fichier principal pour calculer les erreurs relatives en arrondi au plus près ou en arrondi stochastique.
stat.c pour calculer la moyenne et l'écart-type des différentes répétitions.
*.sh les scripts pour lancer le programme. On utilise run_v.sh pour valider nos codes car lorsque $x=2$, il n'y aura pas d'erreur. run_x.sh, run_y.sh et run_z.sh représentent respectivement les valeurs fixes 1.000001, 0.99999987654321 et 1.00010002, puis run_r.sh pour les vecteurs aléatoires.
*.gp pour tracer les courbes avec les résultats obtenus.
UR/ et SR/ contiennent les résultats.
plot/ contient les figures tracées.

Usage

Remplacer 'a' par 'v' ($x=2$), 'x' ($x=1.000001$), 'y' ($x=0.99999987654321$), 'z' ($x=1.00010002$) ou 'r' ($x_i$ aléatoires) :

$ cd sum_prod
$ ./run_a.sh
$ gnuplot plot_a.sh

Auteurs

Yizhi Yang
Yutai Zhao
Chun Qi
Lisa Taldir

Remerciments

Merci à Pablo De Oliveira Castro, El-Mehdi El-Arar et Devan Sohier pour leurs conseils et leur encadrement.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

PPN - Arrondi stochastique pour le calcul scientifique

Prérequis

Algo&Tests

Organisation

Usage

Exponentiation

Organisation

Usage

Exponentiation_etudes_mantisse

Organisation

Usage

Lorenz

Organisation

Usage

Performance 1er_semestre

Organisation

Usage

Performance AWS

Organisation

Usage

Sommation

Organisation

Usage

Sum_prod

Organisation

Usage

Auteurs

Remerciments

About

Uh oh!

Releases

Packages

Contributors 5

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 420 Commits
Algos&Tests		Algos&Tests
Exponentiation		Exponentiation
Exponentiation_etudes_mantisse		Exponentiation_etudes_mantisse
Lorenz		Lorenz
Performance 1er_semestre		Performance 1er_semestre
Performance AWS		Performance AWS
Sommation		Sommation
Sum_prod		Sum_prod
README.md		README.md

lisataldir/PPN-Arrondi-Stochastique

Folders and files

Latest commit

History

Repository files navigation

PPN - Arrondi stochastique pour le calcul scientifique

Prérequis

Algo&Tests

Organisation

Usage

Exponentiation

Organisation

Usage

Exponentiation_etudes_mantisse

Organisation

Usage

Lorenz

Organisation

Usage

Performance 1er_semestre

Organisation

Usage

Performance AWS

Organisation

Usage

Sommation

Organisation

Usage

Sum_prod

Organisation

Usage

Auteurs

Remerciments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Uh oh!

Languages

Packages