Le CUDA sans peine : produire un code efficace

Magazine
Marque
GNU/Linux Magazine
Numéro
137
Mois de parution
avril 2011


Résumé
Dans le précédent article, nous avons rapidement découvert l'architecture CUDA et les outils facilitant la gestion de projet contenant du code CUDA. Dans cet article, nous allons poursuivre notre découverte de CUDA et découvrir notamment les nombreux points auxquels il faut porter une attention marquée pour produire du code efficace.

1. Tirer le meilleur de CUDA

Plus encore que la programmation sur CPU, la programmation sur GPU nécessite de porter une attention particulière à la façon dont on implémente un algorithme pour en tirer le meilleur parti.

1.1 Limitation mémoire ou calculatoire

On distingue, dans le domaine de l'optimisation des programmes informatiques, principalement deux types de limitation des performances :

- La limitation en puissance de calcul : c'est la plus évidente. Dans ce cas-là, le programme travaille sur un petit ensemble de données et effectue beaucoup de calculs dessus. Le CPU passe donc la majorité de son temps à exécuter des instructions. Un tel programme est qualifié de CPU Bound dans la langue de Shakespeare.

- La limitation en accès mémoire : elle est plus subtile. Dans ce cas, soit le programme fait peu de calculs, mais nécessite de charger de nombreuses données pour les effectuer, soit il n'accède pas à beaucoup de données, mais ces dernières sont dispatchées de...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite