Cantitate/Preț
Produs

Programming Massively Parallel Processors: A Hands-on Approach

Autor Wen-Mei W. Hwu, David B. Kirk, Izzat El Hajj
en Limba Engleză Paperback – 19 iun 2026

Subliniem faptul că Programming Massively Parallel Processors se deschide cu o resursă esențială pentru inginerul software: o listă de verificare pentru optimizarea performanței și studii de caz actualizate care reflectă practicile din industrie. Această a patra ediție integrează noutăți critice, precum arhitectura Ampere și utilizarea bibliotecii CuDNN, oferind un suport tehnic solid pentru dezvoltarea de aplicații pe unități de procesare grafică.

Suntem de părere că progresia logică a volumului facilitează o curbă de învățare sustenabilă. Autorii, printre care se numără experți recunoscuți precum Wen-Mei W. Hwu și David B. Kirk, au structurat materialul în patru secțiuni distincte. Primele capitole pun bazele execuției eterogene și a localității datelor în memorie, în timp ce partea a doua explorează pattern-uri paralele fundamentale: convoluția, histogramele și algoritmii de tip stencil. Abordarea lor se extinde în capitole avansate dedicate învățării automate (Deep Learning) și reconstrucției de imagini prin rezonanță magnetică, demonstrând aplicabilitatea practică a conceptelor teoretice.

În contextul operei autorilor, acest titlu rafinează direcțiile explorate în Heterogeneous System Architecture, mutând accentul de pe infrastructura hardware către implementarea software eficientă. Comparativ cu GPU Parallel Program Development Using CUDA, abordarea Programming Massively Parallel Processors este mai puțin abstractă și mult mai aplicabilă, concentrându-se pe studii de caz reale în loc de o simplă prezentare a diferențelor între familiile de GPU-uri. Recomandăm acest volum ca pe un ghid metodologic, unde progresia de la gândirea computațională la execuția pe clustere eterogene prin fluxuri CUDA este tratată cu o rigoare tehnică exemplară.

Citește tot Restrânge

Carte nepublicată încă

Doresc să fiu notificat când acest titlu va fi disponibil:

Specificații

ISBN-13: 9780443439001
ISBN-10: 0443439001
Pagini: 680
Dimensiuni: 191 x 235 mm
Ediția:5
Editura: ELSEVIER SCIENCE

De ce să citești această carte

Recomandăm această carte studenților și programatorilor care doresc să stăpânească programarea paralelă pe arhitecturi moderne. Cititorul câștigă o înțelegere profundă a optimizării CUDA și a pattern-urilor de calcul esențiale (sorting, graph traversal). Este un manual practic, testat la catedră, care transformă teoria complexă în soluții de performanță pentru domenii precum Deep Learning sau procesarea de date medicale.


Descriere scurtă

Programming Massively Parallel Processors: A Hands-on Approach, Fifth Edition shows both students and professionals alike the basic concepts of parallel programming and GPU architecture. Concise, intuitive, and practical, it is based on years of road-testing in the authors' own parallel computing courses. Various techniques for constructing and optimizing parallel programs are explored in detail, while case studies demonstrate the development process, which begins with computational thinking and ends with effective and efficient parallel programs. This new edition has been updated with an expanded repertoire of optimizations, new patterns and applications, ad more coverage of important CUDA features.

  • Expanded optimization checklist with a more comprehensive demonstration of essential optimizations across patterns
  • New pattern and application chapters including: filtering, wavefront parallelism, advanced optimizations for matrix multiplication, and large language models (LLMs)
  • More coverage of important CUDA features including warp-level programming, cooperative groups, CUDA C++ atomics, and multi-GPU programming with NCCL and NVSHMEM

Cuprins

1. Introduction

Part I. Fundamental Concepts
2. Heterogeneous data parallel computing
3. Multidimensional grids and data
4. Compute architecture and scheduling
5. Memory architecture and data locality
6. Performance considerations

Part II. Parallel Patterns
7. Convolution
8. Stencil
9. Parallel histogram
10. Reduction
11. Prefix sum (scan)
12. Merge

Part III. Advanced Patterns and Applications
13. Sorting
14. Filtering (new)
15. Sparse matrix computation
16. Wavefront Algorithms (new)
17. Graph traversal
18. Deep learning
19. Multi-GPU API (new)
20. Electrostatic potential map
21. Parallel programming and computational thinking

Part IV. Advanced Practices
22. Programming a heterogeneous computing cluster
23. Advanced Optimizations for Matrix Multiplication (new)
24. Advanced practices and future evolution
25. Conclusion and outlook