Automating the location of errors and inefficiencies in parallel programs

Authors

Keywords:

supercomputer, performance, efficiency study, parallel computing, parallel programs, dynamic program characteristics, high performance computing, profiling, monitoring, supercomputer center PDF (in Russian) (996KB) PDF. zip (in Russian) (765KB)

Abstract

The problem of efficient utilization of available computational resources becomes much more important with the supercomputer applications scaling fast. Excessive computations due to inefficient algorithm implementations, unreasonably numerous test runs, and peculiarities of software and system architecture untaken into consideration – these and many other matters together lead to the undue usage of computational resources, to the increasing development time, and to a higher cost of getting the result. There are various ways for the automation of efficiency analysis and location of errors in parallel applications. A complex approach to the efficiency study of application runs is proposed in this paper. This work was supported by the Ministry of Education and Science of the Russian Federation (contract N 14.514.11.4062).

Author Biographies

A.S. Antonov

Vad.V. Voevodin

S.A. Zhumatii

D.A. Nikitenko

K.S. Stefanov

P.A. Shvets

References

  1. Воеводин Вл.В., Жуматий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В. Практика суперкомпьютера «Ломоносов» // Открытые системы. 2012. № 7. 36-39.
  2. Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А., Стефанов К.С. Job digest - подход к исследованию динамических свойств задач на суперкомпьютерных системах // Вычислительные методы и программирование. 2012. 13. 160-166.
  3. Брызгалов П.А., Жуматий С.А., Никитенко Д.А., Адинец А.В. Система визуализации параметров работы больших вычислительных систем // Сб. трудов Международной научной конференции «Параллельные вычислительные технологии 2012» (ПаВТ-2012). 2012. 714.
  4. Адинец А.В., Брызгалов П.А., Воеводин В.В., Жуматий С.А., Никитенко Д.А. Мониторинг, анализ и визуализация потока заданий на кластерной системе // Материалы XI Всероссийской конференции «Высокопроизводительные параллельные вычисления на кластерных системах». Нижний Новгород: Изд-во Нижегородского госуниверситета, 2011. 10-14.
  5. Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А. Об одном подходе к мониторингу, анализу и визуализации потока заданий на кластерной системе // Вычислительные методы и программирование. 2011. 12. 90-93.
  6. Никитенко Д.А., Стефанов К.С. Исследование эффективности параллельных программ по данным мониторинга // Вычислительные методы и программирование. 2012. 13. 97-102.
  7. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. СПб.: БХВ-Петербург, 2002.
  8. Афанасьев К.Е., Власенко А.Ю. Семантические ошибки в параллельных программах для систем с распределенной памятью и методы их обнаружения современными средствами отладки // Вестник КемГУ. Вып. 2. Кемерово: Изд-во КемГУ, 2009. 13-20.
  9. Антонов А.С. Технологии параллельного программирования MPI и OpenMP. М.: Изд-во Моск. ун-та, 2012.

Published

2013-11-18

How to Cite

Антонов А.С., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А., Стефанов К.С., Швец П.А. Automating the Location of Errors and Inefficiencies in Parallel Programs // Numerical methods and programming. 2013. 14. 11-17

Issue

Section

Section 2. Programming

Most read articles by the same author(s)

1 2 > >>