Automating the location of errors and inefficiencies in parallel programs
Authors
-
A.S. Antonov
-
Vad.V. Voevodin
-
S.A. Zhumatii
-
D.A. Nikitenko
-
K.S. Stefanov
-
P.A. Shvets
Keywords:
supercomputer
performance
efficiency study
parallel computing
parallel programs
dynamic program characteristics
high performance computing
profiling
monitoring
supercomputer center PDF (in Russian) (996KB) PDF. zip (in Russian) (765KB)
Abstract
The problem of efficient utilization of available computational resources becomes much more important with the supercomputer applications scaling fast. Excessive computations due to inefficient algorithm implementations, unreasonably numerous test runs, and peculiarities of software and system architecture untaken into consideration – these and many other matters together lead to the undue usage of computational resources, to the increasing development time, and to a higher cost of getting the result. There are various ways for the automation of efficiency analysis and location of errors in parallel applications. A complex approach to the efficiency study of application runs is proposed in this paper. This work was supported by the Ministry of Education and Science of the Russian Federation (contract N 14.514.11.4062).
Section
Section 2. Programming
References
- Воеводин Вл.В., Жуматий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В. Практика суперкомпьютера «Ломоносов» // Открытые системы. 2012. № 7. 36-39.
- Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А., Стефанов К.С. Job digest - подход к исследованию динамических свойств задач на суперкомпьютерных системах // Вычислительные методы и программирование. 2012. 13. 160-166.
- Брызгалов П.А., Жуматий С.А., Никитенко Д.А., Адинец А.В. Система визуализации параметров работы больших вычислительных систем // Сб. трудов Международной научной конференции «Параллельные вычислительные технологии 2012» (ПаВТ-2012). 2012. 714.
- Адинец А.В., Брызгалов П.А., Воеводин В.В., Жуматий С.А., Никитенко Д.А. Мониторинг, анализ и визуализация потока заданий на кластерной системе // Материалы XI Всероссийской конференции «Высокопроизводительные параллельные вычисления на кластерных системах». Нижний Новгород: Изд-во Нижегородского госуниверситета, 2011. 10-14.
- Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А. Об одном подходе к мониторингу, анализу и визуализации потока заданий на кластерной системе // Вычислительные методы и программирование. 2011. 12. 90-93.
- Никитенко Д.А., Стефанов К.С. Исследование эффективности параллельных программ по данным мониторинга // Вычислительные методы и программирование. 2012. 13. 97-102.
- Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. СПб.: БХВ-Петербург, 2002.
- Афанасьев К.Е., Власенко А.Ю. Семантические ошибки в параллельных программах для систем с распределенной памятью и методы их обнаружения современными средствами отладки // Вестник КемГУ. Вып. 2. Кемерово: Изд-во КемГУ, 2009. 13-20.
- Антонов А.С. Технологии параллельного программирования MPI и OpenMP. М.: Изд-во Моск. ун-та, 2012.