Понравилась презентация – покажи это...
Слайд 0
NAS Parallel benchmark
Нижегородский государственный университет им. Н.И.Лобачевского
Факультет Вычислительной математики и кибернетики
2011
Слайд 1
NBP – это…
NAS Parellel Benchmark(NBP) – набор тестов производительности нацеленных на проверку возможностей высокопараллельных суперкомпьютеров.
Слайд 2
Немного истории
Сравнительно молодой бенчмарк
Разрабатывался в центре NASA
Является «paper and pencil» тестом
Также имеет готовая реализация
Реализация использует технологии OpenMP/MPI
Актуальная версия 3.3
Слайд 3
Состав NBP
Ядра
Embarrassing Parallel (EP)
MultiGrid (MG)
Integer Sort (IS)
Conjugate Gradient (CG)
Fast Fourier Transform (FT)
Псевдо-приложения
Block Tridiagonal (BT)
Scalar Pentadiagonal (SP)
Lower-Upper разложение (LU)
Слайд 4
Решаемые задачи разделены на 6 классов
Слайд 5
Тест EP
Embarrassingly Parallel — Чрезвычайно параллельный
Генерация независимых нормально распределенных случайных величин
Основывается на методе Марсальи-Брея
Оценивает максимальную производительность кластера при операциях с плавающей точкой
Минимальные межпроцессорные взаимодействия
Слайд 6
Тест EP - результаты
Intel Core i5 4Gb
Слайд 7
Тест IS
Integer Sort – сортировка малых целых чисел
Основан на блочной сортировке
Играет сильное значение начальное распределение в памяти
Оценивает работу с общей памятью
Слайд 8
Тест FT
Решение 3-хмерного уравнения в частных производных при помощи БПФ
Используется прямое и обратное БПФ
Включает большое количество действий, оказывающих большую нагрузку на сеть
Оценивает скорость перемещения массивов данных
Слайд 9
Тест FT - результаты
Intel Core i5 4Gb
Слайд 10
Тест CG
Решение неупорядоченной, разряженной СЛАУ методом сопряженных градиентов
Метод сопряженных градиентов используется для нахождения приближенного значения наименьшего собственного числа матрицы
Тест применяется для оценки скорости передачи данных при отсутствии какой-либо регулярности
Слайд 11
Тест CG - результаты
Intel Core i5 4Gb
Слайд 12
Тест MG
Приближенное решение уравнения Пуассона
Размер сетки N определяется классом теста
Оценивает скорость передачи, как длинных, так и коротких данных
Слайд 13
Тест MG - результаты
Intel Core i5 4Gb
Слайд 14
Псевдо-приложения
Решение системы нелинейных дифференциальных уравнений в частных производных
Lower-Upper symmetric Gauss-Seidel (LU)
Block Triagonal (BT)
Scalar Pentadiagonal (SP)
Слайд 15
Тест BT
Решение серии независимых систем уравнений (блочные трехдиагональные матрицы 5х5 с преобладанием недиагональных элементов)
Эффективность с точки зрения общего потребления простых арифметических операций
Работает с плотными матрицами
Есть подтип данного теста с большой интенсивностью ввода-вывода
Слайд 16
Тест BT - результаты
Intel Core i5 4Gb
Слайд 17
Тест SP
Решение нескольких независимых систем скалярных уравнений (пентадиагональные матрицы с преобладанием недиагональных членов)
Работает с плотными матрицами
Мильтираcпределение данных для полного параллелизма
Метод хорошо распараллеливается и обеспечивает оптимальную загрузку сети
Слайд 18
Тест SP - результаты
Intel Core i5 4Gb
Слайд 19
Тест LU
Решает систему уравнений с равномерной разряженной блочной структурой методом симметричной последовательной верхней сверхрелаксации
Используются трехмерные уравнения Навье-Стокса
Тест критичен ко времени передачи очень маленьких объемов данных между узлами
Слайд 20
Тест LU - результаты
Intel Core i5 4Gb
Слайд 21
Заключение
Проведенные тесты показали, что кластер полностью использует свой потенциал
Время выполнения тестов масштабируется как и ожидается, неожиданных скачков или падений времени выполнения тестов в какой-то определенной области не наблюдается
Это говорит о том что кластер хорошо настроен и вычисления хорошо распределены
Слайд 22
Список литературы
Курс на Intuit.ru:
http://www.intuit.ru/department/supercomputing/tbucs/4/3.html
Статья на Wikipedia:
http://ru.wikipedia.org/wiki/NAS_Parallel_Benchmarks
Официальный сайт NASA:
http://www.nas.nasa.gov/publications/npb.html
Слайд 23
Спасибо за внимание
?