'

СУПЕРВЫЧИСЛЕНИЯ: средства, теория, образование

Понравилась презентация – покажи это...





Слайд 0

Московский государственный университет им.М.В.Ломоносова Институт вычислительной математики РАН www.parallel.ru Воеводин В.В., Воеводин Вл.В. СУПЕРВЫЧИСЛЕНИЯ: средства, теория, образование


Слайд 1

Параллельные вычисления Архитектура компьютеров Технологии программирования Методы, задача “отображения” Теоретические исследования Практика Образование П о л ь з о в а т е л ь


Слайд 2

От идеи - до реализации Задача Метод Алгоритм Технология программирования Программа Компьютер


Слайд 3

Последовательный алгоритм


Слайд 4

Параллельный алгоритм


Слайд 5

Технологии параллельного программирования Традиционные языки + компиляторы Расширения последовательных языков, спецкомментарии Специальные языки параллельного программирования Библиотеки и интерфейсы для взаимодействия параллельных процессов: MPI, PVM, Linda, Shmem... Параллельные предметные библиотеки: SCALAPACK, MKL, FFTW, DFFTpack, PETSc, CRAY Scientific Library... Специализированные пакеты и программные комплексы: PC-GAMESS, PRIRODA, GAUSSIAN… ЭФФЕКТИВНОСТЬ - ПЕРЕНОСИМОСТЬ - ПРОДУКТИВНОСТЬ


Слайд 6

Статический анализ структуры программ Это можно исполнять параллельно


Слайд 7

Статический анализ структуры программ А это - только последовательно


Слайд 8


Слайд 9

Динамический анализ структуры программ


Слайд 10

Пиковая производительность. Проект Blue Gene Процессор - 1 Gflops 32 процессора на кристалле 64 кристалла на плате 8 плат в стойке 64 стойки в проекте $100 M 1Pflops = 1015flops


Слайд 11

Что снижает производительность? (CRAY C90, T90) закон Амдала время разгона конвейера секционирование векторных команд конфликты в памяти каналы процессор-память операции чтения/записи в векторные регистры ограниченное число векторных регистров несбалансированное использование устройств отсутствие операции деления перезагрузка буферов команд ...


Слайд 12

Что снижает производительность? Производительность CRAY C90 на операции ai = bi+ci*d


Слайд 13

Оптимизация программы LIU_FTC для компьютеров CRAY Y-MP C90 Моделирование устойчивости плазмы в установках управляемого термоядерного синтеза (General Atomics, San-Diego, USA; данные с действующей установки D III-D) 490 подпрограмм и функций, более 37000 строк Время работы 1 итерации исходного варианта - 437 с. (QSL: 257 с., NNL:63 с., QSLH: 6.4 с.) Время работы 1 итерации нового варианта - 65.6 с. (QSL: 11.8 с., NNL: 5 с., QSLH: 1.4 с.)


Слайд 14

Структуризация предметной области: в идеале - энциклопедия, минимум - справочник. Формирование среды общения профессионалов Центр создан при поддержке РФФИ Информационно-аналитический Центр в сети Интернет WWW.PARALLEL.RU


Слайд 15

Параллельные вычисления - погоня за эффективностью В.В.Воеводин, Вл.В.Воеводин 1. Что скрывает обыкновенный компьютер 2. Как повышают производительность компьютеров 3. Параллельные вычислительные системы 4. Большие задачи и параллельные вычисления 5. Параллельное программирование 6. Статический анализ и преобразование программ 7. Отображение задач вычислительной математики на архитектуру вычислительных систем 8. Пользователь в среде параллелизма


Слайд 16


Слайд 17


Слайд 18

Метакомпьютинг


Слайд 19

Учебно-научный центр МГУ по высокопроизводительным вычислениям Команда специалистов Высокопроизводительные ресурсы Поддержка научных исследований Учебный процесс Инфраструктура поддержки пользователей Инфраструктура программного обеспечения Организационно-методическая работа Информационная поддержка


×

HTML:





Ссылка: