'

Визуализация в распределенных системах

Понравилась презентация – покажи это...





Слайд 0

Визуализация в распределенных системах Институт математического моделирования Российской академии наук mail: lira@imamod.ru web: http://lira.imamod.ru Нижний Новгород 2009 М.В.Якобовский


Слайд 1

Особенности момента Потребность в суперкомпьютерах высока Эффективность использования суперкомпьютеров низка: Использование каждого ядра последовательной программой составляет проценты и доли процентов Обмены, синхронизация и другие дополнительные операции ещё снижают эффективность параллельной программы Есть минимальный объем вычислений на процессорное ядро, определяющий максимальное число используемых ядер За счет многопроцессорности проблематично сокращать время моделирования физического процесса, но можно повышать сложность решаемой задачи, например за счет увеличения размеров и детальности представления изучаемых объектов


Слайд 2

JSCC MSU Оперативная память Кеш Операционные устройства Множественный доступ Бета-тестер


Слайд 3

4 Вычислительная среда Выбор математической модели и солверов. Сопоставление атрибутам начальных и граничных условий, физических параметров. Выбор сервера вычислений Выбор сервера визуализации Проект Построение геометрической модели, поверхностной и объемной сетки. Задание атрибутов. Формирование варианта задания Расчет варианта задания Файлы результатов Визуализация результатов


Слайд 4

Визуализация Скалярные Векторные Стационарные Зависящие от времени Решетки Треугольные и тетраэдральные сетки сетки Большие


Слайд 5

Этапы визуализации Запись Сетка Сеточная функция Чтение Формирование объектов виртуальной сцены Отображение


Слайд 6

Клиент-серверная технология Аппроксимация и потоковая обработка VISIT ParaView EnSight OpenDX Отображение Расчет Запись результатов Копирование всех данных Чтение Формирование сцены Чтение Формирование сцены TecPlot Origin


Слайд 7

Методы Распределенное иерархическое хранение Декомпозиция Огрубление с контролируемой точностью Клиент-серверная технология Потоковая обработка Хранение образов


Слайд 8

Обтекание самолета Сетка Изоповерхности


Слайд 9


Слайд 10


Слайд 11


Слайд 12


Слайд 13


Слайд 14


Слайд 15


Слайд 16


Слайд 17


Слайд 18

Расчетная сетка


Слайд 19

Огрубление поверхностей


Слайд 20

Огрубление поверхностей


Слайд 21

Двухуровневое разбиение Сетка предварительно разбивается на большое число микродоменов, образующих макрограф Вершины макрографа распределяются по процессорам I II


Слайд 22

Потоковая обработка 40 процессоров, полное чтение файла 40 процессоров, чтение фрагментов файла


Слайд 23

Изоповерхности Ошибка аппроксимации 5%


Слайд 24

Огрубление 3D-данных


Слайд 25

Огрубление 3D-данных


Слайд 26

27 Сечение регулярной 3D сетки плоскостью В результате сечения регулярной кубической решетки получается фрагмент неструктурированной сетки


Слайд 27

28 Аппроксимация триангулированных поверхностей Алгоритмы синтеза Алгоритмы редуцирования


Слайд 28

Начальная аппроксимация кривой


Слайд 29

Аппроксимация кривой этап 2 1 вектор


Слайд 30

Аппроксимация кривой этап 3 3 вектора


Слайд 31

Аппроксимация кривой этап 4 7 векторов


Слайд 32

Аппроксимация кривой этап 5 15 векторов


Слайд 33

34 Методы редуцирования Удаление ребра Удаление точки Уточнение топологии


Слайд 34

35 Аппроксимация изоповерхностей


Слайд 35

36 Плоскость, пересекающая цилиндр Ошибка аппроксимации 5%


Слайд 36

Многоуровневое огрубление больших сеток


Слайд 37

Распределенная визуализация


Слайд 38

39 Моделирование течения вокруг летательного аппарата


Слайд 39

40 Изоповерхности поля плотности RemoteViewer Tecplot


Слайд 40

Тетраэдральные сетки 108 узлов


Слайд 41

42


Слайд 42

43 Заполнение пространства пирамидами На каждую из 2n точек в среднем опирается 2n пирамид Число пирамид ~ n2


Слайд 43

Зависимость объема хранимых данных от числа микродоменов 38 350 -> 2 356 196 узлов 219 034 * 82 -> 14 018 176 тетраэдров На 35% больше чем 124


Слайд 44

Нерегулярная тетраэдральная сетка 45 110 533 834 узлов 659 316 736 тетраэдров 2 589 184 поверхностных треугольников Время выполнения программы на 100 процессорах МВС-15000ВМ составляет 270 секунд (с учетом записи данных на диск). Время равномерного измельчения – 30 секунд. Дисковое пространство 12.33 Гб


Слайд 45

Библиотека ввода-вывода Ввод-вывод тетраэдральных сеток Хранение микродоменов Хранение макрографа Ввод-вывод регулярных решеток Хранение фрагментов сеток Хранение сеточных функций


Слайд 46

Записи двух сеточных 2d функций Функция F1 Функция F2 Рисунок 2.


Слайд 47

Групповое сжатие вещественных чисел Перегруппировка байт Сжатие байт стандартной библиотекой zlib Обнуление младших бит мантиссы


Слайд 48

Отсечение младших бит мантиссы f=x2+y2+z2 23 106 427 байт 10^9 узлов - 113 354 035 байт – 0.1% - 0.92 битa на узел 10^9 узлов: 1000 блоков по 10^6 узлов 3.54 ? бинарный без компрессии без огрубления компрессия без огрубления 49 3.141592 3.14159 3.1415 3.141 3.14


Слайд 49

Огрубление данных 50


Слайд 50

Моделирование процессов охлаждения CPU


Слайд 51

CPU Процессор, охлаждаемый медным радиатором Мощность 65Вт 10мм ~1.4мм Толщина 0.3мм 7мм …… 97.5мм, 78 медных пластин 100мм …… Поток воздуха: T=20C, .004-.005 м3/с Cu 30x30 мм 35мм до границы


Слайд 52

Зависимость эффективности от числа ядер Конфигурация: 78 тонких ребер (0.3 мм) на радиаторе Сетка: 1000 х 3500 х 150 = 525 млн. Параллельная реализация: MPI + нити (8 нитей на узле)


Слайд 53


Слайд 54

Изоповерхности температуры: Т=20.5, 21, 22.5 С сетка 800*700*120=67,2 млн. узлов


Слайд 55


Слайд 56


Слайд 57


Слайд 58

Зависимость коэффициента сжатия от числа усеченных бит 28 244 379 w101_reduced 12.bjn 22 340 718 w101_reduced 13.bjn 17 228 023 w101_reduced 14.bjn 13 339 249 w101_reduced 15.bjn 5 171 208 w101_reduced 16.bjn 3 321 150 w101_reduced 17.bjn 2 213 949 w101_reduced 18.bjn 1 471 818 w101_reduced 19.bjn 793 457 w101grid.bjn Сетка: 1000 х 3500 х 150 = 525 млн узлов


Слайд 59

Параллельные библиотеки http://www.imamod.ru SDLB - динамическая балансировка (0D) MCoarse - огрубление сеток (2D, 3D) BjnIOlib - ввод-вывод регулярных сеток TMLlib - ввод-вывод неструктурированных сеток LRND - генерация псевдослучайных чисел PSORT - параллельная сортировка


Слайд 60

Якобовский М.В. д.ф.-м.н., зав. сектором «Программного обеспечения многопроцессорных систем и вычислительных сетей» Института математического моделирования Российской академии наук mail: lira@imamod.ru http://lira.imamod.ru


Слайд 61


×

HTML:





Ссылка: