'

Использование графических ускорителей при решении задач обработки текстов

Понравилась презентация – покажи это...





Слайд 0

Использование графических ускорителей при решении задач обработки текстов Афонин С.А. Сыроватский Д.А. 1.11.2011 МГУ им.М.В.Ломоносова


Слайд 1

План Что такое GPU и CUDA Алгоритмы анализа данных Задачи обработки текстов


Слайд 2

GPU и CUDA GPU = Graphic Processing Unit CUDA = Computing Unified Device Architecture


Слайд 3

Почему графические ускорители (GPU)?


Слайд 4


Слайд 5


Слайд 6


Слайд 7

Внешний вид


Слайд 8

Графические процессоры


Слайд 9


Слайд 10

#2 in Top500: NEBULAE 1.27 PFlops Linpack 2.9 PFlops peak


Слайд 11

CUDA – почти С Единственное отличие – добавления для работы с потоками


Слайд 12

Архитектура CUDA SIMD мультипроцессоры (8 или 16 ядер) Мультипроцессор имеет регистры и разделяемую (локальную) память Задача разбивается на блоки, блоки — на потоки Блоки назначаются на процессоры; выполненный блок невозможно запустить повторно


Слайд 13

Общая для элементов блока Персональная для элемента блока


Слайд 14


Слайд 15

Персональная для элемента блока 16384 * 32bit 16384 byte 65536 B


Слайд 16


Слайд 17

Алгоритмы анализа данных Выявление ассоциативных зависимостей (Association rule mining, Apriori) Классификация (KNN) Кластеризация (K-means) Уменьшение размерности данных


Слайд 18

Выявление зависимостей I={i1,...,im} — множество атрибутов База данных — набор записей вида (TID, i1, ..., ip) Частотный k-набор — k-подмножество I, элементы которого встречаются более чем в N записях Задача: найти все частотные k-наборы Зависимости: если набор содержит X, то от содержит и x' с вероятностью p


Слайд 19

Алгоритм выявления Найти все частотные 1-наборы Для k=2,... и пока есть новые наборы Построение k-кандидатов: объединение двух частотных (k-1)-наборов с общим (k-2)-префиксом Фильтрация: к-кандидат удаляется, если он содержит не частотное (k-1) подмножество Определение частотности кандидатов


Слайд 20

Классификация Метод ближайших соседей Задана выборка объектов с приписанными метками Для нового объекта вычисляется расстояние до всех объектов выборки Метка нового объекта — самая частотная метка его K ближайших соседей из выборки


Слайд 21

Понижение размерности На вход алгоритма поступает матрица расстояний, принцип действия следующий: На плоскости случайным образом фиксируются точки, попарно соединенные пружинами, длины ненапряженных состояний которых берутся из матрицы расстояний. Затем точки отпускаются, и действующие на них силы приводят потенциальную энергию систему к минимуму. Находятся варианты расположения точек, приводящие к минимуму потенциальной энергии и (или) лучше других удовлетворяющие другим формулам оценки качества распределения. Например, если матрица расстояний строилась по точкам, лежащим на плоскости, то в двумерное пространство точки восстановятся с точностью до поворота и смены знаков осей


Слайд 22

Производительность на GPU: тысячи точек за секунды


Слайд 23


×

HTML:





Ссылка: