'

Использование ИТ в оценке параметров бинарной выборки

Понравилась презентация – покажи это...





Слайд 0

Использование ИТ в оценке параметров бинарной выборки БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ Кафедра математического моделирования и анализа данных Журавский Вячеслав Сергеевич Научный руководитель Лобач Виктор Иванович


Слайд 1

Введение На практике очень часто возникает потребность оценки каких-либо статистических параметров на основе полученных данных. На современном этапе существует ряд программных средств от языков программирования до готовых программных пакетов, которые позволяют получить такие статистические оценки.


Слайд 2

Программное обеспечение Математические пакеты: Matlab Mathematica Mathcad Maple Статистические пакеты Statistica EViews


Слайд 3

Пакет Mathematica Mathematica относится к системам компьютерной алгебры. Центральное место в системах класса Mathematica занимает машинно-независимое ядро математических операций — Kernel. Для ориентации системы на конкретную машинную платформу служит программный интерфейсный процессор Front End. Kernel Front End


Слайд 4

Возможности Mathemetica Аналитические преобразования Численные расчёты Теория чисел Линейная алгебра Графика и звук


Слайд 5

Интерфейс Mathemetica


Слайд 6

STATISTICA STATISTICA — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В пакете STATISTICA реализованы процедуры для анализа данных(data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization). Программа вычисляет практически все используемые описательные статистики общего характера. Практически все описательные статистики и графики могут быть построены для данных, категоризованных (сгруппированных) по значениям одной или нескольких группирующих переменных. Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных.


Слайд 7

Модули STATISTICA Base — включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа. Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д. Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества. Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык Data Miner — интеллектуальный анализ данных


Слайд 8

Интерфейс STATISTICA


Слайд 9

ЕМ-алгоритм ЕМ-алгоритм — очень общий итеративный алгоритм для МП-оценивания в задачах с неполными данными. В ЕМ-алгоритме формализована относительно старая идея обработки неполных данных: заполнение пропусков оценками пропущенных значений оценивание параметров повторное оценивание пропущенных значений и параметров и так далее до сходимости процесса.


Слайд 10

ЕМ-алгоритм для смесей Первая выборка имеет стандартное нормальное распределение. Вторая имеет нормальное распределение с математическим ожиданием а и дисперсией ?.


Слайд 11

Результаты моделирования Параметры: a = 2, ? = 0,5, ? = 0,5. Вероятность пропуска: pmis=0,4. Объем выборки N=1000. С использованием метода максимального правдоподобия и EM-алгоритма были получены следующие оценки. ММП ЕМ-алгоритм


Слайд 12

Зависимось от количества пропусков Объем выборки N = 400. Вероятность pmis изменялась от 0 до 0,99 с шагом 0,01. а ?


Слайд 13

Заключение Были изучены возможности различных математических пакетов. В качестве основного инструмента при выполнении поставленной задачи был выбран пакет Mathematica. ММП дает неплохие оценки, однако для оценки параметров выборок с пропусками следует использовать EM-алгоритм. с увеличением количества пропусков точность EM-алгоритма падает, однако не так сильно, как ожидалось.


Слайд 14

Список использованных источников В. Дьяконов. Mathematica 5/6/7. Полное руководство. Минск, 2009 В. Дьяконов. Mathematica 5.1/5.2/6 в математических и научно-технических расчетах. Минск, 2008 А. Халафян. Statistica 6. Статистический анализ данных. Минск, 2008 В. Боровиков. STATISTICA. Искусство анализа данных на компьютере. Минск, 2003


Слайд 15

Спасибо за внимание!


×

HTML:





Ссылка: