'

Тема 14. Непараметрические критерии. Проверка однородности

Понравилась презентация – покажи это...





Слайд 0

17 февраля 2016 г. Тема 14. Непараметрические критерии. Проверка однородности 14.1. Критерий знаков 14.2. Знако-ранговый критерий 14.3. Критерий Манна-Уитни 14.4. Критерий Вилкоксона


Слайд 1

Параметрические и непараметрические критерии Такие статистические критерии, как z, t и F называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез о типе распределения. Кроме этого, статистики разработали направление, которое развивает непараметрические критерии. В этом случае вид и параметры распределения не рассматриваются. Эти критерии используют, в частности, для исследования генеральных совокупностей, которые не распределены нормально.


Слайд 2

Четыре преимущества непараметрических методов Они могут использоваться для проверки гипотез о параметрах генеральной совокупности, когда переменная не распределена нормально. Они могут использоваться для номинальных и порядковых данных. Они могут использоваться для проверки гипотез, которые не связаны с параметрами генеральной совокупности. В большинстве случаев для непараметрических методов подсчеты проще, чем для параметрических. Они более понятны.


Слайд 3

Три недостатка непараметрических методов Они менее точны, чем соответствующие параметрические методы. Следовательно, требуются более значительные отклонения, чтобы отвергнуть нулевую гипотезу. Они менее информативны, чем параметрические критерии. Например, критерий знаков позволяет исследователю определить, превосходит значение данных медиану или нет, но не отвечает – на сколько именно. Они менее эффективны, чем соответствующие параметрические критерии. Например, непараметрический критерий знаков дает лишь 60% эффективности от того, что можно получить, используя его параметрическое соответствие – z-критерий. Требуется больший объем выборки, чтобы компенсировать утрату информации: нужна выборка из 100 человек для критерия знаков, в то время, как для аналогичных результатов при использовании z-критерия достаточно было бы выборки из 60 человек.


Слайд 4

Сравнение эффективности Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально распределенной генеральной совокупности.


Слайд 5

17 февраля 2016 г. 14.1. Критерий знаков Sign Test


Слайд 6

Пример 1. Кадровые предпочтения Руководство сети ресторанов быстрого обслуживания обратило внимание, что кадровая служба сети отдает большее предпочтение на должность менеджера девушкам, нежели, чем юношам. Среди менеджеров оказалось 30 юношей и 70 девушек. Усомнившись в разумности сложившихся пропорций, руководство запросило объяснений. Кадровая служба объяснила сложившуюся пропорцию результатом случайности, а не итогом определенных предпочтений. Проверить на уровне значимости ?=0,05, может ли такая пропорция оказаться результатом случайности.


Слайд 7

Пример 2. Строительство башни Несколько детей попросили из предоставленных им кубиков собрать башню. Эксперимент повторили с этими же детьми через месяц, результаты времени (в секундах) представлены в таблице ниже. На уровне значимости ?=0,05 проверить предположение о том, что нет существенной разницы между результатами.


Слайд 8

Пример 3. В день 40 леденцов Владелец продуктового магазина строит гипотезу о том, что медианное количество продаваемых им за день леденцов равно 40. Случайная выборка за 20 дней дает следующие данные по количеству леденцов, продаваемых каждый день. При ? = 0,05 проверить гипотезу владельца магазина.


Слайд 9

Кадровые предпочтения В день 40 леденцов Строительство башни Критерий знаков Критерий знаков Гипотеза об однородности для парных выборок Гипотеза о значении медианы Гипотеза о доли признака


Слайд 10

На чем основан критерий Последовательность n знаков разностей представляет собой последовательность случайных величин - результатов независимых испытаний с двумя возможными исходами: “плюс” или “минус”. Если распределения совпадают, то в каждом испытании выполнено: Количество плюсов и количество минусов есть случайные величины, которые распределены по биноминальному закону. Малое количество одинаковых знаков (плюсов или минусов) или, наоборот, очень большое будет означать, что наша гипотеза неверна, поскольку, исходя их ситуации, количество плюсов и количество минусов должно быть в среднем одинаково.


Слайд 11

Условия для применения критерия 1. Данные должны быть получены случайным образом. 2. Нет никаких требований относительно закона распределения генеральных совокупностей, из которых эти данные получены.


Слайд 12

Статистика 1. Объем выборки n?25. Выбираем в качестве критерия: x = min (количество минусов, количество плюсов). Критические значения находятся по таблице. Если x окажется меньше или равен критическому значению из таблицы, то гипотеза отвергается. 2. Объем выборки n>25. Тогда в качестве критерия выберем: Критические значения находятся по таблице нормального закона.


Слайд 13

Решение примера. Строительство башни Гипотезы: H0: изменений не произошло H1: есть изменения Имеем 12 плюсов, 2 минуса и 1 совпадение. Совпадение отбрасываем. n=14 ?=0,05 х = min(2,12) = 2 По таблице находим критическое значение 2. Вывод. Результаты улучшились.


Слайд 14

Решение примера. Кадровые предпочтения Гипотезы: H0: доля юношей в генеральной совокупности равна 0,5 H1: доля юношей значимо отличается от 0,5 Выборка составила 100 человек: n=100. Статистика: x = min (30, 70) = 30 Поскольку n>25, вычислим значение критерия по формуле: Для ?=0,05 находим z = -1,96. (Двустороння область) 0 -3,9 -1,96


Слайд 15

Решение примера. Кадровые предпочтения Вывод. Поскольку значение статистики попало в критическую область, мы отвергаем основную гипотезу и считаем, что кадровые предпочтения имеются. Дополнительный вопрос. Имеется возможность ответить на вопрос – какое соотношение юношей и девушек не приведет к отклонению нулевой гипотезы? Элементарный подсчет приведет к тому, что граничной окажется ситуация с пропорцией, близкой к 40?60 или 60?40. В этих границах отклонение может рассматриваться как результат случайности.


Слайд 16

Решение примера. В день 40 леденцов Гипотезы: H0: медиана равна 40 H1: медиана значимо отливается от 40 Совпадения отбрасываем. n=18, ?=0,05, х = min (3,15) = 3 По таблице находим критическое значение 4. Вывод. У нас достаточно оснований, чтобы отказаться от заявления, о том, что медиана продаваемых в день леденцов равна 40. 3 плюса, 15 минусов, 2 совпадения


Слайд 17

Критические значения для критерия знаков 0 14 2 Критическая область для ?=0,05 Таблица А-7.


Слайд 18

17 февраля 2016 г. 14.2. Знако-ранговый критерий Wilcoxon Signed-Ranks Test for Matched Pairs


Слайд 19

Что проверяет критерий Знако-ранговый критерий проверяет гипотезу об однородности для парных выборок. Требуется проверить, совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Часто проверяют наличие эффекта обработки: совпадение распределений «до» и «после» обработки. Гипотезы формулируются следующим образом: H0: выборки имеют одинаковый закон распределения H1: законы распределения различаются


Слайд 20

Условия применения критерия 1. Исследуются парные (зависимые) выборки, проверяется эффект обработки – эксперименты «до» и «после». 2. Данные должны быть получены случайным образом. 3. Генеральная совокупность разностей имеет симметричное распределение, в том смысле, что правая часть графика является зеркальным отражением левой. При этом не требуется, чтобы данные имели нормальное распределение.


Слайд 21

Последовательность действий Шаг 1. Для каждой пары (x, y) рассматриваются разности d = x – y. Устраняются пары, в которых разность равна нулю. Шаг 2. Ранжируем полученные разности по абсолютной величине (игнорируя знаки). Шаг 3. Находим сумму отрицательных рангов и сумму положительных рангов. Если выборки однородны, то эти суммы не могут сильно отличаться. Обозначим T – наименьшую из полученных сумм, n – число пар, в которых разности не равны нулю. Шаг 4. Определим статистику: если n?30, статистика есть T, если n>30, статистика есть:


Слайд 22

Последовательность действий (2) Шаг 5. Определим критические значения: если n?30, критические точки T находятся по таблице А-8, если n>30, критические z-точки находятся по таблице А-2. Шаг 6. Получим вывод: если значение статистики попадает в критическую область, мы отклоняем нулевую гипотезу.


Слайд 23

Решение примера. Строительство башни


Слайд 24

Решение Шаг 1. В таблице заполнен столбец разностей d = Исп.1 – Исп.2. Устранена первая пара, в которой разность равна нулю. Шаг 2. Следующий столбец заполняем рангами разностей по абсолютной величине (игнорируя знаки). Шаг 3. Далее: сумма отрицательных рангов = 5,5 сумма положительных рангов = 99,5 число пар, в которых разности не равны нулю, n =14 Шаг 4. Определим статистику. Поскольку n?30, статистика есть T=5,5 Шаг 5. Определим критическое значение. Поскольку n?30, критическое значение 21. Шаг 6. Вывод: значение статистики попало в критическую область. Отклоняем нулевую гипотезу.


Слайд 25

Критические значения знако-рангового критерия Таблица А-8. 26 Критическая область для ?=0,05 0


Слайд 26

17 февраля 2016 г. 14.3. Критерий Манна-Уитни Mann-Whitney Test for Two Independent Samples


Слайд 27

Что проверяет критерий Манна-Уитни Критерий Манна-Уитни проверяет гипотезу об однородности для двух независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Гипотезы формулируются следующим образом: H0: выборки взяты из одной генеральной совокупности H1: выборки взяты из разных генеральных совокупностей


Слайд 28

Последовательность действий Шаг 1. В критерии Манна-Уитни сравниваются все элементы первой выборки со всеми элементами второй. Всего есть mn пар сравнений. Не рассматриваются пары, в которых разность равна нулю. Шаг 2. Количества положительных разностей, полученных в результате таких сравнений для каждой выборки, сравниваются между собой и минимальное есть U - статистика Манна-Уитни. Шаг 3. Зададим уровень значимости ? (как правило 0,1; 0.05; 0.01). Шаг 4. По таблицам найдем границу правосторонней критической области, которая зависит от объемов выборок и заданного нами уровня значимости. Шаг 5. Сравним полученное по выборкам значение статистики с границей критической области и сделаем вывод.


Слайд 29

Задача. Длина побегов Исследователь интересуется, имеется ли разница между всхожестью семян на двух соседних участках земли. Имеются следующие данные:


Слайд 30

От данных к анализу


Слайд 31

Выбор переменных для анализа Указываем группы для анализа


Слайд 32

Отчет об анализе Mann-Whitney Test 99 0 41


Слайд 33

Вычисление U в таблице Ведем подсчет случаев уч.1 > уч.2 при сравнениях по всем парам чисел. Заполняем столбец 2. Если пара совпадает, принимаем при подсчете за 0,5. Выбираем минимальное из чисел 58 и 41. 41 есть значение U критерия, полученное по выборкам.


Слайд 34

17 февраля 2016 г. 14.4. Критерий Вилкоксона Wilcoxon Rank-Sum Test for Two Independent Samples


Слайд 35

Что проверяет критерий Вилкоксона Критерий Вилкоксона проверяет гипотезу об однородности для двух независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Гипотезы формулируются следующим образом: H0: выборки взяты из одной генеральной совокупности H1: выборки взяты из разных генеральных совокупностей


Слайд 36

Последовательность действий Шаг 1. Перемешиваем две выборки и ранжируем их значения. Шаг 2. Найдем сумму рангов первой и сумму рангов второй выборки. Если выборки однородны, то суммы не должны сильно отличаться. На этом основано действие критерия Вилкоксона. Шаг 3. Определим критерий: если n?10, статистика W есть сумма рангов первой выборки. если n>10, статистика есть:


Слайд 37

Последовательность действий (2) - объемы выборок, R – сумма рангов первой выборки. есть среднее значение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения есть стандартное отклонение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения


Слайд 38

Последовательность действий (3) Шаг 4. Зададим уровень значимости ? (как правило 0,1; 0.05; 0.01). Шаг 5. Определим критическую область: если n?10, критические точки W находятся по специальной таблице, которую мы не приводим. если n>10, критические z-точки находятся по таблице А-2 (поскольку статистика основывается на нормальном распределении) Шаг 6. Сравним полученное по выборкам значение статистики с границей критической области и сделаем вывод.


Слайд 39

Пример. Простота чтения Проверить гипотезу об однородности двух независимых выборок. Можно ли считать, что простота чтения одинакова для произведений двух исследуемых писателей?


Слайд 40

Решение примера Ранжировали две выборки, перемешав. Нашли сумму рангов каждой выборки. Сумма рангов первой выборки равна 236,5.


Слайд 41

Вычисления Находим следующие величины:


Слайд 42

Получение вывода Критическая область является двусторонней и при ?=0.05 критические точки z=-1,96 и z=-1,96. Полученное нами значение попадает в критическую область. Вывод. Выборки не однородны, получены из разных генеральных совокупностей.


Слайд 43

Решаем в SPSS


Слайд 44

Вновь вспомним о растениях Mann-Whitney Test 210 0 86 -1,96 1,96 -0,646


Слайд 45

Сравнение эффективности Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально распределенной генеральной совокупности.


Слайд 46

Понятия и термины


Слайд 47

Задание на 5 минут Как вы понимаете, что такое эффект взаимодействия. Что с чем взаимодействует? Поясните на любом примере, где можно наблюдать эффект взаимодействия.


Слайд 48

Задачи 14-1. Кворум избирателей. При опросе 1002 человек 701 из них сказал, что собирается идти голосовать на выборах президента. Можно ли полагать, что большинство населения придет на выборы? 14-2. Аренда квартиры. Агент по продаже недвижимости предполагает, что средняя арендная плата за однокомнатную квартиру в городе составляет $325 в месяц. Выборка 12 однокомнатных квартир показала следующие месячные расценки. При ?=0,05 достаточно ли у нас оснований, чтобы опровергнуть заявление агента по продаже недвижимости?


Слайд 49

Задачи 14-3. Один дома. Из 50 опрошенных студентов 29 предпочитали бы жить в общежитиях в одноместной комнате. При ?=0,02 проверьте гипотезу о том, что более 50% студентов предпочитают жить в общежитиях в одиночку. Применить критерий знаков. 14-4. Повлияло ли лечение? Было проведено исследование, чтобы выяснить, повлияют ли новые диетические медикаменты на женщин, желающих сбросить вес. Вес 8 пациенток был измерен до лечения и через 6 недель ежедневного применения лечения. Данные приведены ниже. При ? = 0,05 можно ли сделать вывод, что лечение повлияло (увеличило или уменьшило) на вес этих женщин? Применить критерий знаков.


Слайд 50

Задачи 14-5. Изменения в отношениях. Восьми супружеским парам была предложена анкета на супружескую совместимость. После прохождения парами семинара, им дали вторую анкету, чтобы выяснить, произошли ли какие-либо изменения в их поведении по отношению друг к другу. Данные приведены ниже. При ? = 0,10 есть ли различия в результатах пар?


Слайд 51

Задачи 14-6. Мужчины и женщины. Для сравнения уровня заработной платы были отобраны (в соответствии со стажем) работники-мужчины и работники-женщины. В таблице ниже приведены получившиеся данные (в тысячах рублей). При ? = 0,10 есть ли различие в зарплатах мужчин и женщин?


Слайд 52

Задачи 14-7. Однородность. Проверить гипотезу об однородности следующих выборок:


Слайд 53

Задачи 14-8. Читают ли замужние? Исследователь опросил замужних и одиноких женщин, чтобы проверить, есть ли разница в том, сколько книг те и другие прочитали в течение прошлого года. Данные приведены ниже. При ?=0,10 проверьте заявление о том, что обе группы прочли одинаковое количество книг.


Слайд 54

Задачи 14-9. Кто больше любит свою работу? Двум группам рабочих дали вопросники, чтобы установить степень их удовлетворенности работой. Задавалась шкала диапазоном от 0 до 100. Группы делились по стажу: те, кто работал более 5 лет, и те, кто работал менее 5 лет. Данные приведены ниже. При ?=0,10, проверьте заявление о том, что между удовлетворенностью работой двух групп нет разницы.


Слайд 55

Задачи 14-10. Как работают одинокие? Инспекторам было поручено оценить продуктивность работы служащих. Исследователь хочет узнать, у кого она выше: у людей, живущих в браке, или у одиноких? Диапазон шкалы оценки продуктивности составляет от 1 до 50. Данные приведены ниже. При ?=0,01 достаточно ли у нас оснований, чтобы подтвердить это заявление?


×

HTML:





Ссылка: