Логотип Автор24реферат
Задать вопрос
Реферат на тему: Метод моментов проверки гипотез
100%
Уникальность
Аа
34197 символов
Категория
Метрология
Реферат

Метод моментов проверки гипотез

Метод моментов проверки гипотез .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

Введение

В задачах прикладного значения зачастую требуется по выборочным наблюдениям сделать некоторое заключение касаемо интересующих практика характеристик генеральной совокупности или о величинах неизвестных параметров данной совокупности, из которой эта выборка сделана. В данном случае, речь идет о проверке этих предположений или так называемых – статистических гипотез.
В работе ученого, проводящего какие-либо эксперименты, наиболее существенным является – решение вопроса о том, что и как можно было бы извлечь из наблюдений за случайной величиной (и выборочных её значений) для использования в будующем.
Научный современный подход к решению статистических задач в последнее время основан на использовании непараметрической статистики, а не традиционных, классических методах, которые используются только при заранее известных закономерностях. Но в обоих случаях самой важной задачей опытного ученого является проверка выдвинутых им предположений (гипотез).
Фундаментальную основу для решения подобных задач составляет математическая статистика.
Математическая статистика – наука, которая основана на изучении методов исследования законов распределения в массовых случайных процессах по данным, полученным из некоторого числа наблюдений за ними [7].
Выведенные на основании данных методов зависимости относятся не к отдельным экспериментам, из повторения которых складывается данный процесс, а представляют собой выводы об общих вероятностных характеристиках этого явления (процесса).
В качестве данных характеристик могут быть характеристиками вероятность, плотность распределения вероятности, математическое ожидание, дисперсия и др..
Полученные зависимости позволяют построить вероятностную модель изучаемого явления. Примение к этой модели методов теории вероятностей, позволяет решать разного направления задачи (технические или экономические), например, определять вероятность надежной работы оборудования в течение определенного периода времени.
В соответствии с чем, можно сделать вывод о том, что – теория вероятностей по выстроенной модели процесса предполагает его течение, а математическая статистика по полученным результатам эксперимента – строит его вероятностную модель. В этом заключается плотная взаимосвязь между данными теориями [6].
Для определения закона случайного массового явления необходимо провести отбор и анализ статистических сведений, т.е. сведений, характеризующих отдельные единицы данного процесса.
Методы научной статистики довольно широко используются при анализе разных явлений и процессов. Скажем, если сравнивать некоторые методики лечения, или разные способы инвестирования финансовых средств, а также технических измерений и технологических процессов, ставятся вопросы об результативности новых методов обучения, управления, о достоверности математической модели и др. Перед проведением опыта ученый должен четко сформулировать предположение или гипотезу, подлежащих изучению [8].
Таким образом, если по результатам выполненных опытов требуется проверить некоторую гипотезу относительно генеральной совокупности и сформулировать обоснованный вывод, то для этого используется анализ или статистическая проверка гипотез (предположений).

1. Основы теории проверки статистических гипотез

Понятие гипотеза подразумевает – некоторое предположение о параметрах известных распределений (параметрическая) или о виде неизвестного закона распределения (непараметрическая) некоторых случайных величин, выдвигаемое в качестве предварительного объяснения [11].
Предположительное утверждение относительно генеральной совокупности, проверяемое по выборочным данным, называется статистической гипотезой [9].
Теория и способы проверки статистических гипотез является базовым инструментом доказательной, а не интуитивной основы.
Необходимо различать статистические гипотезы и обыкновенные предположения. Они в первую очередь отличаются тем, что статистических гипотез всегда как минимум две и они противопоставляются друг другу. Первая из гипотез это та, которую предполагают опровергнуть – называется нулевая гипотеза Н0, а вторая – называется альтернативная гипотеза Н1 [4].
Основной вопрос заключается именно в первой (нулевой) гипотезе и её необходимо сформулировать или построить так, чтобы была определенная возможность найти интересующие статиста-практика вероятности в условиях истинности данного предположения.
Предположим, что мы исследуем игральный кубик, т.е. – проверяем его на симметричность. Очевидно, что в виде нулевой гипотезы будет предположение о полной симметрии кубика.
В соответствии с чем, если нулевая гипотеза Н0 достоверна, то вероятности выпадения всех шести цифр на гранях будут одинаковы – по 1/6. Но, а если нулевая гипотеза — это предположение об асимметрии кубика, то это не имело бы практического значения, так как мы ничего бы не смогли сказать о значениях вероятностях выпадения цифр на кубике.
Основной принцип, по которому принимается решение об отклонении или принятии нулевой гипотезы H0, называется критерием.
Непосредственно сама проверка статистической гипотезы основана в том, что всё выборочное пространство делится на две взаимодополняющие области: критическую – Sкр (область неправдоподобных значений) и область допустимых правдоподобных значений Sкр. В зависимости от типа альтернативной гипотезы H1 различают односторонние, где критическая область с одной стороны и двухсторонние критерии, где две критические области. После этого по выборке x1,...,xn определяют специально составленную выборочную характеристику – критическую статистику θкр (x1,x2,...,xn), точное или приблизительное распределение которой известно [10]. Для данного распределения по специальным таблицам определяют точки θкр.н и θкр.в (в случае двухсторонней критической области) или точка θкр (в случае односторонней критической области), разделяющие критическую область Sкр и область допустимых значений Sкр.
Для одностороннего критерия область принятия нулевой гипотезы ограничена только с одной стороны (сверху или снизу), в связи с чем, необходимо определить квантиль уровня 1-α, или квантиль уровня α. Для двухстороннего критерия область принятия нулевой гипотезы имеет два ограничения – сверху (квантиль уровня 1-α/2) и снизу (квантиль уровня α / 2).
После этого определяется эмпирическое значение статистики θэмп подстановкой в θкр конкретных выборочных значений. Если θэмп ∈ Sкр, то основная гипотеза отклоняется и принимается альтернативная гипотеза. Если же θэмп ∈ Sкр, то делается заключение о том, что нет оснований для отклонения основной гипотезы [10].
Так как статист работает с выборочными данными, которые попадают из генеральной совокупности случайным образом, то можно совершить следующие ошибки (табл.1).
Таблица 1.
гипотеза H 0 не отвергается отвергается
верна правильное решение ошибка 1-го рода
не верна ошибка 2-го рода правильное решение

В случае, если верной является нулевая гипотеза, но будет принята альтернативная гипотеза, то данная ошибка называется ошибкой первого рода. Вероятность P (H1 / H0) = α допустить ошибку 1-го рода называется уровнем значимости критерия [7].
Ошибка второго рода – это утверждение нулевой гипотезы в то время, когда в реальности достоверной является альтернативная гипотеза.
Вероятность допустить ошибку 2-го рода: P (H0 / H1) = β .
При реализации этапов проверки гипотез необходимо минимизировать значения всех ошибок (обоих родов), но в практике это не всегда представляется возможным: при ограниченном объёме выборки можно минимизировать лишь что-нибудь одно – или α или β, при этом другая будет становиться больше. В связи с этим поступают следующим образом: фиксируют вероятность ошибки первого рода на каком-то определённом уровне (обычно для α используют стандартные значения, например, равные 0,05 или 0,01), а вероятность ошибки второго рода – стараются свести к минимуму [7].
Вероятность не допустить ошибку 2-го рода P (H1 / H1) =1-P(H0/H1) =1- β имеет определение – мощностью критерия.
Оптимальным критерием признается такой, в результате использования которого при заданном уровне значимости α достигается – максимальное значение функции мощности критерия 1- β (задача Неймана-Пирсона) [7].
Если пользоваться определением – статистический контроль качества продукции, то вероятность α можно трактовать как «риски производителя», т.е. вероятность по результатам выборочного контроля забраковать всю партию изделий, удовлетворяющую стандарту; а вероятность β - «риск покупателя» - вероятность приёмки некачественной продукции.
Процесс анализа сформулированной гипотезы с имеющимися выборочными данными, производится при помощи статистического критерия, который называется – статистической проверкой гипотезы [7].
По своему прикладному значению статистические гипотезы можно подразделить на следующие основные виды:
- о значениях числовых параметров;
- о тождестве числовых характеристик генеральных совокупностей;
- об однородности выборок генеральных совокупностей;
- о стохастической независимости элементов выборки;
- о согласии экспериментального (эмпирического) распределения и выбранной математической модели.

2

Зарегистрируйся, чтобы продолжить изучение работы

. Определение основных методов проверки гипотез

Иногда при работе с некоторыми массивами данных требуется сравнить их и определить вызвано ли различие в числовых характеристиках этих групп систематическими или случайными факторами. Для нахождения решения таких задач в математической статистике имеется 2 варианта – параметрические и непараметрические методы [2].
Методы обработки, основанные на предположении, что результаты экспериментов имеют закон распределения, принадлежащий тому или иному параметрическому семейству – нормальному или показательному –называются параметрическими.
Проверка гипотез о равенстве числовых характеристик генеральных совокупностей – это есть параметрические методы проверки гипотез об однородности выборок. Методы обработки, в которых не расматривается использование какого-то параметрического семейства, называют непараметрическими. Их применяют в том случае, когда приходится работать с обработкой данных, распределение которых не определено или не подчиняется какому-либо из известных законов распределения [2]. В случае, если заключение необходимо делать по малым выборкам, и закон распределения неизвестен, то невозможно применение критериев, связанных с параметрами распределения.
Непараметрические критерии имеют некоторые преимущества, такие как – более широкая сфера применения и меньшая чувствительность к «шуму» в статистических данных и к влиянию некоторых ошибок, попавших в экспериментальные данные. В свою очередь параметрические критерии обладают большей мощностью. И по данной причине, в случаях, когда выборки имеют нормальное распределение, необходимо отдавать предпочтение – параметрическим критериям.

3. Параметрические критерии

При решении задачи о наличии расхождений между определенными выборками – выполняют проверку статистических гипотез о принадлежности этих выборок – генеральной совокупности или о равенстве средних. Если вид или функция распределения известны, то задача оценки различий двух групп независимых наблюдений – решается с использованием параметрических критериев, таких как [11]:
- критерия Стьюдента (при сравнении средние значений выборок);
- критерия Фишера (при сравнении дисперсий).
Критерий Стьюдента. Известный математик Вильям Госсет под псевдонимом «Стьюдент», нашёл следующий закон распределения случайной величины [11]:
,
где основной параметр σ заменен на его выборочную оценку s, а –математическое ожидание. Этот закон, имеет непрерывную функцию распределения, и описывается следующей формулой [11]:

где C - константа, зависящая только от числа степеней свободы n -1.
Данный закон положил начало создания теории «Малой выборки». При большом объёме выборки особенность распределения в генеральной совокупности не имеет особого значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда является нормальным. При небольших объемах выборки (n≤30) на распределении ошибок – будет влиять характер распределения генеральной совокупности.
Это распределение Стьюдента зависит от двух значений: 1) - t и 2)- числа степеней свободы k = n -1. С увеличением числа наблюдений n – это распределение приближается к стандартному нормальному (с параметрами a = 0 и σ = 1). Так уже при n ≥ 30 распределение Стьюдента не отличается от стандартизированного нормального распределения. Для практического использования распределения Стьюдента имеются таблицы, в которых содержатся критические значения t для разных уровней значимости α и k - чисел степеней свободы [11].
Допустим, если необходимо сопоставить средние арифметические x и y двух разных выборок с объемами значений n1 и n2, взятые из нормально распределенных совокупностей с параметрами a1, σ1и a2, σ2.
Для этого выдвигается предположение, что σ1 и σ2 не известны и разница между средними d=x-y появилась случайно. В качестве нулевой гипотезы выдвигается следующее предположение H0: a1 = a2.
Для проверки основной гипотезы используется случайная величина

которая подчиняется распределению Стьюдента с числом степеней свободы k = n1 + n2 - 2. Здесь sd - ошибка разности между выборочными средними. Эта величина вычисляется по следующим формулам [11]:
- для выборок одинакового объёма (n1 = n2 = n):

- для неравновеликих выборок (n1 ≠ n2):

При a1 = a2 разность a1 - a2 = 0, поэтому критерий будет иметь вид:

При альтернативной гипотезе H1: a1≠a2 верхняя критическая точка находится по специальной таблице как квантиль уровня 1-α/2, а нижняя критическая точка расположена симметрично относительно верхней оси ординат: Tкр.н=-Tкр.в. Если Tэмп<Tкр.н или Tэмп>Tкр.в, то нулевая гипотеза отклоняется с вероятностью ошибки первого рода α .
В случае, если анализируемые выборки имеют попарно взаимосвязанные значениями варьирующего признака, то при оценке различий между ними используется метод парных сравнений сопряженных вариант. В данном случае оценкой разности между генеральными средними D=a1-a2 и дисперсией разности σD2 будет являться выборочная средняя из суммы разностей между попарно связанными вариантами сравниваемых групп x1,x2 , ...,xn и y1,y2 ,..., yn [11]:


где n - число парных значений.
Таким образом, выборочная дисперсия будет равна

а ошибка средней разности будет рассчитываться как:


В случае, если варианты генеральной совокупности распределены нормально, то разность между ними будет соответствовать нормальному закону распределения. тогда случайная величина

будет иметь распределение Стьюдента с k = n -1 степенями свободы.
Для нулевой гипотезы H0: D=0 и альтернативной H1: D > 0 статистика критерия [11]:

Если Tэмп = Tкр(α, n -1), то нулевая гипотеза отклоняется с вероятностью ошибки первого рода α.
Ну а если гипотеза о нормальности распределения попарных разностей окажется отвергнутой, то критерий Стьюдента не следует применять. В таких случаях необходимо оперировать непараметрическими критериями.

4. Непараметрические критерии

При исследовании статистических данных не во всех случаях изучаемый признак подчиняется нормальному закону распределения. Бывает, что информации о законе распределения сравниваемых выборок недостаточно. В таких случаях применяют непараметрические критерии [2].
Одно из существующих определений гипотезы об однородности выборок – это предположение о совпадении законов распределения, описывающих разные выборки.
При лимитированном объёме статистической информации одним из путей повышения достоверности – является объединение имеющихся выборок в одну совокупность. Однако для этого необходимо убедиться в правильности применения данных действий, т.е. доказать однородность этих выборок.
Виды непараметрических критериев для сравнения выборок приведены на рис.1 [2].

Рисунок 1 – Виды статистических непараметрических критериев
Рассмотрим алгоритмы применения некоторых непараметрических критериев для некоторых связанных выборок.
T -критерий Уайта. Данный критерий применяется с целью определения достоверности различий, наблюдаемых при сравнении двух независимых результатов, полученных по шкале порядка [2].
Порядок применения критерия:
1. Результаты опытной и контрольной групп объединяют в один общий вариационный ряд и ставят в порядке неубывания, затем устанавливают им ранги (порядковый номер места, которое варианта занимает в упорядоченном ряду);
2. Данные ранги складывают отдельно для каждой группы;
3. Если сопостовляемые результаты контрольной и опытной групп практически не отличаются друг от друга, то суммы их рангов должны быть равны между собой, и наоборот, чем значительнее расхождение между имеющимися результатами, тем больше разница между суммами их рангов;
4. Достоверность различий между суммами рангов оценивается T - критерием Уайта по специальным таблицам [1]: в качестве эмпирического значения берётся меньшая из сумм рангов и сравнивается с табличным значением критерия. Если Tэмп ≥ Tкр, то это указывает на недостоверность различий между группами.
Другой критерий – Критерий Ван-дер-Вардена, также, как и предыдущий относится к группе ранговых критериев и применяется для сравнения выборок равновеликого и неравновеликого объема

50% реферата недоступно для прочтения

Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥

Магазин работ

Посмотреть все
Посмотреть все
Больше рефератов по метрологии:

Ответственность за нарушение законодательства в области метрологии

11072 символов
Метрология
Реферат
Уникальность

Методы и средства измерения твердости

18102 символов
Метрология
Реферат
Уникальность

Технический регламент "О безопасности маломерных судов"

24558 символов
Метрология
Реферат
Уникальность
Все Рефераты по метрологии
Закажи реферат

Наш проект является банком работ по всем школьным и студенческим предметам. Если вы не хотите тратить время на написание работ по ненужным предметам или ищете шаблон для своей работы — он есть у нас.