Критерий стьюдента рассчитывается как. Основные статистики и t-критерий Стьюдента

Excel для Office 365 Excel для Office 365 для Mac Excel 2019 Excel 2016 Excel 2019 для Mac Excel 2013 Excel 2010 Excel 2016 для Mac Excel для Mac 2011 Excel Online Excel для iPad Excel для iPhone Excel для планшетов с Android Excel для телефонов с Android Excel Mobile Excel Starter 2010 Меньше

Возвращает вероятность, соответствующую t-тесту Стьюдента. Функция СТЬЮДЕНТ.ТЕСТ позволяет определить вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.

Синтаксис

СТЬЮДЕНТ.ТЕСТ(массив1;массив2;хвосты;тип)

Аргументы функции СТЬЮДЕНТ.ТЕСТ описаны ниже.

    Массив1 Обязательный. Первый набор данных.

    Массив2 Обязательный. Второй набор данных.

    Хвосты Обязательный. Число хвостов распределения. Если значение "хвосты" = 1, функция СТЬЮДЕНТ.ТЕСТ возвращает одностороннее распределение. Если значение "хвосты" = 2, функция СТЬЮДЕНТ.ТЕСТ возвращает двустороннее распределение.

    Тип Обязательный. Вид выполняемого t-теста.

Параметры

Замечания

    Если аргументы "массив1" и "массив2" имеют различное число точек данных, а "тип" = 1 (парный), то функция СТЬЮДЕНТ.ТЕСТ возвращает значение ошибки #Н/Д.

    Аргументы "хвосты" и "тип" усекаются до целых значений.

    Если аргумент "хвосты" или "тип" не является числом, то функция СТЬЮДЕНТ.ТЕСТ возвращает значение ошибки #ЗНАЧ!.

    Если аргумент "хвосты" принимает любое значение, отличное от 1 и 2, то функция СТЬЮДЕНТ.ТЕСТ возвращает значение ошибки #ЧИСЛО!.

    Функция СТЬЮДЕНТ.ТЕСТ использует данные аргументов "массив1" и "массив2" для вычисления неотрицательной t-статистики. Если "хвосты" = 1, СТЬЮДЕНТ.ТЕСТ возвращает вероятность более высокого значения t-статистики, исходя из предположения, что "массив1" и "массив2" являются выборками, принадлежащими к генеральной совокупности с одним и тем же средним. Значение, возвращаемое функцией СТЬЮДЕНТ.ТЕСТ в случае, когда "хвосты" = 2, вдвое больше значения, возвращаемого, когда "хвосты" = 1, и соответствует вероятности более высокого абсолютного значения t-статистики, исходя из предположения, что "массив1" и "массив2" являются выборками, принадлежащими к генеральной совокупности с одним и тем же средним.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем - клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Метод позволяет проверить гипотезу о том, что средние значения двух ге­неральных совокупностей, из которых извлечены сравниваемые зависимые вы­борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз­действия и после него. В общем же случае каждому представителю одной вы­борки поставлен в соответствие представитель из другой выборки (они по­парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 - мужья, вы­борка 2 - их жены; выборка 1 - годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны).При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

□ каждому представителю одной выборки (из одной генеральной совокупно­сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

□ данные двух выборок положительно коррелируют (образуют пары);

□ распределение изучаемого признака и в той и другой выборке соответству­ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще­ственно не отличаться от нормального; данные двух измерений, соответству­ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона, если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок - если данные для двух выборок не корре­лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при­знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

(3) где M d – средняя разность значений; σ d – стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп­пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» - дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 - никогда, 5 - в половине случаев, 10 - всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).

Таблица 3

Среднее арифметической для разности M d = (-6)/8= -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d.Подставляем все нужные значения, получаем

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз­ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Ш а г 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж­ду критическими для р = 0,05 и р - 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Ш а г 3. Принимаем статистическое решение и формулируем вывод. Статистичес­кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само­оценки конформизма участников после тренинга увеличился статистически досто­верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержатель­ным выводам, а в случае сравнения средних для независимых выборок срав­нение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль­ных совокупностей, из которых извлечены сравниваемые выборки, отлича­ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных ге­неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще­ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 - большая дисперсия, a σ 2 2- меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос­тальным - обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за­дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват­ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2=σ 2 2).

Были получены следующие данные:


Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен­ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль­шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Ш а г 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо­лее - для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь­но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб­щения об удаче.

/ практикум-статистика / справочные материалы / значения t-критерия стьюдента

Значение t -критерия Стьюдента при уровне значимости 0,10, 0,05 и 0,01

ν – степени свободы вариации

Стандартные значения критерия Стьюдента

Число степеней свободы

Уровни значимости

Число степеней свободы

Уровни значимости

Таблица XI

Стандартные значения критерия Фишера, используемые для оценки достоверности различий между двумя выборками

Степени свободы

Уровень значимости

Степени свободы

Уровень значимости

t-Критерий Стьюдента

t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

t -статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе - выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмешенной оценки дисперсии.

История

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Требование нормальности распределения данных является необходимым для точного t {\displaystyle t} -теста. Однако, даже при других распределениях данных возможно использование t {\displaystyle t} -статистики. Во многих случаях эта статистика асимптотически имеет стандартное нормальное распределение - N (0 , 1) {\displaystyle N(0,1)} , поэтому можно использовать квантили этого распределения. Однако, часто даже в этом случае используют квантили не стандартного нормального распределения, а соответствующего распределения Стьюдента, как в точном t {\displaystyle t} -тесте. Асимптотически они эквивалентны, однако на малых выборках доверительные интервалы распределения Стьюдента шире и надежнее.

Одновыборочный t-критерий

Применяется для проверки нулевой гипотезы H 0: E (X) = m {\displaystyle H_{0}:E(X)=m} о равенстве математического ожидания E (X) {\displaystyle E(X)} некоторому известному значению m {\displaystyle m} .

Очевидно, при выполнении нулевой гипотезы E (X ¯) = m {\displaystyle E({\overline {X}})=m} . С учётом предполагаемой независимости наблюдений V (X ¯) = σ 2 / n {\displaystyle V({\overline {X}})=\sigma ^{2}/n} . Используя несмещенную оценку дисперсии s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) {\displaystyle s_{X}^{2}=\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}/(n-1)} получаем следующую t-статистику:

t = X ¯ − m s X / n {\displaystyle t={\frac {{\overline {X}}-m}{s_{X}/{\sqrt {n}}}}}

При нулевой гипотезе распределение этой статистики t (n − 1) {\displaystyle t(n-1)} . Следовательно, при превышении значения статистики по абсолютной величине критического значения данного распределения (при заданном уровне значимости) нулевая гипотеза отвергается.

Двухвыборочный t-критерий для независимых выборок

Пусть имеются две независимые выборки объемами n 1 , n 2 {\displaystyle n_{1}~,~n_{2}} нормально распределенных случайных величин X 1 , X 2 {\displaystyle X_{1},~X_{2}} . Необходимо проверить по выборочным данным нулевую гипотезу равенства математических ожиданий этих случайных величин H 0: M 1 = M 2 {\displaystyle H_{0}:~M_{1}=M_{2}} .

Рассмотрим разность выборочных средних Δ = X ¯ 1 − X ¯ 2 {\displaystyle \Delta ={\overline {X}}_{1}-{\overline {X}}_{2}} . Очевидно, если нулевая гипотеза выполнена E (Δ) = M 1 − M 2 = 0 {\displaystyle E(\Delta)=M_{1}-M_{2}=0} . Дисперсия этой разности равна исходя из независимости выборок: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 {\displaystyle V(\Delta)={\frac {\sigma _{1}^{2}}{n_{1}}}+{\frac {\sigma _{2}^{2}}{n_{2}}}} . Тогда используя несмещенную оценку дисперсии s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 {\displaystyle s^{2}={\frac {\sum _{t=1}^{n}(X_{t}-{\overline {X}})^{2}}{n-1}}} получаем несмещенную оценку дисперсии разности выборочных средних: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 {\displaystyle s_{\Delta }^{2}={\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}} . Следовательно, t-статистика для проверки нулевой гипотезы равна

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}}

Эта статистика при справедливости нулевой гипотезы имеет распределение t (d f) {\displaystyle t(df)} , где d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) {\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}

Случай одинаковой дисперсии

В случае, если дисперсии выборок предполагаются одинаковыми, то

V (Δ) = σ 2 (1 n 1 + 1 n 2) {\displaystyle V(\Delta)=\sigma ^{2}\left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}

Тогда t-статистика равна:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 {\displaystyle t={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}}{s_{X}{\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}}}~,~~s_{X}={\sqrt {\frac {(n_{1}-1)s_{1}^{2}+(n_{2}-1)s_{2}^{2}}{n_{1}+n_{2}-2}}}}

Эта статистика имеет распределение t (n 1 + n 2 − 2) {\displaystyle t(n_{1}+n_{2}-2)}

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t {\displaystyle t} -критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

T = M d s d / n {\displaystyle t={\frac {M_{d}}{s_{d}/{\sqrt {n}}}}}

где M d {\displaystyle M_{d}} - средняя разность значений, s d {\displaystyle s_{d}} - стандартное отклонение разностей, а n - количество наблюдений

Эта статистика имеет распределение t (n − 1) {\displaystyle t(n-1)} .

Проверка линейного ограничения на параметры линейной регрессии

С помощью t-теста можно также проверить произвольное (одно) линейное ограничение на параметры линейной регрессии, оцененной обычным методом наименьших квадратов. Пусть необходимо проверить гипотезу H 0: c T b = a {\displaystyle H_{0}:c^{T}b=a} . Очевидно, при выполнении нулевой гипотезы E (c T b ^ − a) = c T E (b ^) − a = 0 {\displaystyle E(c^{T}{\hat {b}}-a)=c^{T}E({\hat {b}})-a=0} . Здесь использовано свойство несмещенности МНК-оценок параметров модели E (b ^) = b {\displaystyle E({\hat {b}})=b} . Кроме того, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c {\displaystyle V(c^{T}{\hat {b}}-a)=c^{T}V({\hat {b}})c=\sigma ^{2}c^{T}(X^{T}X)^{-1}c} . Используя вместо неизвестной дисперсии её несмещенную оценку s 2 = E S S / (n − k) {\displaystyle s^{2}=ESS/(n-k)} получаем следующую t-статистику:

T = c T b ^ − a s c T (X T X) − 1 c {\displaystyle t={\frac {c^{T}{\hat {b}}-a}{s{\sqrt {c^{T}(X^{T}X)^{-1}c}}}}}

Эта статистика при выполнении нулевой гипотезы имеет распределение t (n − k) {\displaystyle t(n-k)} , поэтому если значение статистики выше критического, то нулевая гипотеза о линейном ограничении отклоняется.

Проверка гипотез о коэффициенте линейной регрессии

Частным случаем линейного ограничения является проверка гипотезы о равенстве коэффициента b j {\displaystyle b_{j}} регрессии некоторому значению a {\displaystyle a} . В этом случае соответстующая t-статистика равна:

T = b ^ j − a s b ^ j {\displaystyle t={\frac {{\hat {b}}_{j}-a}{s_{{\hat {b}}_{j}}}}}

где s b ^ j {\displaystyle s_{{\hat {b}}_{j}}} - стандартная ошибка оценки коэффициента - квадратный корень из соответствующего диагонального элемента ковариационной матрицы оценок коэффициентов.

При справедливости нулевой гипотезы распределение этой статистики - t (n − k) {\displaystyle t(n-k)} . Если значение статистики по абсолютной величине выше критического значения, то отличие коэффициента от a {\displaystyle a} является статистически значимым (неслучайным), в противном случае - незначимым (случайным, то есть истинный коэффициент вероятно равен или очень близок к предполагаемому значению a {\displaystyle a})

Замечание

Одновыборочный тест для математических ожиданий можно свести к проверке линейного ограничения на параметры линейной регрессии. В одновыборочном тесте это «регрессия» на константу. Поэтому s 2 {\displaystyle s^{2}} регрессии это и есть выборочная оценка дисперсии изучаемой случайной величины, матрица X T X {\displaystyle X^{T}X} равна n {\displaystyle n} , а оценка «коэффициента» модели равна выборочному среднему. Отсюда и получаем выражение для t-статистики, приведенное выше для общего случая.

Аналогично можно показать, что двухвыборочный тест при равенстве дисперсий выборок также сводится к проверке линейных ограничений. В двухвыборочном тесте это «регрессия» на константу и фиктивную переменную, идентифицирующую подвыборку в зависимости от значения (0 или 1): y = a + b D {\displaystyle y=a+bD} . Гипотеза о равенстве математических ожиданий выборок может быть сформулирована как гипотеза о равенстве коэффициента b этой модели нулю. Можно показать, что соответствующая t-статистика для проверки этой гипотезы равна t-статистике, приведенной для двухвыборочного теста.

Также к проверке линейного ограничения можно свести и в случае разных дисперсий. В этом случае дисперсия ошибок модели принимает два значения. Исходя из этого можно также получить t-статистику, аналогичную приведенной для двухвыборочного теста.

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна - Уитни. Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Литература

Student. The probable error of a mean. // Biometrika. 1908. № 6 (1). P. 1-25.

Ссылки

О критериях проверки гипотез об однородности средних на сайте Новосибирского государственного технического университета

Одним из наиболее известных статистических инструментов является критерий Стьюдента. Он используется для измерения статистической значимости различных парных величин. Microsoft Excel обладает специальной функцией для расчета данного показателя. Давайте узнаем, как рассчитать критерий Стьюдента в Экселе.

Но, для начала давайте все-таки выясним, что представляет собой критерий Стьюдента в общем. Данный показатель применяется для проверки равенства средних значений двух выборок. То есть, он определяет достоверность различий между двумя группами данных. При этом, для определения этого критерия используется целый набор методов. Показатель можно рассчитывать с учетом одностороннего или двухстороннего распределения.

Расчет показателя в Excel

Теперь перейдем непосредственно к вопросу, как рассчитать данный показатель в Экселе. Его можно произвести через функцию СТЬЮДЕНТ.ТЕСТ . В версиях Excel 2007 года и ранее она называлась ТТЕСТ . Впрочем, она была оставлена и в позднейших версиях в целях совместимости, но в них все-таки рекомендуется использовать более современную — СТЬЮДЕНТ.ТЕСТ . Данную функцию можно использовать тремя способами, о которых подробно пойдет речь ниже.

Способ 1: Мастер функций

Проще всего производить вычисления данного показателя через Мастер функций.


Выполняется расчет, а результат выводится на экран в заранее выделенную ячейку.

Способ 2: работа со вкладкой «Формулы»

Функцию СТЬЮДЕНТ.ТЕСТ можно вызвать также путем перехода во вкладку «Формулы» с помощью специальной кнопки на ленте.


Способ 3: ручной ввод

Формулу СТЬЮДЕНТ.ТЕСТ также можно ввести вручную в любую ячейку на листе или в строку функций. Её синтаксический вид выглядит следующим образом:

СТЬЮДЕНТ.ТЕСТ(Массив1;Массив2;Хвосты;Тип)

Что означает каждый из аргументов, было рассмотрено при разборе первого способа. Эти значения и следует подставлять в данную функцию.

После того, как данные введены, жмем кнопку Enter для вывода результата на экран.

Как видим, вычисляется критерий Стьюдента в Excel очень просто и быстро. Главное, пользователь, который проводит вычисления, должен понимать, что он собой представляет и какие вводимые данные за что отвечают. Непосредственный расчет программа выполняет сама.

Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Гипотезы бывают разные. Одна из них – это гипотеза о средней (математическом ожидании). Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя (точную правду мы никогда не узнаем, но можем сузить круг поиска).

Общий подход в проверке гипотез описан , поэтому сразу к делу. Предположим для начала, что выборка извлечена из нормальной совокупности случайных величин X с генеральной средней μ и дисперсией σ 2 (знаю-знаю, что так не бывает, но не нужно меня перебивать!). Средняя арифметическая из этой выборки, очевидно, сама является случайной величиной. Если извлечь много таких выборок и посчитать по ним средние, то они также будут иметь с математическим ожиданием μ и

Тогда случайная величина

Возникает вопрос: будет ли генеральная средняя c вероятностью 95% находиться в пределах ±1,96s x̅ . Другими словами, являются ли распределения случайных величин

эквивалентными.

Впервые этот вопрос был поставлен (и решен) одним химиком, который трудился на пивной фабрике Гиннеса в г. Дублин (Ирландия). Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения.

Собрав математическое обоснование и рассчитав значения функции обнаруженного им распределения, химик из Дублина Уильям Госсет написал заметку, которая была опубликована в мартовском выпуске 1908 года журнала «Биометрика» (главред – Карл Пирсон). Т.к. Гиннесс строго-настрого запретил выдавать секреты пивоварения, Госсет подписался псевдонимом Стьюдент.

Несмотря на то что, К. Пирсон уже изобрел распределение , все-таки всеобщее представление о нормальности еще доминировало. Никто не собирался думать, что распределение выборочных оценок может быть не нормальным. Поэтому статья У. Госсета осталась практически не замеченной и забытой. И только Рональд Фишер по достоинству оценил открытие Госсета. Фишер использовал новое распределение в своих работах и дал ему название t-распределение Стьюдента . Критерий для проверки гипотез, соответственно, стал t-критерием Стьюдента . Так произошла «революция» в статистике, которая шагнула в эру анализа выборочных данных. Это был краткий экскурс в историю.

Посмотрим, что же мог увидеть У. Госсет. Сгенерируем 20 тысяч нормальных выборок из 6-ти наблюдений со средней () 50 и среднеквадратичным отклонением (σ ) 10. Затем нормируем выборочные средние, используя генеральную дисперсию :

Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты. Изобразим на диаграмме фактическое (Norm) и теоретическое (ENorm) распределение частот выборочных средних.

Точки (наблюдаемые частоты) практически совпадают с линией (теоретическими частотами). Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия – это лишь ошибки выборки.

Проведем новый эксперимент. Нормируем средние, используя выборочную дисперсию .

Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения. Обозначим эмпирическое частоты средних, скажем, через букву t .

Видно, что распределения на этот раз не очень-то и совпадают. Близки, да, но не одинаковы. Хвосты стали более «тяжелыми».

У Госсета-Стьюдента не было последней версии MS Excel, но именно этот эффект он и заметил. Почему так получается? Объяснение заключается в том, что случайная величина

зависит не только от ошибки выборки (числителя), но и от стандартной ошибки средней (знаменателя), которая также является случайной величиной.

Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить (или узнать) из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:

1. средняя и выборочная дисперсия s 2 являются независимыми величинами;

2. соотношение выборочной и генеральной дисперсии, умноженное на количество степеней свободы, имеет распределение χ 2 (хи-квадрат) с таким же количеством степеней свободы, т.е.

где k – количество степеней свободы (на английском degrees of freedom (d.f.))

На этом законе основывается множество других результатов в статистике нормальных моделей.

Вернемся к распределению средней. Разделим числитель и знаменатель выражения

на σ X̅ . Получим

Числитель – это стандартная нормальная случайная величина (обозначим ξ (кси)). Знаменатель выразим из теоремы Фишера.

Тогда исходное выражение примет вид

Это и есть в общем виде (стьюдентово отношение). Вывести функцию его распределения можно уже непосредственно, т.к. распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам.

Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Все равно ей никто не пользуется, т.к. вероятности приведены в специальных таблицах распределения Стьюдента (иногда называют таблицами коэффициентов Стьюдента), либо забиты в формулы ПЭВМ.

Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента.
Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин

где ξ распределена по стандартному нормальному закону, а χ 2 k подчиняется распределению χ 2 c k степенями свободы.

Таким образом, формула критерия Стьюдента для средней арифметической

Есть частный случай стьюдентова отношения

Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы.

При k > 30 t-критерий практически не отличается от стандартного нормального распределения.

В отличие от хи-квадрат, t-критерий может быть одно- и двухсторонним. Обычно пользуются двухсторонним, предполагая, что отклонение может происходить в обе стороны от средней. Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность, т.к. при фиксированном уровне значимости критическое значение немного приближается к нулю.

Условия применения t-критерия Стьюдента

Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, т.к. сам по себе происходит из предположения о нормальном распределении исходных данных. Если данные не являются нормальными (что обычно и бывает), то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения.

Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы.

Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.

Отличие довольно заметно в малых выборках до 15-20-ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения – это, конечно, нехорошо, но некритично.

Больше всего t-критерий «боится» выбросов, т.е. аномальных отклонений. Возьмем 20 тыс. нормальных выборок по 15 наблюдений и в часть из них добавим по одному случайном выбросу.

Картина получается нерадостная. Фактические частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей.

Итак, в не очень малых выборках (от 15-ти наблюдений) t-критерий относительно устойчив к ненормальному распределению исходных данных. А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. Часто из выборки удаляют все значения, выходящие за пределы ±2 стандартных отклонения от средней.

Пример проверки гипотезы о математическом ожидании с помощью t- критерия Стьюдента в MS Excel

В Excel есть несколько функций, связанных с t-распределением. Рассмотрим их.

СТЬЮДЕНТ.РАСП – «классическое» левостороннее t-распределение Стьюдента. На вход подается значение t-критерия, количество степеней свободы и опция (0 или 1), определяющая, что нужно рассчитать: плотность или значение функции. На выходе получаем, соответственно, плотность или вероятность того, что случайная величина окажется меньше указанного в аргументе t-критерия.

СТЬЮДЕНТ.РАСП.2Х – двухсторонне распределение. В качестве аргумента подается абсолютное значение (по модулю) t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия, т.е. фактический уровень значимости (p-level).

СТЬЮДЕНТ.РАСП.ПХ – правостороннее t-распределение. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Если t-критерий положительный, то полученная вероятность – это p-level.

СТЬЮДЕНТ.ОБР – используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы. На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Поэтому для левого хвоста нужен сам уровень значимости α , а для правого 1 — α .

СТЬЮДЕНТ.ОБР.2Х – обратное значение для двухстороннего распределения Стьюдента, т.е. значение t-критерия (по модулю). Также на вход подается уровень значимости α . Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, т.к. достаточно указать лишь два диапазона с данными и еще пару параметров. На выходе получим p-level.

ДОВЕРИТ.СТЬЮДЕНТ – расчет доверительного интервала средней с учетом t-распределения.

Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: средняя масса () составила 50,3кг, среднеквадратичное отклонение (s ) – 0,5кг.

Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг? Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка.

Краткое условие в обще принятых обозначениях выглядит так.

H 0: μ = 50 кг

H 1: μ ≠ 50 кг

Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению (или не сильно от него отличается). Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двухсторонний t-критерий.

Вначале применим допотопные средства: ручной расчет t-критерия и сравнение его с критическим табличным значением. Расчетный t-критерий:

Теперь определим, выходит ли полученное число за критический уровень при уровне значимости α = 0,05. Воспользуемся таблицей t-распределения Стьюдента (есть в любом учебнике по статистике).

По столбцам идет вероятность правой части распределения, по строкам – число степеней свободы. Нас интересует двухсторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: 1 — 0,05/2 = 0,975. Количество степеней свободы – это объем выборки минус 1, т.е. 9 — 1 = 8. На пересечении находим табличное значение t-критерия – 2,306. Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, т.к. t-распределение на небольших выборках имеет более приплюснутый вид.

Сравниваем фактическое (1,8) и табличное значение (2.306). Расчетный критерий оказался меньше табличного. Следовательно, имеющиеся данные не противоречат гипотезе H 0 о том, что генеральная средняя равна 50 кг (но и не доказывают ее). Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-level попробовать найти, но он будет приближенным. А, как правило, именно p-level используется для проверки гипотез. Поэтому далее переходим в Excel.

Готовой функции для расчета t-критерия в Excel нет. Но это и не страшно, ведь формула t-критерия Стьюдента довольно проста и ее можно легко соорудить прямо в ячейке Excel.

Получили те же 1,8. Найдем вначале критическое значение. Альфа берем 0,05, критерий двухсторонний. Нужна функция обратного значения t-распределения для двухсторонней гипотезы СТЬЮДЕНТ.ОБР.2Х.

Полученное значение отсекает критическую область. Наблюдаемый t-критерий в нее не попадает, поэтому гипотеза не отклоняется.

Однако это тот же способ проверки гипотезы с помощью табличного значения. Более информативно будет рассчитать p-level, т.е. вероятность получить наблюдаемое или еще большее отклонение от средней 50кг, если эта гипотеза верна. Потребуется функция распределения Стьюдента для двухсторонней гипотезы СТЬЮДЕНТ.РАСП.2Х.

P-level равен 0,1096, что больше допустимого уровня значимости 0,05 – гипотезу не отклоняем. Но теперь можно судить о степени доказательства. P-level оказался довольно близок к тому уровню, когда гипотеза отклоняется, а это наводит на разные мысли. Например, что выборка оказалась слишком мала для обнаружения значимого отклонения.

Пусть через некоторое время отдел контроля снова решил проверить, как выдерживается стандарт заполняемости мешков. На этот раз для большей надежности было отобрано не 9, а 25 мешков. Интуитивно понятно, что разброс средней уменьшится, а, значит, и шансов найти сбой в системе становится больше.

Допустим, были получены те же значения средней и стандартного отклонения по выборке, что и в первый раз (50,3 и 0,5 соответственно). Рассчитаем t-критерий.


Критическое значение для 24-х степеней свободы и α = 0,05 составляет 2,064. На картинке ниже видно, что t-критерий попадает в область отклонения гипотезы.

Можно сделать вывод о том, что с доверительной вероятностью более 95% генеральная средняя отличается от 50кг. Для большей убедительности посмотрим на p-level (последняя строка в таблице). Вероятность получить среднюю с таким или еще большим отклонением от 50, если гипотеза верна, составляет 0,0062, или 0,62%, что при однократном измерении практически невозможно. В общем, гипотезу отклоняем, как маловероятную.

Расчет доверительного интервала с помощью t-распределения Стьюдента

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов . Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости α , стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия
2. Более современным, рассчитав p-level, добавив степень уверенности при отклонении гипотезы.
3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия). Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю посмотреть видеоролик о том, как проводить расчеты, связанные с t-критерием Стьюдента в Excel.

/-Критерий Стьюдента относится к параметрическим, следовательно, его использование возможно только в том случае, когда результаты эксперимента представлены в виде измерений по двум последним шкалам -- интервальной и отношений . Проиллюстрируем возможности критерия Стьюдента на конкретном примере.

Предположим, вам необходимо выяснить эффективность обучения стрельбе по определенной методике. С этой целью проводится сравнительный педагогический эксперимент, где одна группа (экспериментальная), состоящая из 8 человек, занимается по предлагаемой экспериментальной методике, а другая (контрольная) -- по традиционной, общепринятой. Рабочая гипотеза заключается в том, что новая, предлагаемая вами методика окажется более эффективной. Итогом эксперимента является контрольная стрельба из пяти выстрелов, по результатам которых (табл. 6) нужно рассчитать достоверность различий и проверить правильность выдвинутой гипотезы.

Таблица 6

Что же необходимо сделать для расчета достоверности различий по /-критерию Стьюдента?

1. Вычислить средние арифметические величины X для каждой группы в отдельности по следующей формуле:

где Xt -- значение отдельного измерения; я -- общее число измерений в группе.

Проставив в формулу фактические значения из табл. 6, получим:

Сопоставление среднеарифметических величин доказывает, что в экспериментально^ группе данная величина (X, = 35) выше, чем в контрольной (Хк = 27). Однако для окончательного утверждения того, что занимающиеся экспериментальной группы научились стрелять лучше, следует убедиться в статистической достоверности различий (/) между рассчитанными среднеарифметическими значениями.

2. В обеих группах вычислить стандартное отклонение (5) по следующей формуле:

:де Ximax -- наибольший показатель; Ximm -- наименьший показатель; К -- табличный коэффициент. Порядок вычисления стандартного отклонения (5): -- определить Xitrax в обеих группах; -- определить Ximia в этих группах; -- определить число измерений в каждой группе (л); -- найти по специальной таблице (приложение 12) значение коэффициента К, который соответствует числу измерений в группе (8). Для этого в левом крайнем столбце под индексом (и) находим цифру 0, так как количество измерений в нашем примере меньше 10, а в верхней строке -- цифру 8; на пересечении этих строк -- 2,85, что соответствует значению коэффициента.АГпри 8 испыту--- подставить полученные значения в формулу и произвести необходимые вычисления:

3. Вычислить стандартную ошибку среднего арифметического значения (т) по формуле:

Для нашего примера подходит первая формула, так как п < 30. Вычислим для каждой группы значения:

4. Вычислить среднюю ошибку разности по формуле:

5. По специальной таблице (приложение 13) определить досто верность различий. Для этого полученное значение (t) сравнивает ся с граничным при 5 %-ном уровне значимости (t0fi5) ПРИ числе степеней свободы/= пэ + пк - 2, где пэк пк~ общее число индивидуальных результатов соответственно в экспериментальной иконтрольной группах. Если окажется, что полученное в эксперименте t больше граничного значения (/0)о5)> т0 различия между средними арифметическими двух групп считаются достоверными при 50 %-ном уровне значимости, и наоборот, в случае когда полученное t меньше граничного значения t0<05, считается, что раз личия недостоверны и разница в среднеарифметических показателях групп имеет случайный характер. Граничное значение при 5 %-ном уровне значимости (Г0>05) определяется следующим образом:

вычислить число степеней свободы/= 8 + 8 - 2 = 14;

найти по таблице (приложение 13) граничное значение tofi5 при/= 14.

В нашем примере табличное значение tQ<05 = 2,15, сравним его с вычисленным Г, которое равно 1,7, т.е. меньше граничного значения (2,15). Следовательно, различия между полученными в эксперименте средними арифметическими значениями считаются недостоверными, а значит, недостаточно оснований для того, чтобы говорить о том, что одна методика обучения стрельбе оказалась эффективнее другой. В этом случае можно записать: / = 1,7 при/» > 0,05, это означает, что в случае проведения 100 аналогичньгх экспериментов вероятность (р) получения подобных результатов, когда средние арифметические величины экспериментальных групп окажутся выше контрольных, больше 5 %-ного уровня значимости или меньше 95 случаев из 100. Итоговое оформление таблицы с учетом полученных расчетов и с приведением соответствующих параметров может выглядеть следующим образом.

При сравнительно больших числах измерений условно принято считать, что если разница между средними арифметическими показателями равна или больше трех своих ошибок, различия считаются достоверными. В этом случае достоверность различий определяется по следующему уравнению:

Как уже говорилось в начале этого раздела, /-критерий Стью-дента может применяться только в тех случаях, когда измерения сделаны по шкале интервалов и отношений. Однако в педагогических исследованиях нередко возникает потребность определять Достоверность различий между результатами, полученными по Шкале наименований или порядка. В таких случаях используются непараметрические критерии. В отличие от параметрических непараметрические критерии не требуют вычисления определенных параметров полученных результатов (среднего арифметического, стандартного отклонения и т.п.), чем в основном и связаны их названия. Рассмотрим сейчас два непараметрических критерия для определения достоверности различий между независимыми результатами, полученными по шкале порядка и наименований.

Похожие публикации