:
«Все три выборки принадлежат одной генеральной совокупности или разным генеральным совокупностям с равными средними арифметическими» (если гипотеза H
неверна, то параметр I
оказывает существенное влияние на D
).
Уровень значимости p есть вероятность необоснованно (ошибочно) отвергнуть (считать неверной) гипотезу H0. Проведем расчеты отдельно для данных из работы Линна и для данных, полученных из имитационной модели.
Анализ данных из работы Линна показывает, что вероятность необоснованного отклонения нулевой гипотезы крайне мала: ?9,44 .10
(см. таблицу 1). Следовательно с большой степенью уверенности (1 – p ? 1) можно утверждать, что значения параметра D
зависят от значений параметра I
на основе данных, собранных в (Lynn, Vanhanen, 2002).
Таблица 1[5 - В таблице 1, в столбце SS представлены результаты расчета:– внутригрупповой дисперсии (Columns), характеризующей изменение средних в каждой из трех групп различных значений параметра Ii;– межгрупповой дисперсии (Error), характеризующей рассеяние значений Di вне влияния фактора Ii;– общей выборочной дисперсии (Total).В столбце df приведено число степеней свободы по каждому виду дисперсии. В столбце MS – среднее значение суммы квадратов разностей по каждому виду дисперсии, определяемое как отношение SS/df. В столбце F – значение статистики Фишера для MS. Значение уровня значимости p(Prob > F) для рассчитанного значения статистики F приведено в последнем столбце.]
Оценим характер влияния I
на D
. На рисунке 3 проиллюстрируем результат обработки данных из (Lynn, Vanhanen, 2002) в виде графика box plot («ящик с усами»). На этом рисунке вдоль оси Ох размещены три уровня фактора I
: «низкий», «средний» и «высокий» в соответствующем порядке. Для каждого из трех уровней фактора I
нарисован «ящик с усами» (фигура синего цвета – «ящик», пунктирные вертикальные прямые – «усы»). Горизонтальная линия («талия» у ящика) обозначает медиану выборки значений параметра D
, соответствующих уровню фактора I
(«низкий», «средний» и «высокий»). Как видно из рисунка 3, уровням фактора I
соответствуют следующие значения медианы D
: «низкий» – 0,017, «средний» – 0,065, «высокий» – 0,2. Нижняя и верхняя границы каждого из ящиков иллюстрируют первую и третью квантили q
и q
для выборки D
соответственно[6 - В промежутки значений [0, q
] и [q
, 1] попадает по 25 % от общего числа точек D
из выборки.]. Длина усов каждого из ящиков определяются значениями: нижняя – 9-й процентили, верхняя – 91-й процентили. Данные, выходящие за пределы усов (выбросы), отображаются на графике в виде крестиков.
Рис. 3. Box plot для значений D
при соответствующем уровне фактора I
, полученных из (Lynn, Vanhanen, 2002)
На основе анализа рисунка 3 можно сделать выводы:
1. С ростом значения I
растет медиана значений D
.
2. С ростом значения I
увеличиваются как значения квантилей q
, q
, 9-й и 91-й процентили, так и расстояние между ними, т. е. увеличивается разброс значений D
.
3. Распределение значений D
в выборке становится более симметричным относительно своей медианы с ростом I
.
Приведем результаты аналогичных процедур обработки для данных, полученных в имитационной модели (таблица 2, рисунок 4).
Таблица 2[7 - Столбцы в таблице 2 аналогичны столбцам в таблице 1.]
Так же, как и в случае данных из (Lynn, Vanhanen, 2002), вероятность необоснованного отклонения гипотезы Н
весьма мала, ?7,59.10
(см. таблицу 2). Следовательно, так же как и в предыдущем случае, с большой степенью уверенности (1 – p ? 1) можно утверждать, что значения параметра D
полученные с помощью имитационной модели, зависят от значений параметра I
. Оценим характер этого влияния, используя график box plot для данных имитационной модели (см. рисунок 4).
Рис. 4. Box plot для значений D
при соответствующем уровне фактора I