Математическая статистика — это наука, которая занимается получением, обработкой и анализом данных, характеризующих количественные закономерности жизни общества в неразрывной связи с их качественным содержанием. Статистика, в узком смысле — это совокупность данных о каком-либо процессе или явлении. Основной задачей математической статистики является выяснение вероятностных свойств совокупности: распределения, числовых характеристик и т. д. с применением методов теории вероятности, позволяющих оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (выборки) Совокупность объектов, или совокупность значений какого-то признака объектов, называется генеральной совокупностью. Обычно из генеральной совокупности делают выборку, т.е. исследуют некоторые ее объекты. Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов. С помощью выборки оценивают генеральную совокупность по вероятным свойствам. Чтобы оценки были достоверными, выборка должна быть представительной, т.е. ее вероятностные свойства должны совпадать или быть близкими к свойствам генеральной совокупности. Часто под генеральной совокупностью понимают и исследуемую случайную величину. Для исследования случайной величины при постоянных условиях выполняются испытания. Совокупность полученных значений также называется выборкой и обрабатывается статистически. Методы статистической обработки выборки аналогичны в обоих случаях. При исследовании объектов можно фиксировать или измерять значение одного или нескольких признаков, т.е. речь может идти об одномерной или многомерной выборках.
Корреляционный анализ
Корреляционная таблица
Две случайные величины могут быть связаны либо функциональной, либо статистической зависимостью, либо быть независимыми. Строгая функциональная зависимость реализуется редко в реальной жизни, так как обе величины или одна из них могут быть подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин. В этом случае возникает статистическая зависимость. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.
Предположим, что рассматриваемые случайные величины Х и У связаны корреляционной зависимостью. Так как при большом числе наблюдений одно и то же значение x может встретиться nx раз, и значения y — ny раз, одна и та же пара чисел (х,у) — nxy раз. Поэтому данные наблюдений группируют, т.е. подсчитывают частоты nx, ny, nxy. Все сгруппированные данные записывают в виде таблицы, которую называют корреляционной.
X|Y |
4527,24 |
5792,65 |
7058,07 |
8323,48 |
9588,89 |
10854,30 |
12119,72 |
13385,13 |
14650,55 |
15915,96 |
17181,38 |
Nx |
0,626667 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0,831333 |
0 |
6 |
2 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
8 |
1,036 |
0 |
0 |
10 |
6 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
16 |
1,240667 |
0 |
0 |
0 |
9 |
6 |
0 |
0 |
0 |
0 |
0 |
0 |
15 |
1,445333 |
0 |
0 |
0 |
0 |
8 |
3 |
0 |
0 |
0 |
0 |
0 |
11 |
1,65 |
0 |
0 |
0 |
0 |
1 |
13 |
2 |
0 |
0 |
0 |
0 |
16 |
1,854667 |
0 |
0 |
0 |
0 |
0 |
1 |
10 |
1 |
0 |
0 |
0 |
12 |
2,059333 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
6 |
2,264 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
1 |
1 |
4 |
2,468667 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
1 |
4 |
2,673333 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
6 |
7 |
Ny |
1 |
6 |
12 |
15 |
15 |
17 |
12 |
6 |
3 |
5 |
8 |
n=100 |