Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона рассчитывается по формуле:

, (1)

где — значения, принимаемые переменной X,

— значения, принимаемые переменной У;

— средняя по X,

— средняя по Y.

Расчет коэффициента корреляции Пирсона подразумевает, что переменные Х и Y распределены нормально.

Формула (1)подразумевает, что из каждого значения пе­ременной X, должно вычитаться ее среднее значение . Это не­удобно Коэффициент корреляции Пирсона. Потому для расчета коэффициента корреляции исполь­зуют не формулу (1), а ее аналог, получаемый из этой формулы про­стыми преобразованиями:

, (2)

где

и ,

либо модификацию этой формулы:

. (3)

В формуле (1)встречается величина . (4)

При делении на п (число значений переменной Х либо Y) она именуется ковариацией. Выражение (4) может быть подсчи­тано исключительно в тех случаях, когда число Коэффициент корреляции Пирсона значений переменной X равно числу значений переменной У и равно п. Формула (4) подразумевает также, что при расчете коэффициентов корреля­ции нельзя произвольно переставлять элементы в коррелируемых столбцах.

Для внедрения коэффициента корреляции Пирсона, необхо­димо соблюдать последующие условия:

1. Сравниваемые переменные должны быть получены в интер­вальной шкале либо шкале отношений Коэффициент корреляции Пирсона.

2. Рассредотачивания переменных X и У должны быть близки к нор­мальному.

3. Число варьирующих признаков в сравниваемых переменных X и У должно быть схожим.

4. Таблицы уровней значимости для коэффициента корреляции Пирсона (таблица 20 Приложения) рассчитаны от п = 5 до п = 1000. Оценка уровня значимости по таблицам осуществ­ляется при числе степеней свободы Коэффициент корреляции Пирсона .

Линейная регрессия

Связь меж переменными величинами может быть описана различными методами. К примеру, эту связь можно обрисовать при помощи раз­личных коэффициентов корреляции (линейных, личных, кор­реляционного дела и т.п.). В то же время эту связь можно выразить по-другому: как зависимость меж аргументом (вели­чиной) X ифункцией Y. В Коэффициент корреляции Пирсона данном случае задачка будет состоять в на­хождении зависимости вида Y = F(X) либо, напротив, в нахож­дении зависимости вида Х= F(Y). При всем этом изменение функции зависимо от конфигураций 1-го либо нескольких аргументов именуется регрессией.

Графическое выражение регрессионного уравнения именуют линией регрессии. Линия регрессии выражает лучшее пред Коэффициент корреляции Пирсона­сказание зависимой переменной (Y) по независящим перемен­ным (А). Эти независящие переменные, а их может быть много, носят заглавие предикторов.

Регрессию выражают при помощи 2-ух уравнений регрессии, которые в самом ординарном случае смотрятся, как уравнения пря­мой, а конкретно так:

(1) (2)

В уравнении (1) Y— зависимая переменная, а X Коэффициент корреляции Пирсона — незави­симая переменная, а0 свободный член, а а1— коэффициент регрессии, либо угловой коэффициент, определяющий наклон полосы регрессии по отношению к осям координат.

В уравнении (2) X — зависимая переменная, a Y — незави­симая переменная, b0 свободный член, а b1 — коэффициент регрессии, либо угловой коэффициент, определяющий наклон полосы регрессии по отношению к осям координат Коэффициент корреляции Пирсона.

Полосы регрессии пересекаются в точке , с координа­тами, надлежащими средним арифметическим значениям корреляционно связанных меж собой переменных Х и Y. Линия АВ, проходящая через точку О, соответствует линейной функци­ональной зависимости меж переменными величинами X и У, когда коэффициент корреляции меж Х иУ равен . При всем этом наблюдается такая закономерность Коэффициент корреляции Пирсона: чем посильнее связь меж­ду X и У, тем поближе обе полосы регрессии к прямой АВ, и, на­оборот, чем слабее связь меж этими величинами, тем больше полосы регресии отклоняются от прямой АВ. При отсутствии свя­зи меж X и Y полосы регрессии оказываются под прямым Коэффициент корреляции Пирсона углом по отношению друг к другу и в данном случае .

Количественное представление связи (зависимости) меж X и Y (меж Y и X) именуется регрессионным анализом. Основная задачка регрессионного анализа заключается, в нахождении коэффициентов а0, b0, а1и b1 и определении уровня значимости приобретенных аналитических выражений (1) и (2), связывающих меж собой переменные Коэффициент корреляции Пирсона X и Y.

При всем этом коэффициенты регрессии а1и b1 демонстрируют, на­сколько в среднем величина одной переменной меняется при изменении на единицу меры другой. Коэффициенты регрессии а1 и b1в уравнении (1), (2) можно подсчитать по формулам:

, (3) (4)

где - коэффициент корреляции меж переменными X и Y;

Sx — среднеквадратическое отклонение, подсчитанное для Коэффициент корреляции Пирсона переменной X;

Sу — среднеквадратическое отклонение, подсчитанное для переменной Y.

Коэффициент корреляции рассчитывается по формуле:

(*)

либо ее модификация

(см параграф коэффициент Пирсона)

Коэффициенты регрессии можно вычислить также без под­счета среднеквадратических отклонений по последующим фор­мулам:

, (5) (6)

В этом случае, если неизвестен коэффициент корреляции, коэф­фициенты регрессии можно вычислить по последующим формулам:

, (7) (8)

Величины а Коэффициент корреляции Пирсона1, b1 и взаимосвязаны. Более того, зная две из их — всегда мож­но получить третью. К примеру, зная величины а1и b1 можно просто получить ;

(9)

Формула (9) очень принципиальна, так как она позволяет по из­вестным значениям коэффициентов регрессии а1и b1 опреде­лить коэффициент корреляции, и, не считая того, сравнивая Коэффициент корреляции Пирсона вы­числения по формулам (*) и (9), можно проверить пра­вильность расчета коэффициента корреляции. Как и коэффици­ент корреляции, коэффициенты регрессии охарактеризовывают толь­ко линейную связь и при положительной связи имеют символ плюс, при отрицательной — символ минус.

В свою очередь свободные члены а0и b0 вуравнениях регрессии придется Коэффициент корреляции Пирсона вычислять по последующим формулам. Для подсчета свободного члена а0уравнения регрессии (1) употребляется формула:

(10)

Для подсчета свободного члена b0уравнения регрессии (2) употребляется формула:

(11)

Вычисления по формулам (7), (8), (10) и (11) дос­таточно сложны, потому при расчетах коэффициентов регрессии употребляют, обычно, более обычной способ - способ меньших квадратов. Он заключается в решении 2-ух систем уравнений. При Коэффициент корреляции Пирсона решении одной системы на­ходятся величины а0и а1, и при решении другой — b0 и b1.

Вид системы уравнений для нахождения величин а0и а1такой:

(12)

Вид системы уравнений для нахождения величин — b0 и b1 такой:

(13)

Для внедрения способа линейного регрессионного анализа не­обходимо соблюдать последующие условия:

1. Сравниваемые переменные Коэффициент корреляции Пирсона X и У должны быть измерены в шкале интервалов либо отношений.

2. Подразумевается, что переменные Х и У имеют обычный за­кон рассредотачивания.

3. Число варьирующих признаков в сравниваемых переменных должно быть схожим.


kodi-nagtasanandreas-rabota-s-pogodoj-i-vremenem.html
kodi-obnaruzhivayushie-oshibki.html
kodi-pravilnih-otvetov.html