Функция Excel CORREL - вычисление статистической корреляции

Скачать пример рабочей книги

Загрузите образец книги

В этом руководстве показано, как использовать Функция КОРРЕЛЬ в Excel в Excel для расчета корреляции.

Обзор функции CORREL

Функция CORREL вычисляет корреляцию двух рядов чисел.

Чтобы использовать функцию CORREL Excel Worksheet, выберите ячейку и введите:

(Обратите внимание, как появляются входные данные формулы)

Функция CORREL Синтаксис и входные данные:

1 = КОРРЕЛ (массив1; массив2)

array1 - Массивы чисел.

Что такое функция CORREL?

Функция КОРРЕЛЯЦИИ Excel возвращает коэффициент корреляции (Пирсона р) двух диапазонов данных.

Что такое коэффициент корреляции?

Коэффициент корреляции, обычно называемый коэффициентом Пирсона р (названный в честь Карла Пирсона, человека, который его разработал) - это статистика, которая показывает, насколько сильно связаны две переменные.

Пирсона р - это число между -1 и 1, что может привести к трем возможным интерпретациям: положительная корреляция, отрицательная корреляция и отсутствие корреляции.

Положительная корреляция

Положительная корреляция (р > 0) означает, что когда две переменные находятся в тандеме - когда вы наблюдаете высокий балл по одной переменной, вы, как правило, также наблюдаете высокий балл по другой. Точно так же, когда одна переменная низкая, другая также имеет тенденцию быть низкой.

Например, рост и вес имеют положительную корреляцию. См. Диаграмму ниже, на которой показаны рост и вес небольшой выборки бейсболистов:

В р в этой небольшой выборке 0,73 - очень сильная положительная корреляция. Это имеет логический смысл - более высокие люди в среднем тяжелее, поскольку этот дополнительный рост состоит из костей, мышц и других тканей, которые все что-то весят.

Но корреляция не идеальна (в идеальной корреляции с р из 1 все баллы попадут на линию тренда). Некоторые невысокие люди могут быть тяжелее - возможно, у них немного лишнего жира или они тренируются в тренажерном зале. Точно так же некоторые высокие люди могут быть очень худыми и на самом деле весить меньше, чем многие люди ниже ростом.

Корреляция здесь, вероятно, настолько высока, потому что мы имеем дело со спортсменами, она была бы ниже в общей популяции. Помните об этом при использовании CORREL - р вы получаете не является окончательным - вам нужно подумать о том, что это за данные и как вы их получили, когда делаете свои интерпретации.

Отрицательная корреляция

Отрицательная корреляция (р <0) означает, что когда вы наблюдаете высокий балл по одной переменной, вы, как правило, наблюдаете низкий балл по другой переменной, и наоборот.

Например, результаты тестов учащихся и количество пропусков занятий имеют отрицательную корреляцию. То есть, чем больше дней они пропускают, тем ниже их баллы. Чем меньше дней они пропускают, тем выше будут баллы:

Опять же, корреляция не идеальна (а их почти никогда не бывает). У нас здесь есть один студент, который пропустил 5 дней, но все же сумел набрать 85%. У нас также есть один, который набрал 52%, несмотря на то, что пропустил всего два дня.

У нас по-прежнему есть четкая негативная тенденция. Но результаты тестов по-прежнему сильно различаются, и их нельзя объяснить одним только отсутствием. Это может быть связано с другими переменными, такими как способности, мотивация, здоровье и многими другими потенциальными факторами.

Поэтому, когда вы используете CORREL, имейте в виду, что существует более широкая картина, которую ваши данные не могут полностью объяснить.

Нет корреляции

Нет корреляции (р = 0 или близко к 0) означает, что вы не можете предсказать оценку одной переменной на основе другой. Если вы построите график данных, вы не увидите заметного тренда, а линия тренда будет плоской или почти плоской.

Вот некоторые данные о длине безымянного пальца и IQ:

Как видите, в этом примере нет связи между этими двумя переменными, поэтому мы можем предположить, что они не связаны.

На практике вы вряд ли получите р ровно 0. Помните, что при сборе данных часто наблюдаются некоторые отклонения из-за ошибок, возможно, в измерениях или отчетности. Так что только потому, что ты р не совсем 0, это не значит, что вы что-то нашли.

Корреляция - это не причинная связь

Крайне важно помнить, что CORREL не может сказать вам, какая переменная влияет на другую, и даже если между переменными вообще существует какая-либо причинно-следственная связь. Например, была обнаружена корреляция между следующими переменными:

  • Количество проданного мороженого и количество тяжких преступлений.
  • Насколько вы счастливы и насколько успешны в своей карьере
  • Количество людей, утонувших в бассейне, и количество фильмов, в которых появился Николас Кейдж за год

Первый пример - это проблема третьей переменной. Конечно, мороженое не вызывает в людях насилия, и насилие не вызывает тяги к замороженному молоку и сахару. Третья переменная - погода. В жаркую погоду люди просто чаще выходят на улицу - между людьми больше контактов, а значит, больше шансов на назревание конфликта. В жаркую погоду люди также покупают больше мороженого. Таким образом, продажи мороженого и насильственные преступления связаны только потому, что они оба связаны с третьей переменной.

Второй может быть примером двойная причинность. Успех на работе может быть полезным для вашего счастья - вы будете зарабатывать больше денег и, как правило, будете лучше контролировать, какую работу вы делаете и с кем. Но счастье также может способствовать успеху, может быть, с более счастливыми людьми легче ладить и развивать более крепкие рабочие отношения, или, может быть, они более психологически устойчивы к неудачам. В этом случае обе переменные влияют друг на друга.

Третий - это просто ложная корреляция. То, что две переменные коррелируют в ваших данных, не означает, что они так или иначе взаимодействуют в реальной жизни.

Суть в том, что корреляция не может сказать вам, связаны ли две переменные причинно.

Как использовать CORREL

Используйте функцию Excel CORREL следующим образом:

1 = КОРРЕЛ (B3: B15; C3: C15)

С CORREL вы определяете два аргумента - два диапазона данных, которые вы хотите сопоставить.

Вот несколько ключевых моментов, о которых следует помнить при использовании CORREL:

  • Текстовые, логические (ИСТИНА / ЛОЖЬ) и пустые ячейки игнорируются.
  • Оба диапазона данных должны содержать равное количество точек данных, иначе вы получите ошибку # N / A.
  • Если один из диапазонов данных пуст, или если в данных нет никаких вариаций (то есть, если все точки данных имеют одно и то же число), вы получите # DIV / 0! Ошибка

Функция CORREL в Google Таблицах

Функция CORREL работает в Google Таблицах точно так же, как и в Excel:

Дополнительные замечания

CORREL Примеры в VBA

Вы также можете использовать функцию CORREL в VBA. Тип:
application.worksheetfunction.correl (массив1, массив2)
Для аргументов функции (array1 и т. Д.) Вы можете либо ввести их непосредственно в функцию, либо определить переменные, которые будут использоваться вместо них.

Вернуться к списку всех функций в Excel

wave wave wave wave wave