Немного о лжи и статистике

Я уже писал о том, как нечестные люди могут пользоваться статистикой, чтобы вводить в заблуждение:

Как лгать с помощью статистики

Как лгать с помощью статистики — часть 2

Но на этом хитрости маркетологов не закончились, поэтому перед вами третья часть

Немного о лжи и статистике Статистика, Наука, Маркетинг, Математика, Ложь, График, Корреляция, Человек наук, Длиннопост

Корреляция значит связь?

Если вы не изучали этот вопрос подробно, подумайте, как вы воспринимаете термин корреляция? Его часто используют для того, чтобы показать связь величин. Но правда в том, что корреляция не подразумевает причинно-следственную связь. Она показывает, что две величины изменяются похоже. Связаны ли они, можно только предполагать или доказывать другими методами

Немного о лжи и статистике Статистика, Наука, Маркетинг, Математика, Ложь, График, Корреляция, Человек наук, Длиннопост

Например, представим, что в неком исследовании была выявлена сильная корреляция между временем, проводимым школьниками за видеоиграми, и уровнем их агрессивности. Значит, видеоигры ведут к агрессии?

Нет, не значит! Из одной только корреляции сделать такой вывод нельзя. Можно только сделать несколько предположений:

1. Видеоигры приводят к агрессивному поведению

2. Агрессивные школьники чаще играют в видеоигры — это также может быть справедливо

3. Существует третий фактор, не учтённый в исследовании. Например, дети со строгими родителями могут быть более агрессивными, а дома прятаться в мире видеоигр

4. Связи между параметрами нет, а сильная корреляция — результат случайности

Существуют даже подборки абсурдных корреляций, чтобы показать, что из них не следует причинно-следственная связь. Вот, например, данные по расходам США на науку, космос и технологии в сравнении с уровнем суицидов от удушения. Корреляция 99%

Немного о лжи и статистике Статистика, Наука, Маркетинг, Математика, Ложь, График, Корреляция, Человек наук, Длиннопост

В самом коэффициенте корреляции ничего лживого нет, это чистая математика. Все проблемы появляются при интерпретации его людьми

Немного о лжи и статистике Статистика, Наука, Маркетинг, Математика, Ложь, График, Корреляция, Человек наук, Длиннопост

Скрытие малой выборки за процентами

Хорошая статистика часто требует большого количества наблюдений. Бесполезно делать выводы, основываясь на 2-3 или даже 10 случаях. Но если ваша цель — не строгая научная работа, а суровый маркетинг, то этим можно пренебречь. Но говорить в рекламе, что ваша зубная паста улучшила состояние зубов 3 из 4 человек, не очень эффективно. Зато 75% звучит гораздо лучше!


Такую уловку просто определить, если цифры уж очень круглые: 75, 80, 95 процентов. Но может быть сложнее, если выборка состояла из менее красивого числа — например, шести наблюдений

Маркетинговые графики

Все приёмы, описанные мной в этом и предыдущих постах легко раскусываются людьми, понимающими, как работает статистика. Но они не являются явной ложью: лишь затруднением интерпретации (как отсчёт оси y не с нуля из первого поста) или ошибкой интерпретации, намеренной или случайной. Но мне довелось побывать на бизнес-тренинге, но котором я услышал то, что заставило мои брови поползти на лоб, натянув кожу так, что руки поднялись писать этот пост. Цитата:

Если вы показываете график с доходом вашей компании, то линию через точки можно провести по разному. Можно сделать это плавно или заставить выглядеть чуть выгоднее. А в самом конце, где точки заканчиваются, будет эффектно провести линию вверх, добавив стрелку, чтобы показать, насколько значимым будет ваш рост!

Я даже не мог подумать о такой уловке раньше, потому что это идёт в разрез с миром вокруг меня. В науке за такой график выступающего самого порвут на гистограмму, даже на студенческой конференции. Но на тренинге дальше я ещё не раз наблюдал подобную визуализацию от других людей. Такие вот дела

Немного о лжи и статистике Статистика, Наука, Маркетинг, Математика, Ложь, График, Корреляция, Человек наук, Длиннопост

Если интересны посты об образовании и науке, заглядывайте в мою группу ВК и канал телеграм

Лига образования

4.4K постов21.8K подписчиков

Добавить пост

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:


ДЛЯ АВТОРОВ:


Приветствуются:

-уважение к читателю и открытость

-желание учиться

Не рекомендуются:

-публикация недостоверной информации


ДЛЯ ЧИТАТЕЛЕЙ:


Приветствуются:

-конструктивные дискуссии на тему постов

Не рекомендуются:

-личные оскорбления и провокации

-неподкрепленные фактами утверждения


В этом сообществе мы все союзники - мы все хотим учиться! :)

4
Автор поста оценил этот комментарий

Я, конечно, не математик. Но корреляция - это все-таки связь. Не причинно-следственная, правда, но связь. Другое дело, что связь - далеко не всегда зависимость.

раскрыть ветку
1
Автор поста оценил этот комментарий

А как же пастафарианские пираты и глобальное потепление?

1
DELETED
Автор поста оценил этот комментарий

Нужно больше статей по занимательной статистике!

раскрыть ветку
DELETED
Автор поста оценил этот комментарий

Да всё верно) Есть по этому поводу очень хорошая книга "путеводитель по лжи в эпоху постправды" (2016) тут же на пикабу про неё пост видел) https://pikabu.ru/story/rekomenduyu_knigu_5903703


там первая часть как раз про манипуляции со статистикой могу порекомендовать кому хочется больше почитать про это

Автор поста оценил этот комментарий

Мне кажется, самый известный пример это зависимость количества пиратов от средней температуры на Земле :)


Пастафариане дело говорят :)

Иллюстрация к комментарию