Статистика с макарошками, часть 1

Это первая статья из цикла по основам статистики. В нём вы узнаете, зачем нужна эта наука и даже будете понимать её страшные термины. Но здесь не будет сухого математического языка, я постараюсь донести всё на простых примерах, которыми волею судьбы стали макарошки

Статистика с макарошками, часть 1 Статистика, Математика, Научпоп, Образование, Наука, Макароны, Человек наук, Длиннопост

Зачем нужна статистика

В зарубежных курсах первая лекция часто посвящена обсуждению темы: почему полезен этот предмет. У нас такой традиции почему-то не сложилось, откуда и возникают вопросы студентов «Зачем вообще это нужно?» после матанализа, «Как это использовать?» после дифференциальных уравнений и «Это что сейчас было?» после рядов Фурье. Я постараюсь разрушить эту тенденцию и объяснить, как применяется статистика в реальной жизни и кому она нужна

Статистика зародилась как математическая дисциплина. Это выглядит довольно забавно — математика привыкла работать со строгими абстрактными понятиями: например, в геометрии линии не имеют толщины, а матанализ работает с понятиями бесконечно малых и бесконечно больших чисел. Даже физика, описывающая с помощью математики наш мир, сводит всё к абстракциям. И вот такую строгую, оторванную от реального мира науку, просят описать этот самый реальный мир со всеми его погрешностями и отклонениями. Как тебе такое, Фридрих Гаусс?

Статистика с макарошками, часть 1 Статистика, Математика, Научпоп, Образование, Наука, Макароны, Человек наук, Длиннопост

Но трудами великих, математика с этим справилась и вполне неплохо помогает решать важные задачи. Так врачи могут определить, какое из лекарств работает лучше, маркетологи — понять, что именно нравится людям, а учёные — открыть новую элементарную частицу или ответственный за заболевание ген!

Статистику можно использовать и в повседневной жизни. Одна из моих преподавателей с её помощью подобрала оптимальную цену для сдачи квартиры. Я сам хочу провести подробный анализ постов в своей группе и посмотреть, как люди отреагируют на разные тематики

Самые продвинутые области человеческого знания сегодня обязательно используют статистику. Вы могли слышать про искусственный интеллект или большой адронный коллайдер. Статистика необходима для работы и с тем, и с другим! Более того, в большинстве научных статей используется статистическая обработка данных. Учёные показали, что восприятие оптических иллюзий зависит от возраста? Будьте уверены, в этом замешана статистика

Давайте же разбираться, как работает эта дисциплина!

Генеральная совокупность и выборка

Статистика изучает объекты реального мира, которые мы измеряем опытным путём. И её часто интересуют конкретные числа, описывающие изучаемый объект. Например, маркетолога интересует, как выглядит среднестатистический клиент. Или, каков разброс трат в магазине. Чтобы понять, откуда берутся эти числа, нам сначала нужно поговорить о том, что такое генеральная совокупность и выборка

Генеральная совокупность — это вообще все объекты, обладающие интересным для нас признаком! Например, для маркетолога — это все его клиенты, а для кардиолога — все пациенты с заболеваниями сердца. Изучая генеральную совокупность, мы сможем с огромной точностью описать все её параметры: среднего клиента, самое частое значение или их разброс. Это самый надёжный для статистики метод! Который, правда, почти не используется. И на это есть причины:

• Большой объём. Иногда объектов для изучения слишком много, что делает их изучение дорогим или невозможным. Например, было бы интересно узнать средний рост людей на Земле. Но ещё интереснее было бы найти человека, готового их всех измерить

• Недоступность. Порой все объекты вообще недоступны нам для изучения. Очень бы хотелось узнать побольше про динозавров! Но большинство из них уже давно открыло своими короткими лапками ворота в мир иной и нам приходится делать выводы только по имеющимся останкам

• Бессмысленность. Иногда изучение всех объектов может просто не иметь смысла. Представьте, например, что вы исследуете процент брака таблеток, выпускаемых заводом. Для того, чтобы изучить состав таблетки нужно её разрушить. «Брака не выявлено!» говорите вы директору завода, разрушив всю партию. «Спасибо тебе, друг, большое!» говорит вам ни один директор

Поэтому нам нужно как-то судить о генеральной совокупности по её части. Такая часть называется выборкой. Если выборка хорошая и отлично соответствует картине в целом, она называется репрезентативной

Представьте, что у вас нет микроволновки, но вам нужно разогреть себе на обед макарошки. Приходится делать это по старинке — в сковороде на плите

Статистика с макарошками, часть 1 Статистика, Математика, Научпоп, Образование, Наука, Макароны, Человек наук, Длиннопост

Можно просто подождать достаточно времени и все макарошки гарантированно будут тёплыми. Но кушать хочется уже сейчас! Нужно определить, подогрелась ли еда, попробовав часть: ведь сказать «Холодновато», съев их все не имеет смысла

Теперь, как бы вас ни пугал этот термин, вы заинтересованы в репрезентативности выборки. Но как выбрать макарошки так, чтобы они хорошо отразили картину в целом?

Например, можно попробовать их из разных частей сковородки. Это будет называться простым случайным отбором. Так мы удостоверимся, что часть макарошек не будет холодной из-за неравномерного прогревания. Ещё больше улучшить точность оценки можно, выделив группы. Например, у нас могут иметься макароны разного размера или куски мяса. Попробовав случайные объекты из разных групп, мы проведём то, что называется стратометрическим отбором. Страты или кластеры — просто способ назвать группы понаучнее

Есть и другие методы, но их мы оставим. Для изучения основ этого хватит, к тому же уже пора приступать к поглощению генеральной совокупности!


А отличный пример нерепрезентативной выборки я приводил здесь

Статистика с макарошками, часть 1 Статистика, Математика, Научпоп, Образование, Наука, Макароны, Человек наук, Длиннопост

Спасибо за чтение! Это первая образовательная рубрика для меня, поэтому очень важна обратная связь: пишите пожелания, советы и критику в комментариях. А если интересны посты про образование и науку, заглядывайте ко мне в ВК и телеграм

Лига образования

4.4K постов21.8K подписчиков

Добавить пост

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:


ДЛЯ АВТОРОВ:


Приветствуются:

-уважение к читателю и открытость

-желание учиться

Не рекомендуются:

-публикация недостоверной информации


ДЛЯ ЧИТАТЕЛЕЙ:


Приветствуются:

-конструктивные дискуссии на тему постов

Не рекомендуются:

-личные оскорбления и провокации

-неподкрепленные фактами утверждения


В этом сообществе мы все союзники - мы все хотим учиться! :)

3
Автор поста оценил этот комментарий
Понравилось объяснение репрезентативности выборки на примере макарон! Работая в лаборатории часто имею дело с этим понятием, но так шикарно его объяснить я не мог. Автор красавчик!
раскрыть ветку
4
Автор поста оценил этот комментарий
Отличный пост) Гаусс убил xD
раскрыть ветку
1
Автор поста оценил этот комментарий

Пишите ещё. Если что-то и спасет мир, то это - научпоп.

1
Автор поста оценил этот комментарий

Автор, будьте осторожнее с выводами. Судя по фотографии, некоторые ваши макорошки - колбаса.

раскрыть ветку
Автор поста оценил этот комментарий

Подписалась. Давай ещё! :)