Три дня чтения в подарок
Зарегистрируйтесь и читайте бесплатно

Как лгать при помощи статистики

Как лгать при помощи статистики
Книга доступна в премиум-подписке
Добавить в мои книги
46 уже добавили
Оценка читателей
4.75

В этой всемирно известной книге Дарелл Хафф рассказывает о различных способах злоупотребления статистикой в целях обмана аудитории и манипулирования ее мнением. Каждый день на вас пытаются повлиять, чтобы сподвигнуть на покупку какого-то «нужного» продукта или на выбор «правильного» кандидата: «Благодаря пасте “Чистые зубы” образование кариеса снижается на 23 %!»; «Политика N поддерживает 85 % граждан»… Как понять, насколько достоверны те или иные данные? Каким образом происходят подсчеты? Что учитывается, а что остается за кадром? Автор раскрывает секретные инструменты статистиков и вооружает читателя знаниями, которые помогут разобраться во всех хитросплетениях этой науки и не позволят ввести в заблуждение.

Лучшие рецензии
varlashechka
varlashechka
Оценка:
62

Статистика, действительно, коварная и хитрая вещь, особенно в умелых руках. На первый взгляд, книга Дарелла Хаффа «Как лгать при помощи статистики» — инструкция по применению для мошенников, которые хотят ввести в заблуждение доверчивых читателей. Но на самом деле — наоборот.

Сам автор пишет: «Полагаю всё же, что смогу оправдать её в манере бывшего грабителя, опубликовавшего мемуары, в сущности представляющие собой учебный курс на тему о том, как подобрать отмычку к замку. Жуликам и ворам все эти трюки давно известны, а порядочные люди должны узнать о них, чтобы уметь защитить свой дом от непрошенных гостей».

Хотя книга написана в далеком 1954 году, актуальности своей она не потеряла, также как и коварные приемы, описываемые в ней. Расскажу о трех, которые описывает Хафф.

Необъективная выборка
Чтобы данные выборочного исследования имели ценность, они должны основываться на репрезентативной выборке, из которой исключены все возможные источники предвзятости.

Вот пример нерепрезентативной выборки, который приводит Хафф. Один психиатр заявил, что практически любой человек — неврастеник. Но спросим себя: что послужило основой для такого вывода? Каких именно людей наблюдал данный психиатр? Оказывается, он пришел к такому поучительному выводу, изучая своих пациентов, а они более чем неподходящие кандидатуры на роль выборки из всего населения. Если человек вполне нормален, то у психиатра нет никаких шансов увидеть его у себя на приеме.

Другой — уже хрестоматийный — пример связан с выборами президента США. Журнал Literary Digest в 1936 году, опросив своих подписчиков, предсказал триумфальную победу республиканца Альфреда Лэндона над демократом Франклином Рузвельтом. В журнале забыли учесть, что его подписчики — это в основном богатые и зажиточные американцы, чаще всего сторонники республиканской партии. Победу на выборах одержал Рузвельт.

Грамотно выбранное среднее или Чиновники едят мясо, я — капусту. В среднем, мы едим голубцы. ©

Термин «среднее» имеет очень расплывчатое толкование. В цитате, приведенной выше, это среднее арифметическое. Помимо него существуют мода и медиана.

Во многих случаях все три средних показателя настолько близки по значению, что нет никакой необходимости делать различие между ними. Но если речь идет о доходах, то разница между тремя средними — огромная.

«Если вам попадается заявление владельца компании, где говорится, что у его сотрудников средняя зарплата достаточно высока, это может означать нечто конкретное, а может и не означать ничего. Если упомянутый средний показатель представляет собой медиану, то он укажет на то, что половина сотрудников зарабатывает больше указанной суммы, а другая половина — меньше. Но если перед вами среднее арифметическое (а можете мне поверить, так оно и бывает, если вид среднего не уточняется), то эта цифра не даст вам никакой полезной информации», — пишет Дарелл Хафф. Что касается моды, то это самое часто встречающееся значение из множества и, возможно, оно лучше всего характеризует уровень заработной платы в компании.

Неправильная причинно-следственная связь
После — не всегда значит вследствие! И Дарелл Хафф доказывает это на конкретных примерах и призывает быть бдительными.

«Отстают ли в учебе студенты-курильщики от некурящих студентов. Согласно одному исследованию — да, отстают. Очень многим это пришлось по душе, они пошли дальше и сделали вывод — курение пагубно влияет на умственные способности, — пишет Хафф. — Вышеупомянутое исследование, как мне верится, было проведено по всем правилам: объем выборки был достаточно велик, подобрали ее добросовестно и тщательно, величина корреляции оказалась значимой. Но в нем делается неоправданное предположение, что курение и есть причина плохой успеваемости. Но разве всё это нельзя с таким же успехом перевернуть наоборот? Может быть, именно скверные оценки заставили студентов искать утешения в курении? Если уж на то пошло, данный вывод столь же вероятен и не хуже подкреплен фактами».

Часто бывает так: взаимосвязь существует, но нельзя сказать, какая из переменных выступает причиной, а какая следствием. Гораздо коварнее, когда ни одна из переменных не оказывает воздействия на другую, но корреляция между ними всё равно есть, причем существенная.

Вот пример такой фиктивной корреляции. По словам Хаффа, уровень самоубийств достигает максимума в июне. Тогда же насчитывается наибольшее количество новобрачных. В чем дело? Самоубийства порождают такое количество свадеб? Или свадьбы провоцируют отвергнутых женихом или невестой свести счеты с жизнью? Более убедительным, но тоже недоказанным объяснением будет следующее. Некто отчаявшийся всю зиму борется с депрессией в надежде, что весной тучи рассеются. Но он окончательно сдается, когда наступает лето, выглядывает солнце, а никакого просвета нет…

В общем, смотрите в оба и помните, что существует три вида лжи: ложь, наглая ложь и статистика. Отличная книга, рекомендую.

Читать полностью
Forane
Forane
Оценка:
24

Мне приходилось много времени проводить за изучением статистической информации, собирать ее, анализировать и т.д. Таким образом, многое из написанного автором для меня секретом не было (да и для большинства населения никак не связанного со статистикой тоже). Единственный момент, на который я ранее не обращала внимание - это среднее, мода и медиана. Я как-то не задумывалась о том, какую среднюю используют авторы разнообразных статей (впрочем скорее всего это именно средняя арифметическая).

Основываясь на своем опыте скажу, что все что пишет Хафф в своей книге - правда. А с течением времени все написанное не менее актуально, чем пол века назад. За это время изменилась на мой взгляд лишь 3 основных фактора: упростился доступ простых обывателей к информации, упростился процесс сборки статистической информации, а также упростились методы и сократилось время, необходимое на проведение анализа статистических данных. В остальном же ничего нового не придумали. Люди также "ведутся" на нарисованный мешок денег, все также мелким шрифтом подписывают в рекламе, что исследования прошли 12 человек, а авторы статей продолжают обрезать и растягивать графики и "играются" с выборкой.

Немного успокаивает тот факт, что сейчас многие статистические данные может проверить даже обычный человек, если задастся этой целью и проведет за компьютером пару-тройку часов. Сейчас масса альтернативных источников начиная с нашего Росстата и статистики, которую предоставляют различные Министерства, заканчивая подсчетами, которые ведут иностранцы. На самом деле сейчас в открытом доступе предоставлено просто невероятное количество различного рода источников со статистическими данными.

Оценку я снизила за многочисленные повторения автором уже сказанных ранее вещей. За то, что к середине книге, лично у меня, начал постепенно угасать интерес, а картинки в книге стали не столь интересными)) С одной стороны вроде бы написаны правильные, нужные вещи, а с другой... ну, наверное это кому-то действительно необходимо.

Читать полностью
lovely_reading
lovely_reading
Оценка:
5

Так или иначе, каждому из нас приходится сталкиваться со статистикой. Она повсеместно встречается и в Интернете, и на телевидении, и в газетах, книгах, и порой даже на улице. А множеству людей приходится работать со статистическими материалами по учёбе и работе. В обоих случаях нужно уметь правильно анализировать информацию, чтобы не стать обманутым.

Дарелл Хафф именно этому нас и учит в своей книге. И это у него получается отменно! Книга крутейшая! Вы, конечно, можете подумать, что я преувеличиваю, но это так. Ведь только подумать, 60 лет назад был написан этот труд, который актуален до сих пор!

Чего здесь только нет! И проблема выборки, и особенности иллюстирования, и методики расчёта. Автор всё это подробно объясняет.

Нас дурачат на каждом шагу, а мы, округлив глаза, верим очень многому. Всегда нужно включать свой мозг и думать: что значит эта информация? Как она была получена? Стоит ли верить источнику? Ведь часто это приводит к множеству заблуждений, сопровождающих нас чуть ли не всю жизнь, примеры которых автор неоднократно приводит.

Книга понравится и тем, кто не хочет быть одураченым, и тем, кто хочет научиться дурачить (не надо так!). А также всем, кто интересуется статистикой. Информация донесена крайне доступно и просто, читается махом. А забавные рисунки добавляют приятных эмоций от чтения! Каждое умозаключение автор подтверждает лёгким примером, и даже то, что могло быть недопонятым, усваивается и надолго откладывается в голове.

Умный человек не будет верить во всё, что бы ему ни сказали или показали. Он сто раз проверит, вдумается, почитает альтернативные источники. Так давайте все так делать и читать такие полезные книги!

Читать полностью