Возможно, самый известный пример смещения выборки произошел во время президентских выборов в США в 1936 году. В 1936 году Альфред Лэндон, кандидат от республиканцев, выступил против действующего президента Франклина Д. Рузвельта. 1936 год ознаменовал конец Великой депрессии, и экономические вопросы были главной темой выборов.

«Литературный дайджест» был одним из самых уважаемых журналов того времени, и они много лет точно предсказывали выборы в США. На 1936 год «Литературный дайджест» предсказал, что Лэндон получит 57% голосов и будет избран президентом. Опрос, проведенный «Литературным дайджестом», стал самым масштабным и дорогим опросом года. У них был размер выборки 2,4 миллиона!!!!!! (выборка в 2,4 миллиона слишком велика даже для выборов в США)

Но когда пришли результаты, Лэндон смог набрать только 38% против 62% у Рузвельта. Рузвельт был избран президентом, и ошибка прогноза составила огромные 19%.

Что же произошло на самом деле и почему «Литературный дайджест» допустил эту кричащую ошибку?

  1. Предвзятость выбора: во-первых, чтобы получить адреса для отправки опросов, Литературный дайджест использовал телефонные справочники, подписчиков журналов, списки членов клубов и т. д. Такой список гарантированно будет ориентирован на средний класс и высший класс, которые с большей вероятностью проголосуют. республиканец (отсюда Лэндон).
  2. Предвзятость, связанная с отсутствием ответа : Literary Digest разослал письма 10 миллионам человек, из которых только 2,4 миллиона ответили на опрос. Таким образом, размер выборки составил четверть от запланированного. Люди, которые отвечают на опрос, отличаются от тех, кто не отвечает. На самом деле откликнулись люди, интересующиеся политикой. Таким образом, метод выборки потенциально исключил значительную часть тех, кто не интересуется политикой.

Эти два смещения выборки вызвали огромную ошибку в предсказании «Литературного дайджеста».

Следовательно, всегда помните, что хорошо подобранная небольшая выборка всегда лучше, чем плохо подобранная огромная выборка.

«Тот, кто не учится на истории, склонен повторять одни и те же ошибки»

Ссылка:

https://www.math.upenn.edu/~deturck/m170/wk4/lecture/case1.html