Facebook Pixel
Searching...
Русский
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
Naked Statistics

Naked Statistics

Stripping the Dread from the Data
автор Charles Wheelan 2013 302 страниц
3.95
14k+ оценки
Слушать

ключевых вывода

1. Статистика: Сила превращения данных в инсайты

Легко лгать с помощью статистики, но трудно говорить правду без нее.

Принятие решений на основе данных. Статистика предоставляет инструменты для обработки и анализа огромных объемов информации, превращая сырые данные в значимые инсайты. Эта сила позволяет нам отвечать на важные вопросы в различных областях, от экономики до общественного здравоохранения.

Преодоление интуиции. Статистический анализ часто раскрывает контринтуитивные истины, бросая вызов нашим предположениям и предвзятостям. Полагаясь на данные и строгий анализ, мы можем принимать более обоснованные решения и избегать распространенных ошибок человеческого суждения.

Этические соображения. Хотя статистика является мощным инструментом, ее можно неправильно использовать или интерпретировать. Понимание статистических концепций помогает критически оценивать утверждения, выявлять потенциальные манипуляции и ответственно использовать данные для улучшения нашего мира.

2. Описательная статистика: Суммирование сложной информации

Средний показатель удара - это описательная статистика.

Меры центральной тенденции. Среднее, медиана и мода предоставляют разные способы описания "середины" набора данных:

  • Среднее: Среднее значение, чувствительное к выбросам
  • Медиана: Срединное значение, устойчивое к выбросам
  • Мода: Наиболее частое значение

Меры разброса. Эти статистики описывают, насколько разбросаны данные:

  • Размах: Разница между наибольшим и наименьшим значениями
  • Стандартное отклонение: Среднее расстояние от среднего
  • Дисперсия: Квадрат стандартного отклонения

Визуальные представления. Графики и диаграммы могут эффективно суммировать большие наборы данных:

  • Гистограммы: Показывают распределение данных
  • Ящичные диаграммы: Отображают медиану, квартили и выбросы
  • Точечные диаграммы: Иллюстрируют отношения между переменными

3. Корреляция: Понимание отношений между переменными

Корреляция не подразумевает причинно-следственную связь.

Сила и направление. Коэффициент корреляции измеряет силу и направление линейной связи между двумя переменными, варьируясь от -1 до 1:

  • Положительная корреляция: С увеличением одной переменной другая также стремится увеличиваться
  • Отрицательная корреляция: С увеличением одной переменной другая стремится уменьшаться
  • Отсутствие корреляции: Нет постоянной линейной связи между переменными

Ограничения. Хотя корреляция может выявить интересные закономерности, важно помнить, что она не доказывает причинно-следственную связь. Другие факторы, такие как смешанные переменные или обратная причинность, могут объяснять наблюдаемую связь.

Применение в реальном мире. Анализ корреляции используется в различных областях:

  • Финансы: Анализ отношений между различными инвестиционными активами
  • Маркетинг: Определение факторов, влияющих на поведение потребителей
  • Здравоохранение: Изучение связей между факторами образа жизни и риском заболеваний

4. Вероятность: Навигация в условиях неопределенности и риска

Вероятность не делает ошибок; ошибки делают люди, использующие вероятность.

Основные концепции. Вероятность измеряет вероятность наступления события, варьируясь от 0 (невозможно) до 1 (определенно):

  • Независимые события: Исход одного не влияет на другое
  • Условная вероятность: Вероятность события при условии, что другое уже произошло
  • Ожидаемое значение: Средний результат за многие испытания

Оценка риска. Вероятность помогает количественно оценивать и управлять рисками в различных областях:

  • Страхование: Установление премий на основе вероятности претензий
  • Финансы: Оценка инвестиционных возможностей и потенциальных потерь
  • Общественное здравоохранение: Оценка воздействия вмешательств или вспышек заболеваний

Распространенные заблуждения. Понимание вероятности может помочь избежать ошибок:

  • Ошибка игрока: Вера в то, что прошлые результаты влияют на будущие независимые события
  • Игнорирование базовой вероятности: Игнорирование основной вероятности события
  • Ошибка соединения: Предположение, что специфические условия более вероятны, чем общие

5. Центральная предельная теорема: Основа статистического вывода

Центральная предельная теорема - это Леброн Джеймс статистики.

Ключевой принцип. Центральная предельная теорема утверждает, что распределение средних выборок приближается к нормальному распределению, независимо от исходного распределения населения, при достаточно большом размере выборки.

Последствия для вывода. Эта теорема позволяет нам:

  • Делать выводы о популяциях на основе данных выборки
  • Вычислять доверительные интервалы для параметров популяции
  • Проводить тесты гипотез для оценки утверждений о популяциях

Практическое применение. Центральная предельная теорема имеет решающее значение в:

  • Опросах и исследовательских опросах
  • Контроле качества в производстве
  • Финансовом моделировании и оценке рисков

6. Регрессионный анализ: Изоляция причинно-следственных связей

Регрессионный анализ - это чудодейственное средство социально-научных исследований.

Множественные переменные. Регрессионный анализ позволяет нам изучать связь между зависимой переменной и несколькими независимыми переменными, контролируя смешанные факторы.

Типы регрессии:

  • Линейная регрессия: Для непрерывных зависимых переменных
  • Логистическая регрессия: Для бинарных зависимых переменных
  • Множественная регрессия: Включение нескольких независимых переменных

Интерпретация. Ключевые аспекты результатов регрессии:

  • Коэффициенты: Указывают на силу и направление связей
  • R-квадрат: Измеряет, сколько вариации объясняется моделью
  • Статистическая значимость: Оценивает надежность результатов

7. Оценка программ: Измерение воздействия вмешательств

Нас волнует, что работает.

Экспериментальный дизайн. Рандомизированные контролируемые испытания - это золотой стандарт:

  • Группа лечения: Получает вмешательство
  • Контрольная группа: Не получает вмешательства
  • Случайное распределение: Обеспечивает сопоставимость групп

Квазиэкспериментальные методы. Когда рандомизация невозможна:

  • Разница в различиях: Сравнивает изменения со временем между группами
  • Регрессионная дискретность: Использует произвольные пороги в праве на участие в программе
  • Инструментальные переменные: Использует внешние факторы для имитации рандомизации

Проблемы. Оценка программ должна учитывать:

  • Смещение отбора: Участники могут отличаться от неучастников
  • Эффекты распространения: Вмешательство может косвенно повлиять на контрольную группу
  • Внешняя валидность: Результаты могут не обобщаться на другие контексты

8. Качество данных: Основа надежного анализа

Мусор на входе, мусор на выходе.

Сбор данных. Обеспечение качества данных начинается с правильных методов сбора:

  • Репрезентативная выборка: Избегание смещения отбора
  • Подходящий размер выборки: Баланс между точностью и стоимостью
  • Стандартизированные процедуры: Минимизация ошибок измерения

Очистка данных. Подготовка данных для анализа включает:

  • Обработка пропущенных значений: Импутация или исключение
  • Идентификация и устранение выбросов
  • Проверка на согласованность и логические ошибки

Управление данными. Поддержание целостности данных требует:

  • Четкой документации источников данных и переменных
  • Безопасного хранения и резервного копирования
  • Контроля версий для наборов данных и скриптов анализа

9. Общие статистические ошибки: Избегание неправильной интерпретации

Статистическое злоупотребление имеет очень мало общего с плохой математикой.

Корреляция против причинности. Всегда учитывайте альтернативные объяснения наблюдаемых связей:

  • Обратная причинность: Эффект может вызывать предполагаемую причину
  • Смешанные переменные: Другие факторы могут объяснять связь
  • Ложные корреляции: Случайность может создавать вводящие в заблуждение ассоциации

Смещение отбора. Остерегайтесь нерепрезентативных выборок:

  • Смещение выживаемости: Учитываются только успешные случаи
  • Смещение самовыбора: Участники сами выбирают участие в исследовании
  • Смещение публикации: Публикуются только положительные результаты

Злоупотребление p-значениями. Избегайте чрезмерного упора на статистическую значимость:

  • P-хакерство: Манипуляция данными или анализом для достижения значимости
  • Множественные сравнения: Повышенный риск ложноположительных результатов
  • Практическая значимость: Статистическая значимость не подразумевает важности

10. Применение в реальном мире: Статистика в действии

Статистика может помочь ответить на эти вопросы.

Общественное здравоохранение. Статистика информирует критические решения:

  • Оценка эффективности вакцин и лечения
  • Определение факторов риска заболеваний
  • Моделирование распространения инфекционных заболеваний

Экономика и финансы. Статистические инструменты направляют политику и инвестиции:

  • Прогнозирование экономического роста и инфляции
  • Оценка воздействия изменений политики
  • Управление инвестиционными портфелями и рисками

Социальные науки. Статистика помогает понять поведение человека:

  • Анализ избирательных моделей и политических тенденций
  • Изучение образовательных результатов и вмешательств
  • Оценка эффективности социальных программ

Технологии. Современные приложения статистики включают:

  • Машинное обучение и искусственный интеллект
  • Рекомендательные системы (например, Netflix, Amazon)
  • Обработка естественного языка и анализ настроений

Последнее обновление:

Отзывы

3.95 из 5
Средняя оценка на основе 14k+ оценки с Goodreads и Amazon.

Голая статистика получает в основном положительные отзывы за то, что делает статистику доступной и увлекательной благодаря примерам из реальной жизни и юмору. Читатели ценят ясные объяснения сложных концепций без обилия математики. Некоторые считают, что книга слишком проста для тех, кто уже знаком со статистикой. Книга хвалится за развитие критического мышления в отношении статистических утверждений. Критика включает в себя иногда скучные разделы и чрезмерное использование примеров из американского спорта. В целом, рекомендуется как вводный текст для студентов и широкого круга читателей, интересующихся пониманием статистики.

Об авторе

Чарльз Уилан — старший преподаватель в Рокфеллеровском центре Дартмутского колледжа. Ранее он преподавал в Школе государственной политики Харриса при Чикагском университете. Уилан является автором нескольких популярных книг по экономике и статистике, включая бестселлер "Голая статистика". Он работал журналистом в The Economist и баллотировался в Конгресс. Уилан имеет степень доктора философии в области государственной политики Чикагского университета и признан за свою способность делать сложные темы доступными и увлекательными. Его стиль письма часто описывают как ясный, остроумный и информативный.

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Create a free account to unlock:
Bookmarks – save your favorite books
History – revisit books later
Ratings – rate books & see your ratings
Unlock unlimited listening
Your first week's on us!
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Nov 29,
cancel anytime before.
Compare Features Free Pro
Read full text summaries
Summaries are free to read for everyone
Listen to summaries
12,000+ hours of audio
Unlimited Bookmarks
Free users are limited to 10
Unlimited History
Free users are limited to 10
What our users say
30,000+ readers
“...I can 10x the number of books I can read...”
“...exceptionally accurate, engaging, and beautifully presented...”
“...better than any amazon review when I'm making a book-buying decision...”
Save 62%
Yearly
$119.88 $44.99/yr
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Settings
Appearance