Facebook Pixel
Searching...
فارسی
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
The Art of Statistics

The Art of Statistics

How to Learn from Data
توسط David Spiegelhalter 2019 448 صفحات
4.16
5k+ امتیازها
گوش دادن
گوش دادن

نکات کلیدی

1. آمار: هنر یادگیری از داده‌ها

اعداد به تنهایی نمی‌توانند سخن بگویند. ما برای آن‌ها سخن می‌گوییم. ما به آن‌ها معنا می‌دهیم.

بینش‌های مبتنی بر داده. آمار علم یادگیری از داده‌ها برای درک جهان و اتخاذ تصمیمات بهتر است. این علم شامل جمع‌آوری، تحلیل و تفسیر داده‌ها به منظور استخراج نتایج معنادار است. این حوزه ترکیبی از دقت ریاضی و حل مسائل عملی است که به ما اجازه می‌دهد از اطلاعات پیچیده بینش‌های ارزشمندی استخراج کنیم.

چرخه PPDAC. یک چارچوب اساسی در آمار، چرخه PPDAC است:

  • مشکل: تعریف سوال یا مسئله‌ای که باید به آن پرداخته شود
  • برنامه: طراحی مطالعه یا آزمایش
  • داده: جمع‌آوری و سازماندهی اطلاعات مرتبط
  • تحلیل: به‌کارگیری تکنیک‌های آماری برای کشف الگوها
  • نتیجه‌گیری: تفسیر نتایج و ارتباط یافته‌ها

این رویکرد سیستماتیک اطمینان می‌دهد که تحقیقات آماری به‌خوبی ساختاربندی شده و بر حل مشکلات واقعی متمرکز است.

2. تبدیل جهان به داده: چالش‌ها و فرصت‌ها

حتی احساسات شخصی ما نیز می‌توانند کدگذاری شده و تحت تحلیل آماری قرار گیرند.

نمایش داده. تبدیل پدیده‌های دنیای واقعی به داده، مرحله‌ای حیاتی در تحلیل آماری است. این فرآیند شامل تعریف دسته‌ها، اندازه‌گیری‌ها و متغیرهای واضح برای نمایش واقعیت‌های پیچیده است. با این حال، این تبدیل می‌تواند چالش‌برانگیز و گاهی جنجالی باشد.

چالش‌ها در جمع‌آوری داده:

  • تعریف دسته‌های دقیق (مثلاً، چه چیزی یک "درخت" را تشکیل می‌دهد؟)
  • اطمینان از اندازه‌گیری‌های مداوم در طول زمان
  • تعادل بین جزئیات و عملی بودن
  • در نظر گرفتن عوامل فرهنگی و زمینه‌ای

با وجود این چالش‌ها، توانایی کمی‌سازی و تحلیل جنبه‌های مختلف جهان ما منجر به پیشرفت‌های قابل توجهی در حوزه‌هایی مانند اقتصاد، بهداشت و علوم اجتماعی شده است. کلید این است که از محدودیت‌ها و فرضیات ذاتی در هر نمایش داده آگاه باشیم.

3. احتمال: زبان عدم قطعیت و تغییرپذیری

احتمال واقعاً یک ایده دشوار و غیرغیرقابل درک است.

کمی‌سازی عدم قطعیت. نظریه احتمال یک چارچوب ریاضی برای مقابله با عدم قطعیت و تغییرپذیری فراهم می‌کند. این نظریه به ما اجازه می‌دهد پیش‌بینی کنیم، ریسک‌ها را ارزیابی کنیم و از داده‌های محدود نتیجه‌گیری کنیم. درک احتمال برای تفسیر نتایج آماری و اتخاذ تصمیمات آگاهانه ضروری است.

مفاهیم کلیدی احتمال:

  • متغیرهای تصادفی و توزیع‌ها
  • مقادیر مورد انتظار و واریانس
  • احتمال شرطی
  • قانون اعداد بزرگ
  • نظریه حد مرکزی

در حالی که احتمال می‌تواند غیرغیرقابل درک باشد، ابزارهایی مانند درخت‌های فراوانی و نمایش‌های بصری می‌توانند به درک مفاهیم پیچیده کمک کنند. تسلط بر احتمال برای تکنیک‌های آماری پیشرفته و ارزیابی انتقادی ادعاهای مبتنی بر داده ضروری است.

4. همبستگی، علیت و قدرت آزمایش‌های تصادفی

همبستگی به معنای علیت نیست.

فراتر از ارتباط. در حالی که پیدا کردن همبستگی‌ها در داده‌ها آسان است، برقراری روابط علیتی بسیار چالش‌برانگیزتر است. مطالعات مشاهده‌ای می‌توانند ارتباطات را نشان دهند، اما اغلب تحت تأثیر عوامل دیگر قرار می‌گیرند. آزمایش‌های کنترل‌شده تصادفی (RCTs) استاندارد طلایی برای تعیین علیت هستند.

نقاط قوت RCTs:

  • تخصیص تصادفی تعصب را کاهش می‌دهد
  • گروه‌های کنترل اثرات دارونما را در نظر می‌گیرند
  • کورسازی تعصب ناظر را به حداقل می‌رساند
  • پیش‌ثبت‌نام از p-hacking جلوگیری می‌کند

با این حال، RCTs همیشه قابل اجرا یا اخلاقی نیستند. در چنین مواردی، طراحی دقیق مطالعه، کنترل متغیرهای مزاحم و استفاده از تکنیک‌های آماری مانند تطابق نمره تمایل می‌تواند به تقویت استنتاج‌های علی از داده‌های مشاهده‌ای کمک کند.

5. مدل‌های آماری: ساده‌سازی واقعیت‌های پیچیده

همه مدل‌ها اشتباه هستند، برخی مفیدند.

تفکر مبتنی بر مدل. مدل‌های آماری نمایندگی‌های ساده‌شده‌ای از واقعیت هستند که به ما کمک می‌کنند الگوها را درک کنیم و پیش‌بینی کنیم. این مدل‌ها از رگرسیون‌های خطی ساده تا الگوریتم‌های پیچیده یادگیری ماشین متغیرند. در حالی که همه مدل‌ها محدودیت‌هایی دارند، می‌توانند بینش‌های ارزشمندی را در صورت استفاده مناسب ارائه دهند.

جنبه‌های کلیدی مدل‌سازی آماری:

  • انتخاب متغیرهای مرتبط
  • مشخص کردن روابط بین متغیرها
  • برآورد پارامترها از داده‌ها
  • ارزیابی تناسب مدل و تشخیص‌ها
  • درک محدودیت‌ها و فرضیات

مهم است که به یاد داشته باشیم مدل‌ها ابزارهایی برای درک هستند، نه نمایندگی‌های کامل از واقعیت. هدف یافتن مدل‌هایی است که برای مقاصد خاص مفید باشند در حالی که از محدودیت‌های آن‌ها آگاه باشیم.

6. خطرات P-value و بحران بازتولید

نتایج علمی و تصمیمات تجاری یا سیاستی نباید تنها بر اساس اینکه آیا یک P-value از آستانه خاصی عبور می‌کند، باشد.

فراتر از معنی‌داری آماری. P-value‌ها مدت‌هاست که به عنوان معیاری برای معنی‌داری آماری استفاده می‌شوند، به طوری که p < 0.05 اغلب به عنوان آستانه‌ای برای "کشف" در نظر گرفته می‌شود. با این حال، این رویکرد منجر به مشکلات متعددی در تحقیقات علمی شده است، از جمله تعصب انتشار و بحران بازتولید.

مسائل مربوط به P-value‌ها:

  • تفسیر نادرست از معنی آن‌ها
  • آستانه‌های دلخواه برای معنی‌داری
  • تشویق به p-hacking
  • غفلت از اندازه‌های اثر و معنی‌داری عملی

برای حل این مسائل، بسیاری از آمارشناسان به رویکردهای دقیق‌تری مانند گزارش اندازه‌های اثر و فاصله‌های اطمینان، استفاده از روش‌های بیزی و تمرکز بر تکرار نتایج به جای مطالعات منفرد، تأکید می‌کنند.

7. تفکر بیزی: یادگیری از تجربه

میراث بیز بینش بنیادی است که داده‌ها به تنهایی سخن نمی‌گویند - دانش خارجی ما و حتی قضاوت ما نقش مرکزی دارند.

به‌روزرسانی باورها. آمار بیزی چارچوبی برای به‌روزرسانی باورهای ما به محض جمع‌آوری شواهد جدید فراهم می‌کند. این روش دانش قبلی را با داده‌های مشاهده‌شده ترکیب می‌کند تا احتمال‌های پسین را شکل دهد. این رویکرد به‌ویژه در موقعیت‌هایی با داده‌های محدود یا زمانی که دانش کارشناسانه را در نظر می‌گیرد، مفید است.

مفاهیم کلیدی بیزی:

  • توزیع‌های قبلی و پسین
  • احتمال و نظریه بیز
  • فاصله‌های معتبر
  • مقایسه مدل با استفاده از عوامل بیزی

روش‌های بیزی رویکردی شهودی‌تر به عدم قطعیت ارائه می‌دهند و می‌توانند به‌ویژه در حوزه‌هایی مانند تشخیص پزشکی که احتمال‌های قبلی بیماری‌ها به‌خوبی شناخته شده‌اند، مفید باشند. با این حال، آن‌ها نیاز به توجه دقیق به توزیع‌های قبلی دارند و می‌توانند محاسباتی سنگین باشند.

8. اخلاق داده و آمار مسئولانه در دنیای مدرن

نگرانی‌های فزاینده درباره سوءاستفاده‌های احتمالی از داده‌های شخصی، به‌ویژه زمانی که از حساب‌های رسانه‌های اجتماعی جمع‌آوری می‌شوند، توجه را به جنبه‌های اخلاقی علم داده و آمار معطوف کرده است.

ملاحظات اخلاقی. با افزایش اهمیت داده در تصمیم‌گیری در حوزه‌های مختلف، آمارشناسان و دانشمندان داده باید با ملاحظات اخلاقی دست و پنجه نرم کنند. این شامل مسائل حریم خصوصی، انصاف، شفافیت و احتمال سوءاستفاده از نتایج آماری است.

چالش‌های کلیدی اخلاقی:

  • حفاظت از حریم خصوصی فردی در تحلیل‌های کلان داده
  • اطمینان از انصاف در تصمیم‌گیری‌های الگوریتمی
  • ارتباط عدم قطعیت و محدودیت‌های تحلیل‌ها
  • رسیدگی به تعصبات احتمالی در جمع‌آوری و تحلیل داده
  • تعادل بین مزایای بینش‌های مبتنی بر داده و آسیب‌های احتمالی

عملکرد آماری مسئولانه نه تنها شامل تخصص فنی است، بلکه همچنین تعهد به اصول اخلاقی و آگاهی از تأثیرات اجتماعی گسترده‌تر کار ما را نیز در بر می‌گیرد. با پیشرفت این حوزه، گنجاندن اخلاق در آموزش آماری و عمل حرفه‌ای به‌طور فزاینده‌ای ضروری می‌شود.

آخرین به‌روزرسانی::

FAQ

What's The Art of Statistics: Learning from Data about?

  • Focus on Statistical Science: The book emphasizes the role of statistical science in understanding the world and making informed decisions based on data.
  • Real-World Applications: It uses examples like Harold Shipman and child heart surgery to show how statistics can uncover truths and inform public health.
  • Problem-Solving Framework: Introduces the PPDAC cycle (Problem, Plan, Data, Analysis, Conclusion) as a structured approach to statistical inquiry.

Why should I read The Art of Statistics?

  • Enhance Data Literacy: It improves your ability to critically assess statistical claims and understand data implications in everyday life.
  • Accessible to All: Designed for both students and general readers, it makes complex statistical concepts approachable without advanced math skills.
  • Empower Decision-Making: Understanding statistical principles equips you to make informed decisions in personal and professional contexts.

What are the key takeaways of The Art of Statistics?

  • Understanding Uncertainty: Emphasizes that all statistical estimates come with uncertainty, crucial for data interpretation.
  • Importance of Context: Highlights how context influences data interpretation and perceptions of risk and outcomes.
  • Causation vs. Correlation: Stresses the distinction between correlation and causation, a fundamental principle in statistics.

What are the best quotes from The Art of Statistics and what do they mean?

  • "The numbers have no way of speaking for themselves. We speak for them.": Highlights the need for interpretation and context in deriving meaning from data.
  • "All models are wrong, but some are useful.": Acknowledges the limitations of statistical models while recognizing their utility in predictions.
  • "Correlation does not imply causation.": Reminds that correlation between variables does not mean one causes the other.

How does the PPDAC cycle work in The Art of Statistics?

  • Structured Approach: PPDAC stands for Problem, Plan, Data, Analysis, and Conclusion, providing a systematic framework for statistical inquiries.
  • Iterative Process: Each stage informs the next, allowing for continuous refinement based on findings.
  • Real-World Examples: Illustrated with case studies, demonstrating its application in real-world analysis.

How does The Art of Statistics explain the difference between correlation and causation?

  • Key Distinction: Emphasizes that correlation does not imply causation; other factors may influence the relationship.
  • Examples Provided: Uses examples like ice cream sales and drowning rates to illustrate common misconceptions.
  • Critical Thinking: Encourages critical thinking about variable relationships and seeking evidence of causation.

What is a confidence interval, as defined in The Art of Statistics?

  • Definition: An estimated range within which an unknown parameter likely lies, based on observed data.
  • Calculation: Typically calculated as the estimate ± a margin of error, reflecting the uncertainty of the estimate.
  • Interpretation: Expresses the precision of an estimate, helping understand data reliability and variability.

What is the significance of the distinction between sample statistics and population parameters in The Art of Statistics?

  • Understanding Estimates: Sample statistics estimate population parameters, crucial for accurate data interpretation.
  • Uncertainty in Estimates: Discusses how sample statistics come with uncertainty, quantified using methods like bootstrapping.
  • Implications for Inference: Highlights the importance of sample size and representativeness for making inferences about a population.

How does The Art of Statistics address the concept of causation?

  • Causation vs. Correlation: Emphasizes careful analysis to establish causal relationships, not just correlations.
  • Bradford Hill Criteria: Introduces criteria for assessing causation in observational studies, considering factors like strength and consistency.
  • Importance of Randomized Trials: Advocates for randomized controlled trials as the gold standard for establishing causation.

What role does probability play in The Art of Statistics?

  • Foundation for Inference: Provides the mathematical foundation for statistical inference, quantifying uncertainty and making predictions.
  • Different Interpretations: Discusses classical, frequentist, and subjective approaches, highlighting their relevance in different contexts.
  • Real-World Applications: Applied to scenarios like estimating unemployment rates, reinforcing its practical importance.

How does The Art of Statistics explain the concept of bootstrapping?

  • Resampling Technique: Described as a method of repeatedly sampling from a dataset with replacement to estimate variability.
  • Confidence Intervals: Used to create confidence intervals, enhancing understanding of uncertainty in sample statistics.
  • No Strong Assumptions: Does not require strong assumptions about population distribution, making it a flexible tool.

What are some common pitfalls in statistical practice highlighted in The Art of Statistics?

  • Questionable Research Practices: Discusses issues like selective reporting and P-hacking, leading to misleading conclusions.
  • Publication Bias: Highlights the problem of publication bias, skewing scientific literature and misleading future research.
  • Misinterpretation of Results: Warns against confusing correlation with causation or overgeneralizing from small samples.

نقد و بررسی

4.16 از 5
میانگین از 5k+ امتیازات از Goodreads و Amazon.

کتاب هنر آمار به خاطر رویکرد جذابش در توضیح مفاهیم آماری بدون استفاده از ریاضیات سنگین مورد تحسین قرار گرفته است. خوانندگان از مثال‌های واقعی و توضیحات واضح در مورد موضوعات پیچیده قدردانی می‌کنند. بسیاری این کتاب را برای درک نحوه تفسیر آمار در رسانه‌ها و تحقیقات مفید می‌دانند. برخی آن را در برخی بخش‌ها بیش از حد ابتدایی و در بخش‌های دیگر بیش از حد پیچیده انتقاد کرده‌اند. به‌طور کلی، این کتاب به کسانی که می‌خواهند سواد آماری خود را بهبود بخشند، توصیه می‌شود، هرچند نظرات در مورد دسترسی آن برای مبتدیان کامل متفاوت است.

درباره نویسنده

سر دیوید اسپیکل‌هالتر یک آمارشناس و دانشگاهی برجسته است. به عنوان استاد وینتون در درک عمومی ریسک در دانشگاه کمبریج، او بر ارتباط مفاهیم آماری با عموم مردم تمرکز دارد. زمینه‌ی تخصصی او در آمار پزشکی، به‌ویژه روش‌های بیزی است. اسپیکل‌هالتر نرم‌افزار BUGS را برای تحلیل بیزی توسعه داده و در زمینه‌ی آزمایش‌های بالینی و ایمنی داروها فعالیت کرده است. او به شرکت‌های دارویی مشاوره داده و در روش‌های ارزیابی فناوری سلامت مشارکت داشته است. تخصص او در نظارت بر عملکرد، منجر به مشارکتش در تحقیقات با پروفایل بالا، از جمله موارد بیمارستان سلطنتی بریستول و پرونده‌ی شیپمن شده است.

Other books by David Spiegelhalter

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Create a free account to unlock:
Requests: Request new book summaries
Bookmarks: Save your favorite books
History: Revisit books later
Ratings: Rate books & see your ratings
Try Full Access for 7 Days
Listen, bookmark, and more
Compare Features Free Pro
📖 Read Summaries
All summaries are free to read in 40 languages
🎧 Listen to Summaries
Listen to unlimited summaries in 40 languages
❤️ Unlimited Bookmarks
Free users are limited to 10
📜 Unlimited History
Free users are limited to 10
Risk-Free Timeline
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Mar 1,
cancel anytime before.
Consume 2.8x More Books
2.8x more books Listening Reading
Our users love us
50,000+ readers
"...I can 10x the number of books I can read..."
"...exceptionally accurate, engaging, and beautifully presented..."
"...better than any amazon review when I'm making a book-buying decision..."
Save 62%
Yearly
$119.88 $44.99/year
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Settings
Appearance
Black Friday Sale 🎉
$20 off Lifetime Access
$79.99 $59.99
Upgrade Now →