Facebook Pixel
Searching...
日本語
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
The Art of Statistics

The Art of Statistics

Learning from Data
著者 David Spiegelhalter 2019 448 ページ
4.17
4k+ 評価
聞く
9 分

つの重要なポイント

1. 統計学: データから学ぶ技術

数字自体には意味がない。我々がそれに意味を与えるのだ。

データ駆動の洞察。 統計学はデータから学び、世界を理解し、より良い意思決定を行うための科学である。データの収集、分析、解釈を通じて、有意義な結論を導き出す。この分野は数学的な厳密さと実践的な問題解決を組み合わせ、複雑な情報から価値ある洞察を引き出すことを可能にする。

PPDACサイクル。 統計学の基本的なフレームワークはPPDACサイクルである:

  • 問題: 解決すべき質問や課題を定義する
  • 計画: 研究や実験の設計を行う
  • データ: 関連情報を収集し整理する
  • 分析: 統計技術を適用してパターンを見つける
  • 結論: 結果を解釈し、発見を伝える

この体系的なアプローチにより、統計調査は現実の問題に焦点を当てた構造化されたものとなる。

2. 世界をデータに変える: 課題と機会

私たちの最も個人的な感情でさえ、コード化され統計分析の対象となり得る。

データの表現。 現実の現象をデータに変換することは、統計分析において重要なステップである。このプロセスには、複雑な現実を表現するための明確なカテゴリ、測定、変数を定義することが含まれる。しかし、この変換は困難であり、時には論争を引き起こすこともある。

データ収集の課題:

  • 正確なカテゴリの定義(例:「木」とは何か?)
  • 時間を通じた一貫した測定の確保
  • 詳細と実用性のバランス
  • 文化的および文脈的要因の考慮

これらの課題にもかかわらず、私たちの世界のさまざまな側面を定量化し分析する能力は、経済学、健康、社会科学などの分野で大きな進歩をもたらしている。重要なのは、データ表現に内在する限界と仮定を認識することである。

3. 確率: 不確実性と変動性の言語

確率は本当に難しく直感に反する概念である。

不確実性の定量化。 確率論は、不確実性と変動性を扱うための数学的フレームワークを提供する。これにより、予測を行い、リスクを評価し、限られたデータから推論を引き出すことができる。確率を理解することは、統計結果を解釈し、情報に基づいた意思決定を行うために重要である。

主要な確率概念:

  • ランダム変数と分布
  • 期待値と分散
  • 条件付き確率
  • 大数の法則
  • 中心極限定理

確率は直感に反することが多いが、頻度木や視覚的表現などのツールを使用することで、複雑な概念をより理解しやすくすることができる。確率をマスターすることは、高度な統計技術やデータに基づく主張を批判的に評価するために不可欠である。

4. 相関、因果関係、ランダム化試験の力

相関は因果関係を意味しない。

関連性を超えて。 データに相関を見つけることは容易だが、因果関係を確立することははるかに難しい。観察研究は関連性を明らかにすることができるが、しばしば他の要因によって混乱させられる。ランダム化比較試験(RCT)は、因果関係を決定するためのゴールドスタンダードである。

RCTの強み:

  • ランダム割り当てによりバイアスを減少
  • コントロール群がプラセボ効果を考慮
  • 盲検化により観察者バイアスを最小化
  • 事前登録によりpハッキングを防止

しかし、RCTは常に実行可能または倫理的であるとは限らない。そのような場合、慎重な研究設計、交絡変数の制御、傾向スコアマッチングなどの統計技術を使用することで、観察データからの因果推論を強化することができる。

5. 統計モデル: 複雑な現実を簡略化する

すべてのモデルは間違っているが、いくつかは有用である。

モデルベースの思考。 統計モデルは、現実を簡略化したものであり、パターンを理解し予測を行うのに役立つ。これらは単純な線形回帰から複雑な機械学習アルゴリズムまで多岐にわたる。すべてのモデルには限界があるが、適切に使用すれば貴重な洞察を提供することができる。

統計モデリングの主要な側面:

  • 関連する変数の選択
  • 変数間の関係の特定
  • データからのパラメータの推定
  • モデル適合度と診断の評価
  • 限界と仮定の理解

モデルは理解のためのツールであり、現実の完璧な表現ではないことを忘れてはならない。目標は、特定の目的に有用なモデルを見つけ、その限界を認識しながら使用することである。

6. P値の危険性と再現性の危機

科学的結論やビジネスや政策の決定は、特定の閾値を超えるかどうかだけで判断されるべきではない。

統計的有意性を超えて。 P値は長い間、統計的有意性の指標として使用されてきたが、p < 0.05が「発見」の閾値と見なされることが多い。しかし、このアプローチは、出版バイアスや再現性の危機など、科学研究に多くの問題を引き起こしている。

P値の問題点:

  • 意味の誤解
  • 有意性のための恣意的な閾値
  • pハッキングの奨励
  • 効果の大きさや実用的な有意性の無視

これらの問題に対処するために、多くの統計学者は、効果の大きさや信頼区間の報告、ベイズ法の使用、単一の研究ではなく結果の再現に焦点を当てるなど、より微妙なアプローチを提唱している。

7. ベイズ的思考: 経験から学ぶ

ベイズの遺産は、データ自体が語るのではなく、外部の知識や判断が中心的な役割を果たすという基本的な洞察である。

信念の更新。 ベイズ統計は、新しい証拠を収集するにつれて信念を更新するためのフレームワークを提供する。これは、事前知識と観測データを組み合わせて事後確率を形成する。このアプローチは、データが限られている状況や専門知識を取り入れる場合に特に有用である。

主要なベイズ概念:

  • 事前分布と事後分布
  • 尤度とベイズの定理
  • 信頼区間
  • ベイズ因子を用いたモデル比較

ベイズ法は、不確実性に対するより直感的なアプローチを提供し、特に病気の事前確率がよく知られている医療診断などの分野で有用である。しかし、事前分布の慎重な考慮が必要であり、計算負荷が高いこともある。

8. データ倫理と現代社会における責任ある統計

ソーシャルメディアアカウントから収集された個人データの潜在的な悪用に対する懸念が高まる中、データサイエンスと統計の倫理的側面に注目が集まっている。

倫理的考慮。 データがさまざまな分野で意思決定の中心となるにつれて、統計学者やデータサイエンティストは倫理的な考慮に直面する。これには、プライバシー、公平性、透明性、統計結果の悪用の可能性などの問題が含まれる。

主要な倫理的課題:

  • ビッグデータ分析における個人のプライバシー保護
  • アルゴリズムによる意思決定の公平性の確保
  • 分析の不確実性と限界の伝達
  • データ収集と分析におけるバイアスの対処
  • データ駆動の洞察の利益と潜在的な害のバランス

責任ある統計実践には、技術的な専門知識だけでなく、倫理的原則へのコミットメントと、私たちの仕事の広範な社会的影響に対する認識が必要である。分野が進化するにつれて、統計教育と専門実践に倫理を組み込むことがますます重要となる。

最終更新日:

レビュー

4.17 中 5
平均評価 4k+ GoodreadsAmazonの評価.

統計学の技法は、数学を多用せずに統計の概念を説明する魅力的なアプローチで高く評価されている。読者は現実の例と複雑なトピックの明確な説明を評価している。多くの人がメディアや研究における統計の解釈方法を理解するのに役立つと感じている。一部の人々は、部分的に基本的すぎると感じたり、他の部分では複雑すぎると批判している。全体として、統計リテラシーを向上させたい人に推奨されているが、完全な初心者にとってのアクセスのしやすさについては意見が分かれている。

Your rating:

著者について

デイビッド・スピーゲルハルター卿は、著名な統計学者であり学者である。ケンブリッジ大学のウィントン公共リスク理解教授として、統計概念を一般に伝えることに注力している。彼の専門は医療統計学であり、特にベイズ法に精通している。スピーゲルハルターはベイズ分析のためのBUGSソフトウェアを開発し、臨床試験や薬品の安全性に関する研究に従事してきた。彼は製薬会社のコンサルタントを務め、医療技術評価方法にも貢献している。彼のパフォーマンスモニタリングの専門知識は、ブリストル王立病院やシップマン事件などの高名な調査にも関与することとなった。

Other books by David Spiegelhalter

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Create a free account to unlock:
Bookmarks – save your favorite books
History – revisit books later
Ratings – rate books & see your ratings
Unlock unlimited listening
Your first week's on us!
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Nov 30,
cancel anytime before.
Compare Features Free Pro
Read full text summaries
Summaries are free to read for everyone
Listen to summaries
12,000+ hours of audio
Unlimited Bookmarks
Free users are limited to 10
Unlimited History
Free users are limited to 10
What our users say
30,000+ readers
“...I can 10x the number of books I can read...”
“...exceptionally accurate, engaging, and beautifully presented...”
“...better than any amazon review when I'm making a book-buying decision...”
Save 62%
Yearly
$119.88 $44.99/yr
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Settings
Appearance