Facebook Pixel
Searching...
فارسی
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
Data Science from Scratch

Data Science from Scratch

First Principles with Python
توسط Joel Grus 2019 403 صفحات
3.91
1k+ امتیازها
گوش دادن

نکات کلیدی

1. تسلط بر اصول اولیه پایتون برای علم داده

پایتون دارای ویژگی‌های متعددی است که آن را برای یادگیری (و انجام) علم داده بسیار مناسب می‌سازد.

اصول پایتون. سادگی و اکوسیستم وسیع کتابخانه‌های پایتون، این زبان را به زبانی ایده‌آل برای علم داده تبدیل کرده است. مفاهیم کلیدی شامل ساختارهای داده (لیست‌ها، دیکشنری‌ها، مجموعه‌ها)، جریان کنترل (عبارات شرطی، حلقه‌ها) و توابع است. خوانایی و سهولت استفاده از این زبان به دانشمندان داده اجازه می‌دهد تا بر حل مسائل تمرکز کنند و نه بر نحو پیچیده.

کتابخانه‌های دستکاری داده. با کتابخانه‌های ضروری مانند NumPy برای محاسبات عددی و pandas برای دستکاری داده آشنا شوید. این ابزارها ساختارها و عملیات کارآمدی را برای کار با مجموعه‌های داده بزرگ فراهم می‌کنند. یاد بگیرید که:

  • داده‌ها را در فرمت‌های مختلف بارگذاری و ذخیره کنید
  • داده‌ها را پاک‌سازی و پیش‌پردازش کنید
  • عملیات آماری پایه را انجام دهید
  • مجموعه‌های داده را تغییر شکل داده و ادغام کنید

ابزارهای تجسم. بر کتابخانه‌های تجسم داده مانند Matplotlib و Seaborn تسلط پیدا کنید تا نمودارهای اطلاعاتی و بصری جذاب ایجاد کنید. یاد بگیرید که چگونه:

  • نمودارهای پایه (خطی، پراکنده، میله‌ای) ایجاد کنید
  • زیبایی‌شناسی نمودار را سفارشی کنید
  • زیرنمودارها و شکل‌های چند پنلی ایجاد کنید
  • داده‌های با ابعاد بالا را تجسم کنید

2. درک و به‌کارگیری مفاهیم اصلی آمار

آمار مهم است. (یا شاید آمارها مهم هستند؟)

آمار توصیفی. یاد بگیرید که چگونه داده‌ها را با استفاده از معیارهای گرایش مرکزی (میانگین، میانه، مد) و پراکندگی (واریانس، انحراف معیار) خلاصه و توصیف کنید. اهمیت توزیع داده و چگونگی تجسم آن با استفاده از هیستوگرام‌ها و نمودارهای جعبه‌ای را درک کنید.

آمار استنباطی. بر مفاهیم کلیدی در استنباط آماری تسلط پیدا کنید:

  • توزیع‌های احتمالی (نرمال، دوجمله‌ای، پواسون)
  • آزمون فرضیه و مقادیر p
  • فاصله‌های اطمینان
  • تحلیل رگرسیون

اشکالات آماری. از اشتباهات و تفسیرهای نادرست رایج در آمار آگاه باشید:

  • همبستگی در مقابل علیت
  • پارادوکس سیمپسون
  • سوگیری بقا
  • مشکل مقایسه‌های متعدد

3. استفاده از جبر خطی برای دستکاری و تحلیل داده

جبر خطی شاخه‌ای از ریاضیات است که به فضاهای برداری می‌پردازد.

عملیات برداری و ماتریسی. مفاهیم بنیادی جبر خطی و کاربردهای آن در علم داده را درک کنید:

  • جمع برداری و ضرب اسکالر
  • ضرب ماتریسی و ترانهاده
  • بردارهای ویژه و مقادیر ویژه
  • تجزیه مقدار منفرد (SVD)

کاربردها در علم داده. تکنیک‌های جبر خطی را برای حل مسائل مختلف علم داده به کار ببرید:

  • کاهش ابعاد (به عنوان مثال، تحلیل مؤلفه‌های اصلی)
  • استخراج و تبدیل ویژگی‌ها
  • حل سیستم‌های معادلات خطی
  • پیاده‌سازی الگوریتم‌های یادگیری ماشین (به عنوان مثال، رگرسیون خطی، شبکه‌های عصبی)

4. پیاده‌سازی الگوریتم‌های یادگیری ماشین از ابتدا

یادگیری ماشین در حال حاضر بسیار داغ است و در این فصل ما به‌سختی به سطح آن پرداخته‌ایم.

یادگیری تحت نظارت. الگوریتم‌های بنیادی یادگیری تحت نظارت را درک و پیاده‌سازی کنید:

  • رگرسیون خطی
  • رگرسیون لجستیک
  • درختان تصمیم
  • نزدیک‌ترین همسایه‌ها
  • ماشین‌های بردار پشتیبان (SVM)

یادگیری بدون نظارت. تکنیک‌های یادگیری بدون نظارت را برای کشف الگوها در داده‌ها بررسی کنید:

  • خوشه‌بندی K-means
  • خوشه‌بندی سلسله‌مراتبی
  • تحلیل مؤلفه‌های اصلی (PCA)
  • مدل‌های مخلوط گوسی

ارزیابی مدل. تکنیک‌هایی برای ارزیابی و بهبود عملکرد مدل یاد بگیرید:

  • اعتبارسنجی متقابل
  • منظم‌سازی
  • انتخاب و مهندسی ویژگی‌ها
  • تنظیم هایپرپارامترها

5. بررسی تکنیک‌های پیشرفته در شبکه‌های عصبی و یادگیری عمیق

یادگیری عمیق در اصل به کاربرد شبکه‌های عصبی "عمیق" (یعنی شبکه‌هایی با بیش از یک لایه پنهان) اشاره داشت، اگرچه در عمل این اصطلاح اکنون شامل انواع مختلفی از معماری‌های عصبی می‌شود.

اصول شبکه‌های عصبی. بلوک‌های سازنده اصلی شبکه‌های عصبی را درک کنید:

  • نورون‌ها و توابع فعال‌سازی
  • پیش‌خور و پس‌انتشار
  • نزول گرادیان و الگوریتم‌های بهینه‌سازی

معماری‌های یادگیری عمیق. مدل‌های مختلف یادگیری عمیق و کاربردهای آن‌ها را بررسی کنید:

  • شبکه‌های عصبی کانولوشنی (CNN) برای پردازش تصویر
  • شبکه‌های عصبی بازگشتی (RNN) برای داده‌های توالی
  • شبکه‌های حافظه بلندمدت و کوتاه‌مدت (LSTM)
  • شبکه‌های مولد متخاصم (GAN)

کتابخانه‌های یادگیری عمیق. با کتابخانه‌های محبوب یادگیری عمیق آشنا شوید:

  • TensorFlow
  • PyTorch
  • Keras

6. استفاده از پردازش زبان طبیعی برای تحلیل متن

پردازش زبان طبیعی (NLP) به تکنیک‌های محاسباتی مربوط به زبان اشاره دارد.

پیش‌پردازش متن. تکنیک‌های ضروری برای آماده‌سازی داده‌های متنی را یاد بگیرید:

  • توکن‌سازی
  • ریشه‌یابی و لِماتیزه کردن
  • حذف کلمات توقف
  • برچسب‌گذاری بخش‌های گفتار

استخراج ویژگی. روش‌های تبدیل متن به ویژگی‌های عددی را درک کنید:

  • نمایندگی کیسه‌ای از کلمات
  • TF-IDF (فراوانی واژه-معکوس فراوانی سند)
  • جاسازی‌های کلمه (به عنوان مثال، Word2Vec، GloVe)

کاربردهای NLP. وظایف و تکنیک‌های رایج NLP را بررسی کنید:

  • تحلیل احساسات
  • شناسایی موجودیت‌های نام‌دار (NER)
  • مدل‌سازی موضوع
  • ترجمه ماشینی
  • سیستم‌های پاسخگویی به سوالات

7. به‌کارگیری تکنیک‌های علم داده برای حل مسائل دنیای واقعی

در طول کتاب، ما به بررسی خانواده‌های مختلف مدل‌هایی خواهیم پرداخت که می‌توانیم از داده‌ها یاد بگیریم.

فرمول‌بندی مسئله. یاد بگیرید که چگونه مسائل تجاری را به وظایف علم داده ترجمه کنید:

  • شناسایی ذینفعان کلیدی و نیازهای آن‌ها
  • تعریف اهداف واضح و معیارهای موفقیت
  • تعیین منابع داده مناسب و روش‌های جمع‌آوری

توسعه خط لوله داده. خط لوله‌های داده‌ای قوی برای کاربردهای دنیای واقعی بسازید:

  • بارگذاری و ذخیره‌سازی داده
  • پاک‌سازی و پیش‌پردازش داده
  • مهندسی و انتخاب ویژگی‌ها
  • آموزش و ارزیابی مدل
  • استقرار و نظارت

ملاحظات اخلاقی. پیامدهای اخلاقی علم داده را درک کنید:

  • حریم خصوصی و امنیت داده
  • سوگیری و انصاف در مدل‌های یادگیری ماشین
  • شفافیت و قابلیت تفسیر الگوریتم‌ها
  • توسعه و استقرار هوش مصنوعی مسئولانه

آخرین به‌روزرسانی::

نقد و بررسی

3.91 از 5
میانگین از 1k+ امتیازات از Goodreads و Amazon.

کتاب علم داده از پایه نقدهای متفاوتی دریافت کرده است. بسیاری از خوانندگان از رویکرد عملی و مثال‌های کاربردی آن برای مبتدیان تمجید می‌کنند و توضیحات واضح نویسنده و سبک نوشتاری جذاب او را می‌ستایند. تمرکز کتاب بر ساخت الگوریتم‌ها از پایه به عنوان یک مزیت برای درک اصول بنیادی تلقی می‌شود. با این حال، برخی از منتقدان آن را برای متخصصان با تجربه بیش از حد ساده یا فاقد توضیحات عمیق می‌دانند. خوانندگان از گستره وسیع موضوعات پوشش داده شده قدردانی می‌کنند اما اشاره می‌کنند که مثال‌های کد ممکن است برای کاربردهای واقعی عملی نباشند. به طور کلی، این کتاب برای کسانی که تازه وارد علم داده شده‌اند و به دنبال یک مقدمه عملی هستند، توصیه می‌شود.

درباره نویسنده

جوئل گروس دانشمند داده و مهندس نرم‌افزار است که به خاطر کارهایش در زمینه یادگیری ماشین و تحلیل داده شناخته شده است. او با نگارش کتاب "علم داده از پایه" که به منبعی محبوب برای تازه‌واردان به این حوزه تبدیل شده، به شهرت رسید. گروس دارای پیشینه‌ای در ریاضیات و علوم کامپیوتر است و برای شرکت‌هایی مانند گوگل و مایکروسافت کار کرده است. او به خاطر رویکرد واضح و عملی‌اش در آموزش مفاهیم پیچیده و توانایی‌اش در دسترس‌پذیر کردن علم داده برای مبتدیان شناخته می‌شود. گروس همچنین در جامعه علم داده فعال است و به طور منظم در بحث‌ها شرکت می‌کند و از طریق پلتفرم‌های مختلف تخصص خود را به اشتراک می‌گذارد.

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Create a free account to unlock:
Bookmarks – save your favorite books
History – revisit books later
Ratings – rate books & see your ratings
Unlock unlimited listening
Your first week's on us!
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Dec 1,
cancel anytime before.
Compare Features Free Pro
Read full text summaries
Summaries are free to read for everyone
Listen to summaries
12,000+ hours of audio
Unlimited Bookmarks
Free users are limited to 10
Unlimited History
Free users are limited to 10
What our users say
30,000+ readers
“...I can 10x the number of books I can read...”
“...exceptionally accurate, engaging, and beautifully presented...”
“...better than any amazon review when I'm making a book-buying decision...”
Save 62%
Yearly
$119.88 $44.99/yr
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Settings
Appearance