Facebook Pixel
Searching...
فارسی
EnglishEnglish
EspañolSpanish
简体中文Chinese
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
Deep Learning

Deep Learning

توسط John D. Kelleher 2019 296 صفحات
3.91
100+ امتیازها
گوش دادن
Listen to Summary

نکات کلیدی

1. یادگیری عمیق: تصمیم‌گیری مبتنی بر داده

یادگیری عمیق با شناسایی و استخراج الگوها از مجموعه‌های بزرگ داده، امکان تصمیم‌گیری مبتنی بر داده را فراهم می‌آورد که به‌طور دقیق از مجموعه‌های ورودی پیچیده به نتایج تصمیم‌گیری مطلوب می‌انجامد.

تصمیم‌گیری مبتنی بر داده. یادگیری عمیق در استخراج الگوها از مجموعه‌های وسیع داده‌ها مهارت دارد و امکان نقشه‌برداری دقیق از ورودی‌های پیچیده به نتایج مورد نظر را فراهم می‌کند. این ویژگی آن را برای کاربردهایی که در آن‌ها شهود ناکافی است و داده‌ها حاکم هستند، ایده‌آل می‌سازد. نمونه‌هایی از این کاربردها عبارتند از:

  • تحلیل متن در مکالمات آنلاین توسط فیسبوک
  • جستجوی تصویر و ترجمه ماشینی توسط گوگل، بایدو و مایکروسافت
  • درک محیط و برنامه‌ریزی حرکتی در خودروهای خودران

موفقیت AlphaGo. AlphaGo، برنامه‌ای از دیپ‌مایند که قهرمانان جهانی بازی گو را شکست داد، قدرت یادگیری عمیق را به نمایش می‌گذارد. فضای جستجوی وسیع بازی گو، چالش‌های محاسباتی زیادی ایجاد کرد، اما الگوریتم‌های یادگیری عمیق به AlphaGo این امکان را دادند که پیکربندی‌های صفحه را ارزیابی کرده و تصمیمات استراتژیک اتخاذ کند.

تصمیم‌گیری کلیدی است. توانایی اتخاذ تصمیمات مبتنی بر داده در بسیاری از حوزه‌ها حیاتی است. یادگیری عمیق ابزاری برای شناسایی و استخراج الگوها از مجموعه‌های بزرگ داده فراهم می‌آورد که امکان نقشه‌برداری دقیق از ورودی‌های پیچیده به نتایج مطلوب را می‌دهد.

2. هوش مصنوعی، یادگیری ماشین و یادگیری عمیق: سلسله‌مراتب هوش

حوزه مدرن یادگیری ماشین بر دو موضوع اخیر بنا شده است: کامپیوترهایی که می‌توانند از مثال‌ها یاد بگیرند و تحقیقات در زمینه شبکه‌های عصبی.

حوزه‌های تو در تو. هوش مصنوعی (AI) حوزه‌ای کلی است که شامل یادگیری ماشین (ML) می‌شود و یادگیری ماشین نیز شامل یادگیری عمیق (DL) است. هدف AI ایجاد سیستم‌های هوشمند است، ML بر روی الگوریتم‌هایی تمرکز دارد که از داده‌ها یاد می‌گیرند و DL از شبکه‌های عصبی عمیق استفاده می‌کند.

ریشه‌های AI. حوزه AI در یک کارگاه در کالج دارتموث در سال 1956 متولد شد. تحقیقات ارائه شده در این کارگاه شامل اثبات قضایای ریاضی، پردازش زبان طبیعی، برنامه‌ریزی برای بازی‌ها، برنامه‌های کامپیوتری که می‌توانند از مثال‌ها یاد بگیرند و شبکه‌های عصبی بود.

تمرکز ML. یادگیری ماشین شامل توسعه الگوریتم‌هایی است که به یک کامپیوتر اجازه می‌دهد تا توابع را از یک مجموعه داده (مجموعه‌های مثال) استخراج کند. برای درک مفهوم یادگیری ماشین، نیاز به درک سه اصطلاح داریم: مجموعه داده، الگوریتم و تابع.

3. یادگیری ماشین: استخراج توابع از داده

یک تابع یک نقشه‌برداری قطعی از یک مجموعه مقادیر ورودی به یک یا چند مقدار خروجی است.

نقشه‌برداری‌های قطعی. یک تابع یک نقشه‌برداری قطعی از ورودی‌ها به خروجی‌ها است، به این معنی که برای هر مجموعه خاص از ورودی‌ها، همیشه همان خروجی‌ها را بازمی‌گرداند. هدف یادگیری ماشین یادگیری این توابع از داده‌ها است.

مجموعه‌های داده و الگوریتم‌ها. الگوریتم‌های یادگیری ماشین مجموعه‌های داده را تحلیل می‌کنند تا الگوهای تکراری را شناسایی کنند که سپس به‌عنوان توابع نمایان می‌شوند. این توابع می‌توانند عملیات‌های حسابی ساده، قوانین if-then-else یا نمایش‌های پیچیده‌تری مانند شبکه‌های عصبی باشند.

شبکه‌های عصبی به‌عنوان توابع. یادگیری عمیق، زیرمجموعه‌ای از یادگیری ماشین، بر روی مدل‌های شبکه‌های عصبی عمیق تمرکز دارد. الگوهایی که الگوریتم‌های یادگیری عمیق از مجموعه‌های داده استخراج می‌کنند، توابعی هستند که به‌عنوان شبکه‌های عصبی نمایان می‌شوند.

4. دشواری یادگیری ماشین: نویز و تعصب

اولاً، بیشتر مجموعه‌های داده شامل نویز در داده‌ها هستند، بنابراین جستجوی تابعی که دقیقاً با داده‌ها مطابقت داشته باشد، لزوماً بهترین استراتژی نیست، زیرا معادل یادگیری نویز است.

نویز و مسائل بد-موقعیت. یادگیری ماشین با چالش‌هایی به دلیل نویز در داده‌ها و این واقعیت که مجموعه توابع ممکن اغلب بزرگ‌تر از مجموعه مثال‌ها در مجموعه داده است، مواجه است که این موضوع آن را به یک مسئله بد-موقعیت تبدیل می‌کند.

تعصب استقرایی. برای غلبه بر این چالش‌ها، الگوریتم‌های یادگیری ماشین اطلاعات ارائه شده توسط داده‌ها را با مجموعه‌ای از فرضیات درباره ویژگی‌های بهترین تابع، که به آن تعصب استقرایی الگوریتم گفته می‌شود، تکمیل می‌کنند.

کم‌فیت و بیش‌فیت. انتخاب تعصب استقرایی نادرست می‌تواند منجر به کم‌فیت (تابع خیلی ساده است) یا بیش‌فیت (تابع با نویز داده‌ها مطابقت دارد) شود. یافتن تعادل مناسب بین داده و تعصب استقرایی کلید موفقیت در تعمیم است.

5. یادگیری نظارت‌شده، یادگیری بدون نظارت و یادگیری تقویتی

در یادگیری ماشین نظارت‌شده، هر مثال در مجموعه داده با مقدار خروجی (یا هدف) مورد انتظار برچسب‌گذاری می‌شود.

یادگیری نظارت‌شده. در یادگیری ماشین نظارت‌شده، هر مثال در مجموعه داده با مقدار خروجی (یا هدف) مورد انتظار برچسب‌گذاری می‌شود. الگوریتم با مقایسه خروجی‌های خود با خروجی‌های هدف و تنظیم پارامترهای خود یاد می‌گیرد.

یادگیری بدون نظارت. یادگیری ماشین بدون نظارت معمولاً برای خوشه‌بندی داده‌ها استفاده می‌شود. در یادگیری ماشین بدون نظارت، هیچ مقدار هدفی در مجموعه داده وجود ندارد. در عوض، الگوریتم سعی می‌کند توابعی را شناسایی کند که مثال‌های مشابه را به خوشه‌ها نگاشت کند.

یادگیری تقویتی. یادگیری تقویتی بیشتر برای وظایف کنترل آنلاین، مانند کنترل ربات و بازی‌های ویدیویی مرتبط است. در این سناریوها، یک عامل باید یک سیاست یاد بگیرد که چگونه باید در یک محیط عمل کند تا پاداش بگیرد.

6. مدل‌های ریاضی: معادلات توصیف‌کننده روابط

در ساده‌ترین شکل، یک مدل ریاضی یک معادله است که توصیف می‌کند چگونه یک یا چند متغیر ورودی با یک متغیر خروجی مرتبط هستند.

مدل‌ها به‌عنوان معادلات. یک مدل ریاضی یک معادله است که توصیف می‌کند چگونه متغیرهای ورودی با یک متغیر خروجی مرتبط هستند. این یک نمایش ساده‌شده از یک فرآیند واقعی است.

مدل‌های خطی. یک الگوی ساده برای یک مدل معادله یک خط است: y = mx + c، که در آن y خروجی، x ورودی، m شیب و c عرض از مبدأ است. این پارامترها می‌توانند برای تطبیق مدل با داده‌ها تنظیم شوند.

کاربرد مدل. برای اینکه یک مدل مفید باشد، باید با دنیای واقعی ارتباط داشته باشد. این ارتباط در مورد معنایی که می‌توان به یک متغیر نسبت داد، بیشتر مشهود است.

7. مدل‌های خطی: مجموع وزنی و ورودی‌های چندگانه

ضرب ورودی‌ها در وزن‌ها و سپس جمع آن‌ها به‌عنوان مجموع وزنی شناخته می‌شود.

مجموع وزنی. هسته یک مدل خطی این است که خروجی به‌عنوان مجموع مقادیر ورودی n ضربدر وزن‌های مربوطه محاسبه می‌شود. این محاسبه به‌عنوان مجموع وزنی شناخته می‌شود.

ورودی‌های چندگانه. معادله یک خط می‌تواند به مدل‌هایی با ورودی‌های چندگانه گسترش یابد با افزودن یک وزن جدید برای هر متغیر ورودی. خروجی سپس به‌عنوان مجموع مقادیر ورودی ضربدر وزن‌های مربوطه محاسبه می‌شود.

یادگیری از داده. یادگیری ماشین با یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده کمک می‌کند. یادگیری انجام شده توسط یادگیری ماشین، یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده است.

8. شبکه‌های عصبی: نورون‌های متصل

قدرت شبکه‌های عصبی در مدل‌سازی روابط پیچیده ناشی از مدل‌های ریاضی پیچیده نیست، بلکه از تعاملات بین مجموعه‌ای بزرگ از نورون‌های ساده ناشی می‌شود.

واحدهای ساده، شبکه‌های پیچیده. یک شبکه عصبی شامل شبکه‌ای از واحدهای پردازش اطلاعات ساده به نام نورون‌ها است. قدرت شبکه‌های عصبی در مدل‌سازی روابط پیچیده از تعاملات بین مجموعه‌ای بزرگ از نورون‌های ساده ناشی می‌شود.

لایه‌های نورون. نورون‌ها در یک شبکه عصبی به لایه‌ها سازماندهی می‌شوند: یک لایه ورودی، لایه‌های پنهان و یک لایه خروجی. شبکه‌های یادگیری عمیق، شبکه‌های عصبی هستند که دارای لایه‌های پنهان زیادی از نورون‌ها هستند.

اتصالات و وزن‌ها. هر اتصال در یک شبکه دو نورون را به هم متصل می‌کند و وزنی به آن تعلق دارد. وزن یک اتصال بر نحوه پردازش اطلاعاتی که یک نورون از طریق آن اتصال دریافت می‌کند، تأثیر می‌گذارد.

9. توابع فعال‌سازی: معرفی غیرخطی بودن

در واقع، معرفی نقشه‌برداری غیرخطی در پردازش یک نورون دلیل استفاده از توابع فعال‌سازی است.

پردازش دو مرحله‌ای. یک نورون ورودی‌ها را به یک خروجی در دو مرحله نقشه‌برداری می‌کند: محاسبه مجموع وزنی ورودی‌ها و سپس عبور نتیجه از یک تابع فعال‌سازی.

نقشه‌برداری غیرخطی. توابع فعال‌سازی یک نقشه‌برداری غیرخطی به خروجی مجموع وزنی اعمال می‌کنند. این غیرخطی بودن برای توانمندسازی شبکه در یادگیری روابط پیچیده حیاتی است.

توابع فعال‌سازی رایج. نمونه‌هایی از توابع فعال‌سازی شامل آستانه، لجستیک، tanh و ReLU هستند. انتخاب تابع فعال‌سازی می‌تواند تأثیر قابل توجهی بر عملکرد شبکه داشته باشد.

10. پس‌انتشار: آموزش شبکه‌های عصبی

یادگیری انجام شده توسط یادگیری ماشین، یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده است.

به‌روزرسانی‌های وزنی تکراری. فرآیند استاندارد آموزش یک شبکه عصبی شامل مقداردهی اولیه وزن‌ها به مقادیر تصادفی و سپس به‌روزرسانی تکراری آن‌ها بر اساس عملکرد شبکه بر روی یک مجموعه داده است.

نزول گرادیان. الگوریتم نزول گرادیان برای یافتن مجموعه وزن‌هایی که خطای شبکه را حداقل می‌کند، استفاده می‌شود. این شامل محاسبه گرادیان سطح خطا و به‌روزرسانی وزن‌ها در جهت گرادیان منفی است.

الگوریتم پس‌انتشار. الگوریتم پس‌انتشار برای محاسبه گرادیان‌های خطا برای هر وزن در شبکه استفاده می‌شود. این الگوریتم در دو مرحله کار می‌کند: یک مرحله پیشرو و یک مرحله پسرو.

11. CNNها و RNNها: معماری‌های سفارشی

سفارشی‌سازی ساختار یک شبکه به ویژگی‌های خاص داده‌ها از یک حوزه وظیفه می‌تواند زمان آموزش شبکه را کاهش دهد و دقت آن را بهبود بخشد.

معماری‌های خاص حوزه. سفارشی‌سازی ساختار یک شبکه به ویژگی‌های خاص داده‌ها از یک حوزه وظیفه می‌تواند زمان آموزش شبکه را کاهش دهد و دقت آن را بهبود بخشد.

شبکه‌های عصبی کانولوشنی (CNNها). CNNها برای وظایف شناسایی تصویر طراحی شده‌اند و از اشتراک وزن و تجمع برای دستیابی به عدم وابستگی به ترجمه استفاده می‌کنند. آن‌ها به‌ویژه در استخراج ویژگی‌های بصری محلی مؤثر هستند.

شبکه‌های عصبی بازگشتی (RNNها). RNNها برای پردازش داده‌های توالی طراحی شده‌اند و دارای یک بافر حافظه هستند که خروجی لایه پنهان را برای یک ورودی ذخیره کرده و آن را به همراه ورودی بعدی از توالی به لایه پنهان بازمی‌گرداند.

12. آینده: تفسیرپذیری و سخت‌افزار جدید

در هر فرآیند مبتنی بر داده، عامل اصلی موفقیت دانستن اینکه چه چیزی را اندازه‌گیری کنیم و چگونه اندازه‌گیری کنیم، است.

چالش تفسیرپذیری. یک چالش کلیدی در یادگیری عمیق، عدم تفسیرپذیری است. درک اینکه یک مدل چگونه تصمیمات خود را اتخاذ می‌کند، برای ایجاد اعتماد و اطمینان از انصاف حیاتی است.

سخت‌افزار جدید. تقاضا برای سخت‌افزار سریع‌تر همچنان نوآوری در یادگیری عمیق را پیش می‌برد. محاسبات نورومورفیک و محاسبات کوانتومی دو حوزه تحقیقاتی امیدوارکننده هستند که می‌توانند این حوزه را متحول کنند.

تصمیم‌گیری مبتنی بر داده. یادگیری عمیق به‌طور ایده‌آل برای کاربردهایی که شامل مجموعه‌های بزرگ داده با ابعاد بالا هستند، مناسب است. بنابراین، یادگیری عمیق احتمالاً سهم قابل توجهی در برخی از چالش‌های علمی بزرگ عصر ما خواهد داشت.

آخرین به‌روزرسانی::

نقد و بررسی

3.91 از 5
میانگین از 100+ امتیازات از Goodreads و Amazon.

کتاب یادگیری عمیق نظرات متنوعی را به خود جلب کرده و میانگین امتیاز آن ۳.۹۱ از ۵ است. بسیاری آن را به عنوان یک مقدمه‌ی آموزنده به مفاهیم یادگیری عمیق ستایش می‌کنند، به‌ویژه برای افرادی که دارای پیش‌زمینه‌ی فنی هستند. با این حال، برخی آن را به دلیل جنبه‌های فنی‌اش برای خوانندگان عمومی بیش از حد پیچیده می‌دانند، با وجود اینکه به عنوان کتابی قابل دسترس معرفی شده است. خوانندگان از زمینه‌ی تاریخی و توضیحات مربوط به شبکه‌های عصبی قدردانی می‌کنند، اما برخی ریاضیات موجود در کتاب را چالش‌برانگیز می‌یابند. این کتاب به خاطر مرور جامع خود مورد تحسین قرار گرفته، اما به دلیل عدم پوشش کافی کاربردهای واقعی و ملاحظات اخلاقی مورد انتقاد قرار می‌گیرد.

درباره نویسنده

جان دی. کلاهر استاد علوم کامپیوتر و رهبر علمی در مؤسسه فناوری دابلین است که در زمینه‌های اطلاعات، ارتباطات و تحقیقات سرگرمی فعالیت می‌کند. او نویسنده مشترک کتاب «اصول یادگیری ماشین برای تحلیل داده‌های پیش‌بینی» است که توسط انتشارات MIT منتشر شده است. تخصص کلاهر در علوم کامپیوتر، به‌ویژه در زمینه یادگیری ماشین و هوش مصنوعی، در آثارش به وضوح مشهود است. کتاب او با عنوان «یادگیری عمیق» بخشی از مجموعه دانش ضروری انتشارات MIT است که هدف آن ارائه معرفی‌های مختصر به موضوعات پیچیده می‌باشد. رویکرد کلاهر ترکیبی از عمق فنی و تلاش برای قابل‌فهم کردن موضوع است، هرچند برخی از خوانندگان ممکن است تعادل این دو را چالش‌برانگیز بیابند. آثار او به گسترش ادبیات موجود در توضیح مفاهیم پیشرفته هوش مصنوعی برای مخاطبان وسیع‌تر کمک می‌کند.

Other books by John D. Kelleher

0:00
-0:00
1x
Dan
Andrew
Michelle
Lauren
Select Speed
1.0×
+
200 words per minute
Home
Library
Get App
Create a free account to unlock:
Requests: Request new book summaries
Bookmarks: Save your favorite books
History: Revisit books later
Recommendations: Get personalized suggestions
Ratings: Rate books & see your ratings
Try Full Access for 7 Days
Listen, bookmark, and more
Compare Features Free Pro
📖 Read Summaries
All summaries are free to read in 40 languages
🎧 Listen to Summaries
Listen to unlimited summaries in 40 languages
❤️ Unlimited Bookmarks
Free users are limited to 10
📜 Unlimited History
Free users are limited to 10
Risk-Free Timeline
Today: Get Instant Access
Listen to full summaries of 73,530 books. That's 12,000+ hours of audio!
Day 4: Trial Reminder
We'll send you a notification that your trial is ending soon.
Day 7: Your subscription begins
You'll be charged on Apr 26,
cancel anytime before.
Consume 2.8x More Books
2.8x more books Listening Reading
Our users love us
100,000+ readers
"...I can 10x the number of books I can read..."
"...exceptionally accurate, engaging, and beautifully presented..."
"...better than any amazon review when I'm making a book-buying decision..."
Save 62%
Yearly
$119.88 $44.99/year
$3.75/mo
Monthly
$9.99/mo
Try Free & Unlock
7 days free, then $44.99/year. Cancel anytime.
Scanner
Find a barcode to scan

Settings
General
Widget
Appearance
Loading...
Black Friday Sale 🎉
$20 off Lifetime Access
$79.99 $59.99
Upgrade Now →