Name: یادگیری عمیق
Rating: 4.42 (112 reviews)

Summary Reviews Author

۳ روز دسترسی کامل رایگان

قفل گوش دادن و امکانات بیشتر را باز کنید!

ادامه

نکات کلیدی

1. یادگیری عمیق: تصمیم‌گیری مبتنی بر داده

یادگیری عمیق با شناسایی و استخراج الگوها از مجموعه‌های بزرگ داده، امکان تصمیم‌گیری مبتنی بر داده را فراهم می‌آورد که به‌طور دقیق از مجموعه‌های ورودی پیچیده به نتایج تصمیم‌گیری مطلوب می‌انجامد.

تصمیم‌گیری مبتنی بر داده. یادگیری عمیق در استخراج الگوها از مجموعه‌های وسیع داده‌ها مهارت دارد و امکان نقشه‌برداری دقیق از ورودی‌های پیچیده به نتایج مورد نظر را فراهم می‌کند. این ویژگی آن را برای کاربردهایی که در آن‌ها شهود ناکافی است و داده‌ها حاکم هستند، ایده‌آل می‌سازد. نمونه‌هایی از این کاربردها عبارتند از:

تحلیل متن در مکالمات آنلاین توسط فیسبوک
جستجوی تصویر و ترجمه ماشینی توسط گوگل، بایدو و مایکروسافت
درک محیط و برنامه‌ریزی حرکتی در خودروهای خودران

موفقیت AlphaGo. AlphaGo، برنامه‌ای از دیپ‌مایند که قهرمانان جهانی بازی گو را شکست داد، قدرت یادگیری عمیق را به نمایش می‌گذارد. فضای جستجوی وسیع بازی گو، چالش‌های محاسباتی زیادی ایجاد کرد، اما الگوریتم‌های یادگیری عمیق به AlphaGo این امکان را دادند که پیکربندی‌های صفحه را ارزیابی کرده و تصمیمات استراتژیک اتخاذ کند.

تصمیم‌گیری کلیدی است. توانایی اتخاذ تصمیمات مبتنی بر داده در بسیاری از حوزه‌ها حیاتی است. یادگیری عمیق ابزاری برای شناسایی و استخراج الگوها از مجموعه‌های بزرگ داده فراهم می‌آورد که امکان نقشه‌برداری دقیق از ورودی‌های پیچیده به نتایج مطلوب را می‌دهد.

2. هوش مصنوعی، یادگیری ماشین و یادگیری عمیق: سلسله‌مراتب هوش

حوزه مدرن یادگیری ماشین بر دو موضوع اخیر بنا شده است: کامپیوترهایی که می‌توانند از مثال‌ها یاد بگیرند و تحقیقات در زمینه شبکه‌های عصبی.

حوزه‌های تو در تو. هوش مصنوعی (AI) حوزه‌ای کلی است که شامل یادگیری ماشین (ML) می‌شود و یادگیری ماشین نیز شامل یادگیری عمیق (DL) است. هدف AI ایجاد سیستم‌های هوشمند است، ML بر روی الگوریتم‌هایی تمرکز دارد که از داده‌ها یاد می‌گیرند و DL از شبکه‌های عصبی عمیق استفاده می‌کند.

ریشه‌های AI. حوزه AI در یک کارگاه در کالج دارتموث در سال 1956 متولد شد. تحقیقات ارائه شده در این کارگاه شامل اثبات قضایای ریاضی، پردازش زبان طبیعی، برنامه‌ریزی برای بازی‌ها، برنامه‌های کامپیوتری که می‌توانند از مثال‌ها یاد بگیرند و شبکه‌های عصبی بود.

تمرکز ML. یادگیری ماشین شامل توسعه الگوریتم‌هایی است که به یک کامپیوتر اجازه می‌دهد تا توابع را از یک مجموعه داده (مجموعه‌های مثال) استخراج کند. برای درک مفهوم یادگیری ماشین، نیاز به درک سه اصطلاح داریم: مجموعه داده، الگوریتم و تابع.

3. یادگیری ماشین: استخراج توابع از داده

یک تابع یک نقشه‌برداری قطعی از یک مجموعه مقادیر ورودی به یک یا چند مقدار خروجی است.

نقشه‌برداری‌های قطعی. یک تابع یک نقشه‌برداری قطعی از ورودی‌ها به خروجی‌ها است، به این معنی که برای هر مجموعه خاص از ورودی‌ها، همیشه همان خروجی‌ها را بازمی‌گرداند. هدف یادگیری ماشین یادگیری این توابع از داده‌ها است.

مجموعه‌های داده و الگوریتم‌ها. الگوریتم‌های یادگیری ماشین مجموعه‌های داده را تحلیل می‌کنند تا الگوهای تکراری را شناسایی کنند که سپس به‌عنوان توابع نمایان می‌شوند. این توابع می‌توانند عملیات‌های حسابی ساده، قوانین if-then-else یا نمایش‌های پیچیده‌تری مانند شبکه‌های عصبی باشند.

شبکه‌های عصبی به‌عنوان توابع. یادگیری عمیق، زیرمجموعه‌ای از یادگیری ماشین، بر روی مدل‌های شبکه‌های عصبی عمیق تمرکز دارد. الگوهایی که الگوریتم‌های یادگیری عمیق از مجموعه‌های داده استخراج می‌کنند، توابعی هستند که به‌عنوان شبکه‌های عصبی نمایان می‌شوند.

4. دشواری یادگیری ماشین: نویز و تعصب

اولاً، بیشتر مجموعه‌های داده شامل نویز در داده‌ها هستند، بنابراین جستجوی تابعی که دقیقاً با داده‌ها مطابقت داشته باشد، لزوماً بهترین استراتژی نیست، زیرا معادل یادگیری نویز است.

نویز و مسائل بد-موقعیت. یادگیری ماشین با چالش‌هایی به دلیل نویز در داده‌ها و این واقعیت که مجموعه توابع ممکن اغلب بزرگ‌تر از مجموعه مثال‌ها در مجموعه داده است، مواجه است که این موضوع آن را به یک مسئله بد-موقعیت تبدیل می‌کند.

تعصب استقرایی. برای غلبه بر این چالش‌ها، الگوریتم‌های یادگیری ماشین اطلاعات ارائه شده توسط داده‌ها را با مجموعه‌ای از فرضیات درباره ویژگی‌های بهترین تابع، که به آن تعصب استقرایی الگوریتم گفته می‌شود، تکمیل می‌کنند.

کم‌فیت و بیش‌فیت. انتخاب تعصب استقرایی نادرست می‌تواند منجر به کم‌فیت (تابع خیلی ساده است) یا بیش‌فیت (تابع با نویز داده‌ها مطابقت دارد) شود. یافتن تعادل مناسب بین داده و تعصب استقرایی کلید موفقیت در تعمیم است.

5. یادگیری نظارت‌شده، یادگیری بدون نظارت و یادگیری تقویتی

در یادگیری ماشین نظارت‌شده، هر مثال در مجموعه داده با مقدار خروجی (یا هدف) مورد انتظار برچسب‌گذاری می‌شود.

یادگیری نظارت‌شده. در یادگیری ماشین نظارت‌شده، هر مثال در مجموعه داده با مقدار خروجی (یا هدف) مورد انتظار برچسب‌گذاری می‌شود. الگوریتم با مقایسه خروجی‌های خود با خروجی‌های هدف و تنظیم پارامترهای خود یاد می‌گیرد.

یادگیری بدون نظارت. یادگیری ماشین بدون نظارت معمولاً برای خوشه‌بندی داده‌ها استفاده می‌شود. در یادگیری ماشین بدون نظارت، هیچ مقدار هدفی در مجموعه داده وجود ندارد. در عوض، الگوریتم سعی می‌کند توابعی را شناسایی کند که مثال‌های مشابه را به خوشه‌ها نگاشت کند.

یادگیری تقویتی. یادگیری تقویتی بیشتر برای وظایف کنترل آنلاین، مانند کنترل ربات و بازی‌های ویدیویی مرتبط است. در این سناریوها، یک عامل باید یک سیاست یاد بگیرد که چگونه باید در یک محیط عمل کند تا پاداش بگیرد.

6. مدل‌های ریاضی: معادلات توصیف‌کننده روابط

در ساده‌ترین شکل، یک مدل ریاضی یک معادله است که توصیف می‌کند چگونه یک یا چند متغیر ورودی با یک متغیر خروجی مرتبط هستند.

مدل‌ها به‌عنوان معادلات. یک مدل ریاضی یک معادله است که توصیف می‌کند چگونه متغیرهای ورودی با یک متغیر خروجی مرتبط هستند. این یک نمایش ساده‌شده از یک فرآیند واقعی است.

مدل‌های خطی. یک الگوی ساده برای یک مدل معادله یک خط است: y = mx + c، که در آن y خروجی، x ورودی، m شیب و c عرض از مبدأ است. این پارامترها می‌توانند برای تطبیق مدل با داده‌ها تنظیم شوند.

کاربرد مدل. برای اینکه یک مدل مفید باشد، باید با دنیای واقعی ارتباط داشته باشد. این ارتباط در مورد معنایی که می‌توان به یک متغیر نسبت داد، بیشتر مشهود است.

7. مدل‌های خطی: مجموع وزنی و ورودی‌های چندگانه

ضرب ورودی‌ها در وزن‌ها و سپس جمع آن‌ها به‌عنوان مجموع وزنی شناخته می‌شود.

مجموع وزنی. هسته یک مدل خطی این است که خروجی به‌عنوان مجموع مقادیر ورودی n ضربدر وزن‌های مربوطه محاسبه می‌شود. این محاسبه به‌عنوان مجموع وزنی شناخته می‌شود.

ورودی‌های چندگانه. معادله یک خط می‌تواند به مدل‌هایی با ورودی‌های چندگانه گسترش یابد با افزودن یک وزن جدید برای هر متغیر ورودی. خروجی سپس به‌عنوان مجموع مقادیر ورودی ضربدر وزن‌های مربوطه محاسبه می‌شود.

یادگیری از داده. یادگیری ماشین با یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده کمک می‌کند. یادگیری انجام شده توسط یادگیری ماشین، یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده است.

8. شبکه‌های عصبی: نورون‌های متصل

قدرت شبکه‌های عصبی در مدل‌سازی روابط پیچیده ناشی از مدل‌های ریاضی پیچیده نیست، بلکه از تعاملات بین مجموعه‌ای بزرگ از نورون‌های ساده ناشی می‌شود.

واحدهای ساده، شبکه‌های پیچیده. یک شبکه عصبی شامل شبکه‌ای از واحدهای پردازش اطلاعات ساده به نام نورون‌ها است. قدرت شبکه‌های عصبی در مدل‌سازی روابط پیچیده از تعاملات بین مجموعه‌ای بزرگ از نورون‌های ساده ناشی می‌شود.

لایه‌های نورون. نورون‌ها در یک شبکه عصبی به لایه‌ها سازماندهی می‌شوند: یک لایه ورودی، لایه‌های پنهان و یک لایه خروجی. شبکه‌های یادگیری عمیق، شبکه‌های عصبی هستند که دارای لایه‌های پنهان زیادی از نورون‌ها هستند.

اتصالات و وزن‌ها. هر اتصال در یک شبکه دو نورون را به هم متصل می‌کند و وزنی به آن تعلق دارد. وزن یک اتصال بر نحوه پردازش اطلاعاتی که یک نورون از طریق آن اتصال دریافت می‌کند، تأثیر می‌گذارد.

9. توابع فعال‌سازی: معرفی غیرخطی بودن

در واقع، معرفی نقشه‌برداری غیرخطی در پردازش یک نورون دلیل استفاده از توابع فعال‌سازی است.

پردازش دو مرحله‌ای. یک نورون ورودی‌ها را به یک خروجی در دو مرحله نقشه‌برداری می‌کند: محاسبه مجموع وزنی ورودی‌ها و سپس عبور نتیجه از یک تابع فعال‌سازی.

نقشه‌برداری غیرخطی. توابع فعال‌سازی یک نقشه‌برداری غیرخطی به خروجی مجموع وزنی اعمال می‌کنند. این غیرخطی بودن برای توانمندسازی شبکه در یادگیری روابط پیچیده حیاتی است.

توابع فعال‌سازی رایج. نمونه‌هایی از توابع فعال‌سازی شامل آستانه، لجستیک، tanh و ReLU هستند. انتخاب تابع فعال‌سازی می‌تواند تأثیر قابل توجهی بر عملکرد شبکه داشته باشد.

10. پس‌انتشار: آموزش شبکه‌های عصبی

یادگیری انجام شده توسط یادگیری ماشین، یافتن پارامترها (یا وزن‌ها) یک مدل با استفاده از یک مجموعه داده است.

به‌روزرسانی‌های وزنی تکراری. فرآیند استاندارد آموزش یک شبکه عصبی شامل مقداردهی اولیه وزن‌ها به مقادیر تصادفی و سپس به‌روزرسانی تکراری آن‌ها بر اساس عملکرد شبکه بر روی یک مجموعه داده است.

نزول گرادیان. الگوریتم نزول گرادیان برای یافتن مجموعه وزن‌هایی که خطای شبکه را حداقل می‌کند، استفاده می‌شود. این شامل محاسبه گرادیان سطح خطا و به‌روزرسانی وزن‌ها در جهت گرادیان منفی است.

الگوریتم پس‌انتشار. الگوریتم پس‌انتشار برای محاسبه گرادیان‌های خطا برای هر وزن در شبکه استفاده می‌شود. این الگوریتم در دو مرحله کار می‌کند: یک مرحله پیشرو و یک مرحله پسرو.

11. CNNها و RNNها: معماری‌های سفارشی

سفارشی‌سازی ساختار یک شبکه به ویژگی‌های خاص داده‌ها از یک حوزه وظیفه می‌تواند زمان آموزش شبکه را کاهش دهد و دقت آن را بهبود بخشد.

معماری‌های خاص حوزه. سفارشی‌سازی ساختار یک شبکه به ویژگی‌های خاص داده‌ها از یک حوزه وظیفه می‌تواند زمان آموزش شبکه را کاهش دهد و دقت آن را بهبود بخشد.

شبکه‌های عصبی کانولوشنی (CNNها). CNNها برای وظایف شناسایی تصویر طراحی شده‌اند و از اشتراک وزن و تجمع برای دستیابی به عدم وابستگی به ترجمه استفاده می‌کنند. آن‌ها به‌ویژه در استخراج ویژگی‌های بصری محلی مؤثر هستند.

شبکه‌های عصبی بازگشتی (RNNها). RNNها برای پردازش داده‌های توالی طراحی شده‌اند و دارای یک بافر حافظه هستند که خروجی لایه پنهان را برای یک ورودی ذخیره کرده و آن را به همراه ورودی بعدی از توالی به لایه پنهان بازمی‌گرداند.

12. آینده: تفسیرپذیری و سخت‌افزار جدید

در هر فرآیند مبتنی بر داده، عامل اصلی موفقیت دانستن اینکه چه چیزی را اندازه‌گیری کنیم و چگونه اندازه‌گیری کنیم، است.

چالش تفسیرپذیری. یک چالش کلیدی در یادگیری عمیق، عدم تفسیرپذیری است. درک اینکه یک مدل چگونه تصمیمات خود را اتخاذ می‌کند، برای ایجاد اعتماد و اطمینان از انصاف حیاتی است.

سخت‌افزار جدید. تقاضا برای سخت‌افزار سریع‌تر همچنان نوآوری در یادگیری عمیق را پیش می‌برد. محاسبات نورومورفیک و محاسبات کوانتومی دو حوزه تحقیقاتی امیدوارکننده هستند که می‌توانند این حوزه را متحول کنند.

تصمیم‌گیری مبتنی بر داده. یادگیری عمیق به‌طور ایده‌آل برای کاربردهایی که شامل مجموعه‌های بزرگ داده با ابعاد بالا هستند، مناسب است. بنابراین، یادگیری عمیق احتمالاً سهم قابل توجهی در برخی از چالش‌های علمی بزرگ عصر ما خواهد داشت.

آخرین بروزرسانی: April 11, 2025

Report Issue

خلاصه نقدها

3.89 از 5

میانگین ۴۷۳ امتیاز از Goodreads و Amazon.

کتاب یادگیری عمیق نظرات متنوعی را به خود جلب کرده و میانگین امتیاز آن ۳.۹۱ از ۵ است. بسیاری آن را به عنوان یک مقدمه‌ی آموزنده به مفاهیم یادگیری عمیق ستایش می‌کنند، به‌ویژه برای افرادی که دارای پیش‌زمینه‌ی فنی هستند. با این حال، برخی آن را به دلیل جنبه‌های فنی‌اش برای خوانندگان عمومی بیش از حد پیچیده می‌دانند، با وجود اینکه به عنوان کتابی قابل دسترس معرفی شده است. خوانندگان از زمینه‌ی تاریخی و توضیحات مربوط به شبکه‌های عصبی قدردانی می‌کنند، اما برخی ریاضیات موجود در کتاب را چالش‌برانگیز می‌یابند. این کتاب به خاطر مرور جامع خود مورد تحسین قرار گرفته، اما به دلیل عدم پوشش کافی کاربردهای واقعی و ملاحظات اخلاقی مورد انتقاد قرار می‌گیرد.

Want to read the full book?

Amazon Kindle Audible

درباره نویسنده

جان دی. کلاهر استاد علوم کامپیوتر و رهبر علمی در مؤسسه فناوری دابلین است که در زمینه‌های اطلاعات، ارتباطات و تحقیقات سرگرمی فعالیت می‌کند. او نویسنده مشترک کتاب «اصول یادگیری ماشین برای تحلیل داده‌های پیش‌بینی» است که توسط انتشارات MIT منتشر شده است. تخصص کلاهر در علوم کامپیوتر، به‌ویژه در زمینه یادگیری ماشین و هوش مصنوعی، در آثارش به وضوح مشهود است. کتاب او با عنوان «یادگیری عمیق» بخشی از مجموعه دانش ضروری انتشارات MIT است که هدف آن ارائه معرفی‌های مختصر به موضوعات پیچیده می‌باشد. رویکرد کلاهر ترکیبی از عمق فنی و تلاش برای قابل‌فهم کردن موضوع است، هرچند برخی از خوانندگان ممکن است تعادل این دو را چالش‌برانگیز بیابند. آثار او به گسترش ادبیات موجود در توضیح مفاهیم پیشرفته هوش مصنوعی برای مخاطبان وسیع‌تر کمک می‌کند.

کتاب‌های دیگر از جان دی. کلهر

Fundamentals of Machine Learning for Predictive Data Analytics

John D. Kelleher

Algorithms, Worked Examples, and Case Studies

4.35

۱۰۵

People love SoBrief

Join our global community of 600,000+ readers

★★★★★

This site is a total game-changer. I've been flying through book summaries like never before. Highly, highly recommend.

— Dave G

Worth my money and time, and really well made. I've never seen this quality of summaries on other websites. Very helpful!

— Em

Highly recommended!! Fantastic service. Perfect for those that want a little more than a teaser but not all the intricate details of a full audio book.

— Greg M

Compare Features	Free	Pro
📖 Read Summaries Read unlimited summaries. Free users get 3 per month
🎧 Listen to Summaries Listen to unlimited summaries in 40 languages	—
❤️ Unlimited Bookmarks Free users are limited to 4	—
📜 Unlimited History Free users are limited to 4	—
📥 Unlimited Downloads Free users are limited to 1	—