زمان تخمینی مطالعه: 16 دقیقه
وقتی صحبت از هوش مصنوعی (AI) و یادگیری ماشینی (ML) میشود، اصطلاحات و واژههای مختلف زیادی در اطراف وجود دارد. پیگیری معنای همه چیز میتواند دشوار باشد، به خصوص زمانی که به نظر میرسد برخی از اصطلاحات به جای یکدیگر استفاده میشوند. با این حال، داشتن حداقل درک اولیه از واژهنامه و مفاهیم اساسی هوش مصنوعی و اصطلاحات یادگیری ماشین مهم است. دلیل این موضوع این است که این فناوریها به طور فزایندهای روز به روز هم از نظر کسب و کار و هم از نظر جامعه اهمیت پیدا میکنند.
برای مشاغل، هوش مصنوعی و یادگیری ماشینی میتوانند برای خودکارسازی وظایف، بهبود کارایی و بهره وری و تصمیم گیری بهتر استفاده شوند. برای جامعه، آنها برای توسعه اتومبیلهای بدون راننده، بهبود مراقبتهای بهداشتی و مبارزه با جرم و جنایت استفاده میشوند. در ادامه این مطلب واژه نامهای ارائه شده است که به هیچ وجه جامع نیست و ممکن است گاهی ساده باشد، بنابراین آن را به عنوان نقطه شروع ورود به دنیای هوش مصنوعی در نظر بگیرید. در این مقاله به این موضوعات پرداخته میشود:
- هوش مصنوعی و یادگیری ماشینی.
- یادگیری تحت نظارت، یادگیری بدون نظارت و یادگیری تقویتی.
- علم داده و هوش مصنوعی.
- دانشمند داده و تحلیلگر داده.
- کلان داده و علم داده.
- مهندس داده و دانشمند داده.
- یادگیری عمیق و شبکههای عصبی
- پیش بینی، پردازش زبان طبیعی، و بینایی ماشین.
هوش مصنوعی و یادگیری ماشین
یادگیری ماشین و هوش مصنوعی اغلب به جای یکدیگر استفاده میشوند، اما تفاوت زیادی بین این دو وجود دارد. یادگیری ماشینی زیرمجموعهای از هوش مصنوعی است که به رایانهها توانایی یادگیری از دادهها را میدهد. از سوی دیگر، هوش مصنوعی یک اصطلاح گستردهتر است که تمام جنبههای هوشمندتر کردن رایانهها از جمله یادگیری ماشین را پوشش میدهد. در اینجا یک مسئله با دو نمونه از حلکنندههای شطرنج هوش مصنوعی وجود دارد، یکی بدون یادگیری ماشین و دیگری با یادگیری ماشین:
یک حلکننده شطرنج که بدون یادگیری ماشینی اجرا میشود، از یک الگوریتم جستجو برای یافتن بهترین حرکت در یک موقعیت خاص استفاده میکند. الگوریتم جستجو به تمام حرکات ممکنی که میتوان در موقعیت داده شده انجام داد نگاه میکند و سپس هر حرکت را بر اساس مجموعهای از معیارها ارزیابی میکند. معیارها میتواند شامل مواردی مانند احتمال منجر به مات، احتمال هدایت به موقعیتی که در آن حل کننده در موقعیتی قرار میگیرد و غیره باشد.
از سوی دیگر، یک حلکننده شطرنج که با یادگیری ماشینی اجرا میشود، از مجموعهای از موقعیتها یاد میگیرد و از مجموعه دادهای از بازیهای شطرنج حرکت میکند تا بهترین حرکت را در یک موقعیت مشخص پیدا کند.
به طور کلی، ML بر آموزش رایانهها برای یادگیری از دادهها متمرکز است، در حالی که هوش مصنوعی بر هوشمندتر کردن رایانهها به معنای کلیتر متمرکز است.
حوزههای اصلی یادگیری ماشینی
این مفهوم از مهمترین مفاهیم اساسی هوش مصنوعی است و دارای سه حوزه اصلی است.
– یادگیری با ناظر Supervised Learning
یادگیری با ناظر نوعی از یادگیری ماشینی است که از یک مجموعه داده شناخته شده (به نام مجموعه آموزشی) برای پیش بینی استفاده میکند. مجموعه آموزشی مجموعهای از دادهها است که شامل پاسخهای صحیح (که برچسبها نامیده میشوند) است که یک مدل یادگیری ماشینی بر روی آنها آموزش داده میشود. الگوریتم یادگیری با ناظر به دنبال الگوها در مجموعه آموزشی میگردد و از آنها برای پیش بینی دادههای جدید استفاده میکند. در اینجا دو مثال از مشکلات یادگیری تحت نظارت آورده شده است:
- پیشبینی اینکه آیا یک شخص از پرداخت وام اجتناب میکند یا خیر: مجموعه آموزشی شامل مجموعه دادهای از افرادی است که وام گرفتهاند، و برچسبها این است که آیا آنها اجتناب کردهاند یا خیر. الگوریتم یادگیری تحت نظارت الگوهایی را در مجموعه آموزشی پیدا میکند و از آن الگوها برای پیشبینی دادههای جدید استفاده میکند.
- پیشبینی قیمت سهام: مجموعه آموزشی شامل دادههای تاریخی قیمت سهام است و برچسبها قیمت سهام در روز جمعآوری دادهها خواهد بود.
یادگیری بدون ناظر Unsupervised Learning
یادگیری بدون ناظر نوعی از یادگیری ماشینی است که بدون اینکه هیچ برچسبی به آن داده شود به دنبال الگوها در دادهها میگردد. این برخلاف یادگیری با ناظر است که بر دادههای آموزشی با برچسبها متکی است. برخی از الگوریتمهای رایج یادگیری بدون ناظر شامل خوشه بندی و کاهش ابعاد هستند:
- خوشهبندی تکنیکی است که میتوان از آن برای گروه بندی نقاط دادهای که مشابه یکدیگر هستند استفاده کرد. به عنوان مثال، خوشهبندی میتواند برای گروه بندی مشتریانی که عادات خرید مشابهی دارند استفاده شود.
- کاهش ابعاد تکنیکی است که میتوان از آن برای کاهش تعداد ویژگیهای یک مجموعه داده استفاده کرد. این میتواند برای تجسم دادهها یا برای ساده سازی مدلهای یادگیری ماشین مفید باشد.
یادگیری تقویتی Reinforcement Learning
یادگیری تقویتی نوعی از یادگیری ماشین است که به عامل اجازه میدهد در یک محیط با انجام اقدامات و دریافت پاداش یاد بگیرد. به عنوان مثال، یک الگوریتم یادگیری تقویتی میتواند برای آموزش راه رفتن به ربات استفاده شود. ربات اقداماتی مانند حرکت دادن پاهای خود را انجام میدهد و پاداشهایی مانند حرکت به جلو را دریافت میکند. با گذشت زمان، ربات یاد میگیرد که کدام اقدامات منجر به بهترین پاداشها میشود و بنابراین یاد میگیرد که چگونه راه برود.
علوم داده و هوش مصنوعی
علم داده(Data Science) و هوش مصنوعی دو حوزه دیگر از اصطلاحاتی هستند که اغلب به جای یکدیگر استفاده میشوند و از مفاهیم اساسی هوش مصنوعی هستند. با این حال، چند تفاوت اساسی بین این دو وجود دارد:
- علوم داده مطالعه استخراج بینش از دادهها است. این را میتوان از طریق روشهای مختلفی از جمله یادگیری ماشینی، تجزیه و تحلیل آماری و تجسم دادهها انجام داد.
- از سوی دیگر، هوش مصنوعی مطالعه ایجاد ماشینهای هوشمند است. این می تواند شامل وظایفی مانند پردازش زبان طبیعی، تشخیص تصویر و تصمیم گیری باشد.
در حالی که هم علوم داده و هم هوش مصنوعی به کار با دادهها میپردازند، هوش مصنوعی بیشتر بر ایجاد سیستمهایی متمرکز است که بتوانند خودشان عمل کنند و فکر کنند، در حالی که علم داده بیشتر بر استخراج بینش از دادهها متمرکز است.
دانشمند داده و تحلیلگر داده
دانشمندان داده و تحلیلگران داده هر دو مسئول کار با دادهها برای کمک به سازمانها در تصمیمگیری بهتر هستند و از مفاهیم اساسی هوش مصنوعی هستند. با این حال، تفاوتهایی بین این دو نقش وجود دارد:
- دانشمندان داده(Data Scientist) عمدتاً مسئول تجزیه و تحلیل دادهها و توسعه الگوریتمها و مدلهایی هستند که میتوانند برای پیشبینی یا توصیهها استفاده شوند. دانشمندان داده معمولاً پیشینه قوی در علوم کامپیوتر و ریاضیات دارند.
- از سوی دیگر، تحلیلگران داده(Data Analyst) مسئول گرفتن دادههایی هستند که قبلاً جمعآوری شدهاند و از آنها برای کمک به سازمانها در تصمیمگیری بهتر استفاده میکنند. آنها ممکن است از تکنیکهای آماری برای تجزیه و تحلیل دادهها استفاده کنند، اما تمرکز آنها بیشتر بر تفسیر و ارتباطات است تا توسعه روشهای جدید. تحلیلگران داده معمولاً دارای پیشینه قوی در تجارت یا رشته دیگری هستند که از دادهها به شدت استفاده میکنند.
هم دانشمندان داده و هم تحلیلگران داده اعضای مهم هر سازمانی هستند که برای تصمیم گیری به دادهها متکی هستند. با این حال، مهارتهای متفاوت آنها به این معنی است که آنها نقشهای متفاوتی را در فرآیند کلی ایفا میکنند.
کلان داده و علوم داده
علوم داده شاخهای از علوم کامپیوتر و آمار است که به استخراج دانش از دادهها می پردازد. کلان داده(Big Data) یک زمینه مطالعاتی است که با مجموعه دادههایی سروکار دارد که بیش از حد بزرگ یا پیچیده هستند که با روشهای سنتی پردازش دادهها پردازش نمیشوند. در واقع علوم داده با درک دادهها سروکار دارد اما کلان داده با ذخیره و پردازش دادهها سروکار دارد.
مهندس داده و دانشمند داده
یک مهندس داده(Data Engineer) و یک دانشمند داده(Data Scientist) هر دو با دادهها کار می کنند، اما شباهتها به همین جا ختم میشود. کار یک مهندس داده ساختن سیستمهایی است که دادهها را جمع آوری، ذخیره و پردازش میکند. وظیفه یک دانشمند داده استفاده از آن دادهها برای پاسخ به سؤالات و حل مسائل است. بنابراین ضرورت بررسی مفاهیم اساسی هوش مصنوعی واقعا در این مفهوم نمایان میشود.
به عنوان مثال، یک مهندس داده ممکن است سیستمی برای ردیابی دادههای ترافیکی در زمان واقعی بسازد. یک دانشمند داده ممکن است از این دادهها برای کشف چگونگی کاهش تراکم ترافیک استفاده کند. مثال دیگر: یک مهندس داده ممکن است سیستمی برای ذخیره دادههای مشتری از یک وب سایت بسازد. یک دانشمند داده ممکن است از این دادهها استفاده کند تا بفهمد مشتریان به چه محصولاتی بیشتر علاقه دارند.
یادگیری عمیق
یادگیری عمیق(Deep Learning) زیرمجموعهای از یادگیری ماشینی است که از شبکههای عصبی عمیق برای یادگیری از دادهها استفاده میکند. شبکههای عصبی عمیق شبکههایی با لایههای متعدد نورون هستند، در مقابل شبکههای عصبی با لایههای کم که به آنها شبکههای عصبی کمعمق میگویند. شبکههای عمیق قویتر از شبکههای کم عمق هستند و میتوانند الگوهای پیچیده را از دادهها یاد بگیرند. یادگیری عمیق معمولاً از شبکههای عصبی مغز الهام میگیرد و برای کارهای مختلفی از جمله تشخیص تصویر و پردازش زبان طبیعی استفاده میشود. برای نمونه میتوان مثالهای زیر را در نظر گرفت:
- یک حل کننده شطرنج(Chess Solver) را میتوان با یادگیری عمیق با آموزش یک شبکه عصبی برای پیشبینی بهترین حرکت در یک موقعیت خاص پیاده سازی کرد.
- حلکننده شطرنج را میتوان با یادگیری ماشین، اما بدون یادگیری عمیق، با آموزش درخت تصمیم یا الگوریتم یادگیری ماشینی دیگر برای پیشبینی بهترین حرکت در یک موقعیت معین پیادهسازی کرد.
– مدلهای یادگیری ماشینی که مبتنی بر یادگیری عمیق نیستند
انواع مدلهای یادگیری ماشینی وجود دارد که در واقع مبتنی بر یادگیری عمیق نیستند، مانند موارد زیر:
- ماشینهای بردار پشتیبان (SVM): آنها نوعی الگوریتم یادگیری ماشینی با ناظر هستند که میتوانند هم برای کارهای طبقهبندی و هم برای کارهای رگرسیون استفاده شوند. این الگوریتم با یافتن ابر صفحهای(Hyper plane) کار میکند که نقاط داده را در مجموعه آموزشی به بهترین نحو از هم جدا میکند و سپس برای پیشبینی نقاط داده جدید استفاده میشود.
- رگرسیون خطی: این یک نوع الگوریتم یادگیری ماشینی با ناظر است که میتواند برای کارهای رگرسیون استفاده شود. این الگوریتم با یافتن یک خط بهترین تناسب(Best Fit) برای نقاط داده در مجموعه آموزشی کار میکند و سپس از این خط برای پیشبینی نقاط داده جدید استفاده میشود.
- رگرسیون لجستیک: این یک نوع الگوریتم یادگیری ماشینی نظارت شده است که میتواند برای کارهای طبقهبندی استفاده شود. این الگوریتم با یافتن یک خط بهترین تناسب برای نقاط داده در مجموعه آموزشی کار میکند، که سپس برای پیش بینی نقاط داده جدید با پیشبینی احتمالات کلاس استفاده میشود.
- درختهای تصمیم: نوعی الگوریتم یادگیری ماشینی هستند که هم برای طبقهبندی و هم برای کارهای رگرسیون استفاده میشوند. این الگوریتم با ایجاد درختی از تصمیمات کار میکند، جایی که هر گره در درخت نشان دهنده تصمیمی است که باید گرفته شود. سپس از درخت برای پیش بینی نقاط داده جدید استفاده میشود.
- جنگلهای تصادفی: آنها نوعی الگوریتم یادگیری ماشینی هستند که هم برای طبقهبندی و هم برای کارهای رگرسیون استفاده میشوند. این الگوریتم با ساختن تعداد زیادی درخت تصمیم در زمان آموزش کار میکند. سپس از جنگل برای پیشبینی نقاط داده جدید با رأی اکثریت استفاده میشود.
- K-نزدیکترین همسایه (KNN): این یک نوع الگوریتم یادگیری ماشینی است که میتواند برای کارهای طبقهبندی و رگرسیون استفاده شود. این الگوریتم با یافتن K نزدیکترین همسایگان به یک نقطه داده جدید، و سپس استفاده از آن همسایهها برای پیشبینی با اکثریت آرا کار میکند.
– انواع شبکههای عصبی
در اینجا برخی از انواع محبوب شبکههای عصبی آورده شده است:
- شبکه عصبی پیشخور (FNN): نوعی شبکه عصبی است که در آن اتصالات بین نورونها یک چرخه تشکیل نمیدهند. این نوع شبکه عصبی معمولاً برای وظایف یادگیری با ناظر استفاده میشود. گرههای لایه ورودی، دادههای ورودی را دریافت میکنند و گرههای لایه خروجی، خروجی مورد نظر را تولید میکنند. گرههای بین لایه ورودی و خروجی لایههای پنهان نامیده میشوند و میتوان از آنها برای یادگیری الگوهای پیچیده در دادهها استفاده کرد.
- شبکه عصبی بازگشتی (RNN): نوعی شبکه عصبی است که در آن اتصالات بین گرهها یک چرخه را تشکیل میدهند. این نوع شبکه عصبی معمولاً برای کارهایی استفاده میشود که شبکه را ملزم به به خاطر سپردن اطلاعات در مدت زمان طولانی میکند، مانند وظایف پردازش زبان طبیعی یا پیش بینی.
- شبکه عصبی کانولوشنال (CNN): این یک نوع شبکه عصبی است که معمولاً برای کارهای تشخیص تصویر استفاده میشود. این شبکه شامل انواع خاصی از لایهها به نام “لایههای کانولوشنال” است که از یک سری فیلتر تشکیل شده است که برای تشخیص الگوهای موجود در دادهها استفاده میشود.
- ترانسفورماتور: نوعی شبکه عصبی است که برای کارهای توالی به دنباله sequence-to-sequence (یعنی تبدیل توالی به دنباله، مانند متن به متن جدید) مانند ترجمه ماشینی استفاده میشود. این شبکه شامل انواع خاصی از لایهها به نام “لایههای توجه(attention layers)” است که برای یادگیری روابط بین دادهها استفاده میشود.
– نحوه آموزش شبکههای عصبی
شبکههای عصبی با استفاده از فرآیندی به نام پس انتشار آموزش داده میشوند. این فرآیند شامل تنظیم وزن اتصالات بین نورونهای شبکه است تا شبکه بتواند بهتر تشخیص الگوها را بیاموزد.
– مزایا و معایب یادگیری ماشینی و یادگیری عمیق
مزایا و معایبی برای استفاده از مدلهای یادگیری ماشین استاندارد و مدلهای یادگیری عمیق وجود دارد که به شرح زیر است:
- مدلهای یادگیری ماشین استاندارد میتوانند درک و پیادهسازی آسانتری داشته باشند و به دادههای زیادی نیاز ندارند. آنها معمولاً سریعتر آموزش داده میشوند و کمتر به منابع نیاز دارند.
- مدلهای یادگیری عمیق میتوانند دقیقتر و انعطافپذیرتر باشند (یعنی استفاده از یک مدل برای کارهای مختلف). با این حال، درک دلایل پشت پیشبینیهای آنها سختتر است، زیرا آنها مدلهای جعبه سیاه هستند.
پیش بینی
پیشبینی(Forecasting) فرآیند پیشبینی رویدادهای آینده بر اساس رویدادهای گذشته است و از مفاهیم اساسی هوش مصنوعی میباشد. پیشبینی را میتوان در زمینههای مختلف، از پیشبینی آب و هوا گرفته تا پیشبینی عملکرد آینده یک شرکت، مورد استفاده قرار داد. یکی از مثالهای رایج پیشبینی استفاده از دادههای تاریخی برای پیشبینی فروش آینده است: یک شرکت ممکن است به فروش خود در سالهای گذشته نگاه کند و از آن اطلاعات برای پیشبینی فروش خود برای سال آینده استفاده کند. نمونه رایج دیگر پیشبینی، استفاده از شاخصهای اقتصادی برای پیشبینی فعالیتهای اقتصادی آینده است: اقتصاد دانان ممکن است از دادههای مربوط به بیکاری و تورم برای پیشبینی عملکرد اقتصاد در آینده استفاده کنند.
پردازش زبان طبیعی
پردازش زبان طبیعی (NLP) زیر شاخه و یکی از مفاهیم اساسی هوش مصنوعی است که با درک و تولید زبان انسان سروکار دارد. NLP موارد استفاده زیادی دارد که نمونههای آن در ادامه ذکر شده است:
- تجزیه و تحلیل احساسات: تجزیه و تحلیل احساسات میتواند برای تجزیه و تحلیل خودکار دادههای متن برای تعیین لحن احساسی متن استفاده شود. این به تجزیه و تحلیل احساسات مشتری یا نظارت بر رسانههای اجتماعی کمک میکند.
- مدل سازی موضوع: میتوان از آن برای شناسایی خودکار موضوعات موجود در یک سند متنی استفاده کرد. مدلسازی موضوع برای توصیهها یا وظایف بازیابی اطلاعات مفید است.
- شناسایی موجودیت نامگذاری شده (NER): میتوان از آن برای شناسایی خودکار موجودیتهای نامگذاری شده در دادههای متنی، مانند افراد، مکانها یا سازمانها استفاده کرد. NER به کارهای مختلفی مانند استخراج اطلاعات کمک میکند.
- طبقهبندی متن: میتوان از آن برای طبقهبندی خودکار دادههای متنی به دستههای از پیش تعریف شده استفاده کرد. طبقهبندی متن میتواند برای کارهایی مانند طبقهبندی اسناد یا تشخیص هرزنامه استفاده شود.
- تشخیص زبان: میتوان از آن برای تشخیص خودکار زبان یک سند متنی استفاده کرد. تشخیص زبان به کارهایی مانند ترجمه ماشینی یا طبقهبندی متن کمک میکند.
- خلاصهسازی متن: از خلاصهسازی متن میتوان برای تولید خودکار خلاصهای از یک سند متنی استفاده کرد. برای بازیابی اطلاعات یا توصیه محتوا مفید است.
بینایی کامپیوتر
بینایی کامپیوتر (CV) یکی دیگر از مفاهیم اساسی هوش مصنوعی است که به تجزیه و تحلیل و درک تصاویر دیجیتال میپردازد. بینایی کامپیوتر موارد استفاده زیادی دارد که در ادامه بیان شده است:
- تعدیل خودکار محتوا: از دید کامپیوتری میتوان برای تعدیل خودکار محتوا برای پلتفرمهای آنلاین مانند رسانههای اجتماعی یا بازارهای آنلاین استفاده کرد. این مفهوم میتواند به حذف سریع و کارآمد محتوای نامناسب کمک کند.
- تشخیص اشیاء: کسب و کارهای خرده فروشی میتوانند از بینایی کامپیوتری برای تشخیص اشیا برای کمک به کارهایی مانند موجودی انبار و خدمات مشتری استفاده کنند.
- تشخیص چهره: بینایی کامپیوتری را میتوان برای تشخیص چهره برای بهبود امنیت استفاده کرد. در مکانهای عمومی مانند فرودگاهها یا در مشاغل خصوصی مانند ساختمانهای اداری مفید است.
- تشخیص پلاک: تشخیص پلاک میتواند برای اهداف امنیتی یا اجرای قانون استفاده شود. به عنوان مثال، میتوان از آن برای ردیابی وسایل نقلیه سرقت شده یا نظارت بر تخلفات رانندگی استفاده کرد.
- بازرسی خودکار برای تضمین کیفیت: از دید کامپیوتری میتوان برای بازرسی خودکار محصولات یا مواد استفاده کرد. این به فرآیند تولید برای اطمینان از کنترل کیفیت یا سایر صنایع مانند ایمنی مواد غذایی کمک میکند.
- تشخیص الگو: بینایی کامپیوتری را میتوان برای تشخیص الگو در زمینههایی مانند پزشکی (به عنوان مثال شناسایی الگوهای بیماری)، معماری و مهندسی استفاده کرد.