الگوریتم های یادگیری ماشین یادگیری بدون نظارت
در یادگیری بدون نظارت، الگوریتم به طور مستقیم با برچسب یا دسته داده ها آموزش داده نمی شود. در عوض، الگوریتم باید ساختار یا الگوهای موجود در داده ها را به تنهایی کشف کند. این امر یادگیری بدون نظارت را برای وظایفی مانند خوشه بندی، کاهش ابعاد و تشخیص ناهنجاری مفید می کند.
سه دسته اصلی از الگوریتم های یادگیری بدون نظارت وجود دارد:
۱. خوشه بندی:
- هدف خوشه بندی گروه بندی نقاط داده با شباهت به یکدیگر است.
- الگوریتم های خوشه بندی رایج عبارتند از:
- k-means: این الگوریتم نقاط داده را به k خوشه اختصاص می دهد.
- خوشه بندی سلسله مراتبی: این الگوریتم سلسله مراتبی از خوشه ها را ایجاد می کند.
- خوشه بندی مبتنی بر چگالی: این الگوریتم خوشه ها را بر اساس چگالی نقاط داده در فضا شناسایی می کند.
۲. کاهش ابعاد:
- هدف کاهش ابعاد کاهش تعداد ویژگی ها در یک مجموعه داده بدون از دست دادن اطلاعات مهم است.
- این امر می تواند برای تجزیه و تحلیل داده ها و یادگیری ماشین آسان تر باشد.
- الگوریتم های کاهش ابعاد رایج عبارتند از:
- تحلیل مولفه های اصلی (PCA): این الگوریتم یک تبدیل خطی را پیدا می کند که ابعاد را به ترتیب واریانس نزولی مرتب می کند.
- تجزیه مقادیر منفرد (SVD): این الگوریتم ماتریس داده را به سه ماتریس تبدیل می کند که می توان از آنها برای کاهش ابعاد استفاده کرد.
۳. تشخیص ناهنجاری:
- هدف تشخیص ناهنجاری شناسایی نقاط داده ای است که از بقیه داده ها منحرف می شوند.
- این امر می تواند برای تقلب، نقص و سایر رویدادهای غیرمنتظره مفید باشد.
- الگوریتم های تشخیص ناهنجاری رایج عبارتند از:
- k-نزدیک ترین همسایه (KNN): این الگوریتم نقاط داده را بر اساس شباهت آنها به k نقطه داده نزدیک دیگر طبقه بندی می کند.
- جنگل های تصادفی: این الگوریتم از مجموعه ای از درختان تصمیم برای شناسایی نقاط داده ناهنجار استفاده می کند.
انتخاب الگوریتم مناسب برای یادگیری بدون نظارت به وظیفه و مجموعه داده خاص بستگی دارد.