پاورپوینت کامل و جامع با عنوان آنالیز کلاستر یا تحلیل خوشه ای در 58 اسلاید
در تجزیه و تحلیل خوشه یا خوشه بندی، گروه بندی مجموعه ای از اشیاء انجام میشود اینکار به این صورت است که اشیاء در یک گروه (به نام خوشه) در مقایسه با دیگر دستهها (خوشه ها) مشابه تر هستند. این وظیفه اصلی داده کاوی اکتشافی است و یک روش معمول برای تجزیه و تحلیل دادههای آماری است که در بسیاری از زمینهها از جمله یادگیری ماشین، تشخیص الگو،تجزیه و تحلیل تصویر، بازیابی اطلاعات، بیوانفورماتیک، فشرده سازی دادهها و گرافیک کامپیوتری استفاده میشود.
تجزیه و تحلیل خوشه ای خود یک الگوریتم خاص نیست، بلکه روند کلی است و میتواند توسط الگوریتمهای مختلفی به دست آید که در درک آنچه که یک خوشه را تشکیل می دهند و نحوه کارآمدی آنها را پیدا میکند.
اصطلاحات خوشهها شامل گروههایی با فاصلههای کم بین اعضای خوشه، مناطق متراکم فضای داده، فواصل و یا توزیعهای آماری خاص است. بنابراین خوشه بندی میتواند به عنوان یک مسئله بهینه سازی چند هدفه صورت گیرد. الگوریتم خوشه بندی مناسب و تنظیمات پارامتر (از جمله پارامترهایی مانند تابع فاصله مورد استفاده، آستانه تراکم یا تعداد خوشه مورد انتظار) بستگی به تنظیم مجموعه دادهها توسط فرد و استفاده خاص فرد از نتایج دارد. تجزیه و تحلیل خوشه ای یک روش اتوماتیک نیست، بلکه یک فرآیند تکراری از کشف دانش یا بهینه سازی چند هدفه تعاملی است که شامل آزمایش و شکست است. اغلب لازم است که دادههای پیش پردازش شده و پارامترهای مدل اصلاح شوند تا نتیجه حاصل ، همان نتیجهٔ دلخواه باشد.
علاوه بر اصطلاحات خوشه بندی، تعدادی از اصطلاح با معانی مشابه وجود دارد، از جمله طبقه بندی خودکار، طبقه بندی عددی، روششناسی و تجزیه و تحلیل توپولوژیکی. تفاوتهای کم اغلب در نتایج استفاده میشود: در داده کاوی، نتیجه گروهها مورد توجه هست و در طبقه بندی خودکار، قدرت تشخیصی مورد توجه است.
تجزیه و تحلیل خوشه ای در انسانشناسی توسط Driver و Kroeber در سال 1932 آغاز شد و در روانشناسی توسط زوبین در سال 1938 و رابرت تیرون در سال 1939 معرفی شد و در سال 1943 برای طبقه بندی نظریه رفتاری در روانشناسی شخصیت توسط Cattell استفاده شدهاست.
مفهوم “خوشه” را دقیقا نمیتوان تعریف کرد،یکی از دلایلش این است که الگوریتمهای خوشه بندی زیادی وجود دارد. همهٔ آنها یک قسمت مشترک دارند و آن یک گروه از اشیاء داده است. با این حال، محققان از مدلهای مختلف خوشه استفاده میکنند و برای هر یک از این مدلهای خوشه، الگوریتمهای مختلفی را میتوان ارائه داد. مفهوم یک خوشه، همانطور که توسط الگوریتمهای مختلف یافت میشود، بهطور خاصی در خواص تفاوت دارند. درک این مدلهای خوشه ، کلید فهمیدن تفاوت بین الگوریتمهای مختلف است.
فهرست مطالب:
آنالیز کلاستر چیست؟
کاربرد های آنالیز کلاستر
اهداف آنالیز کلاستر
تباین (ناهمگنی) در داده ها
یافتن Modality طبیعی داده ها
بخش بندی بازار
انتخاب متغیرهای کلاستر
فرایند تصمیم گیری آنالیز کلاستر
مرحله اول : اهداف آنالیز کلاستر
مرحله دوم : طرح تحقیق در آنالیز کلاستر
تعیین outlier ها
انواع شاخص های تشابه
شاخص های همبستگی
شاخص های فاصله ای
شاخص های تطابق
الگوریتم های گروه بندی
رویه های کلاستر سلسله مراتبی
الگوریتم های سلسله مراتبی که برای توسعه کلاسترها مورد استفاده قرار می گیرند
ارتباط تکی
گام های ارتباط تکی
ارتباط کامل
ارتباط متوسط
روش Centroid
روش وارد Ward’s Method
استاندارد کردن داده
استاندارد کردن با متغیرها
مرحله سوم: فرضیات آنالیز کلاستر
مرحله چهارم: استخراج کلاسترها و ارزیابی تناسب کلی
مزایا و معایب روش های سلسله مراتبی
مزایا و معایب روشهای غیر سلسله مراتبی
ترکیبی از هر دو روش
چه تعداد کلاستر باید انتخاب شوند؟
آیا آنالیز کلاستر باید دوباره تخصیص داده شود؟
مرحله پنجم: تفسیر کلاسترها
مرحله ششم: اعتبار سنجی و profile کردن کلاسترها