روشهای دادههای کاوی برای سیستمهای توصیه کننده (مترجم تکتم شریفی)
چکیده در این فصل، یک بررسی کلی از تکنیک های اصلی دادههای کاوی مورد استفاده در زمینه سیستمهای توصیه کننده را انجام میدهیم. ابتدا ما روشهای پیش پردازش رایج مثل نمونه گیری یا کاهش حالت سه بعدی را توصیف میکنیم. بعد مهمترین تکنیکهای طبقه بندی مثل شبکههای بایسین و ماشینهای برداری حامی را مرور میکنیم. ما الگوریتم دستهبندی معدل k را توصیف میکنیم و درباره چند شکل دیگر بحث میکنیم. همچنین قوانین مرتبط و الگوریتمهای مربوطه برای یک فرایند آموزشی موثر را ارائه میکنیم. علاوه بر معرفی این تکنیکها، ما استفادهشان در سیستمهای توصیه کننده را بررسی میکنیم و مواردی را نشان میدهیم که آنها به طور موفقیتآمیزی بکار میبرند.
- 1 مقدمه
سیستمهای توصیه کننده (RS) معمولا تکنیکها و روش شناسی را از بخشهای مجاور دیگر مثل تعامل کامپیوتر انسان (HCI) یا بازیابی اطلاعات (IR) بکار میگیرند. هرچند، بیشتر این سیستمها در هستهشان یک الگوریتم دارند که میتواند به عنوان یک نمونه خاص از تکنیک دادههای کاوی (DM) درک شود.
فرایند دادههای کاوی معمولا شامل سه مرحله میشود، که پی در پی اجرا میشوند: پیش پردازش دادهها (59)، آنالیز داده، تفسیر نتایج (شکل 2.1 را ببینید). ما برخی از مهمترین روشها برای پیش پردازش داده را در بخش 2.2 آنالیز خواهیم کرد. بخصوص، روی نمونهگیری، کاهش سه بعدی، و استفاده از تابع فاصله به دلیل اهمیتشان و نقششان در سیستم توصیه کننده تاکید خواهیم کرد. در بخشهای 2.3 تا 2.5، یک معرفی کلی روشهای دادههای کاوی را گردآوری میکنیم که در سیستم توصیه کننده عموما استفاده میشوند: طبقهبندی، دستهبندی و بررسی قوانین مرتبط (شکل 2.1 را برای یک دیدگاه مفصل عناوین مختلف در این فصل ببینید).
تعداد صفحه 37