طبقه‌ بندی نوع سرطان سینه (خوش خیم و بد خیم) با کمک روشهای لاجستیک رگریشن، درخت تصمیم و SVM

- طبقه‌ بندی نوع سرطان سینه (خوش خیم و بد خیم) با کمک روشهای لاجستیک رگریشن، درخت تصمیم و SVM

طبقه‌ بندی نوع سرطان سینه (خوش خیم و بد خیم) با کمک روشهای لاجستیک رگریشن، درخت تصمیم و SVM

 

 در این پروژه، به طبقه‌بندی داده‌ی سرطان سینه به دو پروه خوش خیم و بدخیم می‌پردازیم.

 

اطلاعات پایگاه داده

**Data Set Characteristics**

Number of Instances: 569

Number of Attributes: 30 numeric, predictive attributes and the class

 

**class**

WDBC-Malignant

WDBC-Benign

 

در ادامه با استفاده از روش PCA چند ویژگی اول که دارای اطلاعات مفیدتری هستند، انتخاب می‌شوند.

برای طبقه‌بندی داده نیز از روش‌های رگرسیون لاجستیک (Logistic Regression)، درخت تصمیم (Decision Tree) و ماشین بردار پشتیبان (SVM) استفاده شده است. پیاده‌سازی این پروژه (در قالب کد برنامه نویسی) به زبان پایتون انجام شده است.

 

 

برای دانلود کلیک کنید