طبقه بندی نوع سرطان سینه (خوش خیم و بد خیم) با کمک روشهای لاجستیک رگریشن، درخت تصمیم و SVM
در این پروژه، به طبقهبندی دادهی سرطان سینه به دو پروه خوش خیم و بدخیم میپردازیم.
اطلاعات پایگاه داده
**Data Set Characteristics**
Number of Instances: 569
Number of Attributes: 30 numeric, predictive attributes and the class
**class**
WDBC-Malignant
WDBC-Benign
در ادامه با استفاده از روش PCA چند ویژگی اول که دارای اطلاعات مفیدتری هستند، انتخاب میشوند.
برای طبقهبندی داده نیز از روشهای رگرسیون لاجستیک (Logistic Regression)، درخت تصمیم (Decision Tree) و ماشین بردار پشتیبان (SVM) استفاده شده است. پیادهسازی این پروژه (در قالب کد برنامه نویسی) به زبان پایتون انجام شده است.