تشخیص بیماری دیابت با استفاده از مدل رای گیری نرم

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی کامپیوتر - دانشکده مهندسی و فناوری ـ دانشگاه مازندران ـ بابلسرـ ایران

2 گروه مهندسی کامپیوتر- دانشکده مهندسی و فناوری ـ دانشگاه مازندران ـ بابلسرـ ایران

چکیده

دیابت یکی از عوامل مهم مرگ و میر در سراسر جهان است و تأثیرات آن بر بیماری‌های کلیوی و قلبی و از دست دادن بینایی قابل توجه است. پیش‌بینی دیابت یک حوزه تحقیقاتی مهم است که می‌تواند به بهبود درمان بیماری کمک کند. در این مقاله، روش جدیدی برای تشخیص بیماری دیابت پیشنهاد شده است. روش پیشنهادی روی مجموعه‌داده دیابت اعمال شده است، ابتدا در مرحله پیش‌پردازش، شناسایی داده‌های پرت و حذف آن‌ها، جایگزین نمودن مقادیر گمشده و نرمال‌سازی داده‌ها انجام می‌شود. پس از پیش‌پردازش داده‌ها با استفاده از الگوریتم لاسو، ویژگی‌های مهم انتخاب می‌شوند. سپس با استفاده از سه طبقه‌بند K-نزدیکترین همسایه، تقویت گرادیان شدید و کت‌بوست، نمونه‌ها به دو کلاس بیماران دیابتی و سالم طبقه‌بندی می‌شوند. در پایان برای بهبود روش پیشنهادی از الگوریتم رای‌گیری نرم برای ادغام سه طبقه‌بند استفاده شده است. مدل پیشنهادی در این پژوهش با استفاده از معیارهای ارزیابی دقت، صحت و پوشش مورد ارزیابی قرار گرفت. این مدل به دقت 94.4%، صحت 96.5% و پوشش 92.7% دست یافت. نتایج حاکی از آن هستند که مدل پیشنهادی با افزایش دقت در تشخیص بیماری دیابت نسبت به سایر، عملکرد بهتری داشته است. بنابراین، با استفاده از این مدل، می‌توان افرادی که در معرض خطر ابتلا به دیابت هستند را با دقت بیشتری شناسایی کرد و اقدامات پیشگیرانه‌ای را برای کنترل بیماری دیابت انجام داد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Diabetes Diagnosis Using Soft Voting Model

نویسندگان [English]

  • Sekine Asadi Amiri 1
  • Hannah Yousefpour 1
  • Saeide Mohammadpour 2
1 Dept. Computer Engineering, Faculty of Engineering and Technology, Mazandaran University, Babolsar, Iran,
2 Dept. Computer Engineering, Faculty of Engineering and Technology, University of Mazandaran, Babolsar, Iran,
چکیده [English]

Diabetes is one of the most significant factors leading to death, which can significantly result in kidney diseases, heart diseases, and sight loss. The application of data mining could be helpful for the diagnosis and treatment of this disease. Predicting diabetes is an important area of research that can help improve the treatment process. It is necessary to prevent, monitor, and raise awareness about this disease. In this article, a new method to diagnose diabetes is proposed. The proposed method includes a pre-processing stage in which outlier data is removed. Eventually, by using the K-Nearest Neighbor classifier and Extreme Gradient Boosting, samples will be classified into two classes: diabetic and non-diabetic. In the end, to improve the proposed method, a soft voting algorithm has been used to merge the two classifiers. The proposed method has been applied to the Pima diabetes dataset, which includes information on age, gender, blood pressure, glucose, and other factors related to diabetes. The proposed method in this research was evaluated using evaluation metrics such as accuracy, precision, and recall. This model achieved 91.3% accuracy, 94.5% precision, and 89.1% recall. The results indicate that the proposed model has performed better than other references by increasing the accuracy in diagnosing diabetes. Therefore, by using this model, it will be possible to identify potential diabetic patients more accurately and ultimately prevent them from becoming diabetic.

کلیدواژه‌ها [English]

  • Machine Learning
  • Feature Selection
  • Data Mining
  • Diabetes
  • Prediction