Розробка інтелектуальної системи прийняття рішень для діагностування діабету

Автор(и)

DOI:

https://doi.org/10.24144/2616-7700.2025.46(1).226-233

Ключові слова:

система прийняття рішень, класифікація, діагностування діабету, інтелектуальна система, машинне навчання

Анотація

У статті представлено результати розробки інтелектуальної системи підтримки прийняття рішень для діагностики цукрового діабету з використанням методів машинного навчання. На основі відкритого медичного датасету було побудовано та проаналізовано низку класифікаційних моделей, зокрема логістичну регресію, Random Forest та XGBoost. З метою підвищення точності було застосовано метод стратифікації при виділенні валідаційних даних, масштабування ознак, крос-валідацію та оптимізацію гіперпараметрів моделей. Особливу увагу приділено аналізу матриць невідповідності та оцінці впливу ключових ознак. Найкраща кросвалідаційна точність досягнута моделлю Random Forest (94.43%), що свідчить про її здатність добре узагальнювати закономірності у незбалансованих даних. Найнижча кількість помилок другого роду (FN = 16) спостерігається в моделі XGBoost. Запропонований підхід може бути ефективно використаний для попереднього діагностування діабету.

Біографії авторів

М. М. Маляр, ДВНЗ «Ужгородський нацiональний унiверситет»

Професор кафедри кiбернетики i прикладної математики. Доктор технiчних наук

Н. Е. Кондрук, ДВНЗ «Ужгородський нацiональний унiверситет»

Доцентка кафедри кiбернетики i прикладної математики. Кандидат технiчних наук

Є. Б. Кондрук, ДВНЗ «Ужгородський нацiональний унiверситет»

Аспірант кафедри кібернетики і прикладної математики

В. А. Нерода, ДВНЗ «Ужгородський нацiональний унiверситет»

Аспірант кафедри кібернетики і прикладної математики

Посилання

  1. Rabie, O., Alghazzawi, D., Asghar, J., Saddozai, F. K., & Asghar, M. Z. (2022). A decision support system for diagnosing diabetes using deep neural network. Frontiers in Public Health, 10, 861062. https://doi.org/10.3389/fpubh.2022.861062
  2. Tuppad, A., & Patil, S. D. (2022). Machine learning for diabetes clinical decision support: A review. Advances in Computational Intelligence, 2(2), 22. https://doi.org/10.1007/s43674-022-00034-y
  3. Omana, J., & Moorthi, M. (2022). Predictive analysis and prognostic approach of diabetes prediction with machine learning techniques. Wireless Personal Communications, 127(1), 465–478. https://doi.org/10.1007/s11277-021-08274-w
  4. Gupta, H., Varshney, H., Sharma, T. K., Pachauri, N., & Verma, O. P. (2022). Comparative performance analysis of quantum machine learning with deep learning for diabetes prediction. Complex & Intelligent Systems, 8(4), 3073–3087. https://doi.org/10.1007/s40747-021-00398-7
  5. Olowe, K. J., Edoh, N. L., Zouo, S. J. C., & Olamijuwon, J. (2024). Comprehensive review of logistic regression techniques in predicting health outcomes and trends. World Journal of Advanced Pharmaceutical and Life Sciences, 7(2), 16–26. https://doi.org/10.53346/wjapls.2024.7.2.0039
  6. Badawy, M., Ramadan, N., & Hefny, H. A. (2023). Healthcare predictive analytics using machine learning and deep learning techniques: A survey. Journal of Electrical Systems and Information Technology, 10(1), 40. https://doi.org/10.21203/rs.3.rs-1885746/v2
  7. Sievering, A. W., & others. (2022). Comparison of machine learning methods with logistic regression analysis in creating predictive models for risk of critical in-hospital events in COVID-19 patients on hospital admission. BMC Medical Informatics and Decision Making, 22(1), 309. https://doi.org/10.1186/s12911-022-02057-4
  8. Iranzad, R., & Liu, X. (2024). A review of random forest-based feature selection methods for data science education and applications. International Journal of Data Science and Analytics. Advance online publication. https://doi.org/10.1007/s41060-024-00509-w
  9. Palimkar, P., Shaw, R. N., & Ghosh, A. (2021). Machine learning technique to prognosis diabetes disease: Random forest classifier approach. In Advanced computing and intelligent technologies: Proceedings of ICACIT 2021. Springer: Singapore. https://doi.org/10.1007/978-981-16-2164-2_19
  10. Bentéjac, C., Csörgő, A., & Martínez-Muñoz, G. (2021). A comparative analysis of gradient boosting algorithms. Artificial Intelligence Review, 54(3), 1937–1967. https://doi.org/10.1007/s10462-020-09896-5
  11. Zhang, P., Jia, Y., & Shang, Y. (2022). Research and application of XGBoost in imbalanced data. International Journal of Distributed Sensor Networks, 18(6). https://doi.org/10.1177/1550132922110693
  12. Darabi, P. K. (2023). Diabetes dataset with 18 features. [Data set]. Kaggle. Retrieved from https://www.kaggle.com/datasets/pkdarabi/diabetes-dataset-with-18-features
  13. Kondruk, N. E. (2023). Analysis of dimensionality reduction techniques in machine learning. Scientific Bulletin of Uzhhorod University, Series "Mathematics and Informatics", 42(1), 181–187. https://doi.org/10.24144/2616-7700.2023.42(1).181-187

##submission.downloads##

Опубліковано

2025-06-03

Як цитувати

Маляр, М. М., Кондрук, Н. Е., Кондрук, Є. Б., & Нерода, В. А. (2025). Розробка інтелектуальної системи прийняття рішень для діагностування діабету. Науковий вісник Ужгородського університету. Серія «Математика і інформатика», 46(1), 226–233. https://doi.org/10.24144/2616-7700.2025.46(1).226-233

Номер

Розділ

Iнформатика, комп’ютернi науки та прикладна математика