Роль конструювання ознак у прогнозуванні роздрібного попиту: від статистичних базових моделей до нейронних ансамблів

О. С. Бурмей; П. П. Антосяк

doi:10.24144/2616-7700.2026.49(2).155-160

Автор(и)

О. С. Бурмей ДВНЗ «Ужгородський нацiональний унiверситет», Україна https://orcid.org/0009-0004-6192-9742
П. П. Антосяк ДВНЗ «Ужгородський нацiональний унiверситет», Україна https://orcid.org/0000-0001-7131-1795

DOI:

https://doi.org/10.24144/2616-7700.2026.49(2).155-160

Ключові слова:

прогнозування попиту, роздрібна торгівля, градієнтний бустинг, глибинне навчання, імовірнісне прогнозування, промоційні ефекти, часові ряди, аналіз внеску компонентів

Анотація

У статтi представлено порiвняльне дослiдження методiв прогнозування роздрiбного попиту на наборi даних Kaggle Store Sales [13] (1 782 часових ряди, 54 магазини × 33 товарнi категорiї). Зiставлено вiсiм методiв — Seasonal Naive, Drift, Prophet, LightGBM, XGBoost, N-HiTS, PatchTST та ансамбль AutoGluon-TimeSeries — за точнiстю точкових прогнозiв, iмовiрнiсним калiбруванням та виявленням стрибкiв попиту. За допомогою крос-валiдацiї з ковзним вiкном (\(h = 15\) днiв, 3 фолди) кожну модель оцiнено у чотирьох конфiгурацiях виключення ознак. Градiєнтний бустинг (LightGBM) досягає найкращої точностi (\(\textrm{sMAPE}_\textrm{nz} = \) 29,4% проти 41,3% для Seasonal Naive), зменшує похибку в промоцiйнi перiоди на 32% та забезпечує калiброванi 80%-вi прогнознi iнтервали (покриття = 79,8%). Моделi глибинного навчання досягають конкурентного \(\textrm{sMAPE}_\textrm{nz}\) на високообiгових категорiях (13,6–17,4%), але генерують менш калiброванi iнтервали. Абляцiйний аналiз показав, що ковзнi ознаки забезпечують прирiст ≈ 1,5 п. п. sMAPE, а промоцiйнi — ≈ 0,7 п. п.

Спонсор дослідження

Дослiдження було проведено без фiнансової пiдтримки.

Біографії авторів

О. С. Бурмей, ДВНЗ «Ужгородський нацiональний унiверситет»

Аспiрант кафедри cистемного аналiзу i теорiї оптимiзацiї

П. П. Антосяк, ДВНЗ «Ужгородський нацiональний унiверситет»

Доцент кафедри cистемного аналiзу i теорiї оптимiзацiї. Кандидат фiзико-математичних наук

Посилання

Fildes, R., Ma, S., & Kolassa, S. (2022). Retail forecasting: Research and practice. International Journal of Forecasting, 38(4), 1283–1318. https://doi.org/10.1016/j.ijforecast.2019.06.004
Hyndman, R. J., & Athanasopoulos, G. (2021). Forecasting: Principles and Practice (3rd ed.). Melbourne: OTexts. Retrieved from https://otexts.com/fpp3/
Lim, B., & Zohren, S. (2021). Time-series forecasting with deep learning: A survey. Philosophical Transactions of the Royal Society A, 379(2194). https://doi.org/10.1098/rsta.2020.0209
Makridakis, S., Spiliotis, E., & Assimakopoulos, V. (2022). M5 accuracy competition: Results, findings, and conclusions. International Journal of Forecasting, 38(4), 1346–1364. https://doi.org/10.1016/j.ijforecast.2021.11.013
Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T.-Y. (2017). LightGBM: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30, 3146–3154.
Gneiting, T., Balabdaoui, F., & Raftery, A. E. (2007). Probabilistic forecasts, calibration and sharpness. Journal of the Royal Statistical Society: Series B, 69(2), 243–268. https://doi.org/10.1111/j.1467-9868.2007.00587.x
Nie, Y., Nguyen, N. H., Sinthong, P., & Kalagnanam, J. (2023). A time series is worth 64 words: Long-term forecasting with transformers. In Proceedings of ICLR.
Challu, C., Olivares, K. G., Oreshkin, B. N., Garza, F., Mergenthaler-Canseco, M., & Dubrawski, A. (2023). N-HiTS: Neural hierarchical interpolation for time series forecasting. In Proceedings of AAAI, 37(6), 6989–6997. https://doi.org/10.1609/aaai.v37i6.25854
Taylor, S. J., & Letham, B. (2018). Forecasting at scale. The American Statistician, 72(1), 37–45. https://doi.org/10.1080/00031305.2017.1380080
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. (pp. 785–794). https://doi.org/10.1145/2939672.2939785
Shchur, O., Turkmen, A. C., Erickson, N., Shen, H., Shirkov, A., Hu, T., & Wang, B. (2023). AutoGluon-TimeSeries: AutoML for probabilistic time series forecasting. In Proceedings of the 2nd International Conference on Automated Machine Learning (AutoML), PMLR, 224, 9/1–21.
Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A nextgeneration hyperparameter optimization framework. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. (pp. 2623–2631). https://doi.org/10.1145/3292500.3330701
Corporaci´on Favorita, Cook, A., DanB, inversion, & Holbrook, R. (2021). Store Sales — Time Series Forecasting [Data set and competition]. Kaggle. License: Kaggle Competition Rules. Retrieved from https://www.kaggle.com/competitions/store-sales-time-series-forecasting