Роль конструювання ознак у прогнозуванні роздрібного попиту: від статистичних базових моделей до нейронних ансамблів
DOI:
https://doi.org/10.24144/2616-7700.2026.49(2).155-160Ключові слова:
прогнозування попиту, роздрібна торгівля, градієнтний бустинг, глибинне навчання, імовірнісне прогнозування, промоційні ефекти, часові ряди, аналіз внеску компонентівАнотація
У статтi представлено порiвняльне дослiдження методiв прогнозування роздрiбного попиту на наборi даних Kaggle Store Sales [13] (1 782 часових ряди, 54 магазини × 33 товарнi категорiї). Зiставлено вiсiм методiв — Seasonal Naive, Drift, Prophet, LightGBM, XGBoost, N-HiTS, PatchTST та ансамбль AutoGluon-TimeSeries — за точнiстю точкових прогнозiв, iмовiрнiсним калiбруванням та виявленням стрибкiв попиту. За допомогою крос-валiдацiї з ковзним вiкном (\(h = 15\) днiв, 3 фолди) кожну модель оцiнено у чотирьох конфiгурацiях виключення ознак. Градiєнтний бустинг (LightGBM) досягає найкращої точностi (\(\textrm{sMAPE}_\textrm{nz} = \) 29,4% проти 41,3% для Seasonal Naive), зменшує похибку в промоцiйнi перiоди на 32% та забезпечує калiброванi 80%-вi прогнознi iнтервали (покриття = 79,8%). Моделi глибинного навчання досягають конкурентного \(\textrm{sMAPE}_\textrm{nz}\) на високообiгових категорiях (13,6–17,4%), але генерують менш калiброванi iнтервали. Абляцiйний аналiз показав, що ковзнi ознаки забезпечують прирiст ≈ 1,5 п. п. sMAPE, а промоцiйнi — ≈ 0,7 п. п.
Спонсор дослідження
- Дослiдження було проведено без фiнансової пiдтримки.
Посилання
- Fildes, R., Ma, S., & Kolassa, S. (2022). Retail forecasting: Research and practice. International Journal of Forecasting, 38(4), 1283–1318. https://doi.org/10.1016/j.ijforecast.2019.06.004
- Hyndman, R. J., & Athanasopoulos, G. (2021). Forecasting: Principles and Practice (3rd ed.). Melbourne: OTexts. Retrieved from https://otexts.com/fpp3/
- Lim, B., & Zohren, S. (2021). Time-series forecasting with deep learning: A survey. Philosophical Transactions of the Royal Society A, 379(2194). https://doi.org/10.1098/rsta.2020.0209
- Makridakis, S., Spiliotis, E., & Assimakopoulos, V. (2022). M5 accuracy competition: Results, findings, and conclusions. International Journal of Forecasting, 38(4), 1346–1364. https://doi.org/10.1016/j.ijforecast.2021.11.013
- Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T.-Y. (2017). LightGBM: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30, 3146–3154.
- Gneiting, T., Balabdaoui, F., & Raftery, A. E. (2007). Probabilistic forecasts, calibration and sharpness. Journal of the Royal Statistical Society: Series B, 69(2), 243–268. https://doi.org/10.1111/j.1467-9868.2007.00587.x
- Nie, Y., Nguyen, N. H., Sinthong, P., & Kalagnanam, J. (2023). A time series is worth 64 words: Long-term forecasting with transformers. In Proceedings of ICLR.
- Challu, C., Olivares, K. G., Oreshkin, B. N., Garza, F., Mergenthaler-Canseco, M., & Dubrawski, A. (2023). N-HiTS: Neural hierarchical interpolation for time series forecasting. In Proceedings of AAAI, 37(6), 6989–6997. https://doi.org/10.1609/aaai.v37i6.25854
- Taylor, S. J., & Letham, B. (2018). Forecasting at scale. The American Statistician, 72(1), 37–45. https://doi.org/10.1080/00031305.2017.1380080
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. (pp. 785–794). https://doi.org/10.1145/2939672.2939785
- Shchur, O., Turkmen, A. C., Erickson, N., Shen, H., Shirkov, A., Hu, T., & Wang, B. (2023). AutoGluon-TimeSeries: AutoML for probabilistic time series forecasting. In Proceedings of the 2nd International Conference on Automated Machine Learning (AutoML), PMLR, 224, 9/1–21.
- Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A nextgeneration hyperparameter optimization framework. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. (pp. 2623–2631). https://doi.org/10.1145/3292500.3330701
- Corporaci´on Favorita, Cook, A., DanB, inversion, & Holbrook, R. (2021). Store Sales — Time Series Forecasting [Data set and competition]. Kaggle. License: Kaggle Competition Rules. Retrieved from https://www.kaggle.com/competitions/store-sales-time-series-forecasting
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 О. С. Бурмей, П. П. Антосяк

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
