@article{Дяконюк_Мудрик_Корольчук_Кондор_2021, title={Розпізнавання математичних формул на базі даних CROHME.}, volume={38}, url={http://visnyk-math.uzhnu.edu.ua/article/view/229086}, DOI={10.24144/2616-7700.2021.38(1).137-142}, abstractNote={<p><span style="font-weight: 400;">У  наш час найбільш точні моделі для розпізнавання об’єктів базуються на двоступеневому підході, популяризованому як R-CNN. На відміну від них, одноступеневі моделі, що застосовуються під час регулярного, детального відбору зразків, можуть бути швидшими та простішими, але вони не досягають точності двоступеневих моделей. Проте з новою функцією втрат, дисбаланс класу, який виникає під час тренування на наборі даних,  зникає. Саме тому одноступенева модель має переваги в  продуктивності та точності на відміну від двоступеневої. У роботі використано цей дисбаланс класів, щоб переформувати стандартні, перехресні ентропійні втрати таким чином, щоб зменшити їх. В архітектурі RetinaNet[1], функція втрат Focal Loss[1] сфокусовує навчання на наборі даних, які зустрічаються рідше, і запобігає перевантаженню моделі під час тренувань. Архітектура RetinaNet  була протестована на наборі даних CROHME[4], що був розширений за допомогою алгоритму </span><span style="font-weight: 400;">Data Augmentation[9]</span><span style="font-weight: 400;"> для збільшення частоти входження певних елементів формул.</span> <span style="font-weight: 400;">Також було порівняно дві бібліотеки машинного навчання: TensorFlow та Torch. Отримані результати показують, що коли модель тренується з фокальною втратою, RetinaNet показує дуже добрі результати та має хорошу швидкість виконання. Окрім того, отриману модель було інтегровано в веб-застосунок на основі мікросервісної архітектури. Основними веб-фреймворками було використано NodeJs для серверної частини та VueJs для рівня подання. Для роботи з базами даних ми використовуємо MongoDB. Розгортання програми відбувається за допомогою хмарної служби AWS на основі Lambda-функцій, </span><span style="font-weight: 400;">що дає змогу виокремити процеси навчання, обробки, візуалізації та контролювати ресурси серверу окремо для кожного процесу.</span></p>}, number={1}, journal={Науковий вісник Ужгородського університету. Серія «Математика і інформатика»}, author={Дяконюк, Л. М. and Мудрик, А. С. and Корольчук, Я. А. and Кондор, М. І.}, year={2021}, month={Трав}, pages={137–142} }