Про швидкiсть збiжностi субградiєнтих методiв з кроком Поляка
DOI:
https://doi.org/10.24144/2616-7700.2019.1(34).94-101Ключові слова:
субградiєнтний метод, крок Поляка, перетворення простору, швидкiсть збiжностi, гострий мiнiмумАнотація
Розглядаються субградiєнтнi методи (метод А та метод В) для знаходження точки мiнiмуму опуклої функцiї, якщо вiдоме її мiнiмальне значення. Обидва методи використовують вiдомий крок Поляка, який залежить вiд скалярного параметра m ≥ 1 i гарантує монотонне зменшення вiдстанi до точки мiнiмуму. Якщо m = 1, то методи А та В застосовнi для довiльної опуклої функцiї. Параметр m > 1 дозволяє врахувати спецiальнi класи опуклих функцiй – опуклi квадратичнi функцiї (m = 2), диференцiйовнi однорiднi функцiї з показником σ (m = σ) та iншi. Для обох методiв доведено теореми про їх збiжнiсть зi швидкiстю O 1/ √ k для довiльної опуклої функцiї та збiжнiсть зi швидкiстю геометричної прогресiї для опуклої функцiї з гострим мiнiмумом. Метод А є субградiєнтним методом з кроком Поляка у вихiдному просторi змiнних. Параметр m = 1 вiдповiдає класичному кроку Поляка для довiльної опуклої функцiї. Параметр m = 2 можна використовувати при мiнiмiзацiї квадратичних функцiй, для яких величина кроку Поляка збiльшується в два рази порiвняно з класичним кроком Поляка при m = 1. Для одновимiрних квадратичних функцiй метод А знаходить точку мiнiмуму за один крок з довiльної стартової точки, що вiдповiдає однiй iтерацiї методу Ньютона. Доведення теорем про швидкiсть збiжностi методу А базується на характеристиках опуклої функцiї в вихiдному просторi змiнних, серед яких ключову роль вiдiграє константа c1, яка обмежує норму субградiєнта. Метод В – субградiєнтний метод з перетворенням простору, де крок Поляка обчислюється у перетвореному лiнiйним оператором просторi змiнних. Метод визначається невиродженою матрицею B. Параметр m = 1 вiдповiдає класичному кроку Поляка для довiльної опуклої функцiї у перетвореному просторi змiнних. Якщо m = 2, то для одновимiрної квадратичної функцiї метод В знаходить точку мiнiмуму за один крок при довiльних матрицi B та стартовiй точцi. Доведення теорем про швидкiсть збiжностi методу B базуються на характеристиках функцiї в перетвореному просторi змiнних, аналогiчних характеристикам функцiй у початковому просторi для методу А.Посилання
- Polyak, B. T. (1969). Minimizatsiya negladkih funktsionalov [Minimization of non-smooth functionals]. Computational Mathematics and Mathematical Physics, 9(3), 509–521 [in Russian].
- Agmon, S. (1954). The relaxation method for linear inequalities. Canadian Journal of Mathematics, 6, 382–392. doi: https://doi.org/10.4153/CJM-1954-037-2
- Motzkin, T. S., & Schoenberg, I. J. (1954). The relaxation method for linear inequalities. Canadian Journal of Mathematics, 6, 393–404. doi: https://doi.org/10.4153/CJM-1954-038-x
- Eremin, I. I. (1965). Obobschenie relaksatsionnogo metoda Motskina-Agmona [Generalization of the relaxation method of Moitskin-Agmon]. it Uspekhi Matematicheskikh Nauk 20(2(122)), 183–187 [in Russian].
- Stetsyuk, P. I. (2012). Acceleration of Polyak’s subgradient method. Theory of Optimum Solutions, 11, 151–160.
- Polyak, B. T. (1983). Vvedenie v optimizatsiyu [Introduction to optimization]. Nauka [in Russian].
- Stetsyuk, P., Stovba, V., & Chernousova, Z. (2018). Subgradient Method with Polyak’s Step in Transformed Space. In International Conference on Optimization and Applications, 49–63. Springer, Cham. doi: https://doi.org/10.1007/978-3-030-10934-9 4
##submission.downloads##
Опубліковано
2019-07-02
Як цитувати
Стецюк, П. І., Стовба, В. О., & Жмуд, О. О. (2019). Про швидкiсть збiжностi субградiєнтих методiв з кроком Поляка. Науковий вісник Ужгородського університету. Серія «Математика і інформатика», 1(34), 94–101. https://doi.org/10.24144/2616-7700.2019.1(34).94-101
Номер
Розділ
Iнформатика, комп’ютернi науки та прикладна математика
Ліцензія
Авторське право (c) 2019 П. І. Стецюк, В. О. Стовба, О. О. Жмуд
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.