Про швидкiсть збiжностi субградiєнтих методiв з кроком Поляка

Автор(и)

DOI:

https://doi.org/10.24144/2616-7700.2019.1(34).94-101

Ключові слова:

субградiєнтний метод, крок Поляка, перетворення простору, швидкiсть збiжностi, гострий мiнiмум

Анотація

Розглядаються субградiєнтнi методи (метод А та метод В) для знаходження точки мiнiмуму опуклої функцiї, якщо вiдоме її мiнiмальне значення. Обидва методи використовують вiдомий крок Поляка, який залежить вiд скалярного параметра m ≥ 1 i гарантує монотонне зменшення вiдстанi до точки мiнiмуму. Якщо m = 1, то методи А та В застосовнi для довiльної опуклої функцiї. Параметр m > 1 дозволяє врахувати спецiальнi класи опуклих функцiй – опуклi квадратичнi функцiї (m = 2), диференцiйовнi однорiднi функцiї з показником σ (m = σ) та iншi. Для обох методiв доведено теореми про їх збiжнiсть зi швидкiстю O 1/ √ k для довiльної опуклої функцiї та збiжнiсть зi швидкiстю геометричної прогресiї для опуклої функцiї з гострим мiнiмумом. Метод А є субградiєнтним методом з кроком Поляка у вихiдному просторi змiнних. Параметр m = 1 вiдповiдає класичному кроку Поляка для довiльної опуклої функцiї. Параметр m = 2 можна використовувати при мiнiмiзацiї квадратичних функцiй, для яких величина кроку Поляка збiльшується в два рази порiвняно з класичним кроком Поляка при m = 1. Для одновимiрних квадратичних функцiй метод А знаходить точку мiнiмуму за один крок з довiльної стартової точки, що вiдповiдає однiй iтерацiї методу Ньютона. Доведення теорем про швидкiсть збiжностi методу А базується на характеристиках опуклої функцiї в вихiдному просторi змiнних, серед яких ключову роль вiдiграє константа c1, яка обмежує норму субградiєнта. Метод В – субградiєнтний метод з перетворенням простору, де крок Поляка обчислюється у перетвореному лiнiйним оператором просторi змiнних. Метод визначається невиродженою матрицею B. Параметр m = 1 вiдповiдає класичному кроку Поляка для довiльної опуклої функцiї у перетвореному просторi змiнних. Якщо m = 2, то для одновимiрної квадратичної функцiї метод В знаходить точку мiнiмуму за один крок при довiльних матрицi B та стартовiй точцi. Доведення теорем про швидкiсть збiжностi методу B базуються на характеристиках функцiї в перетвореному просторi змiнних, аналогiчних характеристикам функцiй у початковому просторi для методу А.

Біографії авторів

П. І. Стецюк, Iнститут кiбернетики iм. В.М. Глушкова НАН України, Київ

завiдувач вiддiлу методiв негладкої оптимiзацiї, доктор фiзико-математичних наук

В. О. Стовба, Iнститут кiбернетики iм. В.М. Глушкова НАН України, Київ

аспiрант

О. О. Жмуд, Iнститут кiбернетики iм. В.М. Глушкова НАН України, Київ

аспiрант

Посилання

  1. Polyak, B. T. (1969). Minimizatsiya negladkih funktsionalov [Minimization of non-smooth functionals]. Computational Mathematics and Mathematical Physics, 9(3), 509–521 [in Russian].
  2. Agmon, S. (1954). The relaxation method for linear inequalities. Canadian Journal of Mathematics, 6, 382–392. doi: https://doi.org/10.4153/CJM-1954-037-2
  3. Motzkin, T. S., & Schoenberg, I. J. (1954). The relaxation method for linear inequalities. Canadian Journal of Mathematics, 6, 393–404. doi: https://doi.org/10.4153/CJM-1954-038-x
  4. Eremin, I. I. (1965). Obobschenie relaksatsionnogo metoda Motskina-Agmona [Generalization of the relaxation method of Moitskin-Agmon]. it Uspekhi Matematicheskikh Nauk 20(2(122)), 183–187 [in Russian].
  5. Stetsyuk, P. I. (2012). Acceleration of Polyak’s subgradient method. Theory of Optimum Solutions, 11, 151–160.
  6. Polyak, B. T. (1983). Vvedenie v optimizatsiyu [Introduction to optimization]. Nauka [in Russian].
  7. Stetsyuk, P., Stovba, V., & Chernousova, Z. (2018). Subgradient Method with Polyak’s Step in Transformed Space. In International Conference on Optimization and Applications, 49–63. Springer, Cham. doi: https://doi.org/10.1007/978-3-030-10934-9 4

##submission.downloads##

Опубліковано

2019-07-02

Як цитувати

Стецюк, П. І., Стовба, В. О., & Жмуд, О. О. (2019). Про швидкiсть збiжностi субградiєнтих методiв з кроком Поляка. Науковий вісник Ужгородського університету. Серія «Математика і інформатика», 1(34), 94–101. https://doi.org/10.24144/2616-7700.2019.1(34).94-101

Номер

Розділ

Iнформатика, комп’ютернi науки та прикладна математика