Книга представляет собой введение в основные понятия, методы и ал
Download 1.93 Mb.
|
machine-learning-mironov
- Bu sahifa navigatsiya:
- Теорема 4 .
- Доказательство.
Применение методаПрименим изложенный выше метод к оптимизационной задаче (2.42) при условиях (2.41). В данном случае 2 целевая функция 𝑓 имеет вид | |2 , и условия являются линейными неравенствами (⟨, ⟩ − 0) − 1 ≥ 0, где ∈ 𝑋𝑆. (2.59) 2 Докажем, что целевая функция выпукла. Данная функция является суперпозицией трех функций: функции ↦→ | |, функции ↦→ 2, и функции ↦→ 1 . Эти функции выпуклы, т.к. выпуклость функции ↦→ | | следует из неравенства треуголь- ника ( |𝑎 + 𝑏 | ≤ |𝑎 | + |𝑏 |) для нормы в произвольном векторном пространстве: ∀ , ′ ∈ R, ∀ 𝛼 ∈ [0, 1] |𝛼 + (1 − 𝛼)′ | ≤ |𝛼 | + |(1 − 𝛼)′ | = 𝛼 | | + (1 − 𝛼) |′ |, выпуклость функции ↦→ 2 обосновывается следующим образом: ∀ , ′ ∈ R, ∀ 𝛼 ∈ [0, 1] требуемое неравенство (𝛼 + (1 − 𝛼)′)2 ≤ 𝛼2 + (1 − 𝛼)(′)2 после раскрытия скобок, перегруппировки слагаемых и приведения подобных членов преобразуется в эквивалентное неравенство 𝛼2( − ′)2 ≤ 𝛼( − ′)2 которое верно потому, что 𝛼 ∈ [0, 1], 2 ↦→ Нетрудно доказать, что если функции 𝑓 : R → R и 𝑔 : R → R выпуклы и, кроме того, 𝑔 монотонно неубывающая, то их суперпозиция (𝑔 ∘ 𝑓 ) тоже выпукла. Действительно, ∀ , ′ ∈ R, ∀ 𝛼 ∈ [0, 1] (𝑔 ∘ 𝑓 )(𝛼 + (1 − 𝛼)′) = 𝑔(𝑓 (𝛼 + (1 − 𝛼)′)) ≤ ≤ 𝑔(𝛼𝑓 () + (1 − 𝛼)𝑓 (′)) ≤ 𝛼𝑔(𝑓 ()) + (1 − 𝛼)𝑔(𝑓 (′)) = = 𝛼(𝑔 ∘ 𝑓 )() + (1 − 𝛼)(𝑔 ∘ 𝑓 )(′). 2 ↦→ ↦→ → Поскольку функции 2 и 1 : R R – выпуклы и монотонно неубывающие, то, следовательно их суперпозиция с выпуклой функцией 2 ↦→ | | ↦→ | | , т.е. функция 1 2 тоже выпукла. Функция Лагранжа для данной задачи имеет вид 𝐿 = | |2 −
∑︁∈𝑋𝑆 𝜆((⟨, ⟩ − 0) − 1), (2.60) и соотношение (2.48) имеет следующий вид: ∀ = 1, . . . , ˆ − ∑︁ 𝜆ˆ = 0, 0 − ∑︁ 𝜆ˆ(−1) = 0, ∈𝑋𝑆 что можно переписать в виде ∈𝑋𝑆 ∈𝑋𝑆 ∈𝑋𝑆 ˆ = ∑︁ 𝜆ˆ, ∑︁ 𝜆ˆ = 0. (2.61) Из теоремы 3 следует, что исходная задача сводится к задаче поиска вектора ˆ, числа ˆ0, и набора чисел 𝜆ˆ = 𝜆ˆ 0 𝑋𝑆 , удовлетво- ряющих соотношениям в (2.61) и условию Теорема 4.∀ ∈ 𝑋𝑆 (⟨, ˆ⟩ − ˆ0) − 1 ≥ 0 {︂ { ≥ | ∈ } 𝜆ˆ((⟨, ˆ⟩ − ˆ0) − 1) = 0. (2.62) { ≥ | ∈ } Задача нахождения объектов ˆ, ˆ0, и 𝜆ˆ = 𝜆ˆ 0 𝑋𝑆 , удовле- ∑︁ творяющих соотношениям (2.61) и (2.62), сводится к задаче нахождения объектов ˆ, ˆ0, и 𝜆ˆ, минимизирующих значения выражения 𝜆ˆ((⟨, ˆ⟩ − ˆ0) − 1) (2.63) ∈𝑋𝑆 ∀ ∈ 𝑋𝑆 Доказательство.𝜆ˆ ≥ 0 (⟨, ˆ⟩ − ˆ0) − 1 ≥ 0. (2.64) Пусть объекты ˆ, ˆ0, и 𝜆ˆ = {𝜆ˆ ≥ 0 | ∈ 𝑋𝑆} удовлетворяют соотношениям (2.61) и (2.62). Тогда при их подстановке вместо со- ответствующих объектов в (2.63) и (2.64) получаем, что ∙ значение суммы (2.63) будет равно 0 (т.к., согласно второму равенству в (2.62), каждое слагаемое в этой сумме равно 0), и соотношения в (2.64) верны, это следует из (2.61) и (2.62). С другой стороны, сумма (2.63) при условиях (2.64), не может быть меньше 0, т.к., согласно этим условиям, каждое ее слагаемое явля- ется произведением неотрицательных чисел. { ≥ | ∈ } Таким образом, объекты ˆ, ˆ0, и 𝜆ˆ = 𝜆ˆ 0 𝑋𝑆 – решение задачи минимизации суммы (2.63) при условиях (2.64). Согласно условиям (2.64), каждое слагаемое в сумме (2.63) при этих условиях неотрицательно, т.е. сумма (2.63) неотрицательна, и ∙ если минимальное значение этой суммы равно 0, то каждое слагаемое в этой сумме равно 0, т.е. объекты ˆ, ˆ0, и 𝜆ˆ, реша- ющие задачу минимизации (2.63) при условиях (2.64), удовле- творяют соотношениям (2.61) и (2.62), и ∙ { ≥ | ∈ } если минимальное значение этой суммы больше 0, то тогда решение задачи нахождения ˆ, ˆ0, и 𝜆ˆ = 𝜆ˆ 0 𝑋𝑆 , удовлетворяющих соотношениям (2.61) и (2.62), не существует (что по предположению невозможно). Перепишем сумму (2.63) путем раскрытия скобок, перегруппировки слагаемых и использования линейности скалярного произведения: ∈∑︀𝑋 𝜆ˆ , ˆ ∑︀⟨ ⟩ − ∈𝑋𝑆 𝜆ˆˆ0 ∑︀− ∈𝑋𝑆 𝜆ˆ = = ∑︀ ∈𝑋𝑆 ∈𝑋𝑆 = ⟨ ∑︀ ⟨𝜆ˆ, ˆ⟩ − ( ∑︀ ∈𝑋𝑆 ∈𝑋𝑆 𝜆ˆ, ˆ⟩ − ( ∑︀ 𝜆ˆ)ˆ0 − ∑︀ ∈𝑋𝑆 ∈𝑋𝑆 𝜆ˆ)ˆ0 − ∑︀ 𝜆ˆ = 𝜆ˆ. (2.65) Из условий (2.64) следует, что (2.65) можно переписать в виде ∈𝑋𝑆 ∈𝑋𝑆 ⟨ˆ, ˆ⟩ − ∑︁ 𝜆ˆ = |ˆ|2 − ∑︁ 𝜆ˆ. (2.66) Выражение (2.66) можно переписать, используя лишь переменные 𝜆ˆ: ,∑︁′∈𝑋𝑆 𝜆ˆ𝜆ˆ′ ′ ⟨, ′⟩ − 𝜆ˆ. (2.67) ∑︁ ∈𝑋𝑆 Таким образом, исходная задача свелась к задаче нахождения набора 𝜆ˆ = {𝜆ˆ | ∈ 𝑋𝑆} минимизирующего значение выражения (2.67), при условиях ∀ ∈ 𝑋𝑆 𝜆ˆ ≥ 0, 𝜆ˆ = 0. ∑︁ ∈𝑋𝑆 Такая задача называется задачей квадратичного программиро- вания (ЗКП). Существует много алгоритмов решения этой задачи. Искомый вектор ˆ вычисляется по найденному решению 𝜆ˆ данной ЗКП согласно первому равенству в (2.64). Для вычисления искомого ˆ0 выбирается такая пара ∈ 𝑋𝑆, что 𝜆ˆ ̸= 0, в этом случае, согласно второму равенству в (2.62), должно быть верно равенство (⟨, ˆ⟩ − ˆ0) − 1 = 0, из которого следует, что ˆ0 = ⟨, ˆ⟩ − . Если данная ЗКП имеет не единственное решение, то среди всех этих ре- шений выбирается такое, что число ˆ0, вычисленное по этому решению, удовлетворяет последнему неравенству в (2.64). Обоснуем, почему ∃ ∈ 𝑋𝑆 : 𝜆ˆ 0. Если бы все числа 𝜆ˆ были равны 0, то ˆ – нулевой вектор, и из последнего неравенства в (2.64) следует, что ∀ ∈ 𝑋𝑆 − ˆ0 − 1 ≥ 0, или −ˆ0 ≥ 1. Выборка 𝑆 предполагается нетривиальной, т.е. м.б. равно как 1, так и −1, откуда следует, что ˆ0 ≥ 1 и −ˆ0 ≥ 1, что невозможно. Download 1.93 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling