Oddiy differensial tenglamalarning analitik yechimini maple dasturi yordamida topish
Download 1.46 Mb. Pdf ko'rish
|
maple kitob guliston
- Bu sahifa navigatsiya:
- * GULISTON DAVLAT UNIVERSITETI AXBOROTNOMASI, 2016. № 1 *
Материал и методы
Принцип поиска и исправления ошибок на основе морфов. Будем считать, что на вход системы контроля информации подается буквенная цепочка W и обозначим позиции несовпадения через D, а как d – ближайшую букву. Далее обозначим через w буквы, стоящие в цепочке W на позиции D. Основным свойством позиции D является то, что никакие изменения исходной цепочки W, оставляющие неизменными первые D букв цепочки W, не могут привести к допустимой цепочке. Основной принцип контроля информации алгоритмом заключается в получении позиции несовпадения D с ближайшей буквой, большей d. Система включает алгоритмы поиска слова в словаре основ и просмотра списков морфов. Пусть процедура поиска в отдельном списке, как в словаре, так и в списке морфов, определяет значения D и d с необходимыми поправками, обеспечивающими отсчет D от начала всей анализируемой цепочки W. Отметим, что на практике, когда в качестве D используется адрес в памяти ЭВМ, то значение D автоматически получается правильным. В данном подходе словоформа рассматривается как конкатенация подцепочек, первая из которых имеется в словаре основ, следующая — в списке морфов первой позиции, и т.д. Например, ўқи- ла- ди-ган: Для наглядности представления результатов разработок работу исследуемого алгоритма рассмотрим на примере использования модели морфологического анализа. * GULISTON DAVLAT UNIVERSITETI AXBOROTNOMASI, 2016. № 1 * 12 Алгоритм морфологического анализа позволяет осуществить сперва поиск начальной подцепочки анализируемого слова в словаре путем просмотра словаря, затем поиск начальной подцепочки оставшейся части слова в первом списке морфов, и т.д. Можно предложить различные способы разложения слова на подцепочки. Одна из возможных моделей построения алгоритма исправления ошибок основывается на определение произведения множеств буквенных цепочек M = M 1 x M 2 всех цепочек, начальная часть которых совпадает с некоторой цепочкой из M 1 , а оставшаяся часть — с некоторой цепочкой из M 2 . Считается, что множество всех правильных словоформ есть подмножество произведения словаря и всех списков морфов. Требуется установить, является ли найденный элемент такого произведения правильной словоформой. Для чего адаптируется правило исправления ошибок путем использования алгоритмом вместо значений D и d более слабых значений, определяющихся как большее значение D и меньшее значение d. Кроме того, предполагается использование значений, определенных для данной цепочки W относительно множества, содержащего множество всех правильных словоформ. Поскольку списки морфов хранятся в оперативной памяти ЭВМ, лишних обращений к дисковой памяти по сравнению со случаем использования списка только правильных словоформ не производится. Таким образом, задача сводится к нахождению значений D и d относительно произведения словаря основ и всех списков морфов и ее отличительной особенностью является то, что фактически рассматривается не поиск части анализируемой цепочки в списке морфов, а поиск всей цепочки в множестве, являющемся произведением списка морфов на начальную часть цепочки, являющуюся произведением цепочек из предыдущих списков. Ниже изложим механизмы построения адаптивных алгоритмов обнаружения и исправления ошибок в текстах. Обозначим анализируемую цепочку через W и пусть M=M 1 xM 2 x...xM n . Рассмотрим все возможные способы выделения в цепочке W некоторой начальной части w, являющейся элементом M 1 x M 2 x ... x M k-1 , либо пустой цепочкой при k=1. Далее обозначим через D и d значения, определенные для W относительно M, а через D' и d' значения, определенные относительно множества M' вида {w} x M k . Нами приняты следующие условия построения алгоритмов, где: D D max и d d min для } {D d . Для доказательства данного условия рассмотрим объединение M'' всех множеств вида M', и соответствующие ему величины D'' и d''. Примем условие, что минимальное и максимальное значения есть в точности D'' и d'' и требуется установление условий D≤D'' и d≥d'. По предложенному способу построения алгоритма каждая цепочка из любого M' может быть дополнена справа до некоторой цепочки из M. Следовательно, M'' получается из M путем выделения подмножества и усечения цепочек справа. Это означает, что D'' не больше D и, если D''=D, то d'' не меньше d. Теперь покажем, что выше приведенное условие справедливо для нового алгоритма, где используется информация непосредственно о соседних с W в M слова W 1 и W 2 , позиции D 1 и D 2 , и буквы d 2 , участвующих в определении D и d. В данном случае рассматривается любое разложение слова W 1 на подцепочки, принадлежащие M 1 , ..., M n . Одно из правил разложения заключается в том, что первые k-1 членов разложения образуют начальную подцепочку слова W, а первые k членов не образуют такой подцепочки. В этом случае позиция несовпадения D 1 расположена внутри k-го члена разложения. Введем слово W' 1 , полученное из W 1 отбрасыванием всех членов разложения, начиная с k+1. Поскольку W 1 не больше W, то W' 1 не больше W, и позиция несовпадения с ним D' 1 =D 1 . При этом отметим, что все начальные члены разложения W' 1 образуют начальную подцепочку W и W' 1 принадлежит некоторому из множеств вида M'. Аналогично, вводятся W' 2 , где W' 2 > W и W 2 принадлежит некоторому множеству вида M', позиция несовпадения с ним D' 2 =D 2 , и буква d' 2 =d 2 . Поскольку W' 1 не больше W и W' 2 > W , слово W расположено между W' 1 и W' 2 . отсюда вытекает, что D' 1 =D 1 , D' 2 =D 2 и d' 2 =d 2 ., а следовательно D=D'' и d=d''. Отметим, что, проанализированное представление словоформы как элемента произведения словаря и списков морфов предполагает существование только одной формальной части речи. В связи с этим, представляется целесообразным рассмотрение ситуации, когда имеется несколько формальных частей речи. Download 1.46 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling