Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017


Download 4.3 Mb.
Pdf ko'rish
bet76/121
Sana27.10.2023
Hajmi4.3 Mb.
#1727451
TuriМетодические указания
1   ...   72   73   74   75   76   77   78   79   ...   121
Bog'liq
78Metod IntelectSysObrInf 10.05.03 12.02.2017

Лингвистический аспект. Лингвистический (А2) аспект касается 
исследований языковых проблем, так как язык — это основное 
средство общения в процессе извлечения знаний. Сразу же следует 
оговорить, что поскольку тема данной книги ограничена изложением 
теории и технологии инженерии знаний, то область разработки 
естественно-языковых интерфейсов и весь спектр проблем, связанных 
с 
ней 
— 
лексических, 
синтаксических, 
семантических, 
прагматических 
и т. д. — не рассматривается. 
В инженерии знаний можно выделить три слоя лингвистических 
проблем (рис.5.4): 
А2 = {S21, $22, S23} = {«общий код», понятийная 
структура, словарь пользователя}. 
Рис. 5.4. Лингвистический аспект извлечения знаний. 
18



Проблема «Общего кода». Большинство психологов и 
лингвистов считают, что язык - это основное средство мышления 
наряду с другими знаковыми системами "внутреннего пользования". 
Языки, на которых говорят и размышляют аналитик и эксперт, могут 
существенно отличаться. Различие языков и обусловливает 
«языковый барьер» или «языковые ножницы» в общении инженера по 
знаниям и эксперта. 
Язык инженера по знаниям (аналитика)состоит из трех 
компонентов: 
общенаучной терминологии из его «теоретического 
багажа»; 
терминов предметной области, которые он почерпнул из 
специальной литературы в период подготовки;
бытового разговорного языка, которым пользуется 
аналитик. 
Язык эксперта включает: 
общенаучную терминологию; 
специальную терминологию, принятую в 
предметной области; 
бытовой язык; 
неологизмы, созданные экспертом за 
время работы, то 
есть его профессиональный жаргон. 
Если считать, что бытовой и общенаучный языки у двух 
участников общения примерно совпадают, то некоторый общий язык, 
или код, который необходимо выработать партнерам для успешного 
взаимодействия, будет включать еще специальные терминологии 
инженера по знаниям и эксперта. В дальнейшем этот общий код 
преобразуется в 
18



некоторую понятийную (семантическую) сеть, которая является 
прообразом поля знаний предметной области. 
Выработка общего кода начинается с выписывания аналитиком 
всех терминов, употребляемых экспертом, и уточнения их смысла. 
Фактически это составление словаря предметной области. Затем 
следуют группировка терминов и выбор синонимов (слов, 
означающих одно и то же). Разработка общего кода заканчивается 
составлением 
словаря 
терминов 
предметной 
области 
с 
предварительной группировкой их по смыслу, т.е. по понятийной 
близости (это уже первый шаг структурирования знаний). 
Важной является проблема неоднозначности интерпретации 
терминов двумя специалистами. В семиотике, науке о знаковых 
системах, проблема интерпретации является одной из центральных. 
Интерпретация связывает "знак" и "означаемый предмет". Только в 
интерпретации знак получает смысл. Так, например, термин "прибор 
X" для эксперта означают некоторую конкретную схему, которая 
соответствует схеме оригинала прибора, а в голове начинающего 
аналитика слова "прибор X" вызывают пустой образ или некоторый 
"черный ящик" с ручками. 
Понятийная 
структура.Большинство 
специалистов 
по 
искусственному интеллекту и когнитивной психологии считают, что 
основная особенность естественного интеллекта и памяти в частности 
- это связанность всех понятий в некоторую сеть. Поэтому для 
разработки базы знаний нужен не словарь, а энциклопедия, в которой 
все термины объяснены в словарных статьях со ссылками на другие 
термины. 
Таким образом, лингвистическая работа инженера по знаниям на 
данном слое проблем заключается в построении 
18



таких связанных фрагментов с помощью "сшивания" терминов. При 
тщательной работе аналитика и эксперта в понятийных структурах 
начинает проглядывать иерархия понятий, что в общем согласуется с 
результатами когнитивной психологии. 
Иерархия понятий - это глобальная схема, которая может быть в 
основе концептуального анализа структуры знаний любой предметной 
области. 
Следует подчеркнуть, что работа по составлению словаря и 
понятийной структуры требует лингвистического "чутья", легкости 
манипулирования терминами и богатого словарного запаса инженера 
по знаниям, так как зачастую аналитик вынужден самостоятельно 
разрабатывать словарь признаков Чем богаче и выразительнее общий 
код, тем полнее база знаний. 
Аналитик вынужден все время помнить о трудности передачи 
образов и представлений в вербальной форме. Часто инженеру по 
знаниям приходится подсказывать слова и выражения эксперту. 
Словарь пользователя.Лингвистические результаты, соотнесенные 
со слоями общего кода и понятийной структуры, направлены на 
создание адекватной базы знаний. Однако не следует забывать, что 
профессиональный уровень конечного пользователя может не 
позволить ему применить специальный язык предметной области в 
полном объеме. Для разработки пользовательского интерфейса 
необходима дополнительная доработка словаря общего кода с 
поправкой на доступность и "прозрачность" системы. 
18



В заключение перечислим характерные лингвистические неудачи, 
подстерегающие начинающего инженера по знаниям: 
разговор на разных языках (из-за слабой подготовки 
инженера по знаниям); 
несоотнесение с контекстом и неадекватная интерпретация 
терминов (из-за отсутствия обратной связи, т.е. слишком 
независимой работы инженера по знаниям); 
отсутствие отличий между общим кодом и языком 
пользователя (не учтены различия в уровне 
знаний эксперта и пользователя). 
Гносеологический аспект связан с теорией познания, или теорией 
отражения действительности в сознании человека. 
Инженерия знаний как наука, если можно так выразиться, дважды 
гносеологична - действительность сначала отражается в сознании 
эксперта, а затем деятельность и опыт эксперта интерпретируются 
сознанием инженера по знаниям, что служит уже основой для 
построения третьей интерпретации - поля знаний экспертной системы. 
Процесс познания в сущности направлен на создание внутреннего 
представления окружающего мира в сознании человека. 
В процессе извлечения знаний аналитика в основном интересует 
компонент знания, связанный с неканоническими индивидуальными 
знаниями экспертов, поскольку предметные области именно с таким 
типом знаний считаются наиболее восприимчивыми к внедрению 
экспертных систем. Эти области обычно называют эмпирическими, 
так как в них накоплен большой объем отдельных эмпирических 
фактов и наблюдений, в то время как их теоретическое обобщение - 
вопрос будущего. 
19



Познание всегда связано с созданием новых понятий и теории. 
Интересно, что часто эксперт как бы "на ходу" порождает новые 
знания, прямо в контексте беседы с аналитиком. Такая генерация 
знаний может быть полезна и самому эксперту, который до того 
момента мог не осознавать ряд соотношений и закономерностей 
предметной области. Аналитику, который является "повитухой" при 
рождении нового знания, может помочь тут и инструментарий 
системной методологии, позволяющий использовать известные 
принципы логики научных исследований, понятийной иерархии 
науки. Эта методология заставляет его за частным увидеть общее, т.е. 
строить гносеологические цепочки
ФАКТ=> 
ОБОБЩЕННЫЙ 
ФАКТ=> 
ЭМПИРИЧЕСКИЙ 
ЗАКОН=> ТЕОРЕТИЧЕСКИЙ ЗАКОН. 
Не всегда инженер по знаниям дойдет до последнего звена этой 
цепочки, но уже само стремление к движению бывает чрезвычайно 
плодотворным. Такой подход полностью согласуется со структурой 
самого знания, которое имеет два уровня: 
эмпирический (наблюдения, явления); 
теоретический (законы, абстракции, обобщения). 
Методологическая структура познания может быть представлена 
как последовательность этапов (рис.5.5), которые рассмотрим с 
позиций инженера по знаниям. 

Download 4.3 Mb.

Do'stlaringiz bilan baham:
1   ...   72   73   74   75   76   77   78   79   ...   121




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling