Методические указания к лабораторным занятиям Интеллектуальные системы обработки информации и машинное обучение Ставрополь, 2017
Download 4.3 Mb. Pdf ko'rish
|
78Metod IntelectSysObrInf 10.05.03 12.02.2017
Лингвистический аспект. Лингвистический (А2) аспект касается
исследований языковых проблем, так как язык — это основное средство общения в процессе извлечения знаний. Сразу же следует оговорить, что поскольку тема данной книги ограничена изложением теории и технологии инженерии знаний, то область разработки естественно-языковых интерфейсов и весь спектр проблем, связанных с ней — лексических, синтаксических, семантических, прагматических и т. д. — не рассматривается. В инженерии знаний можно выделить три слоя лингвистических проблем (рис.5.4): А2 = {S21, $22, S23} = {«общий код», понятийная структура, словарь пользователя}. Рис. 5.4. Лингвистический аспект извлечения знаний. 18 6 Проблема «Общего кода». Большинство психологов и лингвистов считают, что язык - это основное средство мышления наряду с другими знаковыми системами "внутреннего пользования". Языки, на которых говорят и размышляют аналитик и эксперт, могут существенно отличаться. Различие языков и обусловливает «языковый барьер» или «языковые ножницы» в общении инженера по знаниям и эксперта. Язык инженера по знаниям (аналитика)состоит из трех компонентов: общенаучной терминологии из его «теоретического багажа»; терминов предметной области, которые он почерпнул из специальной литературы в период подготовки; бытового разговорного языка, которым пользуется аналитик. Язык эксперта включает: общенаучную терминологию; специальную терминологию, принятую в предметной области; бытовой язык; неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон. Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают, то некоторый общий язык, или код, который необходимо выработать партнерам для успешного взаимодействия, будет включать еще специальные терминологии инженера по знаниям и эксперта. В дальнейшем этот общий код преобразуется в 18 7 некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области. Выработка общего кода начинается с выписывания аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следуют группировка терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, т.е. по понятийной близости (это уже первый шаг структурирования знаний). Важной является проблема неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает "знак" и "означаемый предмет". Только в интерпретации знак получает смысл. Так, например, термин "прибор X" для эксперта означают некоторую конкретную схему, которая соответствует схеме оригинала прибора, а в голове начинающего аналитика слова "прибор X" вызывают пустой образ или некоторый "черный ящик" с ручками. Понятийная структура.Большинство специалистов по искусственному интеллекту и когнитивной психологии считают, что основная особенность естественного интеллекта и памяти в частности - это связанность всех понятий в некоторую сеть. Поэтому для разработки базы знаний нужен не словарь, а энциклопедия, в которой все термины объяснены в словарных статьях со ссылками на другие термины. Таким образом, лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении 18 8 таких связанных фрагментов с помощью "сшивания" терминов. При тщательной работе аналитика и эксперта в понятийных структурах начинает проглядывать иерархия понятий, что в общем согласуется с результатами когнитивной психологии. Иерархия понятий - это глобальная схема, которая может быть в основе концептуального анализа структуры знаний любой предметной области. Следует подчеркнуть, что работа по составлению словаря и понятийной структуры требует лингвистического "чутья", легкости манипулирования терминами и богатого словарного запаса инженера по знаниям, так как зачастую аналитик вынужден самостоятельно разрабатывать словарь признаков Чем богаче и выразительнее общий код, тем полнее база знаний. Аналитик вынужден все время помнить о трудности передачи образов и представлений в вербальной форме. Часто инженеру по знаниям приходится подсказывать слова и выражения эксперту. Словарь пользователя.Лингвистические результаты, соотнесенные со слоями общего кода и понятийной структуры, направлены на создание адекватной базы знаний. Однако не следует забывать, что профессиональный уровень конечного пользователя может не позволить ему применить специальный язык предметной области в полном объеме. Для разработки пользовательского интерфейса необходима дополнительная доработка словаря общего кода с поправкой на доступность и "прозрачность" системы. 18 9 В заключение перечислим характерные лингвистические неудачи, подстерегающие начинающего инженера по знаниям: разговор на разных языках (из-за слабой подготовки инженера по знаниям); несоотнесение с контекстом и неадекватная интерпретация терминов (из-за отсутствия обратной связи, т.е. слишком независимой работы инженера по знаниям); отсутствие отличий между общим кодом и языком пользователя (не учтены различия в уровне знаний эксперта и пользователя). Гносеологический аспект связан с теорией познания, или теорией отражения действительности в сознании человека. Инженерия знаний как наука, если можно так выразиться, дважды гносеологична - действительность сначала отражается в сознании эксперта, а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям, что служит уже основой для построения третьей интерпретации - поля знаний экспертной системы. Процесс познания в сущности направлен на создание внутреннего представления окружающего мира в сознании человека. В процессе извлечения знаний аналитика в основном интересует компонент знания, связанный с неканоническими индивидуальными знаниями экспертов, поскольку предметные области именно с таким типом знаний считаются наиболее восприимчивыми к внедрению экспертных систем. Эти области обычно называют эмпирическими, так как в них накоплен большой объем отдельных эмпирических фактов и наблюдений, в то время как их теоретическое обобщение - вопрос будущего. 19 0 Познание всегда связано с созданием новых понятий и теории. Интересно, что часто эксперт как бы "на ходу" порождает новые знания, прямо в контексте беседы с аналитиком. Такая генерация знаний может быть полезна и самому эксперту, который до того момента мог не осознавать ряд соотношений и закономерностей предметной области. Аналитику, который является "повитухой" при рождении нового знания, может помочь тут и инструментарий системной методологии, позволяющий использовать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным увидеть общее, т.е. строить гносеологические цепочки: ФАКТ=> ОБОБЩЕННЫЙ ФАКТ=> ЭМПИРИЧЕСКИЙ ЗАКОН=> ТЕОРЕТИЧЕСКИЙ ЗАКОН. Не всегда инженер по знаниям дойдет до последнего звена этой цепочки, но уже само стремление к движению бывает чрезвычайно плодотворным. Такой подход полностью согласуется со структурой самого знания, которое имеет два уровня: эмпирический (наблюдения, явления); теоретический (законы, абстракции, обобщения). Методологическая структура познания может быть представлена как последовательность этапов (рис.5.5), которые рассмотрим с позиций инженера по знаниям. Download 4.3 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling