Лекция №5 Дисциплинарный непарадигмальный метод лингвистики Лингвостатистический метод и его методики


Download 28.24 Kb.
Sana15.06.2023
Hajmi28.24 Kb.
#1479682
TuriЛекция
Bog'liq
Лекция 5 (1)


Лекция № 5 Дисциплинарный непарадигмальный метод лингвистики


Лингвостатистический метод и его методики


Для любого современного лингвистического исследования актуальным остаётся философское и общенаучное положение об органическом единстве качественной и количественной определённости предметов и явлений: «познать - значит измерить» 


В науковедении также подчёркивается, что именно действие закона перехода количества в качество служит важнейшим условием выявления закономерности существования объектов и явлений, в том числе и языковых.
При этом в науковедении установлены два основных типа законов[530] [531]. Во-первых, детерминированные законы (lt;лат. determinare - «определять»), признающие строгую, обязательную причинно-следственную обусловленность явлений природы и реже - общества. Например, вода при нагревании до 100° Цельсия при сохранении обязательных условий (без посторонних примесей при давлении 670 мм ртутного столба) обязательно закипит, превратится в пар, а при охлаждении до 0 градусов по Цельсию - в твердое состояние (лёд).
Во-вторых, статистико-вероятностные законы управляют событиями, которые могут произойти, а могут и не произойти, поскольку каждое случайное событие определяется не внутренней структурой объектов, а спецификой воздействия на них очень многих случайных причин, действующих одновременно .
Действие статистических законов связано, главным образом, с жизнью живой природы (растения, животные) и человека. Так, они лежат в основе коммуникативного речепроизводства, на которое влияет целый ряд переменных величин, таких как психика и менталитет говорящего (пишущего), его коммуникативное намерение, фонд знаний о мире, характер собеседника, особенности ситуации общения и т. п. Отсюда законы функционирования и изменения языка и речи могут быть только вероятностно-статистическими.
Если науки естественного цикла сравнительно давно «заговорили» на языке математики, то гуманитарные науки обратились к нему значительно позже: только в 20-м веке, при этом первой из них была лингвистика .
Прежде всего, необходимо выяснить, насколько правомерен такой подход к языку.
В свое время Н. С. Трубецкой высказал мысль, что «язык лежит вне меры и числа». Это утверждение, по словам О. С. Ахмановой, до сих пор «не прокомментировано должным образом». Однако большинство лингвистов придерживается иной позиции. Так, И.А. Бодуэн де Куртенэ, подводя итоги развития лингвистики XIX века, подчеркивал: «Нужно чаще применять в языкознании количественное, математическое мышление и таким образом приблизить его всё более и более к наукам точным». При этом В. М. Алпатов, комментируя это высказывание, отмечает, что «прогноз бесспорно оправдался... Но всерьёз проблема математизации лингвистики встала лишь в 40-50-е годы ХХ века».
К нашим дням выявлено главное: «для языка несомненным является квантитативный фактор». Так, видный польский исследователь В. Манчак, обсуждая вопрос о кризисе современного языкознания, считает, что «основным приёмом реализации в языкознании критерия истинности должно быть статистическое обследование текстов», так как частотность является, по его мнению, «основным двигателем в развитии и функционировании языка», мощным инструментом для выявления сущности лингвистических явлений.
В лингвистике наших дней также утверждается значимость квантитативной характеристики языковых единиц: «При некоторых издержках она
всё-таки, вне сомнения, может способствовать повышению уровня филологической науки, если «чистые филологи» не убоятся бездны математической премудрости».
«Но как нам представляется, было бы всё же ошибкой утверждать, что применение математического аппарата (точнее статистических методов) в принципе неспособно привести к получению новой информации о лингвистических объектах (выделено мною - 3. К.) и обречено лишь конкретизировать и «оттенять» факты, найденные на других путях историко лингвистического познания».
Объективные основания для применения статистических методов языка были сформулированы Б. Н. Головиным: «нужно признать объективную присущность языку количественных признаков, количественных характеристик».
Поддерживая эти идеи Б. Н. Головина, Р. Г. Пиотровский подчёркивает, что первым фактором, стимулирующим использование математических методов, оказались потребности самого языкознания. Дело в том, что расширение и углубление лингвистических исследований в середине ХХ века настоятельно потребовало создания надежной и экспериментальной методики, которая давала бы возможность не только собирать и трактовать непосредственно наблюдаемые лингвистические факты, но также исследовать скрытые от прямого наблюдения лингвистические объекты и связи. Эти потребности могли быть удовлетворены с помощью методов математического моделирования, опирающегося на приёмы количественной и неколичественной математики.
Вторым фактором было «стремление математиков использовать речевой материал для приложения и экспликации новых идей» (например, теории алгоритмов, теории графов, теории конечных автоматов и др.), которое давало импульсы самой лингвистике.
Третьим фактором является контакт лингвистики с семиотическими и системными исследованиями, направленными на создание искусственного интеллекта, имитирующего речемыслительную деятельность человека (Д. А. Поспелов, Р. Г. Пиотровский, В. Н. Садовский, А. В. Гладких, Б. Д. Рабинович и др.).
В качестве четвёртого фактора выступают запросы информационно-вычислительной индустрии и потребности автоматизации. Особенно потребности оперативно перерабатывать научно-технические и деловые документы, написанные на русском и других языках, а также работа по созданию баз данных, баз знаний, национального машинного фонда русского языка, что обусловило создание алгоритмов автоматической переработки текстов.
Пятым фактором, связанным с четвёртым, является информатизация общества в целом, создание постэнергетической картины мира, когда «"атомами" мироздания стали вещество, энергия, знание и информация»1, на базе чего возник «союз информатики и языкознания».
Шестым фактором, ускоряющим развитие этой ветви лингвистики, является необходимость статистической оптимизации преподавания родного и неродного языков, для чего массово создаются лексические минимумы и частотные словари.
Таким образом, применение математических методов, определяемое социальными потребностями и логикой развития самого языкознания, «является неодолимым объективным фактом, не зависящим от воли отдельных учёных и научных школ», «входит в языкознание в своём новом качестве - в качестве неотъемлемой составной части точных методов исследования языка».
При этом продуктивным является вероятностный системно-квантитативный метод в языкознании, а отсюда и сама область - лингвостатистика - «раздел науки о языке, который посвящён получению, обработке и оценке численных характеристик, присущих языковым объектам и отношениям между объектами».
В настоящее время лингвостатистика находится на стадии трезвой оценки своих возможностей, которые определяются природой самого изучаемого объекта - языка. Поэтому центр внимания переместился с вычислительной стороны на содержательную, в частности - «на разработку моделей, воспроизводящих не структуру языка, а функционирование элементов языковой структуры
В результате этого на базе соссюровской дихотомии «язык-речь» и «синхронии-диахронии», с учётом антиномий «потенции» и «реализации» как коррелятов языка (орудия) и речи (реализации, применения), сформировалась методика системно-квантитативного анализа. В ней различаются четыре подсистемы: на языковом уровне - «языковая компетенция» и «языковая схема»; на речевом уровне - «речевой процесс» (акт) и «речевой продукт» (текст).
Это позволило сформулировать методологический постулат: «язык как совокупность одновременно существующих текстов (подчёркнуто мною - 3.К.), то есть текстов в их функционально-стилистической и тематической (подъязыковой) дифференциации. А любая речь, в том числе и научная, прежде всего - «суммарный итог случайных реализаций языка».
При этом современные данные по стилистике научной речи показывают «функционально-стилистическую неоднородность научного регистра речи», что обусловило обращение к предметно-тематической дифференциации русского языка, то есть к понятию подъязык, под которым мы вслед за Н.Д. Андреевым понимаем «набор языковых элементов и их отношений в текстах с однородной тематикой».
Именно этому учёному принадлежит заслуга обоснования актуальности статистического исследования подъязыков: «Как экстралингвистическое, так и внутрилингвистическое в типологии подъязыков, к сожалению, ещё очень плохо изучено (подчёркнуто мною - 3.К.) - и напрасно: роль специальных сфер употребления языка в наше время непрерывно растёт, их взаимодействие с общеязыковой системой речи усиливается, и этот аспект языкового развития должен стать предметом самого пристального внимания языковедов, предметом особых разделов науки о языке: подъязыковой типологии и отраслевой лингвистики».
Если за прошедшие десятилетия положение резко изменилось в исследовании отраслевой лингвистики, где наблюдаются значительные достижения, то в подъязыковой типологии существенных измене-
ний не произошло: «из-за отсутствия надёжных статистических исследований в данной области мы не можем сделать каких-либо исчерпывающих выводов». Следовательно, статистическое обследование подъязыков на сегодняшний день является актуальной проблемой.
А поскольку «подъязыки различных областей отличаются друг от друга, прежде всего, вероятностными спектрами своих лексических наборов», то, как показывает анализ изученной научной литературы, более всего подъязыки статистически обследованы в области лексики (терминологического репертуара) и значительно слабее в области грамматики, где основные результаты получены по корреляционному анализу частей речи, на базе этого - атрибуции текстов и выделению констант стилометрии.
Итак, на сегодняшний день применение математических методов в лингвистике регулируется двумя лингвистическими науками: математической лингвистикой и лингвостатистикой, которые иногда объединяются достаточно условным понятием квантитативная лингвистика.
Математическая лингвистика - пограничная дисциплина, возникшая на стыке математики и лингвистики, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков; для чего используется неколичественный математический аппарат: теория множеств, математическая логика, теория алгоритмов и др.
Лингвостатистика, лингвистическая статистика - лингвистическая дисциплина, разрабатывающая способы применения статистических методов, базирующихся на статистико-вероятностных закономерностях, в языкознании прежде всего используется для изучения процессов речи, а точнее - текстов.
Итак, лингвостатистический метод - это совокупность статистических (межпарадигмальных) методик, приёмов и процедур, используемых для получения количественных данных о языковых явлениях, с целью раскрытия статистических закономерностей функционирования единиц языка и речи, а также для установления статистических закономерностей построения текстов.
Задачи статистического анализа текста: Определить лексическое и грамматическое богатство данного текста или совокупности текстов. Установить особенности индивидуального стиля автора, его способов воздействия на читателя. Исследовать специфику отдельных функциональных стилей (подъязыков науки, прессы, художественной литературы). Определить основы сбора и классификации языковых данных, полученных в результате наблюдений или в результате поставленных экспериментов в зависимости от цели исследования. Составление частотных словарей.
Базовые концепты метода: Г енеральная совокупность - совокупность всех текстов данного автора или данного функционального стиля или отдельного подъязыка науки (лингвистика, экономика, архитектура и т. п.). Можно провести исследование всей данной совокупности, но это потребует больших временных и материальных затрат. В связи с этим из генеральной совокупности выбирают ограниченное число объектов, которые подвергаются изучению. Выборочная совокупность, или выборка - проба из генеральной совокупности определённого объема. Выборка должна быть репрезентативной (фр. representatif - «представительный, показательный»), т. е. она должна правильно представлять всю генеральную совокупность. С этой целью берется обычно несколько выборок, по которым надежно можно судить обо всей генеральной совокупности. Способы формирования выборок. Генеральная совокупность разбивается на части на основе случайного отбора. Обычно берутся от 5 до 20 выборок по 500 словоупотреблений. Под словоупотреблением понимается цепочка графических символов, букв между двумя пробелами.
Литература:
1. Бенвенист, Э. Общая лингвистика / Э. Бенвенист. М. : Высш. шк., 1974.
2. Кодухов, В. И. Введение в языкознание / В. И. Кодухов. – М. : Просвещение, 1971.
3. Маслов, Ю. С. Введение в языкознание / Ю. С. Маслов. – 2-е изд. – М. : Высш. шк., 1987
5. Реформатский, А. А. Введение в языковедение / Под ред. В. А. Виноградова. – М. : Аспект Пресс, 1996.
6. Солнцев, В. М. Понятие уровня языковой системы / В. М. Солнцев // Вопросы языкознания. 1972. № 3.
Download 28.24 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling