Вопросы инноВационной экономики


Download 0.59 Mb.
Pdf ko'rish
bet4/8
Sana24.03.2023
Hajmi0.59 Mb.
#1291780
1   2   3   4   5   6   7   8
Bog'liq
Киреева Н.С., Киреев С.А. (2021) Исследовательские интересы российских ученых в области ... - 1ECONOMIC.RU

ЦИТИрОВАТЬ СТАТЬЮ:
Киреева Н.С., Киреев С.А. Исследовательские интересы российских ученых в области инноваций: кон-
тент-анализ публикаций // Вопросы инновационной экономики. – 2021. – Том 11. – № 1. – С. 87-100. 
doi: 
10.18334/vinec.11.1.111516 
2011), И.О. Малыхина [10] (Malyhina, 2019), Б.Д. Матризаев [11] (Matrizaev, 2019)
О.Н. Мельников, Д.А. Есипенко [12] (Melnikov, Esipenko, 2019), С.М. Молчанова, 
К.В. Лосев [13] (Molchanova, Losev, 2019) и другие.
Зарубежные ученые также уделяют значительное внимание исследованию инно-
ваций. Так, цели, структура и предметное поле исследования инноваций были опре-
делены в работах Фагерберга и Фершпагена [19] (Fagerberg, Verspagen, 2009), которые 
опирались на накопленные в литературе данные и на результаты собственных опросов 
более 1000 специалистов со всего мира.
При этом масштабных исследований, позволяющих определить проблемное и 
предметное поле исследования инноваций, недостаточно.
Цель данной работы – выявить связанные с инновациями области народного 
хозяйства и проблемы, представляющие наибольший интерес научного сообщества. 
Задача исследования – выявление аспектов, которым посвящено наибольшее число 
работ исследователей в области инноваций по тематике «Экономика» с помощью про-
ведения автоматизированного контент-анализа.
В настоящей работе мы будем рассматривать следующий исследовательский 
вопрос: каким проблемам, связанным с инновациями, российские авторы посвящали 
свои работы в 2019 г.
методы исследования
Для исследования публикационной активности используются различные методы. 
В частности, анализ цитирования, анализ совместного цитирования, анализ сопут-
ствующих слов и т.д. [23, 25] (Randhawa, Wilden, Hohberger, 2016; Zupic, Čater, 2015)
Перечисленные методы используются и для анализа публикаций, посвященных инно-
вациям [20, 22, 24] (Fang, Li, 2021; Klarin, 2019; Rossetto, Bernardes, Borini, Gattaz, 2018)
Одним из наиболее распространенных методов выступает контент-анализ, 
развитие которого претерпело несколько фаз, что связано в т.ч. с распространением 
компьютерных технологий [8] (Osin, 2008). Данный метод также используется для ана-
лиза публикаций, посвященных инновациям, в частности для определения перспектив 
инновационного развития России [14] (Mishchenko, 2014).
Контент-анализ – это содержательный анализ массивов однородных документов, 
имеющий своим предметом анализ содержания текстовых массивов и продуктов ком-


Russian JouRnal of innovation Economics
#1’2021 (January-March)
90
муникативной корреспонденции. В отечественной исследовательской традиции кон-
тент-анализ определяется как количественный анализ текстов и текстовых массивов 
с целью последующей содержательной интерпретации выявленных числовых законо-
мерностей [15] (Pashinyan, 2012).
Распространение данного метода связано с развитием интернета, а также с новыми 
возможностями обработки больших массивов оцифрованных данных [3] (Bykov, 
Khaustovich, Sys, 2019).
Для анализа была использована выборка, сформированная на базе крупнейшей в 
России научной электронной библиотеки eLIBRARY.RU, из опубликованных в 2019 
г. публикаций, содержащих слово «инновация» с учетом морфологии по тематике 
«Экономика. Экономические науки». Размер выборки до удаления дубликатов соста-
вил 2451 публикацию. Единицей анализа стали слова и n-граммы – последовательно-
сти из n слов. 
Для программной реализации контент-анализа был выбран язык Python и библио-
тека для работы с естественными языками Natural Language Toolkit (NLTK).
Основной способ применения NLTK – это включение в набор параметров распро-
страненных словосочетаний из двух-трех слов. В NLTK имеется поддержка этих воз-
можностей в виде функций nltk.bigrams(...) и nltk.trigrams(...). NLTK имеет возможно-
сти:
1) токенизации текста,
2) выбора из всего набора данных N самых часто встречающихся слов,
3) идентификации самых часто встречающихся двух- и трехсловных словосочета-
ний.
Токенизация – это разделение текстового материала на небольшие части, токены. К 
токенам относятся слова, предлоги и знаки пунктуации. Достаточно часто стоит задача 
представить текст в виде массива значимых слов. Тогда после токенизации необхо-
димо произвести чистку на предмет знаков пунктуации и незначимых слов (например, 
предлогов). Это делается с помощью передачи библиотеке списка стоп-слов, которые 
автоматически исключаются из рассмотрения [7] (Ismukanova, Lavrov, 2017)
Из выборки были удалены дубликаты названий публикаций. Затем была произве-
дена токенизация названий и удаление знаков пунктуации и незначимых слов (пред-
логов и т.д.), а словоформы были приведены к словарной форме. В результате число 
значимых слов во всех заголовках составило 16655 штук. 
Из набора данных были выделены наиболее часто встречающиеся слова, а также 
биграммы и триграммы (последовательности из двух и трех слов).
результаты и обсуждение
В 2019 г., согласно данным научной электронной библиотеки eLIBRARY.RU, было 
опубликовано 2451 публикаций, содержащих в заголовке слово «инновация», или 0,7% 
из всех опубликованных по тематике «Экономика. Экономические науки» (329 740 


91
Вопросы инноВационной экономики
№ 1’2021 (Январь–март)
штук). Таким образом, интерес к данной теме среди российских исследователей доста-
точно высок.
Статистический анализ названий статей показал следующее: при общем количестве 
значимых слов в заголовках публикаций (16655) слово «развитие» в различных вариа-
циях упоминается 405 раз, «управление» – 248 раз, «экономика» – 236 раз, «современ-
Таблица 1
количество употреблений значимых слов
единицы анализа
единицы счета
Частота упоминания абсолютная, 
раз
Частота упоминания относитель-
ная,%
Инновация
2394
14,4
Развитие
405
2,4
Управление
248
1,5
Экономика
236
1,4
Современный
197
1,2
Внедрение
181
1,1
Предприятие
176
1,1
Сфера
160
1,0
Система
157
0,9
Россия
148
0,9
Проблема
138
0,8
Российский
127
0,8
Образование
126
0,8
Роль
124
0,7
Экономический
122
0,7
Условие
121
0,7
Технологический
113
0,7
Фактор
113
0,7
Технология
112
0,7
Эффективность
108
0,6
Деятельность
102
0,6
Цифровой
102
0,6
Основа
101
0,6
Влияние
100
0,6
Организация
98
0,6
Финансовый
97
0,6
Наука
93
0,6
Повышение
91
0,5
Источник: составлено автором.


Russian JouRnal of innovation Economics
#1’2021 (January-March)
92
ный» – 197 раз, «внедрение» – 191 раз. При этом на первом месте по частоте упомина-
ния находится слово «инновация», что обусловлено способом составления выборки. 
Предметная область исследования определяется категориями «сфера» (1,0% от 
всего количества значимых слов) и «система» (0,9%). Примерами подобных заголов-
ков являются: «Инновации как фактор стабильности экономической системы реги-
она», «Оптимизация складского хозяйства в логистической системе путем внедре-
ния логистических инноваций», «Инновации в финансовой сфере: переход банков к 
микросервисной архитектуре».
Заметную долю также занимают категории «проблема» (0,8%) и «роль» (0,7%).
Таким образом, внимание исследователей главным образом сосредоточено на 
управлении и внедрении инноваций, а также на их роли и проблемах.
В таблице 1 представлены результаты статистического анализа количества употре-
блений значимых слов.
График распределения частоты слов представлен на рисунке 1. Для наглядности 
было удалено наиболее часто встречающееся слово «инновация». График иллюстри-
рует закон Ципфа: если все слова достаточно длинного текста упорядочить по убыва-
нию частоты их использования, то частота n-го слова в таком списке окажется обратно 
пропорциональной его порядковому номеру n.
Облако слов представлено на рисунке 2.
В таблице 2 представлены результаты статистического анализа количества употре-
блений биграмм. В лингвистике данным термином принято обозначать пары симво-
лов, букв, слов [18] (Collins, 1996). Биграмма-коллокация – это неслучайное сочетание 
длинного текста упорядочить по убыванию частоты их использования, 
то частота n-го слова в таком списке окажется обратно пропорциональной 
его порядковому номеру n. 

Download 0.59 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling