Опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений)
https://doi.org/10.21603/sibscript-2025-27-1-97-109
EDN: aishpt
Аннотация
Глобализация и цифровизация способствуют тому, что текстовые данные в современном виртуальном пространстве все в большей степени отражают значимые события, происходящие на планете, в частности, протестные движения способны менять вектор политического и социокультурного развития стран и регионов. Цель – описать опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений) и проиллюстрировать алгоритм работы с ним. Единицей исследования является цифровая лексическая единица, под которой понимается гипертекстовый конструкт, обладающий денотатом, сигнификатом, лексемой, включающий набор других цифровых и обычных лексических единиц, а также различные медиафайлы (фото, изображения, аудио, видеоряд и др.), функционирующий в виртуальном пространстве. Анализ использования цифровых лексических единиц представлен на примере нескольких социально-политических кейсов. Выявлены три тематические группы цифровых лексических единиц протестных движений в виртуальной коммуникации: социальные протесты, политические протесты и протесты коренных народов стран. Обоснована значимость исследования протестных движений с точки зрения их коммуникативного воздействия на современный социум в различных странах мира. Разработанные технические параметры корпуса позволяют осуществлять поиск по нескольким параметрам: социальная сеть, имя пользователя, url-адрес пользователя, дата поста, текст, тип (аудио, ссылка, видео и др.), коннотация и расчет популярности. Экстралингвистический анализ цифровых лексических единиц позволяет определить место движения, зафиксированного в корпусе, в социальной и политической жизни населения различных стран. Описан алгоритм создания технической базы для формирования основы корпуса, установлены особенности применения данного лингвистического корпуса на различных операционных системах.
Об авторах
Александр Владимирович АлексеевРоссия
Scopus Author ID: 57214124708
Москва
Александр Владимирович Беляев
Нидерланды
Роттердам
Список литературы
1. Агурова А. А., Тихонова А. В. Хэштег как символ века цифровых технологий в политике. Возможности и угрозы цифрового общества, общ. ред. А. В. Соколов, А. А. Власова. Ярославль: Цифровая типография, 2019. С. 3–7. https://elibrary.ru/nfmzzc
2. Алексеев А. В. Семантические особенности употребления хештега #PrayforParis и его влияние на международную обстановку в диахронии. Политическая лингвистика. 2024. № 1. С. 21–28. https://elibrary.ru/ukoaij
3. Алексеев А. В., Ленец А. В. Коннотативно-прагматическое описание цифровой лексики в виртуальном пространстве: метод семантического дифференциала (на примере социально-политической кампании Black Lives Matter). Язык и культура. 2024. № 67. С. 8–31. https://elibrary.ru/cmfamo
4. Альбо Т. М. И. К. Социальные медиа как пространство политической коммуникации. Политическая лингвистика. 2021. № 5. С. 38–44. https://doi.org/10.26170/1999-2629_2021_05_04
5. Бакаев М. А., Борисов Н. В., Войскунский А. Е., Захаров В. П., Прокудин Д. Е., Толстикова И. И., Федосов А. Ю., Чугунов А. В. Новые горизонты изучения технологий информационного общества. Культура и технологии. 2018. Т. 3. № 3. С. 65–75. https://elibrary.ru/ymncyd
6. Баранов Н. А. Цифровое политическое участие как форма политической мобилизации. Каспийский регион: политика, экономика, культура. 2020. № 3. С. 66–72. https://doi.org/10.21672/1818-510X-2020-64-3-066-072
7. Басанин К. О. Исследовательский потенциал систем Big Data в лингвистике и методике преподавания иностранного языка. Иностранный язык. Методические вопросы подготовки конкурентоспособного выпускника: Межвуз. науч.-практ. конф. (Москва, 10 апреля 2020 г.) М.: Белый ветер, 2020. С. 29–35. https://elibrary.ru/blfvbs
8. Будаев Э. В., Кушнерук С. Л., Курочкина М. А. Коммуникативное сопровождение массовых протестов в СМИ. СПб.: Наукоемкие технологии, 2022. 201 с. https://elibrary.ru/ncfubi
9. Восканян А. С. Роль и место социальных медиа в американском протестном движении. Медиапространство многополярного мира: конф. (Москва, 13 апреля 2017 г.) М.: РУДН, 2017. С. 75–79. https://elibrary.ru/zgxndt
10. Гавра Д. П., Быкова Е. В. Медиатизированная мобилизация протеста в социальных сетях: алгоритмы построения речевых стратегий. Вестник Московского университета. Серия 10. Журналистика. 2021. № 2. C. 3–24. https://doi.org/10.30547/vestnik.journ.2.2021.324
11. Горожанов А. И. Экспериментальное моделирование базы данных сбалансированного лингвистического корпуса. Филологические науки. Вопросы теории и практики. 2022. Т. 15. № 10. С. 3382–3386. https://doi.org/10.30853/phil20220563
12. Грушевская Е. С., Тягловская И. С. Фреймовая структура концепта «протест». Филология в системе современного гуманитарного знания, ред. Н. Ю. Фанян. Краснодар: КубГУ, 2023. С. 45–58. https://elibrary.ru/ygteaj
13. Заботкина В. И., Голубкова Е. Е., Кронгауз М. А., Позднякова Е. М., Шаронов И. А., Боярская Е. Л., Заячковская О. О., Коннова М. Н., Котов А. А., Суворина Е. В. Методы когнитивного анализа семантики слова: компьютерно-корпусный подход. М.: ЯСК, 2015. 342 с. https://elibrary.ru/tmniur
14. Захаров В. П. Корпусная лингвистика. СПб: СПбГУ, 2005. 48 с. https://elibrary.ru/ratmyr
15. Захаров В. П. Лингвистика больших корпусов. Компьютерная лингвистика и вычислительные онтологии: XVIII объедин. конф. «Интернет и современное общество» (IMS-2015). (Санкт-Петербург, 23–25 июня 2015 г.) СПб.: Университет ИТМО, 2015. С. 82–93. https://elibrary.ru/ulmjxj
16. Калашникова А. Л., Поселенова Е. Ю. Функциональный аспект хэштеггинга в виртуальной коммуникации (на материале аккаунтов Кемеровского государственного университета и его структурных подразделений). Виртуальная коммуникация и социальные сети. 2023. Т. 2. № 3. С. 105–110. https://doi.org/10.21603/2782-4799-2023-2-3-105-110
17. Колмогорова А. В., Калинин А. А., Маликова А. В., Кушко Л. А. Методы компьютерной и корпусной лингвистики для решения задач эмоционального анализа интернет-текстов. М.: Ай Пи Ар Медиа, 2022. 215 с. https://elibrary.ru/anjigb
18. Копотев М. В. О некоторых следствиях корпусной лингвистики для общей теории языка. Филологический класс. 2021. Т. 26. № 2. С. 90–102. https://doi.org/10.51762/1FK-2021-26-02-07
19. Корецкая О. В. Семантическое поле понятия «массовый протест» в современном англоязычном медиапространстве. Глобалистика-2020: Глобальные проблемы и будущее человечества: Междунар. науч. конгресс. (Москва, 18 мая – 24 октября 2020 г.) М.: МООСИПНН Н. Д. Кондратьева, 2020. С. 624–627. https://doi.org/10.46865/978-5-901640-33-3-2020-624-627
20. Никитенко А. А. Интерактивность, мультимедийность, гипертекстуальность как детерминирующие типологические признаки сетевых изданий. Вестник Воронежского государственного университета. Серия: Филология. Журналистика. 2009. № 1. С. 159–166. https://elibrary.ru/kuhimh
21. Ребрина Л. Н. «Плакатная война» как актуальное явление протестной коммуникации в Германии. Научные исследования и разработки. Современная коммуникативистика. 2022. Т. 11. № 3. С. 73–82. https://doi.org/10.12737/2587-9103-2022-11-3-73-82
22. Ребрина Л. Н. Конфликтная мобилизация в сообществах социальных сетей как актуальная практика протестной коммуникации: коллективно-личностное измерение. Научный диалог. 2021. № 5. С. 115–139. https://doi.org/10.24224/2227-1295-2021-5-115-139
23. Шамне Н. Л., Ребрина Л. Н., Милованова М. В. Протестная коммуникация в современном информационном пространстве России и Германии: к методологии исследования. Язык vs. социум: XXI век, гл. ред. Н. В. Юдина. Владимир: Владимирский филиал РАНХиГС, 2020. С. 69–83. https://elibrary.ru/tpqujw
24. Alekseev A. V. On the destructive nature of virtual communicative interaction and protest movements. Modern issues of sustainable development of society in the era of transformational processes: Proc. XII Sci.-Prac. Intern. Conf., Moscow, 16 Oct 2023. Moscow: Alef, 2023, 118–122. https://doi.org/10.34755/IROK.2023.62.74.111
25. Dugo H. The powers and limits of new media appropriation in authoritarian contexts: A comparative case study of Oromo protests in Ethiopia. Journal of Pan African Studies, 2017, 10(10): 48–69.
26. Huffling K. "Our house is on fire. Join us in the streets". Public Health Nursing, 2020, 37(1): 1–2. https://doi.org/10.1111/phn.12704
27. Kulikov L., Totskiy D., Malyonova A., Potapova Y. Gender and age features of lexico-semantic fields of discontent in different types of media texts. INTERAGROMASH 2022: Proc. XV Intern. Sci. Conf., Rostov-on-Don, 25–27 May 2022. Springer, 2023, 1031–1038. https://doi.org/10.1007/978-3-031-21432-5_109
28. Liu J., Singhal T., Blessing L. T. M., Wood K. L., Lim K. H. EPIC30M: An epidemics corpus of over 30 million relevant tweets. 2020 IEEE Intern. Conf. on Big Data, Atlanta, GA, USA, 10–13 Dec 2020, 1206–1215. https://doi.org/10.1109/BigData50022.2020.9377739
29. Osgood C. E., Ware E.E., Morris C. Analysis of the connotative meanings of a variety of human values as expressed by American college students. The Journal of Abnormal and Social Psychology, 1961, 62(1): 62–73. https://psycnet.apa.org/doi/10.1037/h0040142
Рецензия
Для цитирования:
Алексеев А.В., Беляев А.В. Опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений). СибСкрипт. 2025;27(1):97-109. https://doi.org/10.21603/sibscript-2025-27-1-97-109. EDN: aishpt
For citation:
Alekseev A.V., Belyaev A.V. Linguistic Corpus of Digital Lexical Units Related to Socio-Political Protest Movements. SibScript. 2025;27(1):97-109. (In Russ.) https://doi.org/10.21603/sibscript-2025-27-1-97-109. EDN: aishpt