Preview

СибСкрипт

Расширенный поиск

Опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений)

https://doi.org/10.21603/sibscript-2025-27-1-97-109

EDN: aishpt

Аннотация

Глобализация и цифровизация способствуют тому, что текстовые данные в современном виртуальном пространстве все в большей степени отражают значимые события, происходящие на планете, в частности, протестные движения способны менять вектор политического и социокультурного развития стран и регионов. Цель – описать опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений) и проиллюстрировать алгоритм работы с ним. Единицей исследования является цифровая лексическая единица, под которой понимается гипертекстовый конструкт, обладающий денотатом, сигнификатом, лексемой, включающий набор других цифровых и обычных лексических единиц, а также различные медиафайлы (фото, изображения, аудио, видеоряд и др.), функционирующий в виртуальном пространстве. Анализ использования цифровых лексических единиц представлен на примере нескольких социально-политических кейсов. Выявлены три тематические группы цифровых лексических единиц протестных движений в виртуальной коммуникации: социальные протесты, политические протесты и протесты коренных народов стран. Обоснована значимость исследования протестных движений с точки зрения их коммуникативного воздействия на современный социум в различных странах мира. Разработанные технические параметры корпуса позволяют осуществлять поиск по нескольким параметрам: социальная сеть, имя пользователя, url-адрес пользователя, дата поста, текст, тип (аудио, ссылка, видео и др.), коннотация и расчет популярности. Экстралингвистический анализ цифровых лексических единиц позволяет определить место движения, зафиксированного в корпусе, в социальной и политической жизни населения различных стран. Описан алгоритм создания технической базы для формирования основы корпуса, установлены особенности применения данного лингвистического корпуса на различных операционных системах. 

Об авторах

Александр Владимирович Алексеев
Московский государственный институт международных отношений (университет) Министерства иностранных дел Российской Федерации
Россия

Scopus Author ID: 57214124708 

Москва

 



Александр Владимирович Беляев
Happitech
Нидерланды

Роттердам



Список литературы

1. Агурова А. А., Тихонова А. В. Хэштег как символ века цифровых технологий в политике. Возможности и угрозы цифрового общества, общ. ред. А. В. Соколов, А. А. Власова. Ярославль: Цифровая типография, 2019. С. 3–7. https://elibrary.ru/nfmzzc

2. Алексеев А. В. Семантические особенности употребления хештега #PrayforParis и его влияние на международную обстановку в диахронии. Политическая лингвистика. 2024. № 1. С. 21–28. https://elibrary.ru/ukoaij

3. Алексеев А. В., Ленец А. В. Коннотативно-прагматическое описание цифровой лексики в виртуальном пространстве: метод семантического дифференциала (на примере социально-политической кампании Black Lives Matter). Язык и культура. 2024. № 67. С. 8–31. https://elibrary.ru/cmfamo

4. Альбо Т. М. И. К. Социальные медиа как пространство политической коммуникации. Политическая лингвистика. 2021. № 5. С. 38–44. https://doi.org/10.26170/1999-2629_2021_05_04

5. Бакаев М. А., Борисов Н. В., Войскунский А. Е., Захаров В. П., Прокудин Д. Е., Толстикова И. И., Федосов А. Ю., Чугунов А. В. Новые горизонты изучения технологий информационного общества. Культура и технологии. 2018. Т. 3. № 3. С. 65–75. https://elibrary.ru/ymncyd

6. Баранов Н. А. Цифровое политическое участие как форма политической мобилизации. Каспийский регион: политика, экономика, культура. 2020. № 3. С. 66–72. https://doi.org/10.21672/1818-510X-2020-64-3-066-072

7. Басанин К. О. Исследовательский потенциал систем Big Data в лингвистике и методике преподавания иностранного языка. Иностранный язык. Методические вопросы подготовки конкурентоспособного выпускника: Межвуз. науч.-практ. конф. (Москва, 10 апреля 2020 г.) М.: Белый ветер, 2020. С. 29–35. https://elibrary.ru/blfvbs

8. Будаев Э. В., Кушнерук С. Л., Курочкина М. А. Коммуникативное сопровождение массовых протестов в СМИ. СПб.: Наукоемкие технологии, 2022. 201 с. https://elibrary.ru/ncfubi

9. Восканян А. С. Роль и место социальных медиа в американском протестном движении. Медиапространство многополярного мира: конф. (Москва, 13 апреля 2017 г.) М.: РУДН, 2017. С. 75–79. https://elibrary.ru/zgxndt

10. Гавра Д. П., Быкова Е. В. Медиатизированная мобилизация протеста в социальных сетях: алгоритмы построения речевых стратегий. Вестник Московского университета. Серия 10. Журналистика. 2021. № 2. C. 3–24. https://doi.org/10.30547/vestnik.journ.2.2021.324

11. Горожанов А. И. Экспериментальное моделирование базы данных сбалансированного лингвистического корпуса. Филологические науки. Вопросы теории и практики. 2022. Т. 15. № 10. С. 3382–3386. https://doi.org/10.30853/phil20220563

12. Грушевская Е. С., Тягловская И. С. Фреймовая структура концепта «протест». Филология в системе современного гуманитарного знания, ред. Н. Ю. Фанян. Краснодар: КубГУ, 2023. С. 45–58. https://elibrary.ru/ygteaj

13. Заботкина В. И., Голубкова Е. Е., Кронгауз М. А., Позднякова Е. М., Шаронов И. А., Боярская Е. Л., Заячковская О. О., Коннова М. Н., Котов А. А., Суворина Е. В. Методы когнитивного анализа семантики слова: компьютерно-корпусный подход. М.: ЯСК, 2015. 342 с. https://elibrary.ru/tmniur

14. Захаров В. П. Корпусная лингвистика. СПб: СПбГУ, 2005. 48 с. https://elibrary.ru/ratmyr

15. Захаров В. П. Лингвистика больших корпусов. Компьютерная лингвистика и вычислительные онтологии: XVIII объедин. конф. «Интернет и современное общество» (IMS-2015). (Санкт-Петербург, 23–25 июня 2015 г.) СПб.: Университет ИТМО, 2015. С. 82–93. https://elibrary.ru/ulmjxj

16. Калашникова А. Л., Поселенова Е. Ю. Функциональный аспект хэштеггинга в виртуальной коммуникации (на материале аккаунтов Кемеровского государственного университета и его структурных подразделений). Виртуальная коммуникация и социальные сети. 2023. Т. 2. № 3. С. 105–110. https://doi.org/10.21603/2782-4799-2023-2-3-105-110

17. Колмогорова А. В., Калинин А. А., Маликова А. В., Кушко Л. А. Методы компьютерной и корпусной лингвистики для решения задач эмоционального анализа интернет-текстов. М.: Ай Пи Ар Медиа, 2022. 215 с. https://elibrary.ru/anjigb

18. Копотев М. В. О некоторых следствиях корпусной лингвистики для общей теории языка. Филологический класс. 2021. Т. 26. № 2. С. 90–102. https://doi.org/10.51762/1FK-2021-26-02-07

19. Корецкая О. В. Семантическое поле понятия «массовый протест» в современном англоязычном медиапространстве. Глобалистика-2020: Глобальные проблемы и будущее человечества: Междунар. науч. конгресс. (Москва, 18 мая – 24 октября 2020 г.) М.: МООСИПНН Н. Д. Кондратьева, 2020. С. 624–627. https://doi.org/10.46865/978-5-901640-33-3-2020-624-627

20. Никитенко А. А. Интерактивность, мультимедийность, гипертекстуальность как детерминирующие типологические признаки сетевых изданий. Вестник Воронежского государственного университета. Серия: Филология. Журналистика. 2009. № 1. С. 159–166. https://elibrary.ru/kuhimh

21. Ребрина Л. Н. «Плакатная война» как актуальное явление протестной коммуникации в Германии. Научные исследования и разработки. Современная коммуникативистика. 2022. Т. 11. № 3. С. 73–82. https://doi.org/10.12737/2587-9103-2022-11-3-73-82

22. Ребрина Л. Н. Конфликтная мобилизация в сообществах социальных сетей как актуальная практика протестной коммуникации: коллективно-личностное измерение. Научный диалог. 2021. № 5. С. 115–139. https://doi.org/10.24224/2227-1295-2021-5-115-139

23. Шамне Н. Л., Ребрина Л. Н., Милованова М. В. Протестная коммуникация в современном информационном пространстве России и Германии: к методологии исследования. Язык vs. социум: XXI век, гл. ред. Н. В. Юдина. Владимир: Владимирский филиал РАНХиГС, 2020. С. 69–83. https://elibrary.ru/tpqujw

24. Alekseev A. V. On the destructive nature of virtual communicative interaction and protest movements. Modern issues of sustainable development of society in the era of transformational processes: Proc. XII Sci.-Prac. Intern. Conf., Moscow, 16 Oct 2023. Moscow: Alef, 2023, 118–122. https://doi.org/10.34755/IROK.2023.62.74.111

25. Dugo H. The powers and limits of new media appropriation in authoritarian contexts: A comparative case study of Oromo protests in Ethiopia. Journal of Pan African Studies, 2017, 10(10): 48–69.

26. Huffling K. "Our house is on fire. Join us in the streets". Public Health Nursing, 2020, 37(1): 1–2. https://doi.org/10.1111/phn.12704

27. Kulikov L., Totskiy D., Malyonova A., Potapova Y. Gender and age features of lexico-semantic fields of discontent in different types of media texts. INTERAGROMASH 2022: Proc. XV Intern. Sci. Conf., Rostov-on-Don, 25–27 May 2022. Springer, 2023, 1031–1038. https://doi.org/10.1007/978-3-031-21432-5_109

28. Liu J., Singhal T., Blessing L. T. M., Wood K. L., Lim K. H. EPIC30M: An epidemics corpus of over 30 million relevant tweets. 2020 IEEE Intern. Conf. on Big Data, Atlanta, GA, USA, 10–13 Dec 2020, 1206–1215. https://doi.org/10.1109/BigData50022.2020.9377739

29. Osgood C. E., Ware E.E., Morris C. Analysis of the connotative meanings of a variety of human values as expressed by American college students. The Journal of Abnormal and Social Psychology, 1961, 62(1): 62–73. https://psycnet.apa.org/doi/10.1037/h0040142


Рецензия

Для цитирования:


Алексеев А.В., Беляев А.В. Опыт создания лингвистического корпуса цифровых лексических единиц (на примере социально-политических протестных движений). СибСкрипт. 2025;27(1):97-109. https://doi.org/10.21603/sibscript-2025-27-1-97-109. EDN: aishpt

For citation:


Alekseev A.V., Belyaev A.V. Linguistic Corpus of Digital Lexical Units Related to Socio-Political Protest Movements. SibScript. 2025;27(1):97-109. (In Russ.) https://doi.org/10.21603/sibscript-2025-27-1-97-109. EDN: aishpt

Просмотров: 107


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2949-2122 (Print)
ISSN 2949-2092 (Online)