Котельников Е. В.
УДК 004.912 doi: 10.25730/VSU.0536.18.26
Извлечение аргументации из текстов и проблема отсутствия русскоязычных текстовых корпусов*
Е. В. Котельников
Вятский государственный университет. Россия, г. Киров. E‑mail: ev_kotelnikov@vyatsu.ru
Аннотация. В статье рассматривается одно из перспективных направлений в современной компьютерной лингвистике – извлечение аргументации из текстов (ArgumentationMining). Перечисляются задачи, решаемые в системах извлечения аргументации, указываются области применения таких систем. Приводятся схема представления аргументации на основе теории Фримена и пример разметки текста с использованием данной схемы. Рассматриваются существующие текстовые корпуса, снабженные разметкой в соответствии с некоторой схемой аргументации. Отсутствие подобных русскоязычных корпусов является существенным препятствием для развития области ArgumentationMining в России. Два способа получения таких корпусов – на основе разметки новых текстов и с помощью профессионального перевода существующих корпусов на русский язык – оказываются весьма трудоемкими. Предлагается для формирования корпусов использовать машинный перевод и обозначается план дальнейшего исследования этой проблемы.
Ключевые слова: аргументация, извлечение аргументации из текстов, текстовые корпуса, машинный перевод.
* Работа выполнена при поддержке DeutscherAkademischerAustauschdienst (DAAD) и Министерства образования и науки Российской Федерации в рамках государственного задания Минобрнауки РФ № 2.12728.2018/12.2 по теме «Проведение научно‑исследовательских работ в рамках международного научно‑образовательного сотрудничества по программе "Михаил Ломоносов" по теме: "Разработка и исследование аннотированного русскоязычного текстового корпуса для анализа аргументации"».