Телефон редакции:

+7 (8332) 208-964

Свежие номера журналов

Котельников Е. В.

УДК 004.912                                                                                                                       doi: 10.25730/VSU.0536.18.26

 

Извлечение аргументации из текстов и проблема отсутствия русскоязычных текстовых корпусов*

 

Е. В. Котельников

кандидат технических наук, доцент кафедры прикладной математики и информатики,

Вятский государственный университет. Россия, г. Киров. E‑mail: ev_kotelnikov@vyatsu.ru

Аннотация. В статье рассматривается одно из перспективных направлений в современной компьютерной лингвистике – извлечение аргументации из текстов (ArgumentationMining). Перечисляются задачи, решаемые в системах извлечения аргументации, указываются области применения таких систем. Приводятся схема представления аргументации на основе теории Фримена и пример разметки текста с использованием данной схемы. Рассматриваются существующие текстовые корпуса, снабженные разметкой в соответствии с некоторой схемой аргументации. Отсутствие подобных русскоязычных корпусов является существенным препятствием для развития области ArgumentationMining в России. Два способа получения таких корпусов – на основе разметки новых текстов и с помощью профессионального перевода существующих корпусов на русский язык – оказываются весьма трудоемкими. Предлагается для формирования корпусов использовать машинный перевод и обозначается план дальнейшего исследования этой проблемы.

Ключевые слова: аргументация, извлечение аргументации из текстов, текстовые корпуса, машинный перевод.



* Работа выполнена при поддержке DeutscherAkademischerAustauschdienst (DAAD) и Министерства образования и науки Российской Федерации в рамках государственного задания Минобрнауки РФ № 2.12728.2018/12.2 по теме «Проведение научно‑исследовательских работ в рамках международного научно‑образовательного сотрудничества по программе "Михаил Ломоносов" по теме: "Разработка и исследование аннотированного русскоязычного текстового корпуса для анализа аргументации"».