МЕТОДЫ АВТОМАТИЧЕСКОГО ФОРМИРОВАНИЯ СЕМАНТИЧЕСКИ РАЗМЕЧЕННЫХ КОРПУСОВ

БОЛЬШИНА, А.С.

Автор: БОЛЬШИНА АНГЕЛИНА СЕРГЕЕВНА
Журнал: Вестник Московского университета. Серия 9: Филология
Номер: 2
Год издания: 2022
Издательство: Изд-во Моск. ун-та
Местоположение издательства: М.
Первая страница: 173
Последняя страница: 183
Аннотация: В последние годы с появлением предобученных языковых моделей и различных нейросетевых архитектур качество алгоритмов автоматического разрешения лексической неоднозначности значительно улучшилось. Подавляющее большинство передовых моделей созданы методом машинного обучения с учителем, для которого требуются значительные объемы размеченных текстовых данных. Получение семантически аннотированных данных дорогостоящий процесс, требующий немало времени и трудозатрат. В связи с этим достижения в области автоматического разрешения неоднозначности не могут быть применены для решения этой задачи в языках с недостаточным количеством размеченных лингвистических ресурсов, к которым относится и русский язык. Для решения данной проблемы разрабатываются различные методы для автоматического создания обучающих коллекций. В статье предлагается обзор подходов, сгруппированных по основополагающему принципу их работы и источнику знаний, который в них используется.
Добавил в систему: Большина Ангелина Сергеевна

	ИСТИНА	Войти в систему Регистрация
	ИСТИНА ИНХС РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИСТИНА ИНХС РАН

МЕТОДЫ АВТОМАТИЧЕСКОГО ФОРМИРОВАНИЯ СЕМАНТИЧЕСКИ РАЗМЕЧЕННЫХ КОРПУСОВстатья