Аннотация:В последние годы с появлением предобученных языковых моделей и различных нейросетевых архитектур качество алгоритмов автоматического разрешения лексической неоднозначности значительно улучшилось. Подавляющее большинство передовых моделей созданы методом машинного обучения с учителем, для которого требуются значительные объемы размеченных текстовых данных. Получение семантически аннотированных данных дорогостоящий процесс, требующий немало времени и трудозатрат. В связи с этим достижения в области автоматического разрешения неоднозначности не могут быть применены для решения этой задачи в языках с недостаточным количеством размеченных лингвистических ресурсов, к которым относится и русский язык. Для решения данной проблемы разрабатываются различные методы для автоматического создания обучающих коллекций. В статье предлагается обзор подходов, сгруппированных по основополагающему принципу их работы и источнику знаний, который в них используется.