Аннотация:Мы представляем RuSemCor, открытый корпус для разрешения многозначности слов (WSD) для русского языка. Корпус был создан путем ручного сопоставления токенов из корпуса OpenCorpora со значениями слов в русской сети WordNet RuWordNet. Он состоит из 869 документов с 121 710 токенами, из которых 51 588 аннотированы в WordNet. Ресурс представлен с использованием онтологий NIF, OLiA, OntoLex и Global WordNet и интегрирован в облако лингвистических связанных открытых данных (Linguistic Linked Open Data). Мы использовали RuSemCor в качестве диагностического эталона для оценки ряда методов разрешения многозначности слов. Наши эксперименты дали три основных результата: 1) Генеративные LLM-модели значительно превосходят традиционные методы, основанные на знаниях, такие как персонализированный PageRank. 2) Несмотря на свои преимущества, генеративные LLM-модели не превосходят модели на основе кодировщиков, специально обученные для разрешения многозначности слов. 3) Включение лексико-семантических отношений из RuWordNet дает неоднозначные результаты: оно повышает производительность моделей на основе кодировщиков и ведущих моделей линейного программирования, таких как GPT-4, DeepSeek и Mistral 24B, но, как правило, снижает точность для более мелких генеративных моделей, таких как GPT-3 и Mistral 7B. Ресурс распространяется под открытой лицензией CC BY-SA и доступен по адресу: https://github.com/LLOD-Ru/rusemcor.