Мультимедийный размеченный корпус текстов на говорах западных эвенковНИР

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
2 1 января 2011 г.-31 декабря 2011 г. Мультимедийный размеченный корпус текстов на говорах западных эвенков
Результаты этапа: Целью настоящего проекта является построение мультимедийного размеченного корпуса текстов на говорах западных эвенков, в котором обеспечивается хранение языковой и метаязыковой информации и осуществляется поиск информации по различным параметрам, а также анализ проблем, возникающих в процессе работы над подобным корпусом. За второй год работы над проектом был проделан значительный объем работы, в целом соответствующий намеченной программе: Проект рассчитан на три года. За второй, 2011, год нам удалось выполнить все поставленные на этот год задачи: 1) было выполнено морфологическое индексирование 5 текстов на сымском диалекте; по ходу работы проанализированы особенности современных текстов на этом диалекте; 2) было выполнено морфологическое индексирование 5 текстов на чириндинском говоре; по ходу работы выявлены и частично проанализированы фонетические и грамматические особенности современных текстов на этом диалекте (к таковым особенностям относится, например, наличие в текстах противопоставления форм минимального и расширенного инклюзивного личного местоимения 1 лица множественного числа); 3) было выполнено морфологическое индексирование 5 текстов на тутончанском говоре; анализ особенностей современных текстов из Тутончан показывает, что эвенкийские идиомы, используемые жителями поселка, не однородны; 4) была подготовлена и проведена экспедиция к таймырским эвенкам в поселки Хантайское Озеро и Потапово, в ходе которой была сделана аудио- и видеозапись 36-и эвенкийских текстов на четырех таймырских говорах, большая часть текстов расшифрована, записан значительный объем озвученных лексических материалов и проведено социолингвистическое обследование поселков для получения адекватного представления о наличествующей в них языковой ситуации; 5) было выполнено морфологическое индексирование 5 текстов, записанных в Кислокане; начат анализ особенностей кислоканских текстов; уже на первом этапе анализа получило подтверждение наше предположение о говорной неоднородности поселка; 6) было выполнено морфологическое индексирование 5 текстов, записанных в Стрелке-Чуне; ведется анализ особенностей этих текстов; 7) была разработана система дискурсивной разметки текстов; сделана пробная дискурсивная разметка 5 текстов с морфологическими глоссами; 8) был осуществлен импорт 36 проиндексированных (отглоссированных) текстов в ELAN, проведена синхронизация видео- и звукового ряда с графической записью текстов и размещение синхронизированных текстов на Московском сервере языковых архивов LangueDOC http://languedoc.philol.msu.ru; 9) был проведен предварительный анализ фольклорных мотивов, представленных в текстах корпуса; 10) на сайте лаборатории автоматизированных лексикографических систем НИВЦ МГУ было продолжено ведение раздела, посвященного работе над проектом. http://lcl.srcc.msu.ru/mainstream_pages/project.htm; 11) полученные в ходе работы над проектом результаты частично отражены в опубликованных и принятых к печати работах.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".