Мультимедийный размеченный корпус текстов на говорах западных эвенковНИР

Источник финансирования НИР

грант РФФИ
грант РФФИ

Этапы НИР

# Сроки Название
1 1 января 2010 г.-31 декабря 2010 г. Мультимедийный размеченный корпус текстов на говорах западных эвенков
Результаты этапа: Целью настоящего проекта является построение мультимедийного размеченного корпуса текстов на говорах западных эвенков, в котором обеспечивается хранение языковой и метаязыковой информации и осуществляется поиск информации по различным параметрам, а также анализ проблем, возникающих в процессе работы над подобным корпусом. За первый год работы над проектом был проделан значительный объем работы, в целом соответствующий намеченной программе: 1) была разработана общая структура мультимедийного размеченного корпуса эвенкийских текстов; 2) была проведена ревизия имеющихся в нашем распоряжении эвенкийских текстов и сделана сопроводительная разметка всех текстов, предназначенных для включения в корпус (мы приняли решение включить в корпус все имеющиеся у нас эвенкийские тексты, в том числе записанные в 1996-1999 гг. и не имеющие видеоряда); 3) было проведено пробное морфологическое индексирование десяти текстов на говорах как южного, так и северного наречия (двух текстов на полигусовском говоре, двух на суриндинском говоре, одного на говоре Стрелки-Чуни, четырех на совреченском говоре и одного на чириндинском говоре) и проанализированы результати индексирования; 4) была подготовлена и проведена экспедициия в Верхнекетский и Каргасокский районы Томской области, в ходе которой от последних носителей сымского диалекта эвенкийского языка нам удалось записать текстовой и словарный материал и сделать расшифровку записанных текстов; таким образом, объем текстов на сымском диалекте в современной записи в нашем архиве увеличился практически вдвое, что представляется чрезвычайно важным ввиду того, что над этим диалектом сегодня нависла вполне реальная угроза исчезновения (количество его носителей не превышает десятка человек, и все они – люди весьма преклонного возраста); 5) пробная версия мультимедийной текстовой базы, включающей четыре текста на совреченском говоре северного наречия эвенкийского языка с морфологической индексацией была создана и размещена на Московском сервере языковых архивов LangueDOC http://languedoc.philol.msu.ru, использующем программную платформу LAT (Language Archive Technology); 6) на сайте лаборатории автоматизированных лексикографических систем НИВЦ МГУ создан специальный раздел, посвященный работе над проектом. http://lcl.srcc.msu.ru/mainstream_pages/project.htm; 7) полученные в ходе работы над проектом результаты частично отражены в опубликованных и принятых к печати работах.

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".