ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
Сказки, как существеннейшая часть фольклора, являются, пожалуй, наиболее устойчивой формой культурных традиций нации. В статье описан процесс подготовки текстового корпуса на основе собрания сказок А.Н.Афанасьева. К обработке исходных текстов привлекались студенты филологического факультета МГУ, что также способствовало их профессиональной подготовке. Результатом работы является полнотекстовый корпус с возможностью поиска по различным критериям – словоупотреблениям, словосочетаниям, леммам, совместной встречаемости слов в тексте одной сказки, построения конкордансов, частотных словарей и пр. Ключевые слова. фольклор, лемматизация, архаизмы, словарь, компьютер Absrtact. Fairy tales, as an essential part of the folklore, are perhaps the most stable form of the cultural traditions of the nation. This article describes the process of preparing a text corpus on the basis of A.N.Afanaseva tales collection. The students of the Philological Faculty of the Moscow State University, were involved in processing the source texts. This work also contributed to their professional training. The result is a full-text corpus searchable according to various criteria – words, phrases, lemmas, co-occurrence of words in a fairy tale, enables concordances constructing, frequency dictionaries, etc. Keywords. folklore, lemma, archaic forms, lexicon, computer.