ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
В работе проводилось сравнение эмпирических распределений синтаксических связей – направленных отношений между грамматическими атрибутами языка – с модельными ранговыми зависимостями. В результате анализа девяти текстов с помощью программы Dwarf были получены частоты синтаксических отношений и найдены функции, которые с наибольшей точностью аппроксимируют ранговые распределения. Для каждого текста были протестированы две экспоненты с двумя и тремя неизвестными параметрами и ципфовское распределение c поправкой, пренебрежимо малой при больших рангах, выбрана наилучшая аппроксимирующая функция. Найдены МНК-оценки неизвестных параметров. Максимальное отличие в частотах синтаксических отношений, определяемых полученным распределением, наблюдаемое для двух из девяти текстов, составило 7,5% для ранга, равного 1, и оказалось пренебрежимо малым для рангов, больших 10. Полученные в работе результаты позволяют предположить, что предлагаемое экспоненциальное распределение синтаксических связей является универсальным для синтаксиса русских текстов. Ранговое распределение синтаксических связей является экспоненциальным и отличается от рангового распределения слов, поскольку вид ранговых распределений обусловлен тем, как «устроено» множество ранжируемых объектов, насколько плотно оно заполнено различным объектами, имеющими одинаковую частоту.