ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ИНХС РАН |
||
Практические занятия с магистрантами-иностранцами по теме «Машинный перевод и электронные словари» преследует цель дать студентам общее представление об истории развития и современном состоянии систем машинного перевода, электронных словарей, научить студентов пользоваться наиболее развитыми и популярными системами, показать возможности, стоимость и условия применения этих систем. Необходимость предредактирования исходного текста и постредактирования полученного перевода обусловлена несколькими факторами, а именно языковой парой - исходный и целевой языки, синтаксической сложностью предложений исходного текста, предметной областью и жанровыми особенностями текста. Известно, что качество перевода резко падает с увеличением длины исходного предложения (с 90 до 55%). Отсюда дается рекомендация: использовать возможно более короткие и синтаксически простые предложения исходного текста – если автор текста сам студент. Также существенно влияет на качество перевода сложность предметной области – тексты, относящиеся к узкоспециализированной предметной области трудны для перевода даже профессиональному переводчику. Словарь системы МП должен быть настроен на данную предметную область, с другой стороны, синтаксис предложений технического текста, как правило, проще, чем текстов юридических, политических, художественных. Дается рекомендация для перевода технических текстов использовать системы с настраиваемым и пополняемым пользователем словарем. С другой стороны, при переводе текстов из социальных сетей рекомендуется отдавать предпочтение он-лайн системам МП, поскольку они быстрее реагируют на лексические новации, включая их в словарь МП. Мотивация изучения русского языка у китайских студентов – магистрантов имеет четко выраженную практическую направленность. Исходя из этого, нами были подготовлены занятия по составлению письменного перевода на китайский язык краткого русско-китайского разговорника объемом около 500 фраз . Каждому студенту давался набор из 10-15 русских предложений разговорника на бытовые темы, а также аудиофайл, содержащий произношение этих предложений на русском и китайском языке. Студент должен записать китайский перевод каждого предложения, звучание которого совпадает со звучанием в аудиофайле. В помощь студенту рекомендован он-лайн переводчик Google, дающий несколько вариантов перевода в иероглифической записи, звучание перевода и латинизированную транскрипцию перевода. Благодаря такой помощи студент был избавлен от самостоятельной записи иероглифов, что не всегда возможно при использовании стандартной клавиатуры. Наличие нескольких вариантов перевода позволяет выбрать тот, произношение которого соответствует аудиофайлу. В некоторых случаях студент не мог подобрать подходящий перевод, тогда от него требовалось лишь записать латинизированную транскрипцию. Результаты выполненной работы демонстрировались на аудиторном занятии и оценивались остальными студентами. Для оценки предлагалось китайское предложение и несколько русских, из которых требовалось выбрать эквивалентное. Оценка перевода вызывала большое оживление в аудитории и споры, в которых участвовал и автор перевода. Следующим направлением практической работы студентов-магистрантов было составление русско-китайского мини-словаря на основе параллельного корпуса, полученного на первом этапе работы. Порядок выполнения работы следующий: 1. В русской части параллельного корпуса русско-китайского разговорника выделяются все русские слова и каждому слову поставлено в соответствие то китайской предложение, перевод которого включает данное русское слово. 2. Производится лемматизация русских словоформ. Внимание китайских студентов должно быть обращено на то, что различным русским словоформам, как правило, соответствует одно и то же китайское слово. 3. Выполняется сортировка полученной таблицы: русская лемма – китайское предложение в лексикографической последовательности по русским леммам. 4. Полученная отсортированная таблица предъявляется студентам с целью поиска совпадающих последовательностей иероглифов в китайских предложениях, соответствующих одинаковым русским леммам. Обращаем внимание студентов на проблему разделения китайского предложения на слова. 5. Полученный список вида русская лемма – последовательность китайских иероглифов представляет собой заготовку мини-словаря и предъявляется для оценки на аудиторном занятии. Практическая работа по освоению и использованию систем машинного перевода и составлению электронного словаря на основе параллельного русско-китайского микро-корпуса проводилась со студентами-магистрантами, вызвала большой интерес у студентов и может быть рекомендована для развития и внедрения в учебный процесс.