131781
столько раз учителя, ученики и родители
посетили сайт «Инфоурок»
за прошедшие 24 часа
+Добавить материал
и получить бесплатное
свидетельство о публикации
в СМИ №ФС77-60625 от 20.01.2015
Дистанционные курсы профессиональной переподготовки и повышения квалификации для педагогов

Дистанционные курсы для педагогов - курсы профессиональной переподготовки от 6.900 руб.;
- курсы повышения квалификации от 1.500 руб.
Престижные документы для аттестации

ВЫБРАТЬ КУРС СО СКИДКОЙ 50%

ВНИМАНИЕ: Скидка действует ТОЛЬКО сейчас!

(Лицензия на осуществление образовательной деятельности № 5201 выдана ООО "Инфоурок")

ИнфоурокФизическая культураДругие методич. материалыСистемы машинного перевода

Системы машинного перевода

библиотека
материалов
Скачать материал целиком можно бесплатно по ссылке внизу страницы.

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Машинный перевод (МП) является разделом компьютерной лингвистики, который связан с исследованиями и разработками программного обеспечения, предназначенного для перевода текста или речи с одного естественного языка на другой. На элементарном уровне МП просто выполняет замену слов одного естественного языка на другой.

Современное программное обеспечение МП часто учитывает специфику требований заказчика, определяемых отраслью или профессией (например, сообщение о погоде), при этом повышается качество выводимого результата, поскольку ограничиваются контексты допустимых замен.

Эта методика особенно эффективна в областях, где используются формальный или шаблонный язык. Поэтому машинный перевод правительственных и юридических документов производит более готовый для использования выходной текст, чем это бывает в случае разговорной речи или менее стандартизированного текста.

Улучшение качества перевода может также быть достигнуто человеческим вмешательством – некоторые системы в состоянии осуществлять довольно точный перевод, например, если пользователь однозначно идентифицировал, какие слова в тексте являются именами собственными. С помощью этих методик МП оказывается полезным как вспомогательный инструмент для людей-переводчиков, а в некоторых случаях может даже выдать перевод, который может использовать без редактирования. Однако в целом современные системы все же не способны осуществлять вывод того же самого качества как человек-переводчик, особенно если переводимый текст относится к нестандартным языковым доменам.

Машинный перевод на основе словаря. Машинный перевод может использовать метод, основанный на словарных статьях – текст будет переведен «слово за словом», обычно без учета и воспроизведения коррекций их значений.

Статистический машинный перевод. Статистический метод состоит в использовании двуязычных текстовых массивов. Там, где такие массивы доступны, могут быть получены превосходные результаты при переводе сходных текстов, но это достаточно редкие случаи.

Машинный перевод на основе примеров. Этот подход характеризуется использованием во время выполнения двуязычных массивов текстов как основной базы знаний. Это перевод по аналогии, который может рассматриваться как разновидность выполнения логических выводов на основе анализа ситуаций.

Машинный перевод на основе промежуточного языка. В этом подходе текст на исходном языке преобразуется в межъязычное представление, на основе которого после этого создается выходной текст.

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Информация может быть представлена как в декларативной описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

Скорость перевода страницы текста у разных систем составляет от 0,5 до 2 сек. в автоматическом режиме. Полученный в результате текст в большинстве случаев понятен сразу. Поэтому, потратив какие-то минуты на осознание информации, пользователь может сразу сохранить документ для более тщательного изучения.

Одним из известных систем является переводчик «Сократ». Данная система поставляется в комплекте с общелексическим, коммерческим и компьютерными словарями. Данная база составляет 95% требуемого словарного запаса для текстов, которые существуют в электронном виде. Отдельно существует расширяемое множество дополнительных подключаемых к системе «Сократ» словарей специализированного назначения. Среди которых словари по медицине, машиностроению, юриспруденции и др. Перевод является двусторонним, т.е. можно переводить как с иностранного языка на русский, так и наоборот.

Системы перевода PROMT известны пользователям Windows. PROMT также комплектуется общелексическим и компьютерным словарями. Однако основной особенностью данной программы является наличие гораздо большего количества подключаемых словарей. Их число составляет на данный момент несколько десятков. Существуют ряд коллекций или подборок словарей, в том числе – наука, коммерция, техника и промышленность. Каждая из коллекций содержит от 5 до 10 словарей определенной направленности.

Среди систем электронного перевода программы-переводчика PROMT получили наибольшее распространение. Они предоставляют широкие возможности по настройке на перевод текстов, подключению специализированных словарей, созданию пользовательских словарей. Текст для перевода может вводиться не только с клавиатуры, но и со сканера, а также возможен перевод текстов непосредственно в текстовых редакторах.

При работе со сканером и наличии установленной на компьютере какой-либо системы оптического распознавания текстов (FineReader, Cunieform или AutoR) можно запустить OCR-программу непосредственно из системы PROMT. Система OCR прочтет напечатанные на бумаге текст при помощи сканера и передаст его в систему PROMT для перевода и редактирования.

В программе предусмотрены словари нескольких типов. Генеральные словари содержат свыше 150 000 общеупотребляемых слов и выражений и закрыты для пользователя. Специализированные словари предназначены для перевода текста по определенной тематике, а пользовательские словари создаются самими пользователями исходя из их опыта перевода. Возможно открытие сразу нескольких словарей.

Краткое описание документа:
Машинный перевод  связан с исследованиями и разработками программного обеспечения, предназначенного для перевода текста или речи с одного естественного языка на другой. На элементарном уровне машинный перевод просто выполняет замену слов одного естественного языка на другой. В предоставленной работе рассматриваются методы машинного перевода: на основе словаря, на основе примеров, статистический машинный перевод, машинный перевод на основе промежуточного языка. Также приведены примеры известных российских систем машинного перевода - «Сократ» и PROMT.
Общая информация

Номер материала: 103206051316

Вам будут интересны эти курсы:

Курс профессиональной переподготовки «Физическая культура и спорт: теория и методика преподавания в образовательной организации»
Курс повышения квалификации «Формирование компетенций межкультурной коммуникации в условиях реализации ФГОС»
Курс повышения квалификации «Организация практики студентов в соответствии с требованиями ФГОС педагогических направлений подготовки»
Курс профессиональной переподготовки «Организация деятельности экономиста-аналитика производственно-хозяйственной деятельности организации»
Курс повышения квалификации «Применение MS Word, Excel в финансовых расчетах»
Курс повышения квалификации «Маркетинг в организации, как средство привлечения новых клиентов»
Курс повышения квалификации «Организация практики студентов в соответствии с требованиями ФГОС медицинских направлений подготовки»
Курс профессиональной переподготовки «Организация маркетинга в туризме»
Курс профессиональной переподготовки «Организация тренерской деятельности по физической культуре и спорту»
Курс повышения квалификации «Дополнительное образование в системе спортивного менеджмента по ФГОС»
Курс профессиональной переподготовки «Организация тренерской деятельности по адаптивной физической культуре и спорту»
Курс профессиональной переподготовки «Организация и методическое обеспечение процессов физкультурной и спортивной деятельности»
Курс профессиональной переподготовки «Спортивный менеджмент: управление в области физической культуры и спорта»
Курс профессиональной переподготовки «Организация и методическое обеспечение процессов физкультурной и спортивной деятельности в отношении лиц с ограниченными возможностями здоровья»
Курс профессиональной переподготовки «Информационная поддержка бизнес-процессов в организации»
Оставьте свой комментарий
Для того чтобы задавать вопросы нужно авторизироватся.
Включите уведомления прямо сейчас и мы сразу сообщим Вам о важных новостях. Не волнуйтесь, мы будем отправлять только самое главное.