Добавить материал и получить бесплатное свидетельство о публикации в СМИ
Эл. №ФС77-60625 от 20.01.2015

Автоматическая выдача свидетельства о публикации в официальном СМИ сразу после добавления материала на сайт - Бесплатно

Добавить свой материал

За каждый опубликованный материал Вы получите бесплатное свидетельство о публикации от проекта «Инфоурок»

(Свидетельство о регистрации СМИ: Эл №ФС77-60625 от 20.01.2015)

Инфоурок / Информатика / Конспекты / Разработка урока(конспект+мультимедийная презентация) "Системы перевода и распознавания текстов"
ВНИМАНИЮ ВСЕХ УЧИТЕЛЕЙ: согласно Федеральному закону № 313-ФЗ все педагоги должны пройти обучение навыкам оказания первой помощи.

Дистанционный курс "Оказание первой помощи детям и взрослым" от проекта "Инфоурок" даёт Вам возможность привести свои знания в соответствие с требованиями закона и получить удостоверение о повышении квалификации установленного образца (180 часов). Начало обучения новой группы: 26 апреля.

Подать заявку на курс
  • Информатика

Разработка урока(конспект+мультимедийная презентация) "Системы перевода и распознавания текстов"

Выбранный для просмотра документ sistemy_perevoda_i_raspoznavaniya_teksta.doc

библиотека
материалов

План урока

Тема урока: «Системы перевода и распознавания текста»

Тип урока: Урок изучения нового материала.

ТДЦ урока:

  • Образовательная: Дать представление о системах распознавания и перевода текста, сформировать навыки перевода текста при помощи e-mail.

  • Развивающая: Развивать познавательный интерес, внимание, самоконтроль.

  • Воспитательная: Воспитывать информационную культуру, усидчивость.


Формы организации познавательной деятельности: индивидуальная, фронтальная.

Методы обучения (приемы): объяснительно-иллюстративный, репродуктивный.

Материально-техническая база:

  • На рабочем месте ученика: тетрадь, ручка, компьютер.

  • На рабочем месте учителя: компьютер, проектор, доска, конспект урока.

Ход урока:

  1. Организационный момент

  2. Актуализация

  3. Основной этап

  4. Практический этап

  5. Рефлексия

  6. Домашнее задание



  1. Организационный момент

Здравствуйте! Кто сегодня отсутствует?

  1. Актуализация

Знание хотя бы одного иностранного языка необходимо сегодня всем. В особенности пользователям компьютеров: ведь избежать столкновения с английским языком при работе на компьютере, увы, невозможно. Неудобно, если вы не знаете иностранного языка... Однако отчасти вам может помочь установка на компьютер одной из специализированных программ-переводчиков. При создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов. Итак, сегодня мы узнаем о системах перевода и распознавания текста.

  1. Основной этап

Компьютерные словари.

Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части. В одной части записывалось слово на шумерском языке, а в другой — аналогичное по значению слово на другом языке, иногда с краткими пояснениями.

Современные словари построены по такому же принципу. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц. Как вы думаете, удобно ли это? Если нет, то чем удобней пользоваться?

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности.

Во-первых, компьютерные словари могут являться многоязычными, так как дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и так далее).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, то есть предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы машинного перевода.

Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить немедленно, и нет возможности и времени пригласить переводчика.

Системы машинного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду) и, с другой стороны, переводить Web-страницы «на лету», в режиме реального времени. Лучшими среди российских систем машинного перевода считаются PROMT и «Сократ».

Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка (синтаксиса языка — правил построения предложений, правил словообразования) и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы машинного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они неприменимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Системы распознавания текста.

С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.

Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR).

Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, очень плохое. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Так же не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word.

Как видим, для того, чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR необходимо выполнить «цепочку» из множества отдельных операций.

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и так далее. Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст.

Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством отличных от входного изображения точек. При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего соответствует распознаваемому символу. Какие вы знаете системы оптического распознавания текста? Наиболее распространенные системы оптического распознавания символов: FineReader, CuneiForm, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

  1. Практический этап

Вам необходимо перевести предложения, написанные в документе, на иностранные языки и отправить результат мне на e-mail. Адрес моей почты .........@mail.ru.

  1. Рефлексия

Сегодня на уроке мы познакомились с системами перевода и распознавания текста. Для чего используются системы перевода текста? Перечислите дополнительные возможности компьютерного словаря. Как называются лучшие российские системы машинного перевода? В каких ситуациях систему машинного перевода лучше не применять? Как сокращенно называют специальные программы распознавания текста? Что должны уметь современные OCR? Назовите более распространенные системы оптического распознавания текстов. Что-то новое сегодня узнали на уроке? Все было понятным? Вопросы есть?

  1. Домашнее задание

Выучить записи в тетради.

Выбранный для просмотра документ Системы перевода и распознавания текста> .pptx

библиотека
материалов
Презентация На тему: «Системы перевода и распознавания текста»
Словари необходимы для перевода текстов с одного языка на другой. Первые слов...
Бумажные словари Слишком громоздкие и трудно найти нужные слова.
Компьютерные словари предоставляют пользователю дополнительные возможности: в...
Системы компьютерного перевода  Позволяют переводить многостраничные документ...
Системы перевода еще уступают человеку, особенно в работе с художественными т...
Распознавание текста За сотни лет человечество накопило огромный объем информ...
Графический образ, получаемый после сканирования документа, иногда необходимо...
Бланком называется стандартный лист бумаги, на котором размещается постоянная...
Яндекс. Переводчик
Переводчик Google
Спасибо за внимание!
12 1

"Инфоурок" приглашает всех педагогов и детей к участию в самой массовой интернет-олимпиаде «Весна 2017» с рекордно низкой оплатой за одного ученика - всего 45 рублей

В олимпиадах "Инфоурок" лучшие условия для учителей и учеников:

1. невероятно низкий размер орг.взноса — всего 58 рублей, из которых 13 рублей остаётся учителю на компенсацию расходов;
2. подходящие по сложности для большинства учеников задания;
3. призовой фонд 1.000.000 рублей для самых активных учителей;
4. официальные наградные документы для учителей бесплатно(от организатора - ООО "Инфоурок" - имеющего образовательную лицензию и свидетельство СМИ) - при участии от 10 учеников
5. бесплатный доступ ко всем видеоурокам проекта "Инфоурок";
6. легко подать заявку, не нужно отправлять ответы в бумажном виде;
7. родителям всех учеников - благодарственные письма от «Инфоурок».
и многое другое...

Подайте заявку сейчас - https://infourok.ru/konkurs

Описание презентации по отдельным слайдам:

№ слайда 1 Презентация На тему: «Системы перевода и распознавания текста»
Описание слайда:

Презентация На тему: «Системы перевода и распознавания текста»

№ слайда 2 Словари необходимы для перевода текстов с одного языка на другой. Первые слов
Описание слайда:

Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части.  Первые словари

№ слайда 3 Бумажные словари Слишком громоздкие и трудно найти нужные слова.
Описание слайда:

Бумажные словари Слишком громоздкие и трудно найти нужные слова.

№ слайда 4 Компьютерные словари предоставляют пользователю дополнительные возможности: в
Описание слайда:

Компьютерные словари предоставляют пользователю дополнительные возможности: выбор языков и направлений перевода; содержание десятков специализированных словарей по областям знаний (техника, медицина, информатика и др.); обеспечение быстрого поиска словарных статей прослушивание слов в исполнении дикторов, носителей языка.  Компьютерные словари

№ слайда 5 Системы компьютерного перевода  Позволяют переводить многостраничные документ
Описание слайда:

Системы компьютерного перевода  Позволяют переводить многостраничные документы с высокой скоростью; Позволяют переводить Web-страницы в режиме реального времени Иногда допускают смысловые и стилистические ошибки Плюсы Минусы

№ слайда 6 Системы перевода еще уступают человеку, особенно в работе с художественными т
Описание слайда:

Системы перевода еще уступают человеку, особенно в работе с художественными текстами, но эта область информатики развивается очень быстро и «электронные карманные переводчики» уже становятся незаменимым помощником туриста, отправляющегося в страну с незнакомым для него языком.

№ слайда 7 Распознавание текста За сотни лет человечество накопило огромный объем информ
Описание слайда:

Распознавание текста За сотни лет человечество накопило огромный объем информации на традиционных бумажных носителях (книгах, газетах, журналах и т. п.). В настоящее время существует потребность (у электронных библиотек, к примеру) переносить эту информацию в память компьютера. Конечно, это можно сделать с помощью клавиатуры и текстового редактора, но, представьте себе, сколько времени уйдет даже у профессионального оператора на ввод, скажем, романа «Война и мир»? Необходимо как-то ускорить этот процесс. Встает вопрос, нельзя ли использовать сканер для ввода текстовой информации? Правда, в этом случае возникает такая проблема: все, что введено с помощью сканера, хранится в памяти ЭВМ как изображение. Надо «объяснить» компьютеру, что значок «с» — не просто закорючка, а буква, и хранить и обрабатывать его нужно как букву.

№ слайда 8 Графический образ, получаемый после сканирования документа, иногда необходимо
Описание слайда:

Графический образ, получаемый после сканирования документа, иногда необходимо перевести в текст. Для этого используются специальные программные средства, называемые средствами распознавания образов.

№ слайда 9 Бланком называется стандартный лист бумаги, на котором размещается постоянная
Описание слайда:

Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того система должна определить, к какому полю относится распознаваемый текст. Система оптического распознавания форм

№ слайда 10 Яндекс. Переводчик
Описание слайда:

Яндекс. Переводчик

№ слайда 11 Переводчик Google
Описание слайда:

Переводчик Google

№ слайда 12 Спасибо за внимание!
Описание слайда:

Спасибо за внимание!

Выбранный для просмотра документ Системы распознавания текстов.pptx

библиотека
материалов
8 класс Системы перевода и распознавания текста
Как работают программы-переводчики Чтобы найти перевод неизвестного иностранн...
Компьютерные словари Словари необходимы для перевода текстов с одного языка н...
В настоящее время существуют тысячи словарей для перевода между сотнями языко...
Системы машинного перевода позволяют решить эти проблемы. Они, с одной сторон...
Системы распознавания текста С помощью сканера достаточно просто получить из...
Ввод в компьютер печатного и рукописного текста Существуют программы, позвол...
Компьютерные словари предоставляют пользователю дополнительные возможности: в...
Источники http://school.xvatit.com/index.php?title=%D1%E8%F1%F2%E5%EC%E0_%EF...
 Конец
10 1

"Инфоурок" приглашает всех педагогов и детей к участию в самой массовой интернет-олимпиаде «Весна 2017» с рекордно низкой оплатой за одного ученика - всего 45 рублей

В олимпиадах "Инфоурок" лучшие условия для учителей и учеников:

1. невероятно низкий размер орг.взноса — всего 58 рублей, из которых 13 рублей остаётся учителю на компенсацию расходов;
2. подходящие по сложности для большинства учеников задания;
3. призовой фонд 1.000.000 рублей для самых активных учителей;
4. официальные наградные документы для учителей бесплатно(от организатора - ООО "Инфоурок" - имеющего образовательную лицензию и свидетельство СМИ) - при участии от 10 учеников
5. бесплатный доступ ко всем видеоурокам проекта "Инфоурок";
6. легко подать заявку, не нужно отправлять ответы в бумажном виде;
7. родителям всех учеников - благодарственные письма от «Инфоурок».
и многое другое...

Подайте заявку сейчас - https://infourok.ru/konkurs

Описание презентации по отдельным слайдам:

№ слайда 1 8 класс Системы перевода и распознавания текста
Описание слайда:

8 класс Системы перевода и распознавания текста

№ слайда 2 Как работают программы-переводчики Чтобы найти перевод неизвестного иностранн
Описание слайда:

Как работают программы-переводчики Чтобы найти перевод неизвестного иностранного слова, пользователю электронного словаря достаточно ввести это слово в строке поиска, и уже через несколько мгновений будет получен перевод. Современные текстовые процессоры имеют в своем составе словари, позволяющие производить орфографическую проверку правильности написания слов (на разных языках).

№ слайда 3 Компьютерные словари Словари необходимы для перевода текстов с одного языка н
Описание слайда:

Компьютерные словари Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части. 

№ слайда 4 В настоящее время существуют тысячи словарей для перевода между сотнями языко
Описание слайда:

В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, где поиск нужного слова является достаточно трудоемким процессом. 

№ слайда 5 Системы машинного перевода позволяют решить эти проблемы. Они, с одной сторон
Описание слайда:

Системы машинного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду) и, с другой стороны, переводить Web-страницы «на лету», в режиме реального времени. Лучшими среди российских систем машинного перевода считаются PROMT и «Сократ». 

№ слайда 6 Системы распознавания текста С помощью сканера достаточно просто получить из
Описание слайда:

Системы распознавания текста С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. 

№ слайда 7 Ввод в компьютер печатного и рукописного текста Существуют программы, позвол
Описание слайда:

Ввод в компьютер печатного и рукописного текста Существуют программы, позволяющие вводить тексты в ПК с помощью сканера. Используя специальные алгоритмы, они распознают буквы, позволяют редактировать распознан­ный текст и сохранять его в различных форматах. Популяр­ной программой такого типа является ABBY FineReader, Работать с этой программой несложно. Сначала нужно отска­нировать текст (управлять сканером можно прямо в среде Fi­neReader), затем разбить этот текст на фрагменты, потом распознать эти фрагменты, отредактировать полученный текст и, наконец, сохранить его в нужном текстовом форма­те. Интерфейс программы позволяет освоить эти операции легко и быстро. Задача распознавания текста относится к области проб­лем, которые решает наука под названием «Искусственный интеллект». Современные распознающие программы умеют читать не только печатный текст, но и текст, написанный са­мым «корявым» почерком.

№ слайда 8 Компьютерные словари предоставляют пользователю дополнительные возможности: в
Описание слайда:

Компьютерные словари предоставляют пользователю дополнительные возможности: выбор языков и направлений перевода; содержание десятков специализированных словарей по областям знаний (техника, медицина, информатика и др.); обеспечение быстрого поиска словарных статей прослушивание слов в исполнении дикторов, носителей языка.

№ слайда 9 Источники http://school.xvatit.com/index.php?title=%D1%E8%F1%F2%E5%EC%E0_%EF
Описание слайда:

Источники http://school.xvatit.com/index.php?title=%D1%E8%F1%F2%E5%EC%E0_%EF%E5%F0%E5%E2%EE%E4%E0_%E8_%F0%E0%F1%EF%EE%E7%ED%E0%E2%E0%ED%E8%FF_%F2%E5%EA%F1%F2%EE%E2 http://21419.edusite.ru/p2aa1/p22aa1.html http://mypresentation.ru/presentation/sistemy_raspoznavaniya_teksta_texnologiya_obrabotki_tekstovoj_informacii

№ слайда 10  Конец
Описание слайда:

Конец

Автор
Дата добавления 10.02.2016
Раздел Информатика
Подраздел Конспекты
Просмотров1297
Номер материала ДВ-437294
Получить свидетельство о публикации

"Инфоурок" приглашает всех педагогов и детей к участию в самой массовой интернет-олимпиаде «Весна 2017» с рекордно низкой оплатой за одного ученика - всего 45 рублей

В олимпиадах "Инфоурок" лучшие условия для учителей и учеников:

1. невероятно низкий размер орг.взноса — всего 58 рублей, из которых 13 рублей остаётся учителю на компенсацию расходов;
2. подходящие по сложности для большинства учеников задания;
3. призовой фонд 1.000.000 рублей для самых активных учителей;
4. официальные наградные документы для учителей бесплатно(от организатора - ООО "Инфоурок" - имеющего образовательную лицензию и свидетельство СМИ) - при участии от 10 учеников
5. бесплатный доступ ко всем видеоурокам проекта "Инфоурок";
6. легко подать заявку, не нужно отправлять ответы в бумажном виде;
7. родителям всех учеников - благодарственные письма от «Инфоурок».
и многое другое...

Подайте заявку сейчас - https://infourok.ru/konkurs


Выберите специальность, которую Вы хотите получить:

Обучение проходит дистанционно на сайте проекта "Инфоурок".
По итогам обучения слушателям выдаются печатные дипломы установленного образца.

ПЕРЕЙТИ В КАТАЛОГ КУРСОВ


Идёт приём заявок на международный конкурс по математике "Весенний марафон" для учеников 1-11 классов и дошкольников

Уникальность конкурса в преимуществах для учителей и учеников:

1. Задания подходят для учеников с любым уровнем знаний;
2. Бесплатные наградные документы для учителей;
3. Невероятно низкий орг.взнос - всего 38 рублей;
4. Публикация рейтинга классов по итогам конкурса;
и многое другое...

Подайте заявку сейчас - https://urokimatematiki.ru

Похожие материалы

Включите уведомления прямо сейчас и мы сразу сообщим Вам о важных новостях. Не волнуйтесь, мы будем отправлять только самое главное.
Специальное предложение
Вверх