Добавить материал и получить бесплатное свидетельство о публикации в СМИ
Эл. №ФС77-60625 от 20.01.2015
Инфоурок / Информатика / Конспекты / Урок по теме "Сканеры. Сканирование текстовых и графических материалов. Распознавание текстов"

Урок по теме "Сканеры. Сканирование текстовых и графических материалов. Распознавание текстов"


До 7 декабря продлён приём заявок на
Международный конкурс "Мириады открытий"
(конкурс сразу по 24 предметам за один оргвзнос)

  • Информатика

Поделитесь материалом с коллегами:

ИТ в ПД

Тема: Сканеры. Сканирование текстовых и графических материалов. Распознавание сканированных текстов

13

Сканеры

Сканер: устройство или программа, осуществляющие сканирование, то есть исследование объекта, наблюдение за ним или считывание его параметров.

Виды сканеров:

  • Сканер изображений — устройство для считывания двумерного изображения и представления его в растровой электронной форме

  • 3D-сканер — устройство для считывания формы объёмного объекта

  • Биометрические сканеры используются для целей идентификации личности

  • Устройства автоматизированного считывания служебной информации:

    • Сканер штрихкода — устройство для считывания информации, представленной в виде штрих-кода

    • Считыватель RFID-меток

В настоящее время для ввода текстов и графической информации используют следующие типы сканеров:

Планшетные сканеры: наилучшее качество и максимальное удобство при работе. Под крышкой планшета располагается прозрачное основание, на которое кладется документ. Блок сканирования перемещается вдоль документа внутри корпуса сканера. Продолжительность сканирования листа от одной до нескольких секунд.

Ручные сканеры: наиболее простой вид, дающий наименее качественное изображение. Сканирование производится путем перемещения сканера по документу вручную. Пригодны для сканирования текстов.

Барабанные сканеры: очень высокое разрешение сканирования слайдов, негативов и т.п. Сканирующее устройство закреплено неподвижно, а изображение закрепляется на барабане и вращается при сканировании.

Листовые сканеры: позволяют за одну операцию сканировать стандартный лист бумаги (A4). Бумага протягивается мимо сканирующего блока при помощи валиков (как в принтере). Хорошее качество сканирования, но невозможность сканирования книжной страницы и журнала.

Сканеры форм: для ввода информации с заполненных бланков (разновидность листовых). Очень высокое быстродействие (для анкет, опросных листов, избирательных бюллетеней).

Штрих-сканеры: разновидность ручных. Для считывания штрих-кодов с маркировки товаров в магазинах. Позволяют автоматизировать процесс подсчета стоимости покупок.

Технические характеристики сканеров

Для того чтобы правильно выбрать тип сканера, а соответственно максимально использовать его возможности для реализации поставленных задач, необходимо хорошо разбираться в технических характеристиках сканеров и существующей терминологии.

Разрешающая способность (разрешение).

Максимальное разрешение сканера говорит о степени детализации при сканировании. Чем больше разрешение, тем больше информации об оригинале может быть введено в компьютер и подвергнуто дальнейшей обработке.

Производительность

Количество времени, затраченное на предварительный просмотр и собственно сканирование, может значительно влиять на производительность. Скорость сканирования зависит от таких факторов, как разрешение, размер и тип изображения (например, черно-белая или цветная фотография или же текст).

Глубина цвета

Глубина цвета – это характеристика, показывающая, насколько точна информация о цвете каждой точки отсканированного изображения, и отражающая разрядность аналого-цифрового преобразователя.

Сканеры подключаются к ПК

  • С параллельным или последовательным интерфейсом

  • С интерфейсом USB

С интерфейсом Fire Wire

Программное обеспечение сканера

Программное обеспечение сканера состоит из двух частей: программного интерфейса и пакета прикладных графических программ. Программный интерфейс обеспечивает управление сканером, а также его связь с графическими программами сторонних производителей. Это так называемый TWAIN-модуль или драйвер сканера. Стандарт TWAIN поддерживают практически все графические программы.

TWAIN-модуль имеет пользовательский интерфейс (диалоговое окно), с помощью которого можно настроить параметры сканирования. Внешний вид и состав параметров этого модуля могут быть различными, поскольку производители программного обеспечения сканера ограничены только собственно стандартом TWAIN, а совершенствовать пользовательский интерфейс им никто не мешает. Вместе с тем, существует стандартный набор параметров, которые присутствуют во всех интерфейсах: выбор режима и области сканирования, разрешения, контрастности, яркости и т. д.

Кроме TWAIN-модуля в программное обеспечение сканера обычно входит какой-нибудь, обычно весьма скромный по возможностям, графический редактор и, возможно, программа оптического распознавания символов (OCR).


Сканирование текстовых и графических материалов. Распознавание сканированных текстов

Цели и задачи распознавания документов многообразны, как и сами документы. Их решение строится на основе анализа изображения документа, полученного со сканера, видеокамеры или другого сканирующего устройства. Процесс ввода документа при этом называется оптическим вводом. После такого ввода документ представляет собой совокупность черных и белых (либо цветных) точек (растров) - графическое изображение. Поэтому общая задача распознавания графического изображения - преобразование графической формы в другую, воспринимаемую человеком и программой. Эта задача часто может быть разбита на подзадачи распознавания компонент документа:

Фотографии, рисунки и диаграммы часто сохраняют в графическом (растровом) формате.

Контурное изображение (печати, рамки таблиц и т.д.) удобно хранить в векторном, а не растровом виде.

Распознавание текста - это перевод его из графической формы в символьную. Ведется распознавание и рукописного текста, включающее задачи психологического характера (медицина, психология, судмедэкспертиза).

Анализ структуры и анализ реквизитов документов проводится для подтверждения подлинности документа (ценные бумаги и т.п.) и распознавания его компонент.

Хранение текстовых документов в растровом формате нецелесообразно, т.к. растровая графика занимает много дисковой памяти и не подлежит редактированию в редакторах текста. Создание электронной формы документа предполагает:

-детальный анализ структуры (сегментирование и анализ блоков: текст, рисунок, таблица);

-распознавание текста;

-извлечение из него графических компонент;

-компоновку в среде текстового процессора или издательской системы.

Программы распознавания текстов

В настоящее время лидерами программ распознавания текста и создания электронного документа являются программы CuneiForm и FineReader.

Пакет FineReader предназначен для распознавания текстов на русском, английском, немецком, французском и других языках, а также двуязычных текстов. Позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов и бланками. Программу можно обучать для повышения качества распознавания.

Сканирование и корректировка текстового документа

1 Запустить программу Fine Reader

2 Сканировать текстовый документ:

2.1 Поместить документ в сканер, подключить сканер к сети

2.2 Выполнить сканирование, щелкнув по пиктограмме, изображающей сканер на панели инструментов. В образовавшемся окне сканировать текстовый документ:

2.2.1 В окне программы ScanExpress 6000 P выбрать параметры сканирования и щелкнуть no кнопке "PreScan", выполняя предварительное сканирование;

2.2.2 Выделить область сканирования рамкой и сканировать выделенный участок, щелкнув по кнопке "Sсan";

2.2.3 Выйти из окна сканирования, щелкнув по кнопке "Exit" или по кнопке «Закрыть»

3 Произвести преобразование бумажного документа в электронный

Выполнить распознавание текста, щелкнув по кнопке "Распознать". Автоматически распознанный текст появляется в специальном окне. Он теряет связь с исходным изображением и может редактироваться и форматироваться независимо от него.

4 Полученный документ необходимо сохранить, использовав меню ФАЙЛ -СОХРАНИТЬ КАК... Сохраненный документ может быть вызван для редактирования в текстовом процессоре WORD или в табличном процессоре EXCEL

Сканирование графического изображения

Включить сканер и запустить программу графического редактора Adobe PhotoShop Открыть меню ФАЙЛ->ИМПОРТ - > TWAIN-32, выполнить сканирование графического изображения:

В окне программы ScanExpress выбрать параметры сканирования и щелкнуть по кнопке "PreScan". выполняя предварительное сканирование:

Выделить область сканирования и сканировать выделенный участок, щелкнув по кнопке "Sсan";

Выйти из окна сканирования, щелкнув по кнопке "Exit" или по кнопке «Закрыть»;

В открывшемся окне графического редактора Adobe PhotoShop произвести редактирование документа

Кадрировать изображение: щелкнуть по кнопке "Рамка" на панели инструментов, растянуть выделение на нужный участок изображения и выбрать в меню ИЗОБРАЖЕНИЕ -> ОБРЕЗАНИЕ.

Откорректировать цветовую гамму изображения через меню ИЗОБРАЖЕНИЕ-КОРРЕКЦИЯ - ЯРКОСТЬ/КОНТРАСТНОСТЬ, перетащив указатели в нужном направлении и закрыть окно.

Полученное изображения можно сохранить, используя меню ФАЙЛ->СОХРАНИТЬ КАКили щелкнуть по кнопке "Сохранить" для сохранения в стандартном формате с порядковым номером файла.

Полученное изображение можно вывести на принтер, используя меню ФАЙЛ-ПЕЧАТЬ


57 вебинаров для учителей на разные темы
ПЕРЕЙТИ к бесплатному просмотру
(заказ свидетельства о просмотре - только до 11 декабря)

Автор
Дата добавления 01.12.2015
Раздел Информатика
Подраздел Конспекты
Просмотров1148
Номер материала ДВ-216743
Получить свидетельство о публикации
Похожие материалы

Включите уведомления прямо сейчас и мы сразу сообщим Вам о важных новостях. Не волнуйтесь, мы будем отправлять только самое главное.
Специальное предложение
Вверх