Раздел 2. ИНФОРМАЦИЯ И ИНФОРМАЦИОННЫЕ
ПРОЦЕССЫ
Тема 2.1. Информация и измерение информации
Подходы к понятию информации и измерению информации.
Информационные объекты различных видов. Универсальность дискретного
(цифрового) представления информации. Представление информации в двоичной
системе счисления.
Слово
«информация» происходит от латинского слова informatio, что в
переводе означает сведение, разъяснение, ознакомление.
Можно
выделить следующие подходы к определению информации:
* традиционный
(обыденный) - используется в информатике: Информация
– это сведения, знания, сообщения о положении дел, которые человек
воспринимает из окружающего мира с помощью органов чувств (зрения, слуха,
вкуса, обоняния, осязания).
* вероятностный
- используется в теории об информации: Информация
– это сведения об объектах и явлениях окружающей среды, их
параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень
неопределённости и неполноты знаний.
Для
человека: Информация
– это знания, которые он получает из различных источников с помощью органов
чувств.
Вся информация, которую
обрабатывает компьютер, представлена двоичным кодом с помощью двух цифр
– 0 и 1. Эти два символа 0 и 1 принято называть битами
(от англ. binary digit – двоичный знак)
Бит –
наименьшая единица измерения объема информации.
Название
|
Усл.
обозн.
|
Соотношение
|
Байт
|
Байт
|
1 байт = 23 бит = 8 бит
|
Килобит
|
Кбит
|
1Кбит = 210 бит = 1024 бит
|
КилоБайт
|
Кб
|
1 Кб = 210 байт = 1024 байт
|
МегаБайт
|
Мб
|
1 Мб = 210 Кб = 1024 Кб
|
ГигаБайт
|
Гб
|
1 Гб = 210 Мб = 1024 Мб
|
ТераБайт
|
Тб
|
1 Тб = 210 Гб = 1024 Гб
|
Вопрос: «Как
измерить информацию?» очень непростой.
Ответ на него
зависит от того, что понимать под информацией.
Но поскольку определять информацию можно по-разному, то и способы измерения
тоже могут быть разными.
В информатике
используются различные подходы к измерению информации:
Содержательный
подход к измерению информации.
Сообщение, уменьшающее
неопределенность знаний человека в два раза, несет для него 1 бит
информации.
Количество
информации, заключенное в сообщении, определяется по
формуле Хартли:
где N
– количество равновероятных событий;
I – количество
информации (бит), заключенное в сообщении об одном из событий.
Алфавитный (технический) подход
к измерению информации - основан на подсчете числа
символов в сообщении.
Если допустить, что все
символы алфавита встречаются в тексте с одинаковой частотой, то
количество информации, заключенное в сообщении вычисляется по формуле:
Ic – информационный объем
сообщения
К
– количество символов
N – мощность алфавита (количество символов)
i - информационный объем 1 символа
Двоичное
кодирование информации
К
достоинству двоичной системы счисления относится – простота совершаемых
операций, возможность автоматической обработки информации с использованием двух
состояний элементов ПК и операцию сдвиг
Кодирование
– это операция преобразования знаков или групп знаков одной знаковой системы в
знаки или группы знаков другой знаковой системы.
Декодирование
– расшифровка кодированных знаков, преобразование кода символа в его
изображение
Двоичное
кодирование – кодирование информации в виде 0 и 1
Способы кодирования и
декодирования информации в компьютере, в первую очередь, зависит от вида
информации, а именно, что должно кодироваться:
Ø числа
Ø символьная
информация (буквы, цифры, знаки)
Ø графические
изображения
Ø звук
Двоичное
кодирование чисел
Для записи информации о количестве объектов используются числа.
Числа записываются с использованием особых
знаковых систем, которые называют системами счисления.
100 → 11001002
Система счисления – совокупность приемов и
правил записи чисел с помощью определенного набора символов.
Все системы счисления делятся на две большие группы:
Двоичное
кодирование текста
Кодирование
– присвоение каждому символу десятичного кода от 0 до 255 или соответствующего
ему двоичного кода от 00000000 до 11111111
Присвоение
символу определенного кода – это вопрос соглашения,
которое фиксируется в кодовой таблице.
В качестве международного
стандарта была принята кодовая таблица ASCII
(American Standard Code for Information Interchange) :
Коды с
0 по 32 (первые 33 кода) - коды операций
(перевод строки, ввод пробела, т.е. соответствуют функциональным клавишам);
Коды с
33 по 127 – интернациональные, соответствуют символам латинского алфавита,
цифрам, знакам арифметических операций, знакам препинания;
Коды с
128 по 255 – национальные, т.е. кодировка
национального алфавита.
на 1
символ отводится 1 байт
(8 бит), всего можно закодировать 28 = 256 символов
С 1997 года
появился новый международный стандарт Unicode,
который отводит для кодировки одного символа 2 байта
(16 бит), и можно закодировать 65536 различных символов (Unicode
включает в себя все существующие, вымершие и искусственно созданные алфавиты
мира, множество математических, музыкальных, химических и прочих символов)
В настоящий момент
существует пять кодировок кириллицы: КОИ-8, CP1251, CP866, ISO,
Mac. Для преобразования текстовых документов из одной кодировки в другую
существуют программы, которые называются Конверторы.
Двоичное
кодирование графики
Кодирование графической
информации
Пространственная
дискретизация – перевод графического изображения из аналоговой формы в
цифровой компьютерный формат путем разбивания изображения на отдельные
маленькие фрагменты (точки) где каждому элементу присваивается код цвета.
Пиксель
– min участок изображения на экране, заданного цвета
Растровое
изображение формируется из отдельных точек - пикселей, каждая из
которых может иметь свой цвет. Двоичный код изображения, выводимого на
экран храниться в видеопамяти. Кодирование рисунка растровой графики
напоминает – мозаику из квадратов, имеющих определенный цвет
Качество
кодирования изображения зависит от:
1) размера точки (чем
меньше её размер, тем больше кол-во точек в изображении);
2) количества цветов
(чем большее кол-во возможных состояний точки, тем качественнее изображение)
Палитра цветов – совокупность используемого набора цвета
Качество
растрового изображения зависит от:
1) разрешающей
способности монитора – кол-во точек по вертикали и горизонтали.
2) используемой палитры
цветов (16, 256, 65536 цветов)
3) глубины цвета –
количество бит для кодирования цвета точки
Для хранения черно-белого
изображения используется 1 бит.
Цветные
изображения формируются в соответствии с двоичным
кодом цвета, который хранится в видеопамяти. Цветные изображения имеют
различную глубину цвета. Цветное изображение на экране формируется за счет
смешивания трех базовых цветов – красного, зеленого и синего. Для получения
богатой палитры базовым цветам могут быть заданы различные интенсивности.
Двоичное
кодирование звука
В
аналоговой форме звук представляет собой волну с непрерывно меняющейся
амплитудой и частотой. На компьютере работать со звуковыми файлами начали с
начала 90-х годов. В основе кодирования звука с использованием ПК лежит –
процесс преобразования колебаний воздуха в колебания электрического тока и
последующая дискретизация аналогового электрического сигнала. Кодирование и
воспроизведение звуковой информации осуществляется с помощью специальных
программ (редактор звукозаписи). Качество воспроизведения закодированного звука
зависит от – частоты дискретизации и её разрешения (глубины кодирования звука -
количество уровней)
Временная
дискретизация – способ преобразования звука в цифровую
форму путем разбивания звуковой волны на отдельные маленькие временные участки,
где амплитуды этих участков квантуются (им присваивается определенное
значение).
Это производится с
помощью аналого-цифрового преобразователя, размещенного на звуковой плате.
Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется
дискретной последовательностью уровней громкости. Современные 16-битные
звуковые карты кодируют 65536 различных уровней громкости или 16-битную глубину
звука (каждому значению амплитуды звук. сигнала присваивается 16-битный
код)
Качество
кодирования звука зависит от:
1) глубины кодирования
звука - количество уровней звука
2) частоты
дискретизации – количество изменений уровня сигнала в единицу времени (как
правило, за 1 сек).
N
– количество различных уровней сигнала
i
– глубина кодирования звука
Информационный объем звуковой информации равен:
I
= i
* k*
t
где i
– глубина звука (бит)
K
– частота вещания (качество звука) (Гц) (48 кГц – аудио CD)
t – время
звучания (сек)
Представление видеоинформации
В последнее время компьютер все чаще
используется для работы с видеоинформацией. Простейшей такой работой является
просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка
видеоинформации требует очень высокого быстродействия компьютерной системы.
Что представляет собой фильм
с точки зрения информатики? Прежде всего, это сочетание звуковой и
графической информации. Кроме того, для создания на экране эффекта движения
используется дискретная по своей сути технология быстрой смены статических
картинок. Исследования показали, что если за одну секунду сменяется более 10-12
кадров, то человеческий глаз воспринимает изменения на них как непрерывные.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.