Представление
текстовой информации в памяти компьютера
Текст
состоит из символов - букв, цифр, знаков препинания и
т.
д., которые компьютер различает по их двоичному коду.
Соответствие
между изображениями символов и кодами символов устанавливается с помощью кодовых
таблиц.
0 – 32 - управляющие символы
ASCII 33 – 127 – латинские буквы, знаки
препинания, цифры, знаки арифметических операций
128 – 256 – буквы национального алфавита
Представление текстовой информации в памяти
компьютера
Коды русских букв в разных
кодировкахФрагмент кодовой таблицы ASCII
Символ Десятичный Двоичный КодировСимвол ка Десятичный Двоичный
СимволСоотвеПробел тс твие междкод32 Windowsу из00ображ100000код ениям0 и символов код48КОИ и ко-8дами 00110000код символо! в устанавлидесятичн33 ваетый 00ся с по100001двои мощьчный 1ю кодедовых тасятичный 49 блдвицоичный код.00110001
код код код
# 35 00100011 2 50 00110010
$ 36 ? 001001001100 00003 ? 51 1110000100110011 А
*Б 42 ? 001010101100 00014 ? 52 1110001000110100
=В 43 194 001010111100 00105 247 53 1111011100110101
, 44 00101100 6 54 00110110
- 45 00101101 7 55 00110111
_ 46 00101110 8 56 00111000
/ 47 00101111 9 57 00111001
A
65 010000001 N 78 01001110
B
66 01000010 O 79 010001111 C 67 01000011 P 80 01010000
Стандарт
кодирования символов Unicode позволяет пользоваться более чем двумя языками.
В Unicode каждый символ кодируется шестнадцатиразрядным
двоичным кодом.
Такое количество разрядов позволяет закодировать 65 536 различных символов:
216 = 65 536.
текста
I - информационный объём сообщения K – количество символов i – информационный вес символа
В
зависимости от разрядности используемой кодировки информационный вес символа
текста, создаваемого на компьютере, может быть равен:
•8 битов (1 байт) - восьмиразрядная кодировка;
•16 битов (2 байта) - шестнадцатиразрядная кодировка.
Информационный
объём фрагмента
текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для
записи фрагмента оговорённым способом кодирования.
текста
Задача 1. Считая, что каждый символ кодируется одним байтом,
определите, чему равен информационный объём следующего высказывания
Жан-Жака Руссо:
Тысячи путей ведут к
заблуждению, к истине - только один.
Решение
В данном
тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ
кодируется одним байтом. Следовательно, информационный объём всего текста - 57
байтов.
Ответ: 57 байтов.
текста
Задача 2. В кодировке Unicode на каждый символ отводится два
байта. Определите информационный объём слова из 24 символов в этой кодировке.
Решение.
I = 24 2 = 48 (байтов).
Ответ: 48 байтов.
текста
Задача
4. Выразите
в мегабайтах объём текстовой информации в «Современном словаре иностранных
слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по
80 символов (включая пробелы). Считайте, что при записи использовался алфавит
мощностью 256 символов.
Решение
K = 740 80 60 I
= K i
N = 256 N
= 2i
I - ?
256
= 2i = 28, i = 8
К =
740 80 60 8 = 28 416 000 бит = 3 552 000
байтов = = 3 468,75 Кбайт 3,39 Мбайт.
Ответ: 3,39 Мбайт.
Вставьте
недостающие слова
Текст
состоит из символов - _________________и т. д., которые человек различает по
начертанию. Компьютер различает вводимые символы по их двоичному коду.
Соответствие между изображениями и кодами символов устанавливается с помощью _______________
таблиц.
В
зависимости от разрядности используемой кодировки информационный вес символа
текста, создаваемого на компьютере, может быть равен:
• __________(1 байт) - восьмиразрядная
кодировка;
• 16 битов (______байта) - шестнадцатиразрядная
кодировка.
Информационный
объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов),
необходимых для записи фрагмента оговорённым способом кодирования.
Информационный вес символа
8 битов 16
битов
ASCII Windows КОИ-8 Unicode
I = K x i
I - информационный объём сообщения K – количество символов i – информационный вес символа
Вопросы и задания
Считая, чтВ какой кодировочной каждый
символ кодируется одним байтом, таблице можно закодировать 65
536Сообщение занимает различныхопределите, чему равен
информационный объём символов?2 страниц по 2 строк, в каждой
1)Почему кодировки,В текстовом режиме экран монитора компьютера обычно
строке записано по ASCII следующего в8 которых каждый символ кодируется
символов. Информационный объём высказывания: цепочкой из восьми нулей и единиц,
называются иначе всего сообщения равен 64 бита. Сколько двоичных
2)
Длина
данного текста разрядов
было использовано на кодирование одного Windowsразбивается на 25однобайтовыми?
строк по 80 символов в строке. - 32 символа.
Определите объём текста, занимающего
весь экран символа?
3)
1) 32КОИ байта
-8 монитора, в кодировке Unicode.
4)
2 272Unicode
бита
3)
0.033203125
Кбайт
4)
34 байта
Белоснежка
и семь гномов…
Гулливер и лилипуты…
Компьютер и память…
Что может объединять не
только эти пары, но и все эти объекты?
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.