Методическая
разработка по подготовке к ЕГЭ
Кодирование
текстовой информации. Кодировка ASCII. Основные кодировки кириллицы.
Наумчик
Н.В.
Что нужно знать:
● все
символы кодируются одинаковым числом бит (алфавитный
подход)
● чаще
всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или
16 бит (16-битные)
● при
измерении количества информации принимается, что в одном байте 8 бит, а в одном
килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта
● после
знака препинания внутри (не в конце!) текста ставится пробел
● чтобы
найти информационный объем текста I,
нужно умножить количество символов N
на число бит на символ K:
● две
строчки текста не могут занимать 100 Кбайт в памяти
пример задания:
Определите информационный
объем текста в битах
Бамбарбия! Кергуду!
Решение:
1.
в этом тексте 19 символов (обязательно
считать пробелы и знаки препинания)
2.
если не дополнительной информации,
считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка
8- или 16-битная)
3.
поэтому в сообщении 19*8 = 152 бита информации
пример задания:
В таблице ниже
представлена часть кодовой таблицы ASCII:
Символ
|
1
|
5
|
A
|
B
|
Q
|
a
|
b
|
Десятичный
код
|
49
|
53
|
65
|
66
|
81
|
97
|
98
|
Шестнадцатеричный
код
|
31
|
35
|
41
|
42
|
51
|
61
|
62
|
Каков шестнадцатеричный
код символа «q» ?
Решение:
1.
в кодовой таблице ASCII (American
Standard Code for Information Interchange, американский стандартный код для
обмена информацией) все заглавные латинские буквы A-Z расставлены по
алфавиту, начиная с символа с кодом 65=4116
2.
все строчные латинские буквы a-z
расставлены по алфавиту, начиная с символа с кодом 97=6116
3.
отсюда следует, что разница кодов букв «q»
и «a» равна разнице кодов букв «Q» и «A», то есть, 5116 – 4116=1016
4.
тогда шестнадцатеричный код символа «q»
равен коду буквы «a» плюс 1016
5.
отсюда находим 6116 + 1016=7116.
пример задания:
Автоматическое
устройство осуществило перекодировку информационного сообщения на русском
языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку
КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина
сообщения в символах?
Решение:
1. обозначим количество символов
через N
2. при 16-битной кодировке объем
сообщения – 16*N бит
3. когда его перекодировали в
8-битный код, его объем стал равен– 8*N бит
4. таким образом, сообщение
уменьшилось на 16*N – 8*N = 8*N = 480 бит
5. отсюда находим N = 480/8 = 60
символов.
Условия задач взяты с сайта К.Полякова
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.