Введение в теорию систем счисления. Представление информации
в ЭВМ.
Раздел 1.01
Определение.
Система счисления
– способ записи чисел с помощью заданного набора специальных знаков – цифр.
Раздел 1.02
История чисел.
1)
Арифметика каменного века – глиняные фигурки.
2)
Числа начинают получать имена (20-25 тыс лет назад)
·
Сахалин (нивхи) – одно число называется по-разному
в зависимости от формы.
·
Общие названия чисел. Сначала только 1 и 2.
1-Сонце, 2 – крылья, уши, 1 – я, 2 – ты.
·
Много.
·
Новая Гвинея – 1 – урапун, 2 – окоза., 3 –
урапун-окоза, 4 – окоза – окоза, после 6 – много. Мы говорим похоже –
триста, пятьсот.
·
Тройка. Раньше вместо 3 говорили – много, отсюда –
«Обещанного 3 года ждут», «Я тебе 3 раза должна повторять», «3-девять земель».
ПРИДУМАТЬ САМИМ примеры на число 3: 3 богатыря, 3 царства, 3 сына, 3 головы, 3
царства - небесное, земное, подземное, 3 раза перекрестился, сплюнуть 3 раза.
·
Четверка – после нее менялся падеж.
·
Пять. Количество пальцев., Русский – пять=пясть.
·
Семь. Семеро одного не ждут, семь раз отмерь – один
раз отрежь, Семь бед – один ответ.
·
Десять – десять пальцев.
·
Сорок – сороконожка, 40 дней был потоп, сорок
сороков, в пуде 40 фунтов, в бочке 40 ведер.
·
Шестьдесят - у шумеров и вавилонян и у греков. 60
минут, секунд.
·
Тьма. 1000 – 5-7 тыс лет назад
3)
Счет десятками.
·
Счет связан с пальцами ‑ на древнегреческом –
считать=пятерить, дюйм, пядь, локоть
·
Миклухо-Маклай в Новой Гвинее объяснял когда придет
«Витязь». 3 пальца первого человека, 4 пальца второго человека, 2 пальца
третьего=342
·
Вместо пальца второго человека – говорим десять
(дцать). Двадцать, семьдесят., т.е. считаем десятками.
·
Вместо пальца третьего человека – говорим сто.
4)
12-ричная система и 20-ричная.
·
Дюжина, гросс – дюжина дюжин.
·
Сервизы, 12 богов у греков, 12 подвигов Геракла,
Гулливер в 12 раз больше, 12 месяцев, в фунте 12
унций, в футе 12 дюймов.
·
Суставы – шумеры.
5)
Возврат к двоичной системе счисления.
6)
Изображения чисел.
·
Сперва не умели писать.
·
5 тыс лет назад догадались, что можно одним значком
обозначить сразу много предметов.
·
Египет -
-единица,
-десяток,
- сто,
- тысяча
(лотос),
- десять тысяч,
- сто тысяч,
–миллион (ЭТО БЫЛА НЕПОЗИЦИОННАЯ СИСТЕМА).
·
Россия – буквы+титло. Первые 9 букв – единицы,
потом – десятки, последние - сотни.
·

·
Рим – I=1, V=5, X=10, L=50, C=100, D=500, M=1000
·
Арабы – 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Раздел 1.03
Непозиционные системы счисления.
·
Римская форма записи чисел использует значки.
·
Число обозначается набором стоящих подряд знаков, с
учетом сложения и вычитания. Если меньшее стоит перед большим, то оно
вычитается из него, если после большего – то складывается. Например, IV,
VI, IX, XI, XIX, XXI.
Раздел 1.04
Позиционные системы счисления.
·
Первая позиционная система появилась в Вавилоне.
·
Значение цифры зависит от ее места (позиции в
числе).
·
Это стало возможно, благодаря открытию нуля. Все
пользовались позиционными системами счисления, но для обозначения новых
разрядов нужны новые картинки. Архимед мог называть, но обозначать не
умел.
·
Первый нуль придумали вавилоняне 2 тысячи лет
назад, но они обозначали только пропущенные числа в середине.
·
В Индии 1,5 тысячи лет назад додумались писать нули
в конце числа.
·
В нашей стране нуль известен всего лишь с 18 века.
·
Рассмотрим числа 135, 315, 531.
Раздел 1.05
Как идет счет?
1)
Десятками
·
0, 2, 3, ……9 все, кончилось, теперь еще одна цифра
– новый разряд – 10, теперь крайняя правая цифра обозначает единицы, а левая –
десятки.
·
Опять считаем – 97, 98, 99, все, дальше 100.
·
Значит, каждое последующая цифра обозначает новый
разряд – десятки, сотни, тысячи и т.д.,
·
135 = 1*100+3*10+5 = 1*10+3*10+5*10
·
Пронумеруем каждую цифру, начиная с нуля справа
налево. Эти номера совпадают с разрядами.
·
10 основание системы счисления – количество
различных знаков, которые используются для изображения цифр.
·
135,6= 1*100+3*10+5+6*0,1
2)
Пятерками
·
Числа 0, 1, 2, 4. Все кончились числа. Значит,
добавляем впереди цифру, которая теперь считает количество пятерок. 11=1
пятерка и 1 единица. Всего – 6. 1 пятерка, 2-я пятерка, 3-я пятерка, 4-я
пятерка, 5-я пятерка, кончились цифры, получилось 25, значит добавляем еще одну
цифру впереди. 234= 2 двадцатипятерки, 3 пятреки и 4 единицы=69.
3)
Двойками.
·
Числа 0, 1. Все кончились. Теперь добавляем впереди
цифру. 10 и 11. 10 – одна двойка и ноль единиц, 11=1 двойка и 1 единица.
Кончились цифры. Добавляем вереди 1. 100 и т.д.
4)
Единая формула представления числа в позиционной
системе счисления
,
где m – основание системы счисления
Раздел 1.06
Принцип хранения информации в компьютере
·
По иронии судьбы все элементные составляющие ЭВМ
имеют всего 2 устойчивые составляющие – диод открыт-закрыт,
триггер-открыт-закрыт, магнитный домен на дискете – повернут-развернут, свет от
лазерной поверхности отражается-не отражается и т.д. Получается единый принцип
представления информации в компьютере – последовательность сменяющих друг друга
двоичных состояний «да-нет».
·
Эти состояния для людей проще описывать единицей и
нулем. Можно было бы договориться и кодировать информацию буквами «А-Б», но,
договорились кодировать нулем и единицей. На самом деле никаких нулей и единиц
в компьютере нет, есть напряжение больше и меньше, есть отсутствие или наличие
сигнала и тому подобное.
·
Информация бывает текстовой, графической, звуковой,
тактильной, обонятельной. Мы используем компьютер для обработки
информации любой, кроме обонятельной.
·
Любую информацию можно изобразить некими символами.
Например, текстовая – буквы, музыка – ноты. А также знаки дорожного движения,
сигналы флажками, красный цвет светофора и прочее.
·
Но помним, что компьютер может работать только с
двумя символами - 0 и 1. Значит, придется придумывать правила записи различной
информации с помощью двух составляющих. Например, азбука Морзе – точка, тире.
Так и придумали со временем различные алгоритмы оцифровки текста, звука,
графики и осязательной информации.
·
И теперь мы можем с помощью единицы и нуля
представить любую информацию. А значит, мы можем различной природы информацию
хранить и обрабатывать в одном устройстве. Так на диске можно иметь и рисунки и
музыку. И в ОЗУ попадет тоже последовательность единиц и нулей. А чтобы
правильно обработать эту последовательность, нужны соответствующие программы,
которые по разному будут воспринимать цепочку из ноликов и единичек.
·
Лучшая ли двоичная система? Чем больше основание
системы счисления, тем меньше требуется число разрядов для представления числа,
а значит для его передачи и хранения (на диск больше влезет). Однако с ростом
основания повышаются требования к аппаратуре создания и распознавания символов,
логические элементы должны иметь больше устойчивых состояний. Поэтому
целесообразно выбрать систему счисления, обеспечивающую минимум произведения
основания системы счисления и количества разрядов. Обычно берут большое число,
например, 60 000 и записывают в различных системах
счисления, подсчитывая m и l.
·
m
|
·
l
|
·
m*l
|
·
1
|
·
60000
|
·
60000
|
·
2
|
·
16
|
·
32
|
·
3
|
·
10
|
·
30
|
·
4
|
·
8
|
·
32
|
·
8
|
·
6
|
·
48
|
·
10
|
·
5
|
·
50
|
·
16
|
·
4
|
·
64
|
·
60000
|
·
1
|
·
60000
|
·
Как видно лучшая система
троичная. С точки зрения физической реализации мы не можем
сейчас использовать троичную систему.
Раздел 1.07
Количество информации
1)
Теория
·
Объем файлов приятно измерять в битах. Почему?
·
На самом деле в битах измеряется не объем файлов, а
количество информации.
·
Вообще-то принято количество информации измерять по
степени изменения тезауруса приемника.
·
Но возможны варианты: приемник не воспринимает
информацию, т.к. тезаурус его слишком мал, приемник воспринимает информацию,
приемник не нуждается в информации.
·
В 1948 году Клод Шеннон вел математическое понятие
количества информации. Идея такова: информация устраняет неопределенность, а
неопределенность поддается измерению. Идеализированную модель неопределенной
ситуации называют опытом.
·
Например, опыт. Пусть в урне 1 шар. Исход опыта заранее
предопределен, опыт неинформативен, количество информации=0. Если в урне два
шара – черный и белый. Исходы опыта равновероятны и равны=1/2. При изымании
информации неопределенность снимется вообще. При увеличении количества исходов
опыта, степень неопределенности возрастает, а значит возрастает количество
информации о наступлении исхода.
·
Значит, численная мера неопределенности
пропорциональна количеству возможных исходов опыта. Значит, можно было бы
написать I=n, где n- количество исходов. Но при n=1, I=0, значит,
I=log n – мера информации.
·
Определение – за единицу информации принимают
количество информации, заключенной в выборе одного из двух равновероятных
событий, т.е. при сужении неопределенности вдвое.
·
Значит, при n=2, I=1, отсюда формула Хартли:
·
Ввообще то полная формула такая

·
Единица информации называется двоичной единицей или
битом (binary digit-bit)
·
Бит не единственная единица информации. При
количестве исходов=10, мы получаем дит. 1дит=3,32 бит, 1 нит=1,44 бит (число e).
2)
Применение в ЭВМ
·
Как это все может быть приложено к проблемам
обработки информации на ЭВМ?
·
Сообщение фиксируется как последовательность слов,
составленных из символов (знаков алфавита).
·
Появление каждого символа равносильно исходу опыта,
состоящего в случайном выборе символа из алфавита.
·
Для русского языка на 1 знак сообщения приходится
1,21 бит (вспомним, чтовASCII – 8 бит), в немецком – 1,6 бит.
·
В технических системах в алфавите всего 2 символа.
Поэтому на каждый символ приходится 1 бит информации.
·
Так фатально сложилось, что теория информации
(информатики), придуманная гораздо раньше ЭВМ нашла свое блестящее применение и
подтверждение в вычислительных системах. Просто так сложилось, что единица
информации оказалась пригодной напрямую для измерения объемов информации,
хранящейся на электронных носителях.
Оставьте свой комментарий
Авторизуйтесь, чтобы задавать вопросы.