Измерение информации. Алфавитный подход.

Как измерить информацию?

Ответ на этот вопрос зависит от того, что мы понимаем под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть различными.

Чтобы измерить расстояние мы используем единицу – метр, массу – килограмм, время – секунда.

Чем же можно измерить информацию?

Рассмотрим  один из подходов измерения информации – Алфавитный подход.

Все множество используемых в языке символов называется алфавитом.

Число символов алфавита  называют мощностью алфавита.

Обычно под алфавитом понимают только буквы, но в тексте могут встречаться знаки препинания, цифры, скобки, пробелы. Мы их тоже включим в алфавит.

Каждый символ текста имеет определенный информационный вес. Он зависит от мощности алфавита.

Каким может быть наименьшее число символов в алфавите?

2 Символа – Двоичный алфавит. (Часто его символы записывают через 1 и 0)

Информационный вес символа двоичного алфавита принят за единицу информации и называется    1 бит.

С увеличением мощности алфавита (N) увеличивается информационный вес (i) символов этого алфавита.

00   –   2 бита

01   –   2 бита

10   –   2 бита

11   –   2 бита

N = 4

000   –   3 бита

010   –   3 бита

100   –   3 бита

110   –   3 бита

001   –   3 бита

011   –   3 бита

101   –   3 бита

111   –   3 бита

N = 8

Четырехзначным двоичным кодом могут быть закодированы  все символы 16 – символьного алфавита и т. д.

N 2 4 8 16
b 1 бит 2 бита 3 бита 4 бита

Информационный вес каждого символа, выраженный в битах (b) и мощность алфавита (N) связаны между собой формулой :

N = 2^i

Информационный объем текста

При создании текстовых документов, чаще всего используются компьютеры. Алфавит из которого составлен такой текст содержит 256 символов. Так как 2^8 = 256 то один символ алфавита «весит» 8 битов.

Величина, равная 8 битам равна 1 байту.

1 байт = 8 бит

Информационный объем текста равен сумме информационных весов всех символов, составляющих текст.

Для измерения больших информационных объемов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта

1 мегабайт = 1 Мб = 1024 Кб

1 гигабайт = 1 Гб = 1024 Мб

Задание:

  1. Найдите информационный объем книги в которой 90 страниц, на каждой странице 2100 символов, а информационный вес каждого символа равен 1 байту. Ответ запишите в битах, байтах, килобайтах.