Информационный объем текста:
Информационный объем текста складывается из информационных весов составляющих его символов, Например, следующий текст, записанный с помощью двоичного алфавита:
1101001011000101110010101101000111010010
содержит 40 символов, следовательно, его информационный объем равен 40 битам.
Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит, из которого составляется такой «компьютерный текст», содержит 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и пр.
Поскольку 256 = 28, то один символ компьютерного алфавита «весит» 8 битов. Причем 8 битов информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 битов.
Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.
Например, небольшая книжка, подготовленная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов (включая пробелы между словами). Значит, страница содержит 40 х 60 = 2400 байтов информации. Для вычисления информационного объема всей книги нужно полученную величину умножить на число страниц:
2400 байтов · 150 = 360 000 байтов.
Уже на таком примере видно, что байт — «мелкая» единица. А представьте, если нужно, например, измерить информационный объем целой библиотеки? В байтах это окажется громадным числом!
Для измерения больших информационных объемов используются более крупные единицы:
1 килобайт = 1 Кб = 210 байтов = 1024 байта
1 мегабайт = 1 Мб = 210 Кб = 1024 Кб
1 гигабайт = 1 Гб = 210 Мб = 1024 Мб
Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчитать точнее, то получится:
360000/1024 = 351,5625 Кб.
351,5625/1024 - 0,34332275 Мб.
В заключение еще раз обратим внимание на важное свойство рассмотренного здесь алфавитного подхода. При его использовании содержательная сторона текста в учет не берется. Текст, состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объем.