Информационный вес символа — это мера количества информации, которую несет в себе один знак определенного алфавита. В контексте двоичного (бинарного) алфавита этот показатель является базовой единицей измерения в информатике. Понятие двоичного алфавита Двоичный алфавит состоит всего из двух знаков. Обычно их обозначают как 0 и 1. Поскольку набор символов минимален, выбор между ними представляет собой выбор из двух равновероятных событий (да/нет, истина/ложь). Формула Хартли Для определения информационного веса символа используется формула Хартли, которая устанавливает связь между количеством символов в алфавите ( ) и информационным весом одного символа ( ): Где:
- — мощность алфавита (количество знаков в нем). — информационный вес одного символа, измеряемый в битах.
Расчет для двоичного алфавита Применяя формулу к двоичному алфавиту, где : Таким образом, информационный вес символа двоичного алфавита равен 1 биту. Ключевые характеристики 1 бита информации
- Минимальность: Бит является наименьшей единицей измерения информации. Меньше одного бита символ весить не может (в рамках классической теории информации).
- Неопределенность: Получение 1 бита информации полностью устраняет неопределенность при выборе из двух равных возможностей.
- Техническая реализация: В цифровой технике 1 бит соответствует одному физическому элементу памяти или состоянию сигнала (есть ток / нет тока, высокое напряжение / низкое напряжение).
Вес сообщения в двоичном коде Если один символ весит 1 бит, то общий информационный объем сообщения ( ) вычисляется простым умножением количества символов ( ) на вес одного символа ( ): В случае двоичного кодирования информационный объем сообщения в битах численно равен количеству знаков (нулей и единиц), из которых это сообщение состоит. Например, последовательность 10110 содержит 5 символов и имеет объем 5 бит. Я могу составить таблицу сравнения информационного веса символов для алфавитов различной мощности или подготовить задачи на расчет объема текстовых файлов. Сделать это для вас?