0

Информационный вес символа это в информатике

Алфавитный подход к измерению информации

Каждый символ некоторого сообщения имеет определённый информационный вес – несёт фиксированное количество информации.

Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит (bit)».

Информационный вес символа произвольного алфавита

• Алфавит любого языка можно заменить двоичным алфавитом.

• Для кодирования N символов произвольного алфавита требуется i -разрядный двоичный код

• Информационный вес символа = разрядность двоичного кода.

• Мощность алфавита и информационный вес символа алфавита: N =2 i

Информационный объем сообщения

Информационный объём I сообщения равен произведению количества K символов в сообщении на информационный вес i символа алфавита:

К – Число символов в символьном сообщении

I – Количество информации в символьном сообщении

Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение: Составим краткую запись условия задачи.

Известно соотношение, связывающее величины

С учетом исходных данных: 8 = 2 i . Отсюда: i = 3.

Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

N = 32, I = K i, N = 2 i

32 = 2 i , i = 5, I = 140 5 = 700 ( битов )

Ответ: 700 битов

Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

I = 720; K = 180; N – ?

N = 2 i , I = K i, i = I/K

i = 720/180 = 4 (бита); N = 2 4 = 16 (символов)

Nav view search

Навигация

Искать

Новости

Учебники

Как пользоваться:

Счетчики

Сайт участвует

Подробности Опубликовано 07.02.2012 18:19 Просмотров: 22257

§4.Измерение информации

О сновные темы параграфа;

алфавитный подход к измерению и нформации;

информационный вес сим вола;

информационный объем текста и единицы информаци и.

А теперь обсудим вопрос о том, как можно измерять ин­формацию, Существует несколько подходов к измерению ин­формаци и. Здесь мы рассмотрим только один , который назы­вается алфавитным подходом .

Алфавитный подход к измерению информации

Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эта­лонные единицы . Для расстояния — это метр, для массы — килограмм, для времени — секунда . Измерение происходит путем сопоставления измеряемой величины с эталонной еди­ницей, Сколько раз эталонная единица укладывается в изме­ряемой велич ине, таков и резуль тат измерения. Следова ­тельно, и для измерения информации должна быть введена своя эталонная единица.

Алфавитный подход позволяет измерять информацион­ный объем текста на некотором языке (естественн ом или формальном), не связанный с содержанием этого текста.

Алфавит . М ощность алфавита

Под алфавитом мы будем понимать набор букв, знаков препинания , цифр , скобок и др . символов, используемых в тексте. В алфавит также следует включить и пробел, т . е. пропуск между словами.

Полное число символов в алфавите принято называть мощностью алфавит а . Будем обозначать эту величину бук ­вой N. Например , мощность алфавита из русских букв и от­меченных дополнит ельных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки , пробел .

Читайте также:  Как в контакте сделать фотоальбом

И нформацион ный вес символа

При алфавитном подходе считается, что каждый символ текста имеет определенный и н фор м ационны й ве с, Информа­ционный вес символа зависит от мощности алфавита . А ка­ким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете , что такой алфавит ис­пользуется в компьютере . Он содержит всего 2 символа, ко ­торые обозначаются цифрами «0» и «1». Его называют дво­ичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно пред­ставить любую информаци ю.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается инфор­мационный вес символов этого алфавита . Так один символ из четырех символь ного алфавита (N = 4) «весит » 2 бита. Объяс­нение этому можно дать следующее: все символы такого ал­фавита можно закодировать всеми возможными комбинаци­ями из двух цифр двоичного алфавита. Комбинацию из не­скольких (двух , трех и т. д .) знаков двоичного алфавита назовем двоичным кодом.

Используя три двоичные цифры, можно составить 8 раз­личных комбинаций .

Следовательн о , если мощность алфавита равна 8 , то ин ­ формационный вес одного символа равен 3 битам .

Четырехзначным двоичным кодом может быть закодиро­ван каждый символ из 1 6-символьного алфавита. И так далее .

Найдем зависимость между мощностью алфавита ( N) и количеством знаков в коде (b) — разрядностью двоичного кода.

Разрядность двоичного кода — это и есть информацион­ный вес символа.

Информационный вес каждого символа, выраженный в битах ( b ) , и мощность алфавита (N) связаны между собой формулой: N= 2 b .

Информационный объем текста складывается из информа­ционных весов составляющих его символо в. На п ример, следу­ющий текс т, записанный с помощью двоичного алфави т а:

110100101100010111001010 1 101000111010010

содержит 40 символов , следовательно, его информационный объем равен 40 битам .

Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит , из которого составля­ется такой « компьютерный текст , содержит 25 6 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы , цифры, знаки арифметических операций, всевозможные скобк и, знаки препинания и пр.

Поскольку 256 = 2 8 , то один символ компьютерного алфа­ в ита «в есит » 8 битов . Причем 8 битов информации — это на­столько характерная величина, что ей даже присвоили свое название — байт .

Легко подсчитать информационный объем текста , если известно, что информационный вес одного символа равен 1 байту . Надо просто сосчитать число символов в тексте. По­лученное значение и будет информационным объемом тек­ста, выраженным в байтах .

Например, небольшая книжка , подготовленная с помо­щью компьютера , содержит 150 страниц. На каждой страни ­це — 40 строк, в каждой строке — 60 символов (включая пробелы между словами) . Значит, страница содержит 40 х 60 = 2400 байтов информации . Для вычисления инфор­мационного объема всей книги нужно полученную величину умножить на число страниц;

2400 байтов * 150 = 360 000 байтов.

Читайте также:  Доминтерзет официальный сайт личный кабинет

Уже на таком примере видно, что байт — «мелкая » еди­ница. А представьте, если нужн о, например , измерить ин­формационный объем целой библиотеки? В байтах это ока­жется громадным числом!

Для измерения больших информационных объемов ис­пользуются более крупные единицы:

Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчи­тать точнее, то получится:

360000/1024 = 351,5625 Кб.

351,5625/1024 = 0,34332275 Мб.

В заключение еще раз обратим внимание на важное свойст­во рассмотренного здесь алфавитного подхода. При е го ис­пользовании содержательная сторона текста в учет не берет­ся. Текст » состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объе м.

Коротко о главно м

Алфавитный подход — это способ измерения информаци ­онного объема текста , не связанного с его содержанием .

Алфавит — это вся совокупность символо в, используемых в некотором языке для представления информации. Мощ­ность алфавита — это число символов в нем .

1 бит — информационный вес одного символа двух символьного алфавита (N = 2).

Информационный вес символа (разрядность двоичного кода) (b) и мощность алфавита (N) связаны формулой: N = 2

Информационный объем текста равен сумме информаци­онных весов всех символов, составляющих текст .

1 байт — информационный вес символа и з алфавита мощ­ностью 2 8 = 256 символов. 1 байт — 8 бито в.

Ба йт, килобайт , мегабайт, гигабай т — единицы измере­ния информации. Каждая следующая единица больше пре ­дыдущей в 1024 (2 10 ) раза .

Вопросы и задания

Чему вы должны научиться , изучив главу 1

Разл ичать декларативные и процедурные знания . Называть виды информационных процессов. Определять информационный объем текста . Переводить количество информации из одних единиц в другие.

Идёт приём заявок

Подать заявку

Для учеников 1-11 классов и дошкольников

Алфавитный подход к измерению информации.

Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.

Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.

Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.

Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».

За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.

1.6.2. Информационный вес символа произвольного алфавита

Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2 i.

Читайте также:  Вконтакте важные друзья по какому принципу определяются

Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i.

Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение. Составим краткую запись условия задачи.

Известно соотношение, связывающее величины i и N: N = 2 i.

С учётом исходных данных: 8 = 2 i. Отсюда: i = 3.

Полная запись решения в тетради может выглядеть так:

1.6.3. Информационный объём сообщения

Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K * i.

Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

1.6.4. Единицы измерения информации

В наше время подготовка текстов в основном осуществляется с помощью компьютеров. Можно говорить о «компьютерном алфавите», включающем следующие символы: строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и др. Такой алфавит содержит 256 символов. Поскольку 256 = 28, информационный вес каждого символа этого алфавита равен 8 битам. Величина, равная восьми битам, называется байтом. 1 байт — информационный вес символа алфавита мощностью 256.

1 байт = 8 битов

Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта = 210 байтов

1 мегабайт = 1 Мб = 1024 Кб = 210 Кб = 220 байтов

1 гигабайт = 1 Гб = 1024 Мб = 210 Мб = 220 Кб = 230 байтов

1 терабайт = 1 Тб = 1024 Гб = 210 Гб = 220 Мб = 230 Кб = 240 байтов

Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?

Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?

Решение. Номера 128 участников кодируются с помощью двоичного алфавита. Требуемая разрядность двоичного кода (длина цепочки) равна 7, так как 128 = 27. Иначе говоря, зафиксированное устройством сообщение о том, что промежуточный финиш прошёл один велосипедист, несёт 7 битов информации. Когда промежуточный финиш пройдут 80 спортсменов, устройство запишет 80 • 7 = 560 битов, или 70 байтов информации.

admin

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *