0

Единицы измерения данных в информатике

Содержание

Содержание

Мы с вами уже так много говорим о компьютере, программах и их характеристиках, возможных действиях и их последствиях, о файлах и папках, а также многом другом. Вы знаете, что информация записывается на жесткий диск. Она хранится в виде файлов. Но сколько таких файлов сможет вместить Ваш винчестер?

Как узнать ответ на этот вопрос, если не знать, в чем же измеряется информация?

Ответ на этот вопрос Вы узнаете сегодня, если прочитаете данный опус.

Минимальная единица информации — бит

Начнем с малого. Единицы измерения информации ранжируются точно так же, как, к примеру, единицы массы или расстояния. Но если в 1 килограмме 1000 граммов, а в 1 метре 1000 миллиметров, то с измерением информации все немного иначе, хотя принцип и остается тот же.

Чтобы было проще понимать, что такое байт или что такое бит, сперва разберемся с некоторыми основами цифровой информации, то есть той, что хранится и обрабатывается на Вашем компьютере.

Почему цифровая? Сейчас объясню.

Вы можете передавать свои знания и какие-то новости посредством устной речи. Она ведь состоит из гласных и согласных какого-то языка, в нашем случае русского. Компьютер не умеет разговаривать, но и он должен передавать, получать и обрабатывать информацию. Так вот он делает это посредством набора единичек и нолей — двоичного кода. Вся информация, с которой работает Ваш компьютер, выглядит для него примерно вот так: 01 или 0110, или 010110101010. Разумеется, чем больше файл, тем длиннее и эта запись. Кстати, повторите урок о том, что такое файл. По сути, она просто может быть очень длинной, но не бесконечной. Именно поэтому данный вид информации и называется цифровым, т.е. последовательностью единичек и нулей. Замечу, что компьютер может понять только такой язык.

Самой маленькой величиной является бит (анг. BInary digiT – двоичная цифра). Это простейшая величина, которая может хранить лишь одно значение — либо «ноль», либо «единицу». Вот Вам строгое определение того, что такое бит:

Бит — это один двоичный разряд, принимающий одно из двух значений – «0» или «1».

Другими словами, бит – это небольшая емкость, которая хранит в себе самый маленький запас информации.

Не пытайтесь заучивать определение, просто поймите, насколько это мало. Для сравнения, обычная буква в текстовом редакторе для компьютера является набором из 8-ми нолей и единиц, т.е. 8-ми бит.

Для развития Вашей эрудиции скажу, что 0 и 1 — это как «да» (есть сигнал) и «нет» (нет сигнала) для компьютера. Другими словами, это равноценные значения.

Что такое байт

Думаю, все понимают, что измерять всю информацию на винчестере в битах будет очень и очень неудобно. Это все равно, что измерять массу солнца в граммах. Поэтому Вам придется познакомиться с новой величиной и узнать, что такое байт.

Один байт равен восьми бит. Именно восьми, а не десяти, как можно было бы подумать, разумно проводя аналогию с другими единицами измерения. Различных комбинаций ноликов и единичек в одном байте может быть превеликое множество (а точнее – «2» в 8 степени, т.е. 256 вариантов), но этого нам знать совершенно не обязательно. Просто запомним, 1 байт = 8 бит.

Обозначается байт прописной русской буквой «Б».

Производные от «бит»

Прежде, чем рассказать Вам, что такое килобайт, мегабайт, гигабайт и терабайт, упомяну, что существуют и такие единицы, как килобит, мегабит, гигабит и терабит. Вот формулы перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):

1 килобит (Кбит) = 1024 бит («2» в 10 степени бит)

1 мегабит (Мбит) = 1024 килобит («2» в 10 степени килобит)

1 гигабит (Гбит) = 1024 мегабит («2» в 10 степени мегабит)

1 терабит (Тбит) = 1024 гигабит («2» в 10 степени гигабит)

Необычно, правда? Вспомните, что бит — это кодировка из двух цифр. Поэтому все последующие единицы представляют собой кодировку из количества цифр, равную двум в какой-либо степени (зависит от конкретной единицы измерения). Отсюда и такое некруглое значение.

Производные от «байт»

Но исчислять информацию в БИТАХ неудобно, как правило, все применяют «БАЙТЫ». Чаще всего самой популярной единицей измерения количества информации на Вашем компьютере является мегабайт. Если Вы наведете мышкой на любую папку с достаточным количеством информации, то всплывет маленькое пояснительное окошко, где будет указан объем этой папки. Вот таблица перевода одних единиц в другие (жирным шрифтом выделено обозначение величины):

1 килобайт (КБ) = 1024 байт («2» в 10 степени байт)

1 мегабайт (МБ) = 1024 килобайт («2» в 10 степени килобайт)

Читайте также:  Емкость батареи айпад 4

1 гигабайт (ГБ) = 1024 мегабайт («2» в 10 степени мегабайт)

1 терабайт (ТБ) = 1024 гигабайт («2» в 10 степени гигабайт)

Как видно, все аналогично битам.

Объем различных типов файлов

Уверен, многих интересует, как узнать, сколько же информации способен вместить именно Ваш компьютер, а точнее винчестер или жесткий диск. Кстати почитайте перед этим про локальные диски. Я Вас научу самому простому способу это сделать.

Откройте «Мой компьютер». Видите свои локальные диски? Единицы измерения информации, использующиеся для показа количества информации на локальных дисках у всех, как правило, одинаковы. Это гигабайты. Что такое гигабайт мы уже знаем, так что перейдем к подсчету свободного и занятого места на жестком диске. Под каждым диском есть специальное уведомление, где показано, сколько свободного места осталось и сколько всего информации диск может вместить.

Теперь приведу некоторые примеры файлов и их возможные объемы. Это поможет Вам ориентироваться в том, что Вы сможете записать на локальный диск, а что туда уже не влезет. Заметьте, один локальный диск НЕ МОЖЕТ задействовать место другого. Это значит, что файл целиком и полностью должен находиться на одном локальном диске. Есть, правда, специальные программы, позволяющие работать с локальными дисками, но об этом мы будем говорить в другой раз, так как тема сложная и достаточно объемная.

Кстати, различные типы файлов вы можете найти на своем рабочем столе.

Любите слушать музыку? Тогда Вам просто необходимо знать, что один музыкальный трек занимает до нескольких мегабайт объема памяти (в среднем, от 3 до 7). Попробуйте самостоятельно подсчитать, сколько таких мелодий вместит Ваш локальный диск, если на нем есть 1 гигабайт свободного места.

А как на счет того, чтобы посмотреть хороший фильм? Их объем, в зависимости от качества записи и длины трека, может занимать от 700 мегабайт до 1,5 гигабайта.

Для общего развития добавлю, что современные полноформатные игры могут занимать до нескольких десятков гигабайт. Не всякий локальный диск может выдержать такое.

Единицы измерения информации путать не стоит. Четко обращайте внимание на то, сколько места есть и сколько необходимо записать.

Современные жесткие диски могут содержать информацию объемом несколько терабайт. Что очень актуально, ведь качество игр, фильмов и даже музыки растет, что требует постоянного увеличения их информационного объема.

Теперь Вы знаете, что такое байты какие бывают производные от него. Вам известны рамки объема Ваших локальных дисков, а значит, Вы стали лучше понимать работу компьютера.

Единицы измерения информации служат для измерения различных характеристик, связанных с информацией.

Чаще всего измерение информации касается измерения ёмкости компьютерной памяти (запоминающих устройств) и измерения количества данных, передаваемых по цифровым каналам связи. Реже измеряется количество информации.

Содержание

Единицы измерения информации [ править | править код ]

Большой по размеру объём данных может содержать в себе очень малое количество информации. То есть объём данных и количество информации являются разными характеристиками, применяемыми в разных областях, связанных с информацией, но исторически название "количество информации" использовали в значении "объём данных", а для измерения количества информации применяли названия "информационная энтропия" и "ценность информации".

Единицы измерения ёмкости носителей и объёма данных [ править | править код ]

Применяются для измерения ёмкости носителей информации — запоминающих устройств и для измерения объёмов данных.

Единицы измерения количества информации [ править | править код ]

Применяются для измерения количества информации в объёме данных. Информационная энтропия

Первичная единица [ править | править код ]

Первичной характеристикой объёма данных является количество возможных состояний.

Первичной единицей измерения объёма данных является 1 возможное состояние (значение, код).

Вторичные единицы [ править | править код ]

Вторичной характеристикой объёма данных является разряд.

Ёмкость (объём) одного разряда может быть разной и зависит от основания применённой системы кодирования.

Ёмкости одного разряда в двоичной, троичной и десятичной системах кодирования:

Один двоичный разряд (бит) имеет 2 взаимоисключающих возможных состояния (значения, кода).

Один троичный разряд (трит) имеет 3 взаимоисключающих возможных состояния (значения, кода).

Один десятичный разряд (децит) имеет 10 взаимоисключающих возможных состояний (значений, кодов).

Третичные единицы [ править | править код ]

Третичными характеристиками объёма данных являются различные множества разрядов.

Ёмкость множества разрядов равна количеству возможных состояний этого множества разрядов, которое определяется в комбинаторике, равно количеству размещений с повторениями и вычисляется по формуле:

A ¯ ( c , n ) = A ¯ c n = c n <displaystyle <ar >(c,n)=<ar >_^=c^> возможных состояний (кодов, значений)

То есть ёмкость множества разрядов представляет собой показательную функцию от количества разрядов с основанием, равным количеству возможных состояний одного разряда.

1 байт состоит из 8-ми ( n = 8 <displaystyle n=8> ) двоичных разрядов ( c = 2 <displaystyle c=2> ) и может принимать:

A ¯ c n = c n = 2 8 = 256 <displaystyle <ar >_^=c^=2^<8>=256> возможных состояний (значений, кодов).

Логарифмические единицы [ править | править код ]

Когда некоторые величины, в том числе и объём данных, представляют собой показательные функции, то, во многих случаях, удобнее пользоваться не самими величинами, а логарифмами этих величин.

Объём данных тоже можно представлять логарифмически, как логарифм количества возможных состояний [1] .

Объём информации (объём данных) — может измеряться логарифмически. [2] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Для объёмов двоичных данных удобнее пользоваться двоичными логарифмами.

2 1 <displaystyle 2^<1>> возможных состояния, log 2 ⁡ 2 1 = 1 <displaystyle log _<2>2^<1>=1> двоичный разряд = 1 бит 2 8 <displaystyle 2^<8>> возможных состояний, log 2 ⁡ 2 8 = 8 = 2 3 <displaystyle log _<2>2^<8>=8=2^<3>> двоичных разрядов = 1 Байт (Октет) 2 8 ∗ 2 10 <displaystyle 2^<8*2^<10>>> возможных состояния, log 2 ⁡ 2 8 ∗ 2 10 = 8 ∗ 2 10 = 2 13 <displaystyle log _<2>2^<8*2^<10>>=8*2^<10>=2^<13>> двоичных разрядов = 1 КилоБайт (КилоОктет) 2 8 ∗ 2 20 <displaystyle 2^<8*2^<20>>> возможных состояний, log 2 ⁡ 2 8 ∗ 2 20 = 8 ∗ 2 20 = 2 23 <displaystyle log _<2>2^<8*2^<20>>=8*2^<20>=2^<23>> двоичных разрядов = 1 МегаБайт (МегаОктет) 2 8 ∗ 2 30 <displaystyle 2^<8*2^<30>>> возможных состояния, log 2 ⁡ 2 8 ∗ 2 30 = 8 ∗ 2 30 = 2 33 <displaystyle log _<2>2^<8*2^<30>>=8*2^<30>=2^<33>> двоичных разрядов = 1 ГигоБайт (ГигоОктет) 2 8 ∗ 2 40 <displaystyle 2^<8*2^<40>>> возможных состояний, log 2 ⁡ 2 8 ∗ 2 40 = 8 ∗ 2 40 = 2 43 <displaystyle log _<2>2^<8*2^<40>>=8*2^<40>=2^<43>> двоичных разрядов = 1 ТероБайт (ТероОктет)

Читайте также:  В каком формате скачивать фильмы для телевизора

Наименьшее целое число, двоичный логарифм которого целое положительное — это 2. Соответствующая ему единица — бит — является основой исчисления информации в цифровой технике.

Для объёмов троичных данных удобнее пользоваться троичными логарифмами.

3 1 = 3 <displaystyle 3^<1>=3> возможных состояния, log 3 ⁡ 3 1 = 1 <displaystyle log _<3>3^<1>=1> троичный разряд (трит) 3 6 = 729 <displaystyle 3^<6>=729> возможных состояний, log 3 ⁡ 3 6 = 6 <displaystyle log _<3>3^<6>=6> троичных разрядов (тритов) = 1 Трайт.

Единица, соответствующая числу 3, трит равна log23≈1,585 бита.

Такая единица как нат (nat), соответствующая натуральному логарифму применяется в инженерных и научных расчётах. В вычислительной технике она практически не применяется, так как основание натуральных логарифмов не является целым числом.

Для объёмов десятичных данных удобнее пользоваться десятичными логарифмами.

10 1 = 10 <displaystyle 10^<1>=10> возможных состояний, log 10 ⁡ 10 1 = 1 <displaystyle log _<10>10^<1>=1> десятичный разряд = 1 децит 10 10 3 <displaystyle 10^<10^<3>>> возможных состояний, log 10 ⁡ 10 10 3 = 10 3 <displaystyle log _<10>10^<10^<3>>=10^<3>> десятичных разряда = 1 килодецит. 10 10 6 <displaystyle 10^<10^<6>>> возможных состояний, log 10 ⁡ 10 10 6 = 10 6 <displaystyle log _<10>10^<10^<6>>=10^<6>> десятичных разрядов = 1 мегадецит. 10 10 9 <displaystyle 10^<10^<9>>> возможных состояний, log 10 ⁡ 10 10 9 = 10 9 <displaystyle log _<10>10^<10^<9>>=10^<9>> десятичных разрядов = 1 гигадецит.

Единица, соответствующая числу 10, децит равна log210≈3.322 бита.

В проводной технике связи (телеграф и телефон) и радио исторически впервые единица информации получила обозначение бод.

Единицы, производные от бита [ править | править код ]

В целых количествах двоичных разрядов (битов) количество возможных состояний равно степеням двойки.

Тетрада, полубайт, ниббл [ править | править код ]

Особое название имеют четыре двоичных разряда (4 бита) — тетрада, полубайт, ниббл, которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт [ править | править код ]

Измерения в байтах
ГОСТ 8.417—2002 Приставки СИ Приставки МЭК
Название Обозначение Степень Название Степень Название Символ Степень
байт Б 10 0 10 0 байт B Б 2 0
килобайт Кбайт 10 3 кило- 10 3 кибибайт KiB КиБ 2 10
мегабайт Мбайт 10 6 мега- 10 6 мебибайт MiB МиБ 2 20
гигабайт Гбайт 10 9 гига- 10 9 гибибайт GiB ГиБ 2 30
терабайт Тбайт 10 12 тера- 10 12 тебибайт TiB ТиБ 2 40
петабайт Пбайт 10 15 пета- 10 15 пебибайт PiB ПиБ 2 50
эксабайт Эбайт 10 18 экса- 10 18 эксбибайт EiB ЭиБ 2 60
зеттабайт Збайт 10 21 зетта- 10 21 зебибайт ZiB ЗиБ 2 70
йоттабайт Ибайт 10 24 йотта- 10 24 йобибайт YiB ЙиБ 2 80

Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Такие величины как машинное слово и т. п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.

Килобайт [ править | править код ]

Для измерения больших ёмкостей запоминающих устройств и больших объёмов информации, имеющих большое количество байтов, служат единицы «килобайт» = [1000] байт и «Кбайт» [3] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:

  • Сектор диска обычно равен 512 байтам то есть половине Кбайта, хотя для некоторых устройств может быть равен одному или двум кибибайт.
  • Классический размер «блока» в файловых системахUNIX равен одному Кбайт (1024 байт).
  • «Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт [ править | править код ]

Единицы «мегабайт» = 1000 килобайт = [1 000 000] байт и «мебибайт» [3] (mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт [ править | править код ]

Единицы «гигабайт» = 1000 мегабайт = [1 000 000] килобайт = [1 000 000 000] байт и «Гбайт» [3] (гибибайт, gibibyte) = 1024 Мбайт = 2 30 байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт и тебибайт (10 12 и 2 40 байт соответственно), петабайт и пебибайт (10 15 и 2 50 байт соответственно) и т. д.

Читайте также:  Восстановить значок питания на панели задач

Что такое «байт»? [ править | править код ]

В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти, который на старых машинах не обязательно был равен 8 битам (а память не обязательно состоит из битов — см., например: троичный компьютер). В современной традиции, байт часто считают равным восьми битам.

В таких обозначениях как байт (русское) или B (английское) под байтом (B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории.

Во французском языке используются обозначения o, Ko, Mo и т. д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.

Чему равно «кило»? [ править | править код ]

Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:

  • двоичными кратными единицами, обозначаемыми согласно ГОСТ 8.417-2002 как «Кбайт», «Мбайт», «Гбайт» и т. д. (два в степенях кратных десяти);
  • единицами килобайт, мегабайт, гигабайт и т. д., понимаемыми как научные термины (десять в степенях, кратных трём),

эти единицы по определению равны, соответственно, 10 3 , 10 6 , 10 9 байтам и т. д.

В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т. д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т. д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.

В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц.

В английском языке для «киби»=1024=2 10 иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опирается на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».

Единицы представления данных

Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд). Совокупность двоичных разрядов, выражающих числовые или иные данные, образуют некий битовый рисунок. Практика показывает, что битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называют байтами.

Десятичное число Двоичное число Байт
0000 0001
0000 0010
1111 1111

Понятие о байте как о группе взаимосвязанных битов появились вместе с первыми образцами электронной вычислительной техники. Долгое время понятие байта было машинно-зависимым, то есть в различных вычислительных машинах длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным и машинно-независимым.

Выше мы видели, что во многих случаях целесообразно использовать не восьмиразрядное кодирование, 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16-ти взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группа из четырёх взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группа из восьми байтов (64 разряда) – учетверённым словом.

Существует много систем и единиц измерения данных. Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные и традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют универсальное двоичное представление и поэтому вводят свои единицы данных, основанные на нём.

Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объёму в символах (пока исключение составляет универсальная кодировка UNICODE).

Более крупная единица – килобайт (Кбайт). Условно можно считать 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 2 10 байт (1024 байт).

В килобайтах измеряют сравнительно небольшие объёмы данных. Условно можно считать, что одна страница неформатированного машинного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-, пента-, экса-, зета-, йотта-.

Единицы Значения Метрический аналог
1 Кбайт 1024 байта (2 10 ) 1000 (10 2 )
1 Мбайт 1024 Кбайт (2 20 ) 1000000 (10 6 )
1 Гбайт 1024 Мбайт (2 30 ) 10 9
1 Тбайт 1024 Гбайт (2 40 ) 10 12
1 Пбайт 1024 Тбайт (2 50 ) 10 15
1 Эбайт 1024 Пбайт (2 60 ) 10 18
1 Збайт 1024 Эбайт (2 70 ) 10 21
1 Йбайт 1024 Збайт (2 80 ) 10 24

Особо обратим внимание на то, что при переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округления производятся реже.

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Увлечёшься девушкой-вырастут хвосты, займёшься учебой-вырастут рога 9821 – | 7687 – или читать все.

78.85.5.224 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.

Отключите adBlock!
и обновите страницу (F5)

очень нужно

admin

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *