Моя страничка


Download 1.33 Mb.
bet9/48
Sana07.03.2023
Hajmi1.33 Mb.
#1243704
1   ...   5   6   7   8   9   10   11   12   ...   48
Bog'liq
lections

7.3. Символы


Текстовые данные рассматриваются как последовательность отдельных символов, каждому из которых ставится в соответствие двоичный код некоторого неотрицательного целого числа. Существуют разные способы кодирования символов. Наиболее распространенной до последнего времени была кодировка ASCII (American Standard Code for International Interchange). При использовании этой кодировки для представления символа используется 1 байт (8 разрядов). Таким образом, имеется возможность закодировать 256 различных символов.
Для отображения текстового документа с разбивкой его на строки, выравниванием и другими элементами форматирования, в него наряду с обычными символами включаются специальные (управляющие) символы.
В системе ASCII закреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная от 128 до 255. Первые 32 кода базовой таблицы, начиная с нулевого, содержат управляющие коды. Они не выводятся на экран, но с их помощью можно управлять выводом других данных. С 32 по 127 код размещены символы английского алфавита, цифры, знаки арифметических операций и т. п. Расширенная часть системы кодирования ASCII содержит национальные системы кодирования, т. е. коды с 128 по 255 будут содержать русский алфавит, а также символы псевдографики.
ASCII позволяет закодировать только 256 символов, но в некоторых языках символов больше, поэтому разрабатываются другие коды. Наиболее перспективным является Unicode. В этом коде каждый символ состоит из 16 битов (2 байта), что позволяет кодировать 65536 различных символов. Для каждого алфавита определены свои кодовые позиции. Например, 0100-017F – европейские латинские символы , 0400-04FF – кириллица и т. д. Около 29000 позиций пока не заняты, но зарезервированы для использования. Таким образом, Unicode допускает обмен данными на разных языках, каждому коду соответствует единственный символ, коды для разных языков не пересекаются.
На Unicode построена ОС Windows NT. У Windows95-98 16-битное наследство, поэтому вся внутренняя работа в этой ОС построена на использовании ANS-строк (ANSII – American National Standard Institute), в которых символ записан в один байт. ANSI-текст (или текст ASCII) - это текст без форматирования (с ним работает приложение «Блокнот» в Windows 9x).
Если для представления информации в разных информационных системах используются разные кодировки, то данные, подготовленные в одной системе, не смогут быть использованы в другой.

Download 1.33 Mb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   ...   48




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling