«Анализ методов кодирования данных»

Целью индивидуального проекта

bet	2/12
Sana	16.06.2023
Hajmi	448.45 Kb.
	#1515664
Turi	Реферат

1 2 3 4 5 6 7 8 9 ... 12

Bog'liq
ИНЛ Ахмедов Неъматуллох 026 19

Глава 1. Сущность кодирования информации Основные определения кодирования. Алфавит кодирования

Целью индивидуального проекта: является изучение и анализ методов кодирования данных.

В связи с поставленной целью индивидуального проекта, были определенны нижеследующие задачи:

Рассмотреть основные определения и анализ кодирования данных.
Алфавит кодирования;
Изучить способ кодирование информации с помощью систем счисления;
Охарактеризовать способы кодирования текстовой информации;
Выявить способы кодирования целых и действительных чисел;
Рассмотреть кодирование графических данных;
Проследить особенности кодирования звуковой информации.

Объектом исследования индивидуального проекта является система кодирования данных.

Предметом исследования индивидуального преокта является анализ методов и приемов кодирования данных.

Глава 1. Сущность кодирования информации

Основные определения кодирования. Алфавит кодирования

Чтобы автоматизировать работу с различными типами данных, необходимо унифицировать форматы их представления. Обычно это делается с помощью кодирования, которое представляет один тип данных другим типом данных.

Существует множество различных концепций и определений понятия "код". Однако в нашей работе мы используем следующие рекомендации". Код — это "набор знаков, символов и правил для представления информации".

В частности, можно различать двоичный и троичный код. Алфавит первого ограничен двумя символами (0, 1), а второго – тремя символами (-1, 0, +1). Сигналы, реализующие коды, обладают одной из следующих характеристик:

униполярный код (значения сигнала равны 0, +1, либо 0, -1);
полярный код (значения сигнала равны +1, -1);
биполярный код (значения сигнала равны 0, +1, -1).

Кодируемые элементы входного алфавита обычно называются символами. В качестве символов обычно используются цифры, буквы, знаки препинания, символы естественного языка, пробелы, специальные символы и символы манипуляции. Управляющие символы (непечатные символы) также учитываются.

Кодирующий (маркирующий) элемент выходного алфавита называется символом, количество различных символов в выходном алфавите называется объемом кода, а количество символов в кодовой последовательности для одного символа называется количеством цифр.
Последовательный код — это код, символы которого последовательны во времени. Параллельный код — это код, в котором символы передаются одновременно для формирования знака.
Естественный человеческий язык — это система кодирования понятий для выражения мыслей с помощью речи. С языком тесно связан алфавит. Алфавит — это система, которая кодирует элементы языка графическими символами.
Естественный язык имеет много избыточности для экономии ограниченной памяти, и имеет смысл устранить избыточность в тексте или компактном тексте.
Сжатие текста может быть выполнено несколькими способами
1. Переход от естественной нотации к более компактной. Этот метод используется для сжатия дат, номеров предметов, адресов и т.д. Концепция этого метода проиллюстрирована на примере сжатия файла даты. Обычно даты записываются в формате 10. 05. 01. и требуют 6 байт памяти компьютера. Однако очевидно, что 5 бит достаточно для представления дня, 4 бит для представления месяца и максимум 7 бит для представления года, т.е. вся дата может быть записана в 16 битах или 2 байтах.
2. Подавление повторяющихся символов. Различные информационные тексты часто содержат цепочки повторяющихся символов, например, пробелы или нули в числовых полях; если есть группа повторяющихся символов длиной более трех символов, длина может быть сокращена до трех символов. Группа повторяющихся символов, сжатая таким образом, становится триадой S P N , где S - повторяющийся символ, P N - повторяющийся символ, и N - повторяющийся символ; где S - повторяющийся символ, P - повторяющийся символ, и N - количество повторений, закодированных в трехступенчатом аргументе. Другие системы подавления повторяющихся символов используют особенности кодов DKOI, KOI-7 и KOI-8, и большинство комбинаций битов, разрешенных в этих кодах, не используются для представления символьных данных.
3. Кодирование наиболее часто используемых элементов данных. Этот метод сжатия данных также использует неиспользуемые кодовые комбинации DCOI. Для кодирования имен людей, например, можно использовать 2-байтовую комбинацию диграфа PN, где P - атрибут кодирования имени, а N - номер имени. Он может кодировать 256 имен людей, что обычно достаточно для информационных систем. Другой метод - найти наиболее часто встречающиеся в тексте комбинации символов или слов и заменить их неиспользуемыми байтами кода DCOI.
4. Символьное кодирование; 7 и 8-битные коды не могут кодировать символьную информацию в достаточно сжатой форме. 5-битные коды, такие как международный телеграфный код MGC-2, более подходят для этой цели Преобразование в коды МПК-2 может быть осуществлено путем перекодирования программного обеспечения или с помощью специальных компонентов на основе крупномасштабных интегральных схем (LSI) При передаче буквенно-цифровых символов в МПК-2, 8-битных кодах, пропускная способность канала увеличивается почти на 40% по сравнению с использованием 8-битных кодов.

5. Коды переменной длины; коды с переменным количеством битов на символ позволяют более плотную упаковку данных. Этот метод кодирует часто используемые символы в короткие коды, а менее часто используемые символы - в длинные коды. Эта идея кодирования была впервые предложена Хаффманом, а соответствующий код называется кодом Хаффмана. При использовании кодов Хаффмана исходный текст можно сократить до 80%.

Используя различные методы сжатия текста, помимо основной цели - уменьшения избыточности информации, можно также осуществлять несколько процессов шифрования информации. Однако максимальный результат может быть достигнут при использовании комбинации методов шифрования и кодирования информации [6, с. 95].

О надежности защиты информации можно судить по времени, необходимому для расшифровки (анализа) информации и определения ключа.

Если информация зашифрована простой подстановкой, ее можно расшифровать, определив частоту встречаемости каждой буквы в шифротексте и сравнив ее с частотой встречаемости русского алфавита. Таким образом, определяется алфавит замены, и текст расшифровывается.

Информация передается в виде сообщений. Дискретная информация записывается из конечного набора точек. Эти символы, которые мы будем называть буквами, не имеют обычного ограниченного значения слов (например, "русские буквы" или "латинские буквы"). В этом расширенном смысле буква — это знак, определенный некоторым соглашением для общения. Например, когда вы общаетесь на русском языке, знаки — это русские буквы. В общем случае, символ — это элемент конечного числа отличительных признаков. Набор знаков, порядок которых определен, называется алфавитом.

Рассмотрим некоторые примеры алфавитов.
1. Алфавит прописных русских букв:
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
2. Алфавит Морзе:

3. Алфавит клавиатурных символов ПЭВМ IBM (русифицированная клавиатура):

4. Алфавит знаков правильной шестигранной игральной кости:

5. Алфавит арабских цифр:
0123456789
6. Алфавит шестнадцатеричных цифр:
0123456789ABCDEF
Этот пример, в частности, показывает, что знаки одного алфавита могут образовываться из знаков других алфавитов.
7. Алфавит двоичных цифр:
0 1
Алфавит 7 является одним из примеров, так называемых, «двоичных» алфавитов, т.е. алфавитов, состоящих из двух знаков. Другими примерами являются двоичные алфавиты 8 и 9:
8. Двоичный алфавит «точка», «тире»: . _
9. Двоичный алфавит «плюс», «минус»: + -
10. Алфавит прописных латинских букв:
ABCDEFGHIJKLMNOPQRSTUVWXYZ
11. Алфавит римской системы счисления:
I V Х L С D М
12. Алфавит языка блок-схем изображения алгоритмов:

В канале связи сообщение, состоящее из символов (букв) одного алфавита , может быть преобразовано в сообщение, состоящее из букв или символов другого алфавита. Сама процедура преобразования сообщения называется транскодированием. Такое преобразование сообщения может происходить при поступлении сообщения в канал связи от источника (кодирование) и при получении сообщения приемником (декодирование). Устройства, выполняющие кодирование и декодирование, называются соответственно кодерами и декодерами.

На рисунке приведена схема, иллюстрирующая процесс передачи сообщения в случае перекодировки, а также воздействия помех.

Download 448.45 Kb.

Do'stlaringiz bilan baham:

1 2 3 4 5 6 7 8 9 ... 12