Рячкина С.Ю. 130430709 Экономика (080100.62)
05.12.2013
Содержание:
Архивация данных.
Введение
С развитием компьютера стали
увеличиваться и объемы информации хранимой
в нем, что в свою очередь привело к развитию
технологий по хранению этой информации
в сжатом виде, то есть в архивах. Для этого
было придумано множество программ осуществляющих
архивацию информации.
Несмотря на то, что объемы внешней
памяти ЭВМ постоянно растут, потребность
в архивации не уменьшается. Это объясняется
тем, что архивация необходима не только
для экономии места в памяти, но и для надежного
хранения копий ценной информации, а также
для быстрой передачи информации по сети
на другие ЭВМ.
Процесс записи файла в архивный
файл называется архивированием
(упаковкой, сжатием), а извлечение файла
из архива – разархивированием
(распаковкой).
Упакованный (сжатый) файл называется архивом. Архив
содержит оглавление, позволяющее узнать,
какие файлы содержатся в архиве. В оглавлении
архива для каждого содержащегося в нем
файла хранится следующая информация:
- имя файла;
- сведения о каталоге, в котором
содержится файл;
- дата и время последней модификации
файла;
- размер файла на диске и в архиве;
- код циклического контроля
для каждого файла, используемый для проверки
целостности архива.
Архивация информации – это такое преобразование
информации, при котором объем информации
уменьшается, а количество информации
остается прежним.
Степень сжатия информации
зависит от типа файла, а также от выбранного
метода упаковки.
Степень (качество) сжатия файлов
характеризуется коэффициентом сжатия
Kc, который
определяется как отношение объема сжатого
файла Vc к объему
исходного файла Vo, выраженное
в процентах:
Чем меньше Kc, тем выше
степень сжатия.
Теоретические основы сжатия данных.
Все используемые методы сжатия
информации можно разделить на два класса:
- Упаковка без потерь информации
(обратимый алгоритм) – можно точно восстановить
исходную информацию по имеющейся упакованной информации.
- Упаковка с потерей информации
(необратимый алгоритм) – распакованное
сообщение будет отличаться от исходного.
В настоящее время разработано
много алгоритмов архивации без потерь.
Однако все они используют, в основном,
две простые идеи.
- Метод
Хаффмана (1952) – основан на учете частот символов. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие символы – длинными последовательностями битов. К каждому сжатому архиву прикладывается таблица соответствия имеющихся
символов и кодов, заменяющих эти символы.
Пример: Пусть входной алгоритм сообщения
состоит из 4-х символов: a, b, c, d, частоты
повторения которых 1/2, 1/4, 1/8,1/8. Кодирование
Хаффмана для этого алфавита задается
таблицей:
Символ |
Частота |
Входной код
(до архивации) |
Выходной код
(после архивации) |
a |
1/2 |
00 |
0 |
b |
1/4 |
01 |
10 |
c |
1/8 |
10 |
110 |
d |
1/8 |
11 |
111 |
Тогда текст abbadaca будет закодирован
так:
Входной код - 00 01 01 00 11 00 10 00 - 16 бит
Выходной код - 0 10 10 0 111 0 110 0 - 14 бит
К маленькому файлу
прикладывать таблицу кодировки не выгодно,
т.к. она займет места больше, чем сам файл.
Чем длиннее файл, тем выгоднее этот метод.
Метод Хаффмана эффективен для упаковки
текстов.
- Метод
RLE (Run Length Encoding) положен принцип выявления
повторяющихся последовательностей данных
и замены их простой структурой, в которой
указывается код данных и коэффициент
повтора.
Пример: Изображение звездного неба:
на черном фоне видны редкие белые звезды.
При растровом представлении неба информация
в ЭВМ будет храниться в таком виде: черное-
черное- черное- черное- белое- черное-
черное- черное- черное и т.д. Значительно
компактнее хранить информацию, указав,
сколько раз подряд идут черные пиксели,
сколько раз белые и т.д.
Программные реализации методом
RLE отличаются простотой, высокой скоростью
работы, но в среднем обеспечивают недостаточное
сжатие. Наилучшими объектами для данного
алгоритма являются графические файлы,
в которых большие одноцветные участки
изображения кодируются длинными последовательностями
одинаковых байтов.
Создание архивных файлов осуществляется
специальными программами-упаковщиками.
Все архиваторы отличаются используемыми
алгоритмами сжатия, форматами архивных
файлов, скоростью работы и т.д. Даже если
сравнивать программы только по степени
сжатия, то среди них нет лидера: разные
типы файлов лучше сжимаются разными программами.
Наиболее известные программы-архиваторы
для MS-DOS: ARJ (разработчик - Robert K. Jung), pkzip
(компания PKWARE Inc.), lha (Haruyasu Yoshizaki), zoo (Rahul
Dhesi). Безусловным лидером во всем мире
за последние 5 лет стал архиватор RAR. В
настоящее время RAR активно вытесняет
ZIP как основную утилиту сжатия FTP архивов
в сети INTERNET. RAR является единственной
всемирно используемой программой, созданной
русским программистом (за исключением
TETRIS).
Помещение файлов в архив.
При помещении файлов в архив
используются следующие команды вызова:
PKZIP |
|
режимы |
имя_архива
|
|
[имена_файлов] …
|
ARJ |
команда |
режимы |
имя_архива
|
[каталог\] |
[имена_файлов] …
|
команда – одна буква, которая задает
для программы ARJ вид выполняемой деятельности.
(А - добавление файлов в архив; М – пересылка
файлов в архив; U – обновление архива;
L – просмотр оглавления архива; D – удаление
файла из архива)
режимы – указываются с предшествующим
знаком «-» или «/», они задают или уточняют
требуемые от программы архивации действия.
Режимы программы
PKZIP: -u – обновление архива; -m –
пересылка в архив; -d – удаление файла
из архива; -v – просмотр оглавления архива;
-s – защита архива с помощью пароля; -x
– исключение файла или группы файлов
из обработки
Режимы программы
ARJ: -g – защита архива с помощью
пароля; -v – создание многотомного архива
имя_архива - задает обрабатываемый архивный
файл. Если расширение имени файла не указано,
то подразумевается расширение .ZIP для
программы PKZIP и .ARJ для программы ARJ;
каталог – для программы ARJ задает базовый
каталог, в котором содержатся файлы, включаемые
в архив;
имена_файлов – задают файлы, включаемые
в архив. При задании имен файлов можно
использовать символы * и ?. Если имена
файлов не заданы, то подразумеваются
все файлы из текущего каталога.
После ввода команды программы-упаковщики
начинают выполнять запрошенные действия.
На экране изображаются имена помещаемых
в архив файлов в сопровождении информации
о степени сжатия файла.
Примеры:
PKZIP myzip – добавление в архивный файл
MYZIP.ZIP всех файлов из текущего каталога;
ARJ a myarj – добавление в архивный файл
MYARJ.ARJ всех файлов из текущего каталога;
Извлечение файлов из архива.
Для извлечения файлов из архивов,
созданных программой PKZIP (.ZIP-файлов), используется
программа PKUNZIP. А программа ARJ сама умеет
извлекать файлы из своих архивов.
Программы PKUNZIP и ARJ имеют следующие
форматы вызовов:
PKUNZIP |
|
режимы |
имя_архива
|
|
[имена_файлов] …
|
ARJ |
команда |
режимы |
имя_архива
|
[каталог\] |
[имена_файлов] …
|
Примеры:
PKUNZIP a:archive –o – извлечение всех файлов из
архива A:ARCHIVE.ZIP и помещение их в текущий
каталог. Файлы на диске с тем же именем
затираются без предупреждений.
ARJ e a:archive –jyo d:\ - извлечение всех файлов из
архива A:ARCHIVE.ARJ в корневой каталог диска
D:. Файлы на диске с тем же именем затираются
без предупреждений.
Для уменьшения размеров мультимедийных
файлов используют процедуру сжатия.
Сжатие (компрессия, уплотнение) –
такое преобразование информации, в результате
которого исходный файл уменьшается в
объеме, а количество информации в сжатом
файле уменьшается на такую небольшую
величину, которой практически можно пренебречь.
(В отличие от архивации – сжатия без искажения).
Приемы сжатия звука.
Компадирование. Установлено, что если увеличивать громкость звука в 2, 4, 8 и т.д. раз, то человеческое ухо будет воспринимать этот процесс как линейное увеличение громкости звука. Человеческое ухо логарифмирует громкость слышимых звуков. Поэтому при компадировании значение амплитуды звука заменяется логарифмом этого значения. Полученные
цифры округляются, и для их записи требуется
меньшее число разрядов. Для воспроизведения
сигнала его подвергают обратному преобразованию
– потенцированию.
Очищение с помощью фильтров от неслышимых компонентов (например, убирают низкие басовые шумы). Затем вычисляются и удаляются замаскированные частоты, заглушенные другими мощными сигналами. Таким образом можно исключить до 70% информации из сигнала, практически не изменив качества его звучания.
Для стереофонического сигнала
применяют преобразование его в т.н. совмещенный стерео
сигнал. Установлено, что слуховой аппарат человека может определить местоположение источника звука лишь на средних частотах, а высокие и низкие частоты звучат как бы отдельно от источника звука. Т.о., высокие и низкие частоты можно представить в виде монофонического сигнала. Это позволяет вдвое уменьшить объем информации, передаваемой на низких и высоких частотах.
Маскирование во временной области. Тихий звук сразу после очень громкого не слышен. Например, громкий звук длительностью 0,1 сек. может замаскировать тихие последующие звуки, запаздывающие на время до 0,5 сек., а, значит, их не надо сохранять.
Маскирование в частотной области. Постоянно звучащий громкий синусоидальный сигнал «глушит» тихие сигналы близкие к нему по частоте, поэтому такие тихие звуки удаляют, используя алгоритмы спектрального анализа (БПФ).
Однако биоакустические свойства
человеческого слуха не позволяют сжать
звуковой сигнал, если он представляет
собой однотонные звуки с постоянным уровнем
громкости. В этом случае дают эффект традиционные
методы архивации информации (например,
алгоритм Хаффмана).
Приемы сжатия видеоинформации.
Создается опорный кадр
(I-кадр). Он формируется с помощью методов
сжатия неподвижных изображений. I-кадры
размещаются через каждые 10 – 15 кадров.
Фрагменты изображений, которые изменяются,
сохраняются при помощи расчетных кадров
– P-кадров. Р-кадры содержат различия
текущего изображения с предыдущим или
последующим I-кадром и располагаются
между опорными I-кадрами. Еще используются
В-кадры. Они содержат усредненную информацию
относительно двух ближайших (предыдущего
и последующего) I-кадров или Р-кадров.
Это позволяет предположительно восстанавливать
отсутствующие кадры. В-кадры учитывают
тот факт, что человек не способен за доли
секунды рассмотреть детали движущегося
изображения, поэтому можно формировать
некоторое приблизительное изображение,
учитывая информацию опорных кадров. Здесь
происходит умышленный обман органов
чувств человека.
Отчет по второму заданию.
Имеется табл.1 данных об окладах
сотрудников предприятия.
Таблица 1
Поздразделение |
ФИО |
Оклад, руб. |
- Сформировать табл.2 «Ведомость
расчета заработной платы»
Таблица 2
Подразделение |
ФИО |
Оклад, руб. |
Районный коэффициент |
Северные надбавки |
Подоходный налог |
Сумма к выдаче |
Выходной документ должен содержать
15-20 записей (3-5 подразделений, в каждом
подразделении по 3-5 сотрудников).