Что такое архивация информации

Что такое архивация информации

Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации – это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например, за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Архивный файл – это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и, соответственно, стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

Степень сжатия файлов характеризуется, как правило, коэффициентом Kс, определяемым как отношение объема сжатого файла Vc к объему исходного файла V, выраженное в процентах:

.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия. В случае архивирования исполняемых EXE-файлов их величина может быть сокращена на 30 %-50 %, текстовых — на 40 %- 70 % от их первоначального объема.

Программы, осуществляющие работу с архивными файлами, их упаковку и распаковку, называются программами-архиваторами.

Архивация (упаковка) – помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Разархивация (распаковка) – процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том – это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие-либо программы-архиваторы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.

Самораспаковывающийся архивный файл – это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архи-ватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа обычно создаются в форме файла с расширением ЕХЕ.

Существует несколько десятков различных программ-архива-торов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики.

Различают два основных типа программ-архиваторов. Первый из них представляют утилиты архивирования данных, работающие в реальном масштабе времени. Эти программы функционируют как бы в фоновом режиме на уровне операционной системы компьютера без вмешательства пользователя. Процедура сжатия всех файлов осуществляется непосредственно в процессе их записи на жесткий диск. При загрузке с жесткого диска в оперативную память фактический объем файлов восстанавливается автоматически. Таким образом, емкость жесткого диска увеличивается в 1,5-2,5 раза. Программы указанного типа — это утилиты Double-Density фирмы Abacus Software, XtraDrrive фирмы Integrated Information Technology, DoubleSpace фирмы Microsoft и др.

Вторым наиболее распространенным видом утилит сжатия информации является семейство программ-упаковщиков обычного, классического типа. При использовании таких программ пользователь должен ввести в машину команду, предписывающую компьютеру проделать те или иные конкретные действия с конкретным набором файлов. В результате работы такой программы получается новый файл, или «архив», в котором в сжатом виде представлена информация, содержащаяся в исходных архивируемых файлах. Аналогичным образом осуществляется и процедура восстановления из архива упакованных в него ранее данных. Как и любой обычный файл, архив может быть перемещен на диске из одной директории в другую, переименован, скопирован на дискету.

Среди наиболее распространенных программ можно назвать ARJ, PKZIP, LHA, PKPAK, PAK и другие, работающие под управлением ОС MS DOS.

Программы-архиваторы могут объединяться в специальные программные пакеты-оболочки.

Оболочка в общем случае представляет собой программу, которая обеспечивает пользователю возможность наиболее эффективным способом исполнять тот или иной набор операций, реализованных с помощью отдельных, не зависящих друг от друга программ. Иными словами, такая оболочка предоставляет в распоряжение пользователя удобное средство по управлению ходом исполнения некоторого набора программ, создает удобный в обращении пользовательский интерфейс.

Среди наиболее известных в настоящее время можно назвать пакеты RAR, SHEZ и WinZip, WinRAR, WinARJ. Два первых из них работают непосредственно под DOS, третий и последующие — в среде Windows. Эти пакеты имеют дружественный пользовательский интерфейс, базирующийся на стандартной системе командных меню. Работа с программами ведется в режиме диалога.

Понятие и цель архивации, принципы сжатия информации. Основные методы сжатия, сущность процесса архивации файлов. Методы архивации в WinRAR. Основные программы-архиваторы и их функции. 10 самых популярных архиваторов. Рекомендации по выбору архиватора.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 24.05.2016
Размер файла 29,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Читайте также:  Acer aspire one 756 характеристики

Размещено на http://www.allbest.ru

АРХИВАЦИЯ ИНФОРМАЦИИ И ПРОГРАММЫ АРХИВАТОРЫ

    СОДЕРЖАНИЕ

  • Введение
  • Определение архивации
  • Принципы сжатия информации
  • Два основных класса методов сжатия
  • Понятие процесса архивации файлов
  • Методы архивации
    • Методы архивации в WinRAR
    • Основные программы архиваторы и их функции
      • 10 самых популярных архиваторов
      • Какой же выбрать архиватор?
      • Заключение
      • Список используемых интернет сайтов
      • При работе с данными существует возможность порчи или потери информации на магнитном диске, обусловленная физической порчей диска, случайным уничтожением объектов или наличием какого-либо компьютерного вируса. Для сохранения нужных данных (программ, документов) нужно хранить их резервные копии. Можно просто скопировать данные на винчестер или записать на CD, но при этом такие копии будут занимать столько же места, сколько и оригиналы файлов. Для решения этих проблем используют программы-архиваторы, которые позволяют уменьшить размер файлов путем сжатия информации.

        Необходимость архивации связана с резервным копированием информации на диски и дискеты с целью сохранения программного обеспечения компьютера и защиты его от порчи и уничтожения (умышленного, случайного или под действием компьютерного вируса). Чтобы уменьшить потери информации, следует иметь резервные копии всех программ и файлов.

        Программы-упаковщики (архиваторы) позволяют за счет специальных методов сжатия информации создавать копии файлов меньшего размера и объединять копии нескольких файлов в один архивный файл. Это даёт возможность на дисках или дискетах разместить больше информации, то есть повысить плотность хранения информации на единицу объёма носителя (дискеты или диска). архиватор сжатие файл архивация

        Кроме того, архивные файлы широко используются для передачи информации в Интернете и по электронной почте, причем благодаря сжатию информации повышается скорость её передачи. Это особенно важно, если учесть, что быстродействие модема и канала связи (телефонной линии) намного меньше, чем процессора и жесткого диска.

        Работа архиваторов основана на том, что они находят в файлах повторяющиеся участки и пробелы, помечают их в архивном файле и затем при распаковке восстанавливают по этим отметкам исходные файлы.

        В данном реферате я рассмотрю такие темы как определение архивации, принципы сжатия информации, методы архивации, основные программы архиваторы и их функции

        Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

        Существует множества определений понятия Архивация, вот некоторые из них:

        Архивация — сжатие информации для уменьшения ее объема

        Архивация — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде. Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

        Архивация данных представляет собой процедуру сжатия информации, содержащейся в одном или нескольких файлах. Иногда необходимость архивации возникает при желании пользователя продублировать информацию, как на своем компьютере, так и на дискетах. Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл. Для создания архивного файла предназначены специальные программы архивации данных или программы-архиваторы.

        Архивация информации — это такое преобразование информации, при котором объем файла уменьшается, а количество информации остается прежним.

        Процесс записи файла в архивный файл называется архивированием (упаковкой, сжатием), а извлечение файла из архива — разархивированием (распаковкой). Упакованный (сжатый) файл называется архивом.

        В основе любого способа сжатия информации лежит модель источника информации, или, более конкретно, модель избыточности. Иными словами для сжатия информации используются некоторые сведения о том, какого рода информация сжимается — не обладая никакими сведениями об информации нельзя сделать ровным счётом никаких предположений, какое преобразование позволит уменьшить объём сообщения. Эта информация используется в процессе сжатия и разжатия. Модель избыточности может также строиться или параметризоваться на этапе сжатия. Методы, позволяющие на основе входных данных изменять модель избыточности информации, называются адаптивными. Неадаптивными являются обычно узкоспецифичные алгоритмы, применяемые для работы с хорошо определёнными и неизменными характеристиками. Подавляющая часть же достаточно универсальных алгоритмов являются в той или иной мере адаптивными.

        Любой метод сжатия информации включает в себя два преобразования обратных друг другу:

        1. преобразование сжатия;

        2. преобразование расжатия.

        Преобразование сжатия обеспечивает получение сжатого сообщения из исходного. Разжатие же обеспечивает получение исходного сообщения (или его приближения) из сжатого.

        Два основных класса методов сжатия

        Кардинальное различие между ними в том, что сжатие без потерь обеспечивает возможность точного восстановления исходного сообщения. Сжатие с потерями же позволяет получить только некоторое приближение исходного сообщения, то есть отличающееся от исходного, но в пределах некоторых заранее определённых погрешностей. Эти погрешности должны определяться другой моделью — моделью приёмника, определяющей, какие данные и с какой точностью представленные важны для получателя, а какие допустимо выбросить.

        Понятие процесса архивации файлов

        Одним из наиболее широко распространенных видов сервисных программ являются программы-архиваторы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

        Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

        Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации. Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

        Читайте также:  Aiboo cc как удалить на андроид

        Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

        Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

        Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах:

        Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

        Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Это объясняется тем, что архивация необходима не только для экономии места в памяти, но и для надежного хранения копий ценной информации, а также для быстрой передачи информации по сети на другие ЭВМ.

        Кроме того, возможность отказа магнитных носителей информации, разрушающее действие вирусов заставляют пользователей делать резервное копирование ценной информации на другие (запасные) носители информации.

        При кодировании символов в ЭВМ используют кодовые таблицы. При этом каждый символ кодируется либо одним байтом (CP-1251, КОИ-8), либо двумя байтами (Unicode). Кодовые таблицы стандартизируют процедуру кодирования. Однако для передачи информации по каналу связи (или для долговременного хранения) можно использовать более сложную процедуру кодирования, которая обеспечит уменьшение размера файла при полном сохранении исходной информации. При архивации не используются стандартные кодовые таблицы, а создаются собственные. При этом вид кодовой таблицы каждый раз изменяется и зависит от содержания архивируемого документа.

        При упаковке по методу Хаффмана часто встречающиеся символы кодируются (заменяются) короткими последовательностями битов, а более редкие символы — длинными последовательностями. К каждому сжатому архиву прикладывается таблица соответствия имеющихся символов и кодов, заменяющих эти символы. Архивы как бы отменяют стандартные кодовые таблицы.

        Архиватор WinRAR предоставляет пользователю возможность выбора одного из шести возможных методов архивации. В таблице 10.2 приведено сравнение степени сжатия и времени, затрачиваемого на архивацию на одной и той же машине и на одной и той же группе тестовых файлов. Отметим, что метод Storing создает архивный файл без сжатия. Кроме того, из таблицы видно, что выбор метода Best не дает большого выигрыша по сравнению с методом Good, но требует существенных временных затрат. По-видимому, выбирать следует методы сжатия Normal или Good. Выбор метода сжатия производится с помощью развертывающегося списка Compression (compression — сжатие). По умолчанию архиватор предлагает способ Normal (normal — обычный).

        Максимальная длина каждой части многотомного архива выбирается из развертывающегося списка Volume size (volume size — размер тома). Если архив предполагается создавать на гибких дискетах, то в списке нужно выбрать строку 1457500, которая соответствует объему трехдюймовых дискет. В принципе, в строку Volume size можно ввести произвольный размер тома, указав с помощью расположенного ниже переключателя выбранные единицы измерения (байты, тысячи байтов или килобайты).

        Если архив создается из нескольких файлов, то можно включить флажок Solid archive (solid — сплошной), который управляет режимом создания так называемого непрерывного архива, обеспечивающего более высокий коэффициент сжатия на группе файлов. А для создания самораспаковывающегося архива необходимо включить флажок SFX archive (SFXSelF extracting — самораспаковывающийся).

        Назначение программ-архиваторов заключается в экономии места на диске за счет сжатия (упаковки) одного или нескольких файлов в архивный файл. Программы-архиваторы используют для хранения в упакованном виде больших объемов информации, которая понадобится в будущем; переноса информации между компьютерами с помощью дискет или электронной почты; создания в сжатом виде резервных копий файлов; для защиты от компьютерных вирусов. В результате работы программ-архиваторов создаются архивные файлы (архивы).

        В основе работы программ-архиваторов лежит процедура поиска и перекодирования одинаковых фрагментов содержимого файлов. Сжатие информации в файлах производится за счет устранения избыточности различными способами (за счет упрощения кодов, исключения постоянных битов, замены их повторяющейся последовательности коэффициентом повторения и т. д.). Существует множество алгоритмов сжатия данных. Например, метод энтропийного кодирования. Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в архив.

        Большинство программ-архиваторов позволяют создавать многотомные архивы. Многотомный архив — это последовательность архивных файлов, размер которых не превышает заданного размера тома. Обычно создается при необходимости переноса архива на гибких дисках, если размер архива превышает емкость дискеты. При создании таких архивов архиватор делает паузу для смены дискеты. Многотомный архив имеет общее имя, в расширении же каждого файла многотомного архива указывается номер тома.

        В настоящее время наибольшее распространение получили программы-архиваторы, ориентированные на работу под управлением операционной системы Windows. Это WinRAR и. WinZip, отличающиеся большой степенью сжатия, работой с длинными именами файлов и удобным интерфейсом.

        Особенно удобным пользовательским интерфейсом обладает программа WinRAR. Этот архиватор поддерживает обработку многих архивных форматов и использует оригинальный алгоритм упаковки, особенно эффективный для исполняемых и текстовых файлов. К важным дополнительным возможностям программы относятся: защита архива при помощи пароля; восстановление поврежденных архивов; создание многотомных и самораспаковывающихся архивов; сохранение комментариев к архивам. Пользовательский интерфейс WinRAR содержит основное меню, панель инструментов и рабочую область, в которой показаны все файлы текущей папки. При работе с WinRAR архивы воспринимаются как папки, содержимое которых можно просмотреть традиционными способами.

        Читайте также:  Мобильные телефоны doogee отзывы

        14.1. Что такое архивирование

        Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Архивация необходима не только для экономии памяти, но и для надежного хранения копий ценной информации, для быстрой передачи информации по сети.

        Архивирование (упаковка, сжатие) это процесс записи файла в архивный файл, разархивирование (распаковка) — процесс извлечения файла из архива. Архив — упакованный (сжатый) файл.
        Архивация информации это такое преобразование информации, при котором объем информации уменьшается, а количество информации остается прежним.

        Степень сжатия информации зависит от типа файла и от выбранного метода упаковки. Степень (качество) сжатия файлов характеризуется коэффициентом сжатия:

        Vc — объем сжатого файла, Vи — объем исходного файла.

        Проблемы архивации тесно связаны с проблемами кодирования (замена символов текста двоичными кодами с помощью кодовой таблицы), шифрования (криптография), компрессией звуковых и видео-сигналов.

        14.2. Какие существуют методы архивирования

        Все используемые методы сжатия информации можно разделить на два класса:

        • упаковка без потерь — исходную информацию можно точно восстановить по имеющейся упакованной информации;
        • упаковка с потерей информации — распакованное сообщение будет отличаться от исходного сообщения.

        В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, две простые идеи.

        Первая идея основана на учете частот символов , она разработана Д. А. Хаффманом а 1952 году. Эта идея базируется на том факте, что в обычном тексте частоты появления различных символов неодинаковы. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие — длинными. К каждому сжатому архиву прикладывается таблица соответствия символов и кодов.

        Вторая идея упаковки состоит в использовании того факта, что в сообщениях часто встречаются несколько подряд идущих одинаковых байтов , а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида "повторить данный байт n раз" (при упаковке графической информации) или "взять часть текста длиной k байтов, которая встречалась m байтов назад" (при упаковке текстовой информации). Такой алгоритм архивации называется RLE (кодирование путем учета повторений) .

        14.3. Какими возможностями обладают архиваторы

        Средства архивации-разархивации, как правило, обеспечивают:

        • создание архива;
        • обслуживание архива (добавление файлов, удаление файлов из архива, замену файлов в архиве и т.п.);
        • извлечение файлов из архива;
        • автоматическую архивацию и разархивацию поддерева файловой структуры;
        • тестирование целостности архивов;
        • создание многотомных архивов с возможностью задания произвольного размера тома;
        • создание самораспаковывающихся архивов;
        • создание пароля для доступа к архиву;
        • работу с частично разрушенными архивами.

        Каждый архиватор обычно реализует свой собственный уникальный алгоритм сжатия.

        14.4. Как сжать звуковые файлы

        Для уменьшения размеров мультимедийных файлов используют процедуру сжатия .

        Cжатие (уплотнение, компрессия) это такое преобразование информации, в результате которого исходный файл уменьшается в объеме, а количество информации в сжатом файле уменьшается на такую небольшую величину, которой практически можно пренебречь.

        Компрессия без потерь используется, например, архиваторами ZIP, RAR, ARJ. Применение подобных алгоритмов для сжатия файлов, содержащих оцифрованный звук, не позволяет получить сжатие более чем в 2 раза.

        Звуковой сигнал, преобразованный с помощью АЦП, обычно не повторяет сам себя и по этой причине плохо сжимается с помощью алгоритмов сжатия без потерь. Многие приемы сжатия аудиоинформации основываются на обмане органов чувств человека путем исключения избыточной и нформации, которую человек не способен воспринять (в силу своих физиологических особенностей).

        Такие методы относятся к классу компрессии с потерями . Они не ставят цель абсолютно точного восстановления формы исходных колебаний. Их главная задача — достижение максимального сжатия звукового сигнала при минимальных слышимых искажениях восстановленного после с жатия сигнала.

        Звуковой файл можно сжать с помощью компадирования , которое заключается в сжатии по амплитуде исходного звукового сигнала и последующем его восстановлении с помощью расширителя. Значение амплитуды звука заменяется логарифмом этого значения. Полученные числа округляются, и для их записи требуется меньшее число разрядов. Для воспроизведения сжатого сигнала, его подвергают потенцированию (преобразование, обратное логарифмированию).

        Еще один способ сжатия звукового сигнала заключается в том, что исходный звуковой сигнал очищается с помощью фильтров от неслышимых компонент (например, низкие басовые шумы). Затем производится более сложный анализ сигнала: вычисляются и удаляются замаскированные частоты, заглушенные другими мощными сигналами. Таким образом можно исключить до 70% информации из сигнала, практически не изменив качество его звучания.

        Есть и другие способы, так же основанные на свойствах человеческого слуха.

        Если звуковой сигнал представляет собой однотонные звуки с постоянным уровнем громкости, то биоакустические свойства слуха не позволяют его сжать. В этом случае дают эффект традиционные методы архивации информации, например, алгоритм Хаффмана.

        14.5. Как сжать графические файлы

        Методы сжатия видеоинформации разделяются на две группы, в зависимости от скорости упаковки изображения:

        • сжатие неподвижных изображений может выполняться с любой скоростью, т.к. этот процесс не регламентирован во времени, в силу статичности изображения.
        • сжатие движущихся изображений должно выполняться, как правило, в режиме реального времени по мере ввода данных.

        Стандарт JPEG позволяет сократить размеры графического файла с неподвижным изображением в 10-20 раз. Этим методом удается при специальных действиях сжимать и движущиеся изображения.

        Ссылка на основную публикацию
        Adblock detector