Понятие файла. Файловый принцип хранения данных. Операции с файлами. Типы файлов
Информация, представляемая для обработки на компьютере, называется данными. Для хранения на устройствах внешней памяти данные организуют в виде файлов. Файл — именованная область внешней памяти. Способ организации как служебной, так и пользовательской информации о файлах на носителях называют файловой системой. Конкретная файловая система определяет, в частности, правила именования файлов. Необходимые для выполнения операций с файлами и носителями программные средства входят в состав операционных систем. Такие программные средства не изменяют и не обращаются к содержимому файлов, а оперируют с ними просто как с целым, непрерывным массивом данных. Таким образом, файловая система обеспечивает выполнение операций для любых программ. Имя файлу присваивает пользователь, или программа, создающая файл, предлагает имя в автоматическом режиме. По историческим причинам для пользователя имя файла в операционных системах фирмы Майкрософт состоит из двух частей, разделенных точкой: собственно имени и расширения. Тип файла определяется по его расширению, которое задает программа, сохраняющая файл. С точки зрения прикладных программ, файл представляет собой некоторую последовательность байтов. Используя такой подход, как доступ к файлам, организуется также доступ к некоторым устройствам, которые принимают или возвращают поток байтов. К таким устройствам относятся принтеры, модемы, клавиатура или поток текстового вывода на экран и др. В некоторых операционных системах предусмотрен такой доступ и к служебной информации самих носителей. Для работы с такими файлами предусмотрены специальные, зарезервированные системой, имена файлов. Следует помнить, что для ОС линии Microsoft: между именем и расширением ставится точка, не входящая ни в имя, ни в расширение; имя файла можно набирать в любом регистре, т.к. для системы все буквы строчные; символы, не использующиеся в имени файла * = + [ ] \;:,. < > /? имена устройств не могут использоваться в качестве имён файлов (prn, lpt, com, con, nul). Наиболее часто встречающиеся расширения: EXE, COM — готовая к выполнению программа; ВАТ — пакетный командный файл; SYS — программа-драйвер устройства (системная); ВАК — резервная копия файла; OBJ — объектный модуль («полуфабрикат» программы); DAT — файл данных со служебной информацией; BAS — исходный текст программы на Бейсике; ТХТ — текстовый файл; DOC — документ, созданный в Microsoft Word. Для удобства хранения и работы файловые структуры организуются с помощью вложенных каталогов (папок). Каталог — специальный системный файл, в котором хранится служебная информация о файлах. На каждом носителе может быть множество каталогов. В каждом каталоге может быть зарегистрировано много файлов, но каждый файл регистрируется только в одном каталоге На каждом логическом томе присутствует один главный, или корневой, каталог. В нем регистрируются файлы и подкаталоги (каталоги 1 уровня). В каталогах 1 уровня регистрируются файлы и каталоги 2 уровня и т. д. Получается древовидная структура каталогов, например: Каталог, с которым работает пользователь в настоящий момент, называется текущим. Когда используется файл не из текущего каталога, программе, осуществляющей доступ к файлу, необходимо указать, где именно этот файл находится. Это делается с помощью указания пути к файлу. Путь к файлу — это последовательность имен каталогов, в операционных системах Windows разделенных символом «\» (в ОС линии UNIX используется символ «/»). Этот путь задает маршрут к тому каталогу, в котором находится нужный файл. Рассмотрим, например, запись \KLASS10\DOCS\START2\text.doc Она означает, что файл text.doc находится в подкаталоге START2, который находится в каталоге DOCS, а он в свою очередь находится в каталоге KLASS10 корневого каталога. Над файлами можно производить следующие основные операции: копирование, перемещение, удаление, переименование и пр. Каждый файл на диске имеет свой адрес. Чтобы понять принцип доступа к информации, хранящейся в файле, необходимо знать способ записи данных на носители информации. Перед использованием диск размечается на дорожки и секторы (форматируется). С точки зрения оборудования разметка — это процесс записи на носитель служебной информации, отмечающей конец и начало каждого сектора. Обычный объем сектора — 512 байт. На одной стороне размещается 80 дорожек. Каждая дорожка содержит 18 секторов. Названия «сектор», «дорожка» введены для дисковых носителей. Во многих современных носителях информации, использующих хранение данных в энергонезависимой памяти, эти понятия поддерживаются реализацией файловых систем для обеспечения общих принципов работы. В одной из распространенных файловых систем, FAT, предусматривается, что все файлы перечислены в каталогах. Обязателен корневой каталог, размещенный в определенном месте диска. О каждом из перечисленных в каталоге файлов помимо обычных данных известно местоположение (в виде номера) начала файла. Для того, чтобы определить, какие именно секторы занимает файл, применяется второй обязательный элемент файловой системы — таблица FAT (размещения файлов). Таблица представляет собой массив ячеек. Размер ячейки фиксирован и отражается в номере файловой системы (12, 16, 32 бита). Каждый файл занимает некоторую последовательность секторов, не обязательно последовательно расположенных. При сохранении файла в ячейку записывается номер следующего сектора в цепочке. Поскольку на современных дисках секторов существенно больше, чем можно записать номеров в таблице, то секторы объединяют в кластеры. Именно кластерами и распределяется пространство на дисках, в результате эта файловая система неэффективно работает с мелкими файлами. Сделать эту проблему менее острой позволяет увеличение размера ячейки в FAT. Это позволяет уменьшить размер кластера и увеличить количество адресов (файлов) на диске. В операционных системах, начиная с Windows 98, реализована FAT-32. Помимо этой файловой системы, существует большое количество других, разработанных для разных операционных систем и решаемых задач.
|