К понятию страниц в адресном пространстве памяти компьютера.

Поэтому страничное преобразование памяти широко распространено при организации систем виртуальной памяти. Прикладные программы не касаются процесса страничного преобразования адреса и могут использовать все линейное адресное пространство. Когда программа обращается к странице, отсутствующей в физической памяти, процессор автоматически формирует особый случай страничного нарушения. При этом адрес, по которому был обнаружен последний отказ страницы, заносится и хранится в регистре управления CR2. При обработке этого особого случая операционная система загружает в оперативную память, затребованную страницу из внешней памяти (при необходимости отправляя ненужную страницу из оперативной памяти на диск). Поэтому сутью страничного преобразования является способ отображения любой страницы линейного адресного пространства на страничный кадр физического памяти. Границы страниц следуют через одинаковые интервалы 4Кбайт. В то же время границы сегментов являются произвольными, так как определяются базовыми адресами конкретного сегмента. Строго говоря, границы страниц и сегментов не зависят друг от друга и не обязательно должны быть выровнены. Однако для повышения производительности процессора рекомендуется выравнивать небольшие сегменты (с размером 4Кбайт и менее, например сегменты состояния задач TSS), так, чтобы они полностью находились в пределах одной страницы. Такое выравнивание гарантирует, что при загрузке одной страницы будет полностью загружен весь сегмент. Отметим также, что система защиты используется как на уровне сегментов, так и на уровне страниц. Отличие заключается в том, что если для сегментов предусмотрено 4 уровня привилегий (0,1,2,3), то при страничной организации памяти имеется всего два уровня привилегий: пользователь и супервизор. При этом уровень 3 соответствует уровню пользователя (User), а уровни 0,1,2 – уровню супервизора (Supervisor). Организация страничного преобразования. В процессе страничного преобразования старшие 20 бит 32-разрядного линейного адреса, которые представляют номер виртуальной страницы, заменяется другим 20-битным значением – номером физической страницы. Это осуществляется с помощью специальной таблицы страниц. Остающиеся младшие 12 бит линейного адреса, определяют положение адресуемого байта внутри страницы (смещение в странице), и остаются неизменными. Прежде чем рассмотреть схему устройства реализации страничного преобразования адресов в современных микропроцессорах, рассмотрим общий принцип страничного преобразования виртуальных адресов адресного пространства размером 4 Г (т.е. 32-разрядных адресов) в адреса физической оперативной памяти общим объемом 32 Кбайт.
Рис III.19 Схема преобразования адреса виртуальной памяти в физический адрес реальной оперативной памяти.
Будем считать, что размер страничного кадра физической оперативной памяти равен 4 Кбайт (наиболее широко используемый размер страниц). Следовательно, наша оперативная память будет содержать всего 8 страничных кадров. А поскольку пользователю дается в распоряжение 4 Гбайт памяти, то устройство преобразования адресов должно отображать 4 Гбайт виртуальной памяти на 32 Кбайт реальной физической оперативной памяти используемого компьютера. В случае же отсутствия запрашиваемого адреса в оперативной памяти, недостающая страница с требуемым адресом должна быть вызвана из внешней памяти, помещена в оперативную память и запрос по требуемому адресу должен быть повторен. Схема преобразования адреса виртуальной памяти в физический адрес оперативной памяти в рассматриваемом случае приведена на Рис III.19. Данная схема иллюстрирует как 32-разрядный виртуальный адрес, определяющий любую ячейку виртуального адресного пространства в 4 Г, отображается в 15-разрядный физический адрес, определяющий ячейку памяти в реально используемой оперативной памяти, емкостью 32 К ячеек. Центральным блоком устройства управления памятью является таблица страниц виртуальной памяти, количество которых определяется двадцатью старшими разрядами виртуального адреса. Таким образом, в рассматриваемом случае таблица страниц содержит 220 = 1 М строк, каждая из которых характеризуется тремя основными атрибутами: номером виртуальной страницы, битом присутствия данной страницы в реальной оперативной памяти и номером страничного кадра в этой оперативной памяти. (Заметим, что в существующих устройствах управления памятью в каждой строке хранится и некоторая дополнительная информация, например, связанная с организацией системы защиты). Поскольку в нашем случае оперативная память состоит из 8 страничных кадров, то на представление номера страничного кадра достаточно трех двоичных разрядов. Поступающий на вход устройства управления памятью 32-разрядный виртуальный адрес используется следующим образом. Младшие 12 разрядов непосредственно определяют ячейку памяти в страничном кадре реальной оперативной памяти. Двадцать же старших разрядов виртуального адреса определяют номер виртуальной страницы. Если бит присутствия выбранной страницы равен 1, то это значит, что данная страница присутствует в реальной оперативной памяти и содержимое соответствующей строки таблицы страниц передается в выходной регистр устройства управления памятью, как старшие три разряда физического адреса. Если же бит присутствия равен 0, то это значит, что в оперативной памяти этой страницы нет. Следовательно, ее необходимо найти и выбрать из внешней памяти, переписать в оперативную память на место менее запрашиваемого страничного кадра, определить ее адрес в оперативной памяти (занеся соответствующий трехразрядный код в таблицу страниц), установить в 1 соответствующий бит присутствия, и повторить адресацию. Однако практически такое одноэтапное преобразование виртуальных адресов адресного пространства в реальные физические адреса используемой оперативной памяти оказывается недостаточно эффективным. Поэтому, вместо одноэтапного, в процессорах семейства х86 использовано более гибкое двухэтапное или двухуровневое преобразование, показанное на рисунке III.20. Включение страничного преобразования осуществляется установкой в 1 бита PG в регистре управления CR0, а основой страничного преобразования выступает регистр управления CR3, который содержит 20 старших разрядов физического базового адреса каталога страниц текущей задачи и называется регистром базового адреса каталога страниц – PDBR (Page Directory Base Register). Младшие 12 бит адреса считаются нулевыми, т.е. каталог выровнен по границе страниц. Каталог страниц постоянно находится в памяти и не участвует в свопинге. Каталог страниц (Page Directory) содержит 1024 32-битных элемента каталога страниц – PDE (Page Directory Entry). Каждый из них адресует подчиненную таблицу страниц, т.е. всего допускается до 1024 таблиц страниц. Каждая из таблиц страниц содержит 1024 32-битных элементов таблиц страниц – PTE (Page Table Entry), и каждый из элементов PTE, в свою очередь, адресует страницу (страничный кадр) в физической памяти. Отметим, что наличие в каталоге страниц и таблице страниц по 1024 32-битных элементов определяет их размер точно в одну страницу, поскольку каждый элемент занимает 4 байта.
Рис. III.20 Двухэтапное преобразование линейного адреса в физический.
Собственно преобразование линейного адреса в физический адрес состоит из следующих действий. · Старшие 10 бит (31…22) линейного адреса служат индексом каталога страниц и, дополненные двумя нулями со стороны младших разрядов (поскольку каждый элемент занимает 4 байта), суммируются с базовым адресом каталога страниц. Этим формируется адрес элемента PDE каталога и, тем самым, выбирается один из его 1024 элементов. Выбранный элемент PDE определяет 20 старших бит адреса таблицы страниц. С помощью дополнения их 12 нулями со стороны младших разрядов, формируется базовый адрес соответствующей таблицы страниц в адресном пространстве процессора. · Средние 10 бит, биты (21…12) линейного адреса, индексируют таблицу страниц. Дополненные со стороны младших разрядов двумя нулями (поскольку каждые элемент PTE также занимает 4 байта) и, суммируясь с базовым адресом выбранной таблицы страниц, они образуют адрес в адресном пространстве запрашиваемого элемента PTE. Из последнего извлекается 20 старших разрядов базового адреса страничного кадра в физической памяти. Дополнив их 12 нулевыми младшими разрядами, процессор формирует полный базовый адрес выбранного страничного кадра в адресном пространстве. · 20 старших разрядов базового адреса страничного кадра, хранимые в элементе PTE, объединяются (конкатенируются, сцепляются) с младшими 12 битами (11…0) линейного адреса, в результате чего получается 32-битный физический адрес, по которому производится обращение к адресуемому байту памяти. Из изложенного следует, что полный размер всех служебных страниц в двухэтапном преобразовании адреса, в общем случае, составляет: 4 Кбайт (каталог страниц) плюс 4Мбайт (1024 таблицы страниц по 4 Кбайт каждая). Однако в любой практической системе требуемый для таблиц размер памяти можно существенно уменьшить. Заметим, что в процессорах шестого поколения семейства Х86, т.е. начиная с процессора Pentium Pro, шина адреса используется 36 разрядная и, следовательно, адресное пространство у них составляет 64 Гбайт. Поэтому в процессорах шестого поколения, при организации страничной переадресации, имеется четыре каталога страниц, и старшие 4 бита линейного адреса используются для выбора одного из них.
Формат элементов каталога и таблицы страниц. Элементы каталога страниц – PDE и элементы таблиц страниц – PTE имеют одинаковый формат, представленный на рисунке III.21. Отличие между ними заключается только в способах интерпретации битов 6 и 7 элемента.
31 12 11 9 8 7 6 5 4 3 2 1 0
31 12 11 9 8 7 6 5 4 3 2 1 0
Рис. III.21. Формат элементов каталога и таблиц страниц
Адрес страничного кадра. В элементе PDE адрес страничного кадра представляет старшие 20 разрядов адреса таблицы страниц (младшие 12 разрядов равны 0). В элементе PTE адрес страничного кадра представляет старшие 20 разрядов начального адреса страницы, содержащей данные или команды, которые впоследствии конкатенируются с 12 младшими разрядами линейного адреса. Биты системного программиста. Процессор их не использует. Разработчики ОС могут привлекать эти биты для хранения информации о «старении» таблиц страниц, т.е. о том, как часто они используются. P (Present) – бит присутствия. Этот бит показывает, присутствует ли данная страница в физической памяти (P=1) или нет (P=0). Если P=0 остальная часть элемента таблицы страниц доступна для ОС, например для хранения информации о местонахождении отсутствующей страницы. Если бит P сброшен в нуль, в каком либо элементе (PDE или PTE), то при попытке использовать этот элемент возникает особый случай (исключение ) страничного нарушения. При этом реализуется такая последовательность событий. · ОС копирует страницу с магнитного диска в физическую память. · ОС загружает адрес страничного кадра в элемент таблицы страниц и устанавливает бит P. Могут быть также установлены и другие биты, например, бит R/W. · Так как в буфере TLB может оставаться копия старого элемента таблицы страниц, она очищает его. · Осуществляется рестарт команды, вызвавшей этот особый случай. Эти действия могут дополняться операцией выбора одного из страничных кадров и пересылку его на магнитный диск (винчестер). Биты обращения A (Accessed) и «грязный» бит D (Dirty) – содержат информацию об использовании страницы. Бит A сообщает об обращении, для считывания или записи, к странице или таблице страниц, а бит D сообщает об обращении к таблице для записи. Периодически проверяя и сбрасывая биты A во всех элементах таблиц страниц, операционная система может следить за наиболее часто используемыми страницами памяти. Бит D операционная система привлекает при возвращении страницы на магнитный диск. Состояние D=0 показывает, что содержимое страничного кадра не изменялось и, при выборе его для передачи на диск, в процессе свопинга физическую передачу производить не нужно. Когда же бит D=1, при выборе страничного кадра на удаление из физической памяти его содержимое необходимо записывать на диск. Биты: R/W (Read/Write - бит считывания/записи, и U/S (User/Supervisor - пользователь/супервизор), используются в механизме защиты на страничном уровне. При этом контроль достоверности обращения осуществляется одновременно с преобразованием адреса. Если запрос страницы осуществляется программой пользователя (уровень привилегий PL=3), то при значении бита U/S = 0, этот запрос выполнен не будет, а процессор уйдет на прерывание. Если U/S = 1, то при значении R/W = 0 разрешено только чтение каталога или страницы, а при R/W = 1 возможны и чтение и запись. Биты управления кэшированием PCD (Page Cache Disable – запрещение кэширования страницы) и PWT (Page Write Through – бит сквозной записи) применяются для управления кэшированием отдельных страниц. Бит PWT определяет политику записи при кэшировании (при PWT = 0 реализуется метод обратной записи для сохранения целостности данных памяти, а при PWT = 1 –реализуется метод сквозной записи). Бит PCD запрещает кэширование памяти для обслуживаемых страниц или таблиц. Отметим, что эти биты впервые введены в процессорах i486 и затем используются во всех дальнейших моделях процессоров семейства Х86. G – бит глобальности. Он программно устанавливается в состояние 1, чтобы отметить каталоги страниц или страницы, часто используемые при решении данной задачи. Базовые адреса этих каталогов или страниц, загруженные во внутреннюю буферную кэш-память TLB (Translation Look-aside Buffer – буфер ассоциативной трансляции ), блока страничной переадресации, сохраняются при ее очистке. В PDE бит 6 всегда равен 0, зато бит 7 является действующим битом PS (Page Size), который задает размер страницы. При PS =0 страница имеет размер 4 Кбайт. PS =1 используется только в МП Pentium+ при включении в управляющем регистре CR4 расширений PAE и PSE. Дело в том, что для процессоров Pentium+, т.е. процессоров пятого (P5) и шестого поколения (P6) семейства Х86 дополнительно предусмотрено страничное преобразование со страницами размером 4 Мбайт. Этот режим работы получил название PSE (Page Size Extension – расширение размера страниц). Для включения этого режима устанавливается в состояние 1 бит PSE в регистре общего управления CR4. Кроме того, устанавливается в состояние 1 бит 7 (PS – Page Size) в элементе каталога страниц В этом случае ступень таблиц страниц исключается и 10 старших разрядов из элемента каталога страниц конкатенируются (объединяются) с 22 младшими разрядами линейного адреса, образуя физический адрес адресуемого байта в адресном пространстве памяти. Схема страничного преобразования при страницах равных 4 Мбайт приведена на рис.III.22.
На первый взгляд процесс страничного преобразования выглядит довольно сложным, и должен приводить к большой потери производительности процессора, при его разрешении. Ведь при включенном механизме страничного преобразования, каждое обращения к памяти потребует две дополнительные операции считывания из нее: первое для передачи в процессор требуемого элемента PDE и второе для передачи в процессор необходимого элемента PTE. Однако, практически, снижение производительности процессора при разрешенном страничном преобразовании оказывается весьма незначительным. Прежде всего, потому, что устройство процессора, реализующее страничную переадресацию, включает в себя множественно-ассоциативную кэш – память TLB (Translation look aside Buffer – буфер ассоциативной трансляции), которая содержит последние используемые 32 элемента PTE. Каждый элемент PTE определяет одну из страниц, а каждая из страниц содержит 4К байтовых адресов в физической памяти. Таким образом, в кэш–буфере TLB может храниться информация об используемых за последнее время адресах для 128 Кбайт физической памяти. И, следовательно, когда блок сегментации формирует линейный адрес, который отображен на находящийся в кэш-буфере элемент PTE, страничное преобразование осуществляется без дополнительного обращения к памяти. Практический опыт показывает, что это происходит в 98% случаев. Таким образом, дополнительное обращение к памяти при страничном преобразовании происходит только при обращении к новой странице, а это происходит сравнительно редко, учитывая принцип «локальности программ». Более подробно принцип работы TLB будет рассмотрен в разделе, посвященном общим принципам организации кэш-памятей современного компьютера.
Замечания по сегментному и страничному преобразованию адресов. Использование принципа сегментации памяти в современных процессорах позволило: · Организовать виртуальную память; · Реализовать базовую защиту сегментов памяти от ошибок, связанных с указанием в программе неправильных логических адресов, нарушениями пределов вызываемых сегментов или нарушениями правил их использования; · Реализовать механизм защиты сегментов памяти по привилегиям, позволяющий надежно обеспечить защиту операционной системы от несанкционированных или случайных обращений к ней, которые могли бы привести к нарушению ее правильной работы. Однако сегментация памяти ведет и к некоторым издержкам. Так, например, сегментация влечет за собой операции с неудобными 48 разрядными логическими адресами (указателями – селектор:смещение). Кроме того, принцип сегментации допускает формирование сегментов разного размера, что приводит к неэффективности использования физической оперативной памяти. Это объясняется тем, что в результате свопинга могут появиться многочисленные и довольно значительные «дыры» (т.е. неиспользованные области) между сегментами в физической памяти. Но, пожалуй, наиболее существенным недостатком является необходимость выполнения ряда дополнительных действий при загрузке селекторов в сегментные регистры. Эта операция влечет за собой необходимость обязательной загрузки из дескрипторной таблицы оперативной памяти в теневой регистр процессора соответствующего восьмибайтного дескриптора. Для этого требуется хотя бы один цикл шины. Кроме того, при этом, в дескрипторной таблице бит A этого дескриптора должен быть установлен в 1, отмечая произошедшее обращение к соответствующему сегменту. А эта операция также требует хотя бы одного цикла шины. Следует отметить, что при этом осуществляется еще и контроль типа сегмента, размера дескрипторных таблиц и уровней привилегий. Поэтому загрузка сегментного регистра длится значительно дольше, чем загрузка регистра общего назначения. Отметим, при этом, что следствием вышесказанного является то, что маленькие сегменты делать невыгодно с точки зрения производительности работы процессора. Однако делать крупные сегменты нерационально с точки зрения эффективности использования физической памяти, поскольку заполнить сегменты полностью программным продуктом, в этом случае, гораздо сложнее. Инициализация системы страничного преобразования позволяет уменьшить влияние некоторых недостатков сегментации памяти. Основным достоинством страничной организации памяти является фиксированный размер страницы. Поскольку неиспользованных областей памяти между страницами нет, то отсутствует и проблема внешней фрагментации памяти (наличие неиспользованных «дыр» между сегментами). Конечно, может иметь место внутренняя фрагментация, т.е. не полная заполненность отдельных страниц памяти, когда программный объект точно не укладывается в страницу или несколько страниц. Однако, в связи со сравнительно небольшим размером страниц, эта внутренняя фрагментация оказывает значительно меньшее влияние на эффективность использования памяти, чем фрагментация на уровне сегментов.
|