ГЛАВА 12 МНОГОПРОЦЕССОРНЫЕ СИСТЕМЫ В классической постановке для системы UNIX предполагается использование однопроцессорной архитектуры, состоящей из одного ЦП, памяти и периферийных устройств. Многопроцессорная архитектура, напротив, включает в себя два и более ЦП, совместно использующих общую память и периферийные устройства (Ри- сунок 12.1), располагая большими возможностями в увеличении производитель- ности системы, связанными с одновременным исполнением процессов на разных ЦП. Каждый ЦП функционирует независимо от других, но все они работают с од- ним и тем же ядром операционной системы. Поведение процессов в такой системе ничем не отличается от поведения в однопроцессорной системе - с сохранением семантики обращения к каждой системной функции - но при этом они могут отк- рыто перемещаться с одного процессора на другой. Хотя, к сожалению, это не приводит к снижению затрат процессорного времени, связанного с выполнением процесса. Отдельные многопроцессорные системы называются системами с присое- диненными процессорами, поскольку в них периферийные устройства доступны не для всех процессоров. За исключением особо оговоренных случаев, в настоящей главе не проводится никаких различий между системами с присоединенными про- цессорами и остальными классами многопроцессорных систем. Параллельная работа нескольких процессоров в режиме ядра по выполнению различных процессов создает ряд проблем, связанных с сохранением целостности данных и решаемых благодаря использованию соответствующих механизмов защиты. Ниже будет показано, почему классический вариант системы UNIX не может быть принят в многопроцессорных системах без внесения необходимых изменений, а также будут рассмотрены два варианта, предназначенные для работы в указанной среде. ------------- ------------- ------------- | Процессор | | Процессор | | Процессор | | 1 | | 2 | ........... | n | ------т------ ------т------ ------т------ ------------------т----------------------т------------------------ ---------- --------------------------- | Память | | Периферийные устройства | ---------- --------------------------- Рисунок 12.1. Многопроцессорная конфигурация 12.1 ПРОБЛЕМЫ, СВЯЗАННЫЕ С МНОГОПРОЦЕССОРНЫМИ СИСТЕМАМИ В главе 2 мы говорили о том, что защита целостности структур данных ядра системы UNIX обеспечивается двумя способами: ядро не может выгрузить один процесс и переключиться на контекст другого, если работа производится в ре- жиме ядра, кроме того, если при выполнении критического участка программы обработчик возникающих прерываний может повредить структуры данных ядра, все возникающие прерывания тщательно маскируются. В многопроцессорной системе, однако, если два и более процессов выполняются одновременно в режиме ядра на разных процессорах, нарушение целостности ядра может произойти даже несмотря на принятие защитных мер, с другой стороны, в однопроцессорной системе впол- не достаточных. 362 --------------------------------------------------------- | struct queue { | | | | } *bp, *bp1; | | bp1->forp=bp->forp; | | bp1->backp=bp; | | bp->forp=bp1; | | /* рассмотрите возможность переключения контекста в | | * этом месте */ | | bp1->forp->backp=bp1; | --------------------------------------------------------- Рисунок 12.2. Включение буфера в список с двойными указателями В качестве примера рассмотрим фрагмент программы из главы 2 (Рисунок 12.2), в котором новая структура данных (указатель bp1) помещается в список после существующей структуры (указатель bp). Предположим, что этот фрагмент выполняется одновременно двумя процессами на разных ЦП, причем процессор A пытается поместить вслед за структурой bp структуру bpA, а процессор B - структуру bpB. По поводу сопоставления быстродействия процессоров не прихо- дится делать никаких предположений: возможен даже наихудший случай, когда процессор B исполняет 4 команды языка Си, прежде чем процессор A исполнит одну. Пусть, например, выполнение программы процессором A приостанавливается в связи с обработкой прерывания. В результате, даже несмотря на блокировку остальных прерываний, целостность данных будет поставлена под угрозу (в гла- ве 2 этот момент уже пояснялся). Ядро обязано удостовериться в том, что такого рода нарушение не сможет произойти. Если вопрос об опасности возникновения нарушения целостности ос- тавить открытым, как бы редко подобные нарушения ни случались, ядро утратит свою неуязвимость и его поведение станет непредсказуемым. Избежать этого можно тремя способами: 1. Исполнять все критические операции на одном процессоре, опираясь на стандартные методы сохранения целостности данных в однопроцессорной сис- теме; 2. Регламентировать доступ к критическим участкам программы, используя эле- менты блокирования ресурсов; 3. Устранить конкуренцию за использование структур данных путем соответст- вующей переделки алгоритмов. Первые два способа здесь мы рассмотрим подробнее, третьему способу будет посвящено отдельное упражнение. 12.2 ГЛАВНЫЙ И ПОДЧИНЕННЫЙ ПРОЦЕССОРЫ Систему с двумя процессорами, один из которых - главный (master) - может работать в режиме ядра, а другой - подчиненный (slave) - только в режиме за- дачи, впервые реализовал на машинах типа VAX 11/780 Гобл (см. [Goble 81]). Эта система, реализованная вначале на двух машинах, получила свое дальнейшее развитие в системах с одним главным и несколькими подчиненными процессорами. Главный процессор несет ответственность за обработку всех обращений к опера- ционной системе и всех прерываний. Подчиненные процессоры ведают выполнением процессов в режиме задачи и информируют главный процессор о всех производи- мых обращениях к системным функциям. Выбор процессора, на котором будет выполняться данный процесс, произво- дится в соответствии с алгоритмом диспетчеризации (Рисунок 12.3). В соответ- ствующей записи таблицы процессов появляется новое поле, в которое записыва- ется идентификатор выбранного процессора; предположим для простоты, что он показывает, является ли процессор главным или подчиненным. Когда процесс 363 производит обращение к системной функции, выполняясь на подчиненном процес- соре, подчиненное ядро переустанавливает значение поля идентификации процес- сора таким образом, чтобы оно указывало на главный процессор, и переключает контекст на другие процессы (Рисунок 12.4). Главное ядро запускает на выпол- нение процесс с наивысшим приоритетом среди тех процессов, которые должны выполняться на главном процессоре. Когда выполнение системной функции завер- шается, поле идентификации процессора перенастраивается обратно, и процесс вновь возвращается на подчиненный процессор. Если процессы должны выполняться на главном процессоре, желательно, что- бы главный процессор обрабатывал их как можно скорее и не заставлял их ждать своей очереди чересчур долго. Похожая мотивировка приводится в объяснение выгрузки процесса из памяти в однопроцессорной системе после выхода из сис- темной функции с освобождением соответствующих ресурсов для выполнения более насущных счетных операций. Если в тот момент, когда подчиненный процессор делает запрос на исполнение системной функции, главный процесс выполняется в режиме задачи, его выполнение будет продолжаться до следующего переключения контекста. Главный процессор реагировал бы гораздо быстрее, если бы подчи- ненный процессор устанавливал при этом глобальный флаг; проверяя установку флага во время обработки очередного прерывания по таймеру, главный процессор произвел бы в итоге переключение контекста максимум через один таймерный тик. С другой стороны, подчиненный процессор мог бы прервать работу главного и заставить его переключить контекст немедленно, но данная возможность тре- бует специальной аппаратной реализации. -------------------------------------------------------------- | алгоритм schedule_process (модифицированный) | | входная информация: отсутствует | | выходная информация: отсутствует | | { | | выполнять пока (для запуска не будет выбран один из про-| | цессов) | | { | | если (работа ведется на главном процессоре) | | для (всех процессов в очереди готовых к выполне- | | нию) | | выбрать процесс, имеющий наивысший приоритет | | среди загруженных в память; | | в противном случае /* работа ведется на подчинен- | | * ном процессоре */ | | для (тех процессов в очереди, которые не нуждают-| | ся в главном процессоре) | | выбрать процесс, имеющий наивысший приоритет | | среди загруженных в память; | | если (для запуска не подходит ни один из процессов) | | не загружать машину, переходящую в состояние про-| | стоя; | | /* из этого состояния машина выходит в результате| | * прерывания */ | | } | | убрать выбранный процесс из очереди готовых к выполне- | | нию; | | переключиться на контекст выбранного процесса, возобно- | | вить его выполнение; | | } | -------------------------------------------------------------- Рисунок 12.3. Алгоритм диспетчеризации 364 -------------------------------------------------------------- | алгоритм syscall /* исправленный алгоритм вызова систем- | | * ной функции */ | | входная информация: код системной функции | | выходная информация: результат выполнения системной функции| | { | | если (работа ведется на подчиненном процессоре) | | { | | переустановить значение поля идентификации процессо-| | ра в соответствующей записи таблицы процессов; | | произвести переключение контекста; | | } | | выполнить обычный алгоритм реализации системной функции;| | перенастроить значение поля идентификации процессора, | | чтобы оно указывало на 'любой' (подчиненный); | | если (на главном процессоре должны выполняться другие | | процессы) | | произвести переключение контекста; | | } | -------------------------------------------------------------- Рисунок 12.4. Алгоритм обработки обращения к системной функции Программа обработки прерываний по таймеру на подчиненном процессоре сле- дит за периодичностью перезапуска процессов, не допуская монопольного ис- пользования процессора одной задачей. Кроме того, каждую секунду эта прог- рамма выводит подчиненный процессор из состояния бездействия (простоя). Под- чиненный процессор выбирает для выполнения процесс с наивысшим приоритетом среди тех процессов, которые не нуждаются в главном процессоре. Единственным местом, где целостность структур данных ядра еще подверга- ется опасности, является алгоритм диспетчеризации, поскольку он не предохра- няет от выбора процесса на выполнение сразу на двух процессорах. Например, если в конфигурации имеется один главный процессор и два подчиненных, не ис- ключена возможность того, что оба подчиненных процессора выберут для выпол- нения в режиме задачи один и тот же процесс. Если оба процессора начнут вы- полнять его параллельно, осуществляя чтение и запись, это неизбежно приведет к искажению содержимого адресного пространства процесса. Избежать возникновения этой проблемы можно двумя способами. Во-первых, главный процессор может явно указать, на каком из подчиненных процессоров следует выполнять данный процесс. Если на каждый процессор направлять нес- колько процессов, возникает необходимость в сбалансировании нагрузки (на один из процессоров назначается большое количество процессов, в то время как другие процессоры простаивают). Задача распределения нагрузки между процес- сорами ложится на главное ядро. Во-вторых, ядро может проследить за тем, чтобы в каждый момент времени в алгоритме диспетчеризации принимал участие только один процессор, для этого используются механизмы, подобные семафорам. 12.3 СЕМАФОРЫ Поддержка системы UNIX в многопроцессорной конфигурации может включать в себя разбиение ядра системы на критические участки, параллельное выполнение которых на нескольких процессорах не допускается. Такие системы предназнача- лись для работы на машинах AT&T 3B20A и IBM 370, для разбиения ядра исполь- зовались семафоры (см. [Bach 84]). Нижеследующие рассуждения помогают понять суть данной особенности. При ближайшем рассмотрении сразу же возникают два вопроса: как использовать семафоры и где определить критические участки. Как уже говорилось в главе 2, если при выполнении критического участка программы процесс приостанавливается, для защиты участка от посягательств со 365 стороны других процессов алгоритмы работы ядра однопроцессорной системы UNIX используют блокировку. Механизм установления блокировки: выполнять пока (блокировка установлена) /* операция проверки */ приостановиться (до снятия блокировки); установить блокировку; механизм снятия блокировки: снять блокировку; вывести из состояния приостанова все процессы, приостановленные в ре- зультате блокировки; Процесс A/Процессор A Процесс B/Процессор B ---------------------------------------------------------- | ----------------------------- | | Блокировка НЕ установлена | | щ ----------------------------- щ | щ щ | щ щ | Проверяет, установлена Проверяет, установлена | ли блокировка ли блокировка | (нет) (нет) t - + - - - - - - - - - - - - - - - - - - - - - - - - - - - - - | Устанавливает Устанавливает | блокировку блокировку | | Использует ресурс Использует ресурс v ^ ^ Время | | -------- -------- Опасность нарушения целостности Рисунок 12.5. Конкуренция за установку блокировки в многопро- цессорных системах Блокировки такого рода охватывают некоторые критические участки, но не работают в многопроцессорных системах, что видно из Рисунка 12.5. Предполо- жим, что блокировка снята и что два процесса на разных процессорах одновре- менно пытаются проверить ее наличие и установить ее. В момент t они обнару- живают снятие блокировки, устанавливают ее вновь, вступают в критический участок и создают опасность нарушения целостности структур данных ядра. В условии одновременности имеется отклонение: механизм не сработает, если пе- ред тем, как процесс выполняет операцию проверки, ни один другой процесс не выполнил операцию установления блокировки. Если, например, после обнаружения снятия блокировки процессор A обрабатывает прерывание и в этот момент про- цессор B выполняет проверку и устанавливает блокировку, по выходе из преры- вания процессор A так же установит блокировку. Чтобы предотвратить возникно- вение подобной ситуации, нужно сделать так, чтобы процедура блокирования бы- ла неделимой: проверку наличия блокировки и ее установку следует объединить в одну операцию, чтобы в каждый момент времени с блокировкой имел дело толь- ко один процесс. 12.3.1 Определение семафоров Семафор представляет собой обрабатываемый ядром целочисленный объект, для которого определены следующие элементарные (неделимые) операции: * Инициализация семафора, в результате которой семафору присваивается не- отрицательное значение; * Операция типа P, уменьшающая значение семафора. Если значение семафора 366 опускается ниже нулевой отметки, выполняющий операцию процесс приоста- навливает свою работу; * Операция типа V, увеличивающая значение семафора. Если значение семафора в результате операции становится больше или равно 0, один из процессов, приостановленных во время выполнения операции P, выходит из состояния приостанова; * Условная операция типа P, сокращенно CP (conditional P), уменьшающая значение семафора и возвращающая логическое значение 'истина' в том слу- чае, когда значение семафора остается положительным. Если в результате операции значение семафора должно стать отрицательным или нулевым, ника- ких действий над ним не производится и операция возвращает логическое значение 'ложь'. Определенные таким образом семафоры, безусловно, никак не связаны с се- мафорами пользовательского уровня, рассмотренными в главе 11. 12.3.2 Реализация семафоров Дийкстра [Dijkstra 65] показал, что семафоры можно реализовать без ис- пользования специальных машинных инструкций. На Рисунке 12.6 представлены реализующие семафоры функции, написанные на языке Си. Функция Pprim блокиру- ет семафор по результатам проверки значений, содержащихся в массиве val; каждый процессор в системе управляет значением одного элемента массива. Прежде чем заблокировать семафор, процессор проверяет, не заблокирован ли уже семафор другими процессорами (соответствующие им элементы в массиве val тогда имеют значения, равные 2), а также не предпринимаются ли попытки в данный момент заблокировать семафор со стороны процессоров с более низким кодом идентификации (соответствующие им элементы имеют значения, равные 1). Если любое из условий выполняется, процессор переустанавливает значение сво- его элемента в 1 и повторяет попытку. Когда функция Pprim открывает внешний цикл, переменная цикла имеет значение, на единицу превышающее код идентифи- кации того процессора, который использовал ресурс последним, тем самым га- рантируется, что ни один из процессоров не может монопольно завладеть ресур- сом (в качестве доказательства сошлемся на [Dijkstra 65] и [Coffman 73]). Функция Vprim освобождает семафор и открывает для других процессоров возмож- ность получения исключительного доступа к ресурсу путем очистки соответству- ющего текущему процессору элемента в массиве val и перенастройки значения lastid. Чтобы защитить ресурс, следует выполнить следующий набор команд: Pprim(семафор); команды использования ресурса; Vprim(семафор); В большинстве машин имеется набор элементарных (неделимых) инструкций, реализующих операцию блокирования более дешевыми средствами, ибо циклы, вхо- дящие в функцию Pprim, работают медленно и снижают производительность систе- мы. Так, например, в машинах серии IBM 370 поддерживается инструкция compare and swap (сравнить и переставить), в машине AT&T 3B20 - инструкция read and clear (прочитать и очистить). При выполнении инструкции read and clear про- цессор считывает содержимое ячейки памяти, очищает ее (сбрасывает в 0) и по результатам сравнения первоначального содержимого с 0 устанавливает код за- вершения инструкции. Если ту же инструкцию над той же ячейкой параллельно выполняет еще один процессор, один из двух процессоров прочитает первона- чальное содержимое, а другой - 0: неделимость операции гарантируется аппа- ратным путем. Таким образом, за счет использования данной инструкции функцию Pprim можно было бы реализовать менее сложными средствами (Рисунок 12.7). Процесс повторяет инструкцию read and clear в цикле до тех пор, пока не бу- дет считано значение, отличное от нуля. Начальное значение компоненты сема- фора, связанной с блокировкой, должно быть равно 1. 367 Как таковую, данную семафорную конструкцию нельзя реализовать в составе ядра операционной системы, поскольку работающий с ней процесс не выходит из цикла, пока не достигнет своей цели. Если -------------------------------------------------------------- | struct semaphore | | { | | int val[NUMPROCS]; /* замок---1 элемент на каждый про- | | /* цессор */ | | int lastid; /* идентификатор процессора, полу- | | /* чившего семафор последним */ | | }; | | int procid; /* уникальный идентификатор процес- | | /* сора */ | | int lastid; /* идентификатор процессора, полу- | | /* чившего семафор последним */ | | | | INIT(semaphore) | | struct semaphore semaphore; | | { | | int i; | | for (i = 0; i < NUMPROCS; i++) | | semaphore.val[i] = 0; | | } | | Pprim(semaphore) | | struct semaphore semaphore; | | { | | int i,first; | | | | loop: | | first = lastid; | | semaphore.val[procid] = 1; | | /* продолжение на следующей странице */ | -------------------------------------------------------------- Рисунок 12.6. Реализация семафорной блокировки на Си семафор используется для блокирования структуры данных, процесс, обнаружив семафор заблокированным, приостанавливает свое выполнение, чтобы ядро имело возможность переключиться на контекст другого процесса и выполнить другую полезную работу. С помощью функций Pprim и Vprim можно реализовать более сложный набор семафорных операций, соответствующий тому составу, который оп- ределен в разделе 12.3.1. Для начала дадим определение семафора как структуры, состоящей из поля блокировки (управляющего доступом к семафору), значения семафора и очереди процессов, приостановленных по семафору. Поле блокировки содержит информа- цию, открывающую во время выполнения операций типа P и V доступ к другим по- лям структуры только одному процессу. По завершении операции значение поля сбрасывается. Это значение определяет, разрешен ли процессу доступ к крити- ческому участку, защищаемому семафором. В начале выполнения алгоритма опера- ции P (Рисунок 12.8) ядро с помощью функции Pprim предоставляет процессу право исключительного доступа к семафору и уменьшает значение семафора. Если семафор имеет неотрицательное значение, текущий процесс получает доступ к критическому участку. По завершении работы процесс сбрасывает блокировку се- мафора (с помощью функции Vprim), открывая доступ к семафору для других про- цессов, и возвращает признак успешного завершения. Если же в результате уменьшения значение семафора становится отрицательным, ядро приостанавливает выполнение процесса, используя алгоритм, 368 -------------------------------------------------------------- | forloop: | | for (i = first; i < NUMPROCS; i++) | | { | | if (i == procid) | | { | | semaphore.val[i] = 2; | | for (i = 1; i < NUMPROCS; i++) | | if (i != procid && semaphore.val[i] == 2) | | goto loop; | | lastid = procid; | | return; /* успешное завершение, ресурс | | /* можно использовать | | */ | | } | | else if (semaphore.val[i]) | | goto loop; | | } | | first = 1; | | goto forloop; | | } | | Vprim(semaphore) | | struct semaphore semaphore; | | { | | lastid = (procid + 1) % NUMPROCS; /* на следующий | | /* процессор */ | | semaphore.val[procid] = 0; | | } | -------------------------------------------------------------- Рисунок 12.6. Реализация семафорной блокировки на Си (продолжение) подобный алгоритму sleep (глава 6): основываясь на значении приоритета, ядро проверяет поступившие сигналы, включает текущий процесс в список приостанов- ленных процессов, в котором последние представлены в порядке поступления, и выполняет переключение контекста. Операция V (Рисунок 12.9) получает исклю- чительный доступ к семафору через функцию Pprim и увеличивает значение сема- фора. Если очередь приостановленных по семафору процессов непуста, ядро вы- бирает из нее первый процесс и переводит его в состояние 'готовности к за- пуску'. Операции P и V по своему действию похожи на функции sleep и wakeup. Главное различие между ними состоит в том, что семафор является структурой данных, тогда как используемый функциями sleep и wakeup адрес представляет собой всего лишь число. Если начальное значение семафора - нулевое, при вы- полнении операции P над семафором процесс всегда приостанавливается, поэтому операция P может заменять функцию sleep. Операция V, тем не менее, выводит из состояния приостанова только один процесс, тогда как однопроцессорная функция wakeup возобновляет все процессы, приостановленные по адресу, свя- занному с событием. С точки зрения семантики использование функции wakeup означает: данное системное условие более не удовлетворяется, следовательно, все приостанов- ленные по условию процессы должны выйти из состояния приостанова. Так, нап- ример, процессы, приостановленные в связи с занятостью буфера, не должны дальше пребывать в этом состоянии, если буфер больше не используется, поэто- му они возоб- новляются ядром. Еще один пример: если несколько процессов выводят данные на терминал с помощью функции write, терминальный драйвер может перевести их в 369 --------------------------------------------------------- | struct semaphore { | | int lock; | | }; | | | | Init(semaphore) | | struct semaphore semaphore; | | { | | semaphore.lock = 1; | | } | | | | Pprim(semaphore) | | struct semaphore semaphore; | | { | | while (read_and_clear(semaphore.lock)) | | ; | | } | | | | Vprim(semaphore) | | struct semaphore semaphore; | | { | | semaphore.lock = 1; | | } | --------------------------------------------------------- Рисунок 12.7. Операции над семафором, использующие инструкцию read and clear состояние приостанова в связи с невозможностью обработки больших объемов ин- формации. Позже, когда драйвер будет готов к приему следующей порции данных, он возобновит все приостановленные им процессы. Использование операций P и V в тех случаях, когда устанавливающие блокировку процессы получают доступ к ресурсу поочередно, а все остальные процессы - в порядке поступления запро- сов, является более предпочтительным. В сравнении с однопроцессорной проце- дурой блокирования (sleep-lock) данная схема обычно выигрывает, так как если при наступлении события все процессы возобновляются, большинство из них мо- жет вновь наткнуться на блокировку и снова перейти в состояние приостанова. С другой стороны, в тех случаях, когда требуется вывести из состояния приос- танова все процессы одновременно, использование операций P и V представляет известную сложность. Если операция возвращает значение семафора, является ли она эквивалент- ной функции wakeup ? while (value(semaphore) < 0) V(semaphore); Если вмешательства со стороны других процессов нет, ядро повторяет цикл до тех пор, пока значение семафора не станет больше или равно 0, ибо это оз- начает, что в состоянии приостанова по семафору нет больше ни одного процес- са. Тем не менее, нельзя исклю- чить и такую возможность, что сразу после того, как процесс A при тестирова- нии семафора на одноименном процессоре обнаружил нулевое значение семафора, процесс B на своем процессоре выполняет операцию P, уменьшая значение сема- фора до -1 (Рисунок 12.10). Процесс A продолжит свое выполнение, думая, что им возобновлены все приостановленные по семафору процессы. Таким образом, цикл выполнения операции не дает гарантии возобновления всех приостановлен- ных процессов, поскольку он не является элементарным. 370 -------------------------------------------------------------- | алгоритм P /* операция над семафором типа P */ | | входная информация: (1) семафор | | (2) приоритет | | выходная информация: 0 - в случае нормального завершения | | -1 - в случае аварийного выхода из | | состояния приостанова по сигналу, при-| | нятому в режиме ядра | | { | | Pprim(semaphore.lock); | | уменьшить (semaphore.value); | | если (semaphore.value >= 0) | | { | | Vprim(semaphore.lock); | | вернуть (0); | | } | | /* следует перейти в состояние приостанова */ | | если (проверяются сигналы) | | { | | если (имеется сигнал, прерывающий нахождение в сос- | | тоянии приостанова) | | { | | увеличить (semaphore.value); | | если (сигнал принят в режиме ядра) | | { | | Vprim(semaphore.lock); | | вернуть (-1); | | } | | в противном случае | | { | | Vprim(semaphore.lock); | | longjmp; | | } | | } | | } | | поставить процесс в конец списка приостановленных по се-| | мафору; | | Vprim(semaphore.lock); | | выполнить переключение контекста; | | проверить сигналы (см. выше); | | вернуть (0); | | } | -------------------------------------------------------------- Рисунок 12.8. Алгоритм выполнения операции P Рассмотрим еще один феномен, связанный с использованием семафоров в од- нопроцессорной системе. Предположим, что два процесса, A и B, конкурируют за семафор. Процесс A обнаруживает, что семафор свободен и что процесс B приос- тановлен; значение семафора равно -1. Когда с помощью операции V процесс A освобождает семафор, он выводит тем самым процесс B из состояния приостанова и вновь делает значение семафора нулевым. Теперь предположим, что процесс A, по-прежнему выполняясь в режиме ядра, пытается снова заблокировать семафор. Производя операцию P, процесс приостановится, поскольку семафор имеет нуле- вое значение, несмотря на то, что ресурс пока свободен. Системе придется 'раскошелиться' на дополнительное переключение контекста. С другой стороны, если бы блокировка была реализована на основе однопроцессорной схемы 371 -------------------------------------------------------------- | алгоритм V /* операция над семафором типа V */ | | входная информация: адрес семафора | | выходная информация: отсутствует | | { | | Pprim(semaphore.lock); | | увеличить (semaphore.value); | | если (semaphore.value <= 0) | | { | | удалить из списка процессов, приостановленных по се-| | мафору, первый по счету процесс; | | перевести его в состояние готовности к запуску; | | } | | Vprim(semaphore.lock); | | } | -------------------------------------------------------------- Рисунок 12.9. Алгоритм выполнения операции V (sleep-lock), процесс A получил бы право на повторное использование ресурса, поскольку за это время ни один из процессов не смог бы заблокировать его. Для этого случая схема sleep-lock более подходит, чем схема с использованием семафоров. Когда блокируются сразу несколько семафоров, очередность блокирования должна исключать возникновение тупиковых ситуаций. В качестве примера расс- мотрим два семафора, A и B, и два алгоритма, требующих одновременной блоки- ровки семафоров. Если бы алгоритмы устанавливали блокировку на семафоры в обратном порядке, как следует из Рисунка 12.11, последовало бы возникновение тупиковой ситуации; процесс A на одноименном процессоре захватывает семафор SA, в то время как процесс B на своем процессоре захватывает семафор SB. Процесс A пытается захватить и семафор SB, но в результате операции P пере- ходит в состояние приостанова, поскольку значение семафора SB не превышает 0. То же самое происходит с процессом B, когда последний пытается захватить семафор SA. Ни тот, ни другой процессы продолжаться уже не могут. Для предотвращения возникновения подобных ситуаций используются соответ- ствующие алгоритмы обнаружения опасности взаимной блокировки, устанавливаю- щие наличие опасной ситуации и ликвидирующие ее. Тем не менее, использование таких алгоритмов 'утяжеляет' ядро. Поскольку число ситуаций, в которых про- цесс должен одновременно захватывать несколько семафоров, довольно ограниче- но, легче было бы реализовать алгоритмы, предупреждающие возникновение тупи- ковых ситуаций еще до того, как они будут иметь место. Если, к примеру, ка- кой-то набор семафоров всегда блокируется в одном и том же порядке, тупико- вая ситуация никогда не возникнет. Но в том случае, когда захвата семафоров в обратном порядке избежать не удается, операция CP предотвратит возникновение тупиковой ситуации (см. Ри- сунок 12.12): если операция завершится неудачно, процесс B освободит свои ресурсы, дабы избежать взаимной блокировки, и позже запустит алгоритм на вы- полнение повторно, скорее всего тогда, когда процесс A завершит работу с ре- сурсом. Чтобы предупредить одновременное обращение процессов к ресурсу, програм- ма обработки прерываний, казалось бы, могла воспользоваться семафором, но из-за того, что она не может приостанавливать свою работу (см. главу 6), ис- пользовать операцию P в этой программе нельзя. Вместо этого можно использо- вать 'циклическую блокировку' (spin lock) и не переходить в состояние приос- танова, как в следующем примере: while (! CP(semaphore)); 372 Процесс A/Процессор A Процесс B/Процессор B ------------------------------------------------------------ | щ -------------------------- щ | щ | Значение семафора = -1 | щ | щ -------------------------- щ | проверяет(значение сема- щ | фора < 0) ? щ | (да) щ | V(семафор) щ | щ щ | щ -------------------------- щ | щ | Значение семафора = 0 | щ | щ -------------------------- щ | проверяет(значение сема- щ | фора < 0) ? щ | щ щ | щ P(семафор) | щ Значение семафора = -1 | щ | (нет) | НЕВЕРНО !! v Время Рисунок 12.10. Неудачное имитация функции wakeup при исполь- зовании операции V Операция повторяется в цикле до тех пор, пока значение семафора не превысит 0; программа обработки прерываний не приостанавливается и цикл завершается только тогда, когда значение семафора станет положительным, после чего это значение будет уменьшено операцией CP. Чтобы предотвратить ситуацию взаимной блокировки, ядру нужно запретить все прерывания, выполняющие 'циклическую блокировку'. Иначе выполнение про- цесса, захватившего семафор, будет прервано еще до того, как он сможет осво- бодить семафор; если программа обработки прерываний попытается захватить этот семафор, используя 'циклическую блокировку', ядро заблокирует само се- бя. В качестве примера обратимся к Рисунку 12.13. В момент возникновения Процесс A/Процессор A Процесс B/Процессор B ------------------------------------------------------------ | P(семафор SA); щ | щ щ | щ щ | щ щ | щ P(семафор SB); | щ щ | щ щ | щ щ | щ P(семафор SA); | щ приостанавливается | щ | P(семафор SB); | приостанавливается | v Взаимная блокировка !! Время Рисунок 12.11. Возникновение тупиковой ситуации из-за смены очередности блокирования 373 прерывания значение семафора не превышает 0, поэтому результатом выполнения операции CP всегда будет 'ложь'. Проблема решается путем запрещения всех прерываний на то время, пока семафор захвачен процессом. 12.3.3 Примеры алгоритмов В данном разделе мы рассмотрим четыре алгоритма ядра, реализованных с использованием семафоров. Алгоритм выделения буфера иллюстрирует сложную схему блокирования, на примере алгоритма wait показана синхронизация выпол- нения процессов, схема блокирования драйверов реализует изящный подход к ре- шению данной проблемы, и наконец, метод решения проблемы холостой работы процессора показывает, что нужно сделать, чтобы избежать конкуренции между процессами. 12.3.3.1 Выделение буфера Обратимся еще раз к алгоритму getblk, рассмотренному нами в главе 3. Ал- горитм работает с тремя структурами данных: заголовком буфера, хеш-очередью буферов и списком свободных буферов. Ядро связывает семафор со всеми экземп- лярами каждой структуры. Другими словами, если у ядра имеются в распоряжении 200 буферов, заголовок каждого из них включает в себя семафор, используемый для захвата буфера; когда процесс выполняет над семафором операцию P, другие процессы, тоже пожелавшие захватить буфер, приостанавливаются до тех пор, пока первый процесс не исполнит операцию V. У каждой хеш-очереди буферов также имеется семафор, блокирующий доступ к очереди. В однопроцессорной сис- теме блокировка хеш-оче- Процесс A/Процессор A Процесс B/Процессор B ------------------------------------------------------------ | P(семафор SA); щ | щ щ | щ P(семафор SB); | щ щ | щ щ | щ если (! CP(семафор SA)) | щ { | щ V(семафор SB); | щ перезапустить алго- | щ ритм | щ } | P(семафор SB); | приостанавливается v Время Рисунок 12.12. Использование операции P условного типа для предотвращения взаимной блокировки реди не нужна, ибо процесс никогда не переходит в состояние приостанова, ос- тавляя очередь в несогласованном (неупорядоченном) виде. В многопроцессорной системе, тем не менее, возможны ситуации, когда с одной и той же хеш-оче- редью работают два процесса; в каждый момент времени семафор открывает дос- 374 туп к очереди только для одного процесса. По тем же причинам и список сво- бодных буферов нуждается в семафоре для защиты содержащейся в нем информации от искажения. На Рисунке 12.14 показана первая часть алгоритма getblk, реализованная в многопроцессорной системе с использованием семафоров. Просматривая буферный кеш в поисках указанного блока, ядро с помощью операции P захватывает сема- фор, принадлежащий хеш-очереди. Если над семафором уже кем-то произведена операция данного типа, текущий процесс приостанавливается до тех пор, пока процесс, захвативший семафор, не освободит его, выполнив операцию V. Когда текущий процесс получает право исключительного контроля над хеш-очередью, он приступает к поиску подходящего буфера. Предположим, что буфер находится в хеш-очереди. Ядро (процесс A) пытается захватить буфер, но если оно исполь- зует операцию P и если буфер уже захвачен, ядру придется приостановить свою работу, оставив хеш-очередь заблокированной и не допуская таким образом об- ращений к ней со стороны других процессов, даже если последние ведут поиск незахваченных буферов. Пусть вместо этого процесс A захватывает буфер, ис- пользуя операцию CP; если операция завершается успешно, буфер становится от- крытым для процесса. Процесс A захватывает семафор, принадлежащий списку свободных буферов, выполняя операцию CP, поскольку семафор захватывается на непродолжительное время и, следовательно, приостанавливать свою работу, вы- полняя операцию P, процесс просто не имеет возможности. Ядро убирает буфер из списка свободных буферов, снимает блокировку со списка и с хеш-очереди и возвращает захваченный буфер. | | P(семафор); | (Значение семафора теперь равно 0) | | Прерывание | | CP(семафор) завершается неудачно --- | семафор захвачен | | Семафор не освобождается до выхода из прерывания. | | Выход из прерывания без его обработки невозможен. | | Тупиковая ситуация (взаимная блокировка) v Время Рисунок 12.13. Взаимная блокировка при выполнении программы обработки прерывания Предположим, что операция CP над буфером завершилась неудачно из-за то- го, что семафор, принадлежащий буферу, оказался захваченным. Процесс A осво- бождает семафор, связанный с хеш-очередью, и приостанавливается, пытаясь вы- полнить операцию P над семафором буфера. Операция P над семафором будет вы- полняться, несмотря на то, что операция CP уже потерпела неудачу. По завер- шении выполнения операции процесс A получает власть над буфером. Так как в оставшейся части алгоритма предполагается, что буфер и хеш-очередь захваче- ны, процесс A теперь пытается захватить хеш-очередь (*). Поскольку очеред- --------------------------------------- (*) Вместо захвата хеш-очереди в этом месте можно было бы установить соот- ветствующий флаг, проверяемый далее перед выполнением операции V, но чтобы проиллюстрировать схему захвата семафоров в обратной последова- тельности, в изложении мы будем придерживаться ранее описанного вариан- та. 375 ность захвата здесь (сначала семафор буфера, потом семафор очереди) обратна вышеуказанной очередности, над семафором выполняется операция CP. Если по- пытка захвата заканчивается неудачей, имеет место обычная обработка, требую- щаяся по ходу задачи. Но если захват удается, ядро не может быть уверено в -------------------------------------------------------------- | алгоритм getblk /* многопроцессорная версия */ | | входная информация: номер файловой системы | | номер блока | | выходная информация: захваченный буфер, предназначенный для| | обработки содержимого блока | | { | | выполнять (пока буфер не будет обнаружен) | | { | | P(семафор хеш-очереди); | | если (блок находится в хеш-очереди) | | { | | если (операция CP(семафор буфера) завершается не- | | удачно) /* буфер занят */ | | { | | V(семафор хеш-очереди); | | P(семафор буфера); /* приостанов до момен-| | * та освобождения | | */ | | если (операция CP(семафор хеш-очереди) заверша-| | ется неудачно) | | { | | V(семафор буфера); | | продолжить; /* выход в цикл 'выполнять' | | */ | | } | | в противном случае если (номер устройства или | | номер блока изменились) | | { | | V(семафор буфера); | | V(семафор хеш-очереди); | | } | | } | | выполнять (пока операция CP(семафор списка свобод-| | ных буферов) не завершится успешно) | | ; /* 'кольцевой цикл' */ | | пометить буфер занятым; | | убрать буфер из списка свободных буферов; | | V(семафор списка свободных буферов); | | V(семафор хеш-очереди); | | вернуть буфер; | | } | | в противном случае /* буфер отсутствует в хеш- | | * очереди | | */ | | /* здесь начинается выполнение оставшейся части алго-| | * ритма | | */ | | } | | } | -------------------------------------------------------------- Рисунок 12.14. Выделение буфера с использованием семафоров 376 том, что захвачен корректный буфер, поскольку содержимое буфера могло быть ранее изменено другим процессом, обнаружившим буфер в списке свободных буфе- ров и захватившим на время его семафор. Процесс A, ожидая освобождения сема- фора, не имеет ни малейшего представления о том, является ли интересующий его буфер тем буфером, который ему нужен, и поэтому прежде всего он должен убедиться в правильности содержимого буфера; если проверка дает отрицатель- ный результат, алгоритм запускается сначала. Если содержимое буфера коррект- но, процесс A завершает выполнение алгоритма. -------------------------------------------------------------- | многопроцессорная версия алгоритма wait | | { | | для (;;) /* цикл */ | | { | | перебор всех процессов-потомков: | | если (потомок находится в состоянии 'прекращения | | существования') | | вернуть управление; | | P(zombie_semaphore); /* начальное значение - 0 */| | } | | } | -------------------------------------------------------------- Рисунок 12.15. Многопроцессорная версия алгоритма wait Оставшуюся часть алгоритма можно рассмотреть в качестве упражнения. 12.3.3.2 Wait Из главы 7 мы уже знаем о том, что во время выполнения системной функции wait процесс приостанавливает свою работу до момента завершения выполнения своего потомка. В многопроцессорной системе перед процессом встает задача не упустить при выполнении алгоритма wait потомка, прекратившего существование с помощью функции exit; если, например, в то время, пока на одном процессоре процесс-родитель запускает функцию wait, на другом процессоре его потомок завершил свою работу, родителю нет необходимости приостанавливать свое вы- полнение в ожидании завершения второго потомка. В каждой записи таблицы про- цессов имеется семафор, именуемый zombie_semaphore и имеющий в начале нуле- вое значение. Этот семафор используется при организации взаимодействия wait/exit (Рисунок 12.15). Когда потомок завершает работу, он выполняет над семафором своего родителя операцию V, выводя родителя из состояния приоста- нова, если тот перешел в него во время исполнения функции wait. Если потомок завершился раньше, чем родитель запустил функцию wait, этот факт будет обна- ружен родителем, который тут же выйдет из состояния ожидания. Если оба про- цесса исполняют функции exit и wait параллельно, но потомок исполняет функ- цию exit уже после того, как родитель проверил его статус, операция V, вы- полненная потомком, воспрепятствует переходу родителя в состояние приостано- ва. В худшем случае процесс-родитель просто повторяет цикл лишний раз. 12.3.3.3 Драйверы В многопроцессорной реализации вычислительной системы на базе компьюте- ров AT&T 3B20 семафоры в структуру загрузочного кода драйверов не включают- ся, а операции типа P и V выполняются в точках входа в каждый драйвер (см. [Bach 84]). В главе 10 мы говорили о том, что интерфейс, реализуемый драйве- рами устройств, характеризуется очень небольшим числом точек входа (на прак- 377 тике их около 20). Защита драйверов осуществляется на уровне точек входа в них: P(семафор драйвера); открыть (драйвер); V(семафор драйвера); Если для всех точек входа в драйвер использовать один и тот же семафор, но при этом для разных драйверов - разные семафоры, критический участок программы драйвера будет исполняться процессом монопольно. Семафоры могут назначаться как отдельному устройству, так и классам устройств. Так, напри- мер, отдельный семафор может быть связан и с отдельным физическим терминалом и со всеми терминалами сразу. В первом случае быстродействие системы выше, ибо процессы, обращающиеся к терминалу, не захватывают семафор, имеющий от- ношение к другим терминалам, как во втором случае. Драйверы некоторых уст- ройств, однако, поддерживают внутреннюю связь с другими драйверами; в таких случаях использование одного семафора для класса устройств облегчает понима- ние задачи. В качестве альтернативы в вычислительной системе 3B20A предос- тавлена возможность такого конфигурирования отдельных устройств, при котором программы драйвера запускаются на точно указанных процессорах. Проблемы возникают тогда, когда драйвер прерывает работу системы и его семафор захвачен: программа обработки прерываний не может быть вызвана, так как иначе возникла бы угроза разрушения данных. С другой стороны, ядро не может оставить прерывание необработанным. Система 3B20A выстраивает прерыва- ния в очередь и ждет момента освобождения семафора, когда вызов программы обработки прерываний не будет иметь опасные последствия. 12.3.3.4 Фиктивные процессы Когда ядро выполняет переключение контекста в однопроцессорной системе, оно функционирует в контексте процесса, уступающего управление (см. главу 6). Если в системе нет процессов, готовых к запуску, ядро переходит в состо- яние простоя в контексте процесса, выполнявшегося последним. Получив преры- вание от таймера или других периферийных устройств, оно обрабатывает его в контексте того же процесса. В многопроцессорной системе ядро не может простаивать в контексте про- цесса, выполнявшегося последним. Посмотрим, что произойдет после того, как процесс, приостановивший свою работу на процессоре A, выйдет из состояния приостанова. Процесс в целом готов к запуску, но он запускается не сразу же по выходе из состояния приостанова, даже несмотря на то, что его контекст уже находится в распоряжении процессора A. Если этот процесс выбирается для запуска процессором B, последний переключается на его контекст и возобновля- ет его выполнение. Когда в результате прерывания процессор A выйдет из прос- тоя, он будет продолжать свою работу в контексте процесса A до тех пор, пока не произведет переключение контекста. Таким образом, в течение короткого промежутка времени с одним и тем же адресным пространством (в частности, со стеком ядра) будут вести работу (и, что весьма вероятно, производить запись) сразу два процессора. Решение этой проблемы состоит в создании некоторого фиктивного процесса; когда процессор находится в состоянии простоя, ядро переключается на кон- текст фиктивного процесса, делая этот контекст текущим для бездействующего процессора. Контекст фиктивного процесса состоит только из стека ядра; этот процесс не является выполнимым и не выбирается для запуска. Поскольку каждый процессор простаивает в контексте своего собственного фиктивного процесса, навредить друг другу процессоры уже не могут. 378 12.4 СИСТЕМА TUNIS Пользовательский интерфейс системы Tunis совместим с аналогичным интер- фейсом системы UNIX, но ядро этой системы, разработанное на языке Concurrent Euclid, состоит из процессов, управляющих каждой частью системы. Проблема взаимного исключения решается в системе Tunis довольно просто, так как в каждый момент времени исполняется не более одной копии управляемого ядром процесса, кроме того, процессы работают только с теми структурами данных, которые им принадлежат. Системные процессы активизируются запросами на ввод, защиту очереди запросов осуществляет процедура программного монитора. Эта процедура усиливает взаимное исключение, разрешая доступ к своей исполняемой части в каждый момент времени не более, чем одному процессу. Механизм мони- тора отличается от механизма семафоров тем, что, во-первых, благодаря пос- ледним усиливается модульность программ (операции P и V присутствуют на вхо- де в процедуру монитора и на выходе из нее), а во-вторых, сгенерированный компилятором код уже содержит элементы синхронизации. Холт отмечает, что разработка таких систем облегчается, если используется язык, поддерживающий мониторы и включающий понятие параллелизма (см. [Holt 83], стр.190). При всем при этом внутренняя структура системы Tunis отличается от традиционной реализации системы UNIX радикальным образом. 12.5 УЗКИЕ МЕСТА В ФУНКЦИОНИРОВАНИИ МНОГОПРОЦЕССОРНЫХ СИСТЕМ В данной главе нами были рассмотрены два метода реализации многопроцес- сорных версий системы UNIX: конфигурация, состоящая из главного и подчинен- ного процессоров, в которой только один процессор (главный) функционирует в режиме ядра, и метод, основанный на использовании семафоров и допускающий одновременное исполнение в режиме ядра всех имеющихся в системе процессов. Оба метода инвариантны к количеству процессоров, однако говорить о том, что с ростом числа процессоров общая производительность системы увеличивается с линейной скоростью, нельзя. Потери производительности возникают, во-первых, как следствие конкуренции за ресурсы памяти, которая выражается в увеличении продолжительности обращения к памяти. Во-вторых, в схеме, основанной на ис- пользовании семафоров, к этой конкуренции добавляется соперничество за сема- форы; процессы зачастую обнаруживают семафоры захваченными, больше процессов находится в очереди, долгое время ожидая получения доступа к семафорам. Пер- вая схема, основанная на использовании главного и подчиненного процессоров, тоже не лишена недостатков: по мере увеличения числа процессоров главный процессор становится узким местом в системе, поскольку только он один может функционировать в режиме ядра. Несмотря на то, что более внимательное техни- ческое проектирование позволяет сократить конкуренцию до разумного минимума и в некоторых случаях приблизить скорость повышения производительности сис- темы при увеличении числа процессоров к линейной (см., например, [Beck 85]), все построенные с использованием современной технологии многопроцессорные системы имеют предел, за которым расширение состава процессоров не сопровож- дается увеличением производительности системы. 12.6 УПРАЖНЕНИЯ 1. Решите проблему функционирования многопроцессорных систем таким обра- зом, чтобы все процессоры в системе могли функционировать в режиме яд- ра, но не более одного одновременно. Такое решение будет отличаться от первой из предложенных в тексте схем, где только один процессор (глав- ный) предназначен для реализации функций ядра. Как добиться того, чтобы в режиме ядра в каждый момент времени находился только один процессор ? Какую стратегию обработки прерываний при этом можно считать приемлемой? 379 2. Используя системные функции работы с разделяемой областью памяти, про- тестируйте программу, реализующую семафорную блокировку (Рисунок 12.6). Последовательности операций P-V над семафором могут независимо один от другого выполнять несколько процессов. Каким образом в программе следу- ет реализовать индикацию и обработку ошибок ? 3. Разработайте алгоритм выполнения операции CP (условный тип операции P), используя текст алгоритма операции P. 4. Объясните, зачем в алгоритмах операций P и V (Рисунки 12.8 и 12.9) нуж- на блокировка прерываний. В какие моменты ее следует осуществлять ? 5. Почему при выполнении 'циклической блокировки' вместо строки: while (! CP(семафор)); ядро не может использовать операцию P безусловного типа ? (В качестве наводящего вопроса: что произойдет в том случае, если процесс запустит операцию P и приостановится ?) 6. Обратимся к алгоритму getblk, приведенному в главе 3. Опишите реализа- цию алгоритма в многопроцессорной системе для случая, когда блок отсут- ствует в буферном кеше. *7. Предположим, что при выполнении алгоритма выделения буфера возникла чрезвычайно сильная конкуренция за семафор, принадлежащий списку сво- бодных буферов. Разработайте схему ослабления конкуренции за счет раз- биения списка свободных буферов на два подсписка. *8. Предположим, что у терминального драйвера имеется семафор, значение ко- торого при инициализации сбрасывается в 0 и по которому процессы приос- танавливают свою работу в случае переполнения буфера вывода на терми- нал. Когда терминал готов к приему следующей порции данных, он выводит из состояния ожидания все процессы, приостановленные по семафору. Раз- работайте схему возобновления процессов, использующую операции типа P и V. В случае необходимости введите дополнительные флаги и семафоры. Как должна вести себя схема в том случае, если процессы выводятся из состо- яния ожидания по прерыванию, но при этом текущий процессор не имеет возможности блокировать прерывания на других процессорах ? *9. Если точки входа в драйвер защищаются семафорами, должно соблюдаться условие освобождения семафора в случае перехода процесса в состояние приостанова. Как это реализуется на практике ? Каким образом должна производиться обработка прерываний, поступающих в то время, пока сема- фор драйвера заблокирован ? 10. Обратимся к системным функциям установки и контроля системного времени (глава 8). Разные процессоры могут иметь различную тактовую частоту. Как в этом случае указанные функции должны работать ? 380