next up previous contents
Next: PBS очереди на Lxfarm Up: Система управления заданиями PBS Previous: Система управления заданиями PBS   Contents

Принцип работы PBS

Система PBS состоит из сервера, принимающего и распределяющего задания, компьютеров-клиентов, с которых задания могут направляться на сервер, и вычислительных компьютеров, где эти задания выполняются. В настоящий момент на Lxfarm роль сервера выполняет lxfarm00, клиентскими машинами являются все компьютеры с lxfarm00 по lxfarm03, а выполняться задания могут на всех компьютерах с lxfarm00 по lxfarm05.

В PBS существует несколько очередей (queue), которые не привязаны к определенному вычислительному компьютеру, а принадлежат всей системе PBS в целом. Каждая очередь имеет имя и обладает набором атрибутов, наиболее важным из которых являются минимальное и максимальное процессорное время, в течение которого задание может исполняться в данной очереди. Пользователь составляет свое задание (job) и направляет его в определенную очередь, указав либо имя очереди, либо необходимое для выполнения задания процессорное время. Пользователь может запросить и другие ресурсы, например, объем оперативной памяти, необходимый для выполнения задания. Сервер направляет задание на тот вычислительный компьютер, который удовлетворяет запрошенным в задании пользователя критериям и в настоящий момент является свободным. Если выполнение задания в данный момент невозможно, оно остается ждать в очереди.

Система PBS на Lxfarm в настоящий момент настроена таким образом, что на каждом вычислительном компьютере может выполняться ограниченное число заданий, равное числу процессоров на данном компьютере. Т.е. на lxfarm00, lxfarm04 и lxfarm05 могут одновременно выполняться (под управлением PBS) по два задания, а на остальных - по одному. Учитывая, что вычислительные компьютеры на Lxfarm обладают разной производительностью, сервер пытается сначала направить задание на наиболее быстрые - lxfarm04 и lxfarm05. Если эти компьютеры оказываются заняты (т.е. на каждом из них выполняется по два задания), то сервер пытается направить задание последовательно на lxfarm00, lxfarm01, lxfarm02, lxfarm03.



Vladimir Tikhomirov 2004-07-08