Принцип роботи MPICH
MPICH для Windows складається з наступних компонентів: · Менеджер процесів smpd.exe, який являє собою системну службу. Менеджер процесів веде список обчислювальних вузлів системи, і запускає на цих вузлах МРІ-програми та надає їм необхідну інформацію для роботи та обміну повідомленнями. · Заголовочні файли (h.) і бібліотеки стадії компіляції (lib.), необхідні для розробки МРІ-програм. · Бібліотеки часу виконання (.dll), необхідні для роботи МРІ-програм. · Додаткові утиліти (.exe), необхідні для налаштування MPICH та запуску МРІ-програм. Усі компоненти, крім бібліотек часу виконання, за замовченням встановлюються у папку C:\Program Files\MPICH2; dll-бібліотеки встановлюються C:\Windows\System32. Менеджер процесів є основним компонентом, який повинен бути встановлений та налаштований на всіх комп’ютерах мережі (бібліотеки часу виконання можна, у крайньому випадку, копіювати разом з MPI-програмою). Інші файли потрібна для розробки МРІ-програм і налаштування деякого «головного» комп’ютера, з якого буде проходити їх запуск. Менеджер працює у фоновому режимі і чекає запитів до нього з мережі з боку «головного» менеджера процесів (за замовчуванням використовується мережевий порт 8676). Щоб якось захистити себе від хакерів та вірусів, менеджер вимагає пароль при звертанні до нього. Коли один менеджер процесів звертається до іншого, він передає йому свій пароль. Звідси слідує, що потрібно вказувати один і той самий пароль при встановленні MPICH на комп’ютери мережі. Запуск МРІ-програми проводиться наступним чином: 1. Користувач з допомогою програми Mpirun (чи Mpiexec, при використанні МРІСН2 для Windows) вказує ім’я виконуваного файлу МРІ-програми і потрібну кількість процесів. Крім того можна вказати ім’я користувача і пароль: процеси МРІ-програми будуть запускатися від імені цього користувача. 2. Mpirun передає відомості про запуск локальному менеджеру процесів, у якого є список доступних обчислювальних вузлів. 3. Менеджер процесів звертається до обчислювальних вузлів за списком та передає запущеним на них менеджерам процесів вказівки по запуску МРІ-програми. 4. Менеджери процесів запускають на обчислювальних вузлах декілька копій МРІ-програми (можливо, по декілька копій на кожному вузлі) та передають програмам необхідну інформацію для зв’язку один з одним. Дуже важливим моментом тут є те, що перед запуском МРІ-програма не копіюється автоматично на обчислювальні вузли кластера. Замість цього менеджер процесів передає вузлам шлях до файлу програми, що виконується, точно у тому вигляді, у якому користувач вказав цей шлях програмі Mpirun. Це означає, що якщо ви, наприклад, запускаєте програму C:\proga.exe, то всі менеджери процесів на обчислювальних вузлах будуть намагатися запустити файл C:\proga.exe. Якщо хоча б на одному з вузлів такого не буде, то станеться помилка МРІ-програми. Щоб кожен раз не копіювати вручну програму і всі необхідні для її роботи файли на обчислювальні кластери, зазвичай використовують спільний мережевий ресурс. У цьому випадку користувач копіює програму і додаткові файли на мережевий ресурс, який видно всім вузлам кластера, і вказує шлях до файлу програми на цьому ресурсі. Додатковою зручністю такого підходу є те, що при наявності можливості запису на спільний мережевий ресурс запущені копії програми можуть записувати туди результати своєї роботи. Робота МРІ-програми проходить наступним чином: 1. Програма запускається та ініціалізує бібліотеку часу виконання МРІСН шляхом виклику функції MPI_Init. 2. Бібліотека отримує від менеджера процесів інформацію про кількість і місце знаходження процесів програми, та встановлює з ними зв’язок. 3. Після цього запущені копії програми обмінюються одна з іншою інформацією за допомогою бібліотеки МРІСН. З точки зору операційної системи бібліотека є частиною програми, тому можна вважати, що запущені копії МРІ-програми обмінюються даними напряму одна з одною, як будь які інші додатки, що передають дані по мережі. 4. Консоль вводу-виводу всіх процесів МРІ-програм перенаправляється на консоль, на якій запущена Mpirun. 5. Перед завершенням усі процеси визивають функцію MPI_Finalize, яка коректно завершує передачу і прийом усіх повідомлень, і відключає МРІСН.
|