next up previous contents
Next: Проблемы ввода-вывода Up: Программы завершаются с ошибкой Previous: LINUX   Contents

Сети рабочих станций

  1. В: Задача работает до окончания, но завершается с сообщением
    Таймаут при ожидании завершения процессов. Это может вызываться дефектной
    программой rsh (Некоторые версии Kerberos rsh имеют эту проблему).

    Это не проблема P4 или mpich, а проблема операционной среды. Для многих
    приложений эта проблема замедляет прекращение процессов.
    Что это означает?

    О: Если что-либо вызывает завершение MPI_Finalize за время более, чем 5 минут, в этом подозревается реализация rsh. rsh, используемая в некоторых инсталляциях Kerberos предполагает, что sizeof (FD_SET) == sizeof (int). Это означает, что программа rsh предполагает, что наибольшее значение FD это 32. Если программа использует fork для создания процессов, которые запускают rsh с поддержкой stdin, stdout, и stderr порожденных процессов, это предположение неверно, поскольку FD, которые rsh создает для сокета, могут быть > 31, если запущено достаточно много процессов. При использовании такой неисправной реализации rsh симптомом является то, что задача никогда не завершается, поскольку задачи rsh ждут (благодаря select) закрытия сокета.

    Устройство ch_p4mpd исключает эту проблему.



Alex Otwagin 2002-12-16