Руководство по управлению и эксплуатации

Этот онлайн-инструмент представляет собой руководство M&O, с помощью которого можно выявить ситуацию в ЦОД независимо от достигнутого уровня Tier и имеющейся инфраструктуры, которые влияют на способность ЦОД соответствовать бизнес-задачам и заявленной производительности. Это руководство было специально разработано для выявления процессов M&O, не зависимых от структуры ЦОД, включая как повседневную деятельность на местах, так и планирование и принятие решений.

Описание вариантов поведения взято непосредственно из стандарта Tier Standard: Operational Sustainability. Проверку выполняют ключевые заинтересованные стороны, представляющие владельца компании, аутсорсинговые компании и различные третьи стороны. В результате обеспечивается соответствие процессов управления и эксплуатации различным решениям по управлению в различных вычислительных средах. Данное руководство документирует результаты этих усилий. Критерии M&O, представленные в этом руководстве, разработаны участниками отрасли ЦОД для специалистов ЦОД, а не заимствованы из других отраслей.

Критерии поведения в каждом из компонентов управления и эксплуатации (найм персонала, техническая поддержка, обучение, планирование и условия эксплуатации) приведены для того, чтобы владельцы ЦОД, операторы и менеджеры знали, какой тип поведения требуется для обеспечения бесперебойного круглосуточного функционирования объектов ЦОД. Если придерживаться рекомендованного поведения, то можно реализовать весь потенциал производительности инфраструктуры, повысить эффективность рабочих процессов и снизить расходы на электроэнергию.

Поведение в области управления и эксплуатации

Определенное поведение в области управления и эксплуатации, описанное в приведенных ниже категориях, необходимо для реализации полного потенциала инфраструктуры, достижения высокой эффективности процессов в ЦОД и снижения расходов на электроэнергию. Для получения дополнительной информации щелкните по каждой категории.

Категории поведения в области управления и эксплуатации5:   

Набор вариантов поведения в каждой категории не зависит от инфраструктуры: архитектуры здания, местоположения и других элементов, которые по стандарту Operational Sustainability не имеют прямого отношения к повседневным действиям по управлению и эксплуатации ЦОД.


Найм персонала и организационная структура:
Эффективная кадровая политика имеет решающее значение для достижения высокой производительности в долгосрочной перспективе. Для выполнения всех задач по технической поддержке, эксплуатации ЦОД и обеспечению бесперебойной работы необходимо достаточное количество персонала. Все сотрудники, работающие в ЦОД, должны обладать опытом и технической квалификацией, необходимыми для выполнения своих обязанностей без ущерба для производительности ЦОД. Роли и обязанности каждой должностной позиции должны быть определены и утверждены руководством. Организационная структура ЦОД должна быть направлена на достижение целей в отношении отказоустойчивости.
Щелкните здесь, чтобы просмотреть информацию о поведении в отношении найма персонала и организационной структуры.

Обслуживание:
Эффективная программа обслуживания, которая включает программы упреждающего обслуживания, поддержки поставщиков, наличие достаточного количества ресурсов и возможность мониторинга эффективности работы, необходима для поддержания оборудования в идеальном состоянии и для снижения риска выхода оборудования из строя. Программа упреждающего обслуживания, которая обеспечивает высокую производительность оборудования, является самым эффективным способом минимизации риска сбоев в работе. Должны существовать четко документированные процессы и процедуры для выполнения всех необходимых задач технической поддержки.

Эффективная программа обслуживания подразумевает наличие системы управления техническим обслуживанием, которая отслеживает состояние оборудования и анализирует необходимость обслуживания. Действенная программа упреждающего обслуживания выявляет потенциальные проблемы до того, как они возникнут, и обеспечивает более эффективное распределение ресурсов для обслуживания. Система управления техническим обслуживанием используется для составления графика технического обслуживания и выполнения соответствующих задач, распределения нагрузки на персонал и разработки планов и бюджетов в соответствии с жизненным циклом оборудования. Отслеживание статуса выполнения задач имеет важное значение для снижения вероятности отсрочки технического обслуживания (любой вид отложенного технического обслуживания может представлять риск для ЦОД). Отслеживание сбоев и определение первопричины — это необходимые действия для обеспечения своевременного реагирования на проблемы.

Для любого уровня обслуживания с поддержкой поставщика должен существовать список сертифицированных поставщиков, в котором содержатся официальные договоры с указанием объема работ, процессов вызова, квалификаций и времени реагирования. Все это гарантирует уровень обслуживания, необходимый для достижения отказоустойчивости инфраструктуры. Уборка является важным аспектом работ по обслуживанию ЦОД. Она позволяет избавляться от загрязнений в компьютерном зале и критической среде.
Щелкните здесь, чтобы просмотреть информацию о поведении в области технического обслуживания

Обучение:
Программа обучения гарантирует, что все сотрудники понимают политику, процедуры и уникальные требования для работы в ЦОД. Обучение необходимо для исключения незапланированных сбоев и надлежащего реагирования на ожидаемые и неожиданные события. Кроме того, для обеспечения бесперебойной работы и снижения сложности инфраструктуры требуется более продуманная и комплексная программа обучения, имеющая своей целью исключение человеческих ошибок. Программы обучения должны быть надлежащим образом задокументированы для обеспечения последовательности образовательного процесса для всех учащихся.

Объем программы, необходимый для поставщиков, зависит от того, требуется ли их постоянная поддержка. Обучение поставщиков не должно ограничиваться проверкой квалификаций и сертификатов для определенной деятельности и оборудования, которое они обслуживают. Они должны быть обучены применению политик и рабочих процедур, установленных на объекте.
Щелкните здесь, чтобы просмотреть информацию о поведении относительно обучения.

Планирование, координация и управление:
Компоненты эффективной программы планирования, координации и управления являются составными компонентами политики объекта; политики финансового управления; библиотека инфраструктуры объекта и средства управления ресурсами электропитания и охлаждения.

Все политики и процедуры ЦОД должны быть задокументированы для обеспечения их понимания и соблюдения. Непоследовательность в процессах управления ЦОД может привести к сбоям в работе. На территории ЦОД должна иметься библиотека, которая содержит всю информацию по инфраструктуре ЦОД. Это важно для тех специалистов, которые работают над устранением неполадок. Кроме того, такие специалисты должны иметь доступ к точным чертежам ЦОД.

Мониторинг и анализ воздушных потоков и электроэнергии может помочь в выявлении потенциальных проблем, улучшить коэффициент использования ресурсов и повысить доступность ЦОД, а также определить действия по снижению энергопотребления.

Необходимо также наличие финансового процесса, который бы гарантировал, что ЦОД располагает бюджетом для поддержки бизнес-целей. Данные из системы управления техническим обслуживанием (см. раздел о поддержке) представляют особую ценность для создания, проверки и обоснования уровней комплектования персоналом и бюджета на инфраструктуру ЦОД.
Щелкните здесь, чтобы просмотреть информацию о поведении, которое обеспечивает успешное планирование, координирование и управление
Условия эксплуатации:
Последовательное и документированное управление компонентами инфраструктуры необходимо для обеспечения доступности ресурсов электропитания и охлаждения. Условия эксплуатации должны быть основаны на риске и расходах. Решения, касающиеся управления электрической нагрузкой, должны быть задокументированы и реализованы с учетом имеющихся электроэнергетических ресурсов. Это необходимо, чтобы не превышать максимально допустимую нагрузку, а также для того, чтобы обеспечить себя возможностью переключения между компонентами в случае выхода какого-либо из них из строя.
Щелкните здесь, чтобы просмотреть информацию о поведении для обеспечения должных условий эксплуатации

Powered by Translations.com GlobalLink OneLink SoftwarePowered By OneLink