Восстановление RAID-массива на контроллере Adaptec в сервере Supermicro
Контроллеры Adaptec (Microsemi/Microchip) — одни из самых распространённых решений для серверов Supermicro, особенно на платформах предыдущих поколений (X8–X11). Отказ RAID-массива может случиться по разным причинам: сбой блока питания, повреждение прошивки, выход из строя диска или самого контроллера. В этом руководстве мы разберём все этапы диагностики и восстановления: от простых перезагрузок до работы с утилитами ARCCONF, MaxView Storage Manager и замены контроллера.
1. Быстрая диагностика: что именно произошло?
Прежде чем лезть в настройки, оцените симптомы:
- Контроллер не определяется в системе — отсутствует в POST, не виден в Device Manager / lspci.
- Контроллер виден, но не работает — ошибка
Adaptec RAID Controller Configuration Required, зависание на инициализации, статусFailedилиDegraded. - Пропал логический диск (LD) — массив отображается как
Foreign(чужой) или отсутствует в списке. - Проблемы с дисками — один или несколько HDD/SSD имеют статус
Failed,Missing,ReadyилиInitializing.
Запишите модель контроллера (например, Adaptec 6805, 8805, 71605) и версию прошивки, если видите её при загрузке.
2. Первичные аппаратные проверки
В большинстве случаев проблема решается простыми действиями с «железом».
2.1 Глубокий сброс питания (Full Power Cycle)
- Полностью выключите сервер.
- Отключите все кабели питания от блоков питания (PSU) или выньте блоки из корпуса.
- Подождите 2–3 минуты — это сбросит состояние контроллера и накопителей.
- Включите питание и запустите сервер.
2.2 Проверка кабелей и подключений
Осмотрите кабели SAS/SATA от контроллера к backplane или напрямую к дискам. Убедитесь, что они надёжно зафиксированы, нет перегибов и окисления контактов. Попробуйте переключить кабели на другой порт контроллера.
2.3 Запуск без дисков
Отключите все диски от сервера и включите его. Если контроллер теперь определяется нормально (например, утилита Ctrl+A загружается без ошибок), значит проблема в конфигурации на дисках или в самом диске. Выключите сервер, подключите диски по одному и следите за появлением ошибки.
3. Вход в утилиту конфигурации Adaptec (ARC)
Большинство контроллеров Adaptec имеют встроенную утилиту настройки, доступную по комбинации Ctrl+A во время POST. Чтобы она появилась, нужно сначала включить поддержку RAID в BIOS сервера.
- Во время загрузки войдите в BIOS (Del или F2).
- Найдите параметр SATA RAID Enable (обычно в разделе Advanced → IDE/SATA Configuration) и установите его в Enabled.
- Сохраните изменения и выйдите из BIOS.
- При следующей загрузке на экране появится сообщение: «Press <Ctrl><A> for Adaptec RAID Configuration Utility». У вас будет 5 секунд, чтобы нажать указанную комбинацию.
В открывшемся меню доступны:
- Array Configuration Utility (ACU) — создание, управление и удаление массивов, настройка горячих резервов.
- Disk Utilities — форматирование и проверка дисков.
- Controller Configuration — настройка параметров контроллера.
3.1 Импорт Foreign Configuration
Если вы переставили диски с одного контроллера на другой или после сбоя, массив может определиться как «Foreign» (чужой). В утилите ARC:
- Выберите Array Configuration Utility.
- В главном меню выберите Manage Arrays.
- Если массив отображается как Foreign, нажмите Ctrl+I для импорта.
- Подтвердите действие. Контроллер прочитает метаданные с дисков и восстановит логический диск.
Если импорт не удался, не пытайтесь «Clear» или создать новый массив. Переходите к следующему шагу.
3.2 Перестроение (Rebuild) деградированного массива
Если массив имеет статус Degraded (один диск вышел из строя или отключился):
- В Manage Arrays выберите проблемный массив.
- Статус сбойного диска будет отмечен как Missing или Failed.
- Замените физический диск на новый (того же или большего объёма).
- Вернитесь в утилиту, выберите массив и нажмите Ctrl+R для запуска перестроения (Rebuild).
После этого контроллер начнёт фоновое копирование данных на новый диск. Статус можно отслеживать в том же меню.
4. Утилита ARCCONF: полное управление из командной строки
ARCCONF — официальная утилита командной строки Microchip (ранее Microsemi) для управления контроллерами Adaptec. Она доступна для Windows, Linux и UEFI Shell. Скачайте её с сайта поддержки Adaptec (ныне Microchip).
Где взять: На странице поддержки вашего контроллера на сайте microchip.com в разделе «Software & Drivers» ищите «ARCCONF Command Line Interface».
4.1 Запуск и базовая диагностика
Загрузите сервер с Live USB (например, Ubuntu Live) или войдите в UEFI Shell. Поместите исполняемый файл arcconf (для Linux) или arcconf.efi (для UEFI) на флешку и запустите.
# Для Linux (с правами root)
chmod +x arcconf
./arcconf LIST
# Вы должны увидеть список контроллеров, например, Controller 1
Команды для диагностики:
# Полная информация о контроллере, массивах и дисках
./arcconf GETCONFIG 1
# Статус логических дисков (LD)
./arcconf GETCONFIG 1 LD
# Статус физических дисков (PD)
./arcconf GETCONFIG 1 PD
# Статус фоновых операций (перестроение, проверка согласованности)
./arcconf GETSTATUS 1
Пример вывода для здорового RAID-массива:
Controller 1 — Adaptec 6805E
Logical Device number 0
RAID level : 5
Status of logical device : Optimal
Size : 2794 GB
Read-cache setting: Enabled
Write-cache setting: Enabled
4.2 Восстановление Foreign Configuration через ARCCONF
Если контроллер не определил конфигурацию автоматически, можно попробовать импортировать её вручную:
# Сканирование Foreign Configuration
./arcconf RESCAN 1
# Импорт Foreign Configuration (если обнаружена)
./arcconf IMPORT 1 CONFIG 0
# Если не помогло — попробовать сбросить контроллер и заново импортировать
./arcconf SETCONFIG 1 FACTORY
SETCONFIG FACTORY сбрасывает контроллер в заводское состояние, но не удаляет данные на дисках. После сброса обязательно выполните RESCAN и IMPORT.
4.3 Управление дисками и перестроение (Rebuild) через ARCCONF
# Запуск перестроения (сначала узнать Channel и ID сбойного диска)
./arcconf GETCONFIG 1 PD
# Запуск перестроения на конкретном устройстве
./arcconf REBUILD 1 DEVICE 0 0
4.4 Просмотр и очистка журнала событий (Event Log)
# Экспорт логов в файл
./arcconf GETLOGS 1 File events.log
# Очистка журнала
./arcconf GETLOGS 1 DELETE
4.5 Полный справочник команд ARCCONF
+-----------------------+--------------------------------------------------+
| Команда | Описание |
+-----------------------+--------------------------------------------------+
| LIST | Список всех контроллеров в системе |
| GETCONFIG | Детальная конфигурация (контроллер, LD, PD, ARRAY)|
| GETSTATUS | Статус фоновых операций (Rebuild, Consistency) |
| GETLOGS | Сохранение/очистка журнала событий |
| RESCAN | Принудительное сканирование дисков и |
| | Foreign Configuration |
| IMPORT | Импорт Foreign Configuration |
| SETCONFIG FACTORY | Сброс контроллера до заводских настроек |
| REBUILD | Запуск перестроения массива |
| DELETE | Удаление логического диска |
| CREATE | Создание нового массива |
| MODIFY | Изменение RAID уровня или расширение |
| SETNAME | Переименование логического диска |
| SETCACHE | Настройка кэширования |
| SETBOOT | Назначение загрузочного устройства |
| IDENTIFY | Мигание LED на указанном диске |
| GETVERSION | Версия прошивки и утилиты |
| SAVECONFIG | Сохранение конфигурации в XML файл |
| SAVESUPPORTARCHIVE | Сбор полного дампа для поддержки |
+-----------------------+--------------------------------------------------+
5. MaxView Storage Manager: графическое управление
MaxView Storage Manager — это графическая утилита (веб-интерфейс) для мониторинга и управления контроллерами Adaptec. Доступна для Windows, Linux, VMware ESXi и даже в виде загрузочного образа USB.
- Установка в ОС: Скачайте соответствующий пакет с сайта Microchip, установите через менеджер пакетов и запустите сервис
maxView Storage Manager Agent. - Доступ к веб-интерфейсу: Откройте браузер и перейдите по адресу
http://ip-адрес-сервера:8443(логин/пароль — root/root или root/ваш_пароль).
Возможности MaxView:
- Просмотр состояния контроллеров, логических дисков и физических накопителей.
- Импорт Foreign Configuration одним кликом.
- Запуск перестроения (Rebuild).
- Проверка согласованности массива (Consistency Check).
- Настройка уведомлений по email о сбоях.
- Обновление прошивки контроллера и дисков.
sudo systemctl restart maxview (Linux) или через диспетчер служб Windows.
6. Замена контроллера на аналогичный
Если оригинальный контроллер физически сломан (не виден в шине, не отвечает на команды), лучший способ восстановить доступ к данным — установить точно такой же или совместимый контроллер Adaptec.
- Приобретите идентичную или более новую модель из той же серии (например, 6805 → 6805E).
- Установите контроллер в тот же слот PCIe.
- Подключите диски в любом порядке — Adaptec умеет читать метаданные с дисков независимо от портов.
- Включите сервер и войдите в утилиту ARC (Ctrl+A).
- Импортируйте Foreign Configuration (меню Manage Arrays → Ctrl+I).
7. Извлечение данных через Linux (mdadm) — крайний метод
Если нет возможности заменить контроллер, а данные критичны, можно попробовать собрать программный RAID на Linux. Это сложный метод, требующий опыта.
- Подключите все диски от массива к SATA-портам обычного компьютера с Ubuntu/Debian.
- Убедитесь, что диски видны:
lsblk. - Попробуйте автоматическое обнаружение:
sudo mdadm --assemble --scan. - Если не собралось, создайте массив вручную в режиме только для чтения:
Параметрsudo mdadm --create /dev/md0 --level=5 --raid-devices=4 --assume-clean /dev/sdb /dev/sdc /dev/sdd /dev/sde--assume-cleanзапрещает перезапись данных. Указывайте точный порядок дисков, который был в исходном массиве (если неизвестен — экспериментируйте с осторожностью). - Смонтируйте результат (
sudo mount /dev/md0 /mnt) и скопируйте данные на другой носитель.
mdadm --create без ключа --assume-clean уничтожит суперблоки и данные. Если вы не уверены в своих действиях, обратитесь к профессионалам по восстановлению данных.
8. Сброс контроллера до заводских настроек (когда всё остальное не помогло)
Если контроллер «завис» с битой конфигурацией в NVRAM, можно сбросить его настройки, затем перезагрузить и импортировать массив заново. Этот метод описан в официальных руководствах Supermicro.
# Через утилиту ARC
Выберите Controller Configuration → Set Factory Defaults → Save and Exit
# Через ARCCONF
./arcconf SETCONFIG 1 FACTORY
# Для некоторых моделей поможет сброс через перемычку на плате контроллера (см. документацию)
После сброса выключите сервер, отключите питание на минуту, включите и выполните импорт Foreign Configuration. Этот метод неоднократно помогал администраторам восстанавливать массивы после неудачных обновлений прошивки.
9. Типичные статусы и их значения
+-------------------------+--------------------------------------------------+
| Статус | Что означает |
+-------------------------+--------------------------------------------------+
| Optimal | Массив полностью исправен, все диски в работе. |
| Degraded | Один диск отсутствует или неисправен. Данные |
| | доступны, но без избыточности. |
| Suboptimal | RAID 6/60 — один диск неисправен, но массив |
| | ещё работает. Требуется замена диска. |
| Failed | Массив неработоспособен (два и более диска в |
| | RAID 5/6, или один в RAID 0). |
| Foreign | Конфигурация на дисках не соответствует той, что |
| | ожидает контроллер. Требуется импорт. |
| Offline | Логический диск отключён принудительно или |
| | из-за ошибки. |
| Rebuilding | Идёт процесс восстановления данных на новый диск.|
| Consistency Check | Идёт фоновая проверка чётности массива. |
+-------------------------+--------------------------------------------------+
10. Чек-лист действий при отказе RAID
- Отключите питание сервера на 2-3 минуты (глубокий сброс).
- Проверьте кабели и подключение дисков.
- Включите сервер и нажмите Ctrl+A для входа в утилиту ARC.
- Если массив виден как Foreign — выполните Import (Ctrl+I).
- Если массив Degraded — замените сбойный диск и запустите Rebuild.
- Если контроллер не входит в утилиту — загрузитесь с Live USB и используйте ARCCONF.
- При необходимости сбросьте контроллер в заводские настройки (
SETCONFIG FACTORY), затем импортируйте Foreign. - Если контроллер неисправен — замените на аналогичный и импортируйте конфигурацию.
- Если данные критичны, а все попытки не увенчались успехом — обратитесь в лабораторию по восстановлению данных.
11. Профилактика и мониторинг после восстановления
- Обновите прошивку контроллера — скачайте последнюю версию с сайта Microchip и установите через ARCCONF:
./arcconf ROMUPDATE 1 firmware.bin - Настройте MaxView Storage Manager для мониторинга и email-оповещений.
- Включите Background Consistency Check для периодической проверки чётности массива.
- Регулярно проверяйте журнал событий и состояние дисков (SMART).
- Держите на складе запасной диск того же производителя и объёма.
- Планово выполняйте резервное копирование — RAID не отменяет бэкапы.
- Официальный сайт поддержки Adaptec/Microchip:
www.microchip.com/design-centers/adaptec - Страница загрузки ARCCONF: обычно в разделе «Software & Drivers» для конкретной модели контроллера.
- Руководства по утилите ARC входят в комплект поставки серверов Supermicro (файл
Emb_SA_RAID_UG.pdf).
12. Заключение
Восстановление RAID-массива на контроллере Adaptec в сервере Supermicro — процесс, который в большинстве случаев заканчивается успешно, если следовать алгоритму: не паниковать, не делать лишних действий, использовать импорт Foreign Configuration. В тяжёлых ситуациях на помощь приходит утилита ARCCONF и замена контроллера на аналогичный. Помните, что резервное копирование — единственная гарантия сохранности данных, поэтому после восстановления обязательно настройте мониторинг и систему бэкапов.

