Пропускная способность памяти системы с учетом количества модулей DIMM для серверов DELL PowerEdge R770.
Краткое содержание
Сервер Dell PowerEdge R770 с процессорами Intel Xeon 6 обеспечивают заметное улучшение пропускной способности DDR5 памяти для современных рабочих нагрузок. Эти стойки Dell PowerEdge 17-го поколения для массовой аудитории поставляются в двухсокетных версиях в форм-факторах 2U.
В двухсокетных системах, таких как 2U Dell PowerEdge R770, каждый разъем поддерживает 8 каналов памяти, в общей сложности 16 каналов и 32 модулей DIMM, тогда как односокетные системы, такие как 1U Dell PowerEdge R570, поддерживают 8 каналов и до 16 модулей. Обе платформы используют модули памяти DDR5 RDIMM со скоростью до 6400 MT/s при конфигурации с одним DIMM на канал (1DPC) и 5200 MT/s при конфигурации с двумя модулями DIMM на канал (2DPC).
В статье сравниваются показатели пропускной способности памяти, измеренные на этих новых серверах с разными наборами памяти, с серверами предыдущего поколения, работающими на процессорах Intel Xeon 5.
Архитектура памяти Intel Xeon 6
Процессоры Intel Xeon 6 улучшают поддержку памяти DDR5, впервые представленную в Xeon 5. Благодаря дезагрегированной архитектуре чиплетов с отдельными вычислительными и вводно-выводными плитками, память работает со скоростью до 6400 МТ/с, что примерно на 15% лучше, чем 5600 МТ.
Тест пропускной способности памяти
Тест памяти STREAM – это синтетический бенчмарк, предназначенный для измерения устойчивой пропускной способности памяти, то есть скорости, с которой данные могут перемещаться в память и из памяти в реальных условиях. Он широко используется в средах высокопроизводительных вычислений (HPC), искусственного интеллекта и машинного обучения, где пропускная способность памяти часто является ограничительным фактором. Тест STREAM оценивает, насколько эффективно система может обрабатывать большие передачи данных, что критически важно для рабочих нагрузок, обрабатывающих большие наборы данных.
Сначала мы рассмотрим производительность памяти PowerEdge R770. Эти данные охватывают разные группы каналов памяти с 32-гигабайтными модулями DIMM, работающими на максимальной частоте 6400 МТ/с.
Важно отметить, что на скорость памяти влияет количество модулей DIMM на канал (DPC).
На платформах Intel Xeon 6:
- Настройки 1DPC поддерживают скорость до 6400 MT/s.
- Настройки 2DPC обычно работают со скоростью 5200 MT/s.
На платформах Intel Xeon 5:
- Настройки 1DPC поддерживают скорость до 5600 MT/s.
- Настройки 2DPC обычно работают со скоростью 4400 MT/s.
Представленные здесь данные были собраны с настроенными параметрами BIOS, сравнивающими настройки SNC (Sub NUMA Cluster) с включенным и выключенным. Следующие системы были протестированы с 2DPC:
- Dell PowerEdge R770 последнего поколения на базе процессоров Intel Xeon 6, оборудованных до 16 модулями DIMM DDR5 6400 MT/s на разъем.
- Dell PowerEdge R760 предыдущего поколения оснащен процессорами Intel Xeon 5 и оснащен до 16 модулями DIMM DDR5 5600 MT/s на разъем.
Примечание:
- Полностью сбалансирован : все доступные каналы памяти заполнены модулями DIMM, которые максимизируют пропускную способность и емкость.
- Почти сбалансирован : большинство каналов памяти заполнены приближающимся к балансу, предлагая почти оптимальную пропускную способность с несколько уменьшенной емкостью или симметрией.

Рисунок 1. Тенденции изменения совокупной пропускной способности памяти системы с учетом количества модулей DIMM для серверов PowerEdge на базе процессора Intel Xeon 6 с использованием настроенных настроек BIOS и включенного SNC.

Рисунок 2. Тенденции изменения совокупной пропускной способности памяти системы с учетом количества DIMM модулей для серверов PowerEdge на базе процессора Intel Xeon 6 с использованием настроенных параметров BIOS и выключенного SNC.

Рисунок 3. Тенденции изменения совокупной пропускной способности памяти системы с учетом заполнения DIMM модулей для серверов PowerEdge на базе процессора Intel Xeon 5 с использованием настроенных параметров BIOS и включенного SNC.

Рисунок 4. Тенденции изменения совокупной пропускной способности памяти системы с учетом количества модулей DIMM для серверов PowerEdge на базе процессора Intel Xeon 5 с использованием настроенных настроек BIOS и выключенных SNC.
Примечание: Серверы Dell на базе Intel Xeon 5/6 не поддерживают несбалансированную конфигурацию памяти. Модули DIMM, установленные в несбалансированных каналах, автоматически отключаются.
Ключевые выводы
Эти результаты показывают увеличение производительности на 20,6% по сравнению с предыдущим поколением при полностью заполненной или сбалансированной конфигурации памяти. Почти сбалансированные конфигурации показали в среднем увеличение производительности почти на 21% по сравнению с Intel Xeon 5. Это улучшение способствует стабильно высокому уровню производительности системы, которую клиенты привыкли ожидать от серверных решений Dell PowerEdge на базе Intel.
Эти данные отражают постоянное развитие технологии DDR5 и опыт Dell Technologies в сфере платформы с процессорами мирового класса Intel. Независимо от конфигурации памяти, выбранной для вашего устойчивого решения Dell Intel Xeon 6, производительность корпоративного класса остается неизменной во всех конфигурациях.
Для достижения этих результатов была использована следующая оптимизированная конфигурация BIOS:
| Настройка | Значение/Статус |
|---|---|
|
Настройка ADDDC |
Инвалид |
|
Корректируемый ECC SMI памяти |
Инвалид |
|
Восстановление DIMM (ремонт после упаковки) включено Неисправимая ошибка памяти |
Инвалид |
|
Политика подкачки памяти |
Закрытый пейджинг |
|
Технология виртуализации |
Инвалид |
|
Подкластер NUMA |
Включено |
|
ООО «Предыдущая выборка» |
Включено |
|
Режим x2APIC |
Инвалид |
|
Управляемый турбокомпрессор Dell |
Включено |
|
Системный профиль |
пользовательская |
|
Управление питанием процессора |
Максимальная производительность |
|
С1Е |
Инвалид |
|
Государства С |
Автономный |
|
Политика энергоэффективности |
Производительность |
|
Управление питанием шины межпроцессорного соединения процессора |
Инвалид |
|
Управление питанием PCI ASPM L1 |
Инвалид |
|
Тепловой профиль |
Максимальная производительность (Оптимизировано для производительности) |
|
Смещение скорости вентилятора |
Максимум (+100%) |
|
Минимальная скорость FDan |
пользовательская |
|
Минимальная скорость вентилятора (ШИМ) диапазон X – 100 процентов) |
100 |
Конфигурации сервера
| Модель сервера | Процессор |
Память |
|---|---|---|
|
PowerEdge R770 |
Intel Xeon 6787P |
32 ГБ 2R RDIMM 6400 МТ/с |
|
PowerEdge R760 |
Intel Xeon 8592+ |
32 ГБ 2R RDIMM 5600 МТ/с |
Тестирование было проведено компанией Dell Technologies на сервере PowerEdge R770 с процессорами Intel Xeon 66787P и Dell PowerEdge R760 с процессорами Intel Xeon 58592+. Результаты могут отличаться в редких случаях.
- Кластеризация Sub-NUMA (SNC) улучшает пропускную способность памяти, уменьшая задержку благодаря лучшему осознанию локальности. Когда эта функция включена, рабочие нагрузки, поддерживающие NUMA, могут достигать более высокой пропускной способности, поскольку доступ к памяти оптимизирован в пределах меньших кластеров.
