Пропускна здатності пам'яті системи з урахуванням кількості модулів DIMM для серверів DELL PowerEdge R770.
Короткий зміст
Сервер Dell PowerEdge R770 з процесорами Intel Xeon 6 забезпечують помітне покращення пропускної здатності пам'яті DDR5 для сучасних робочих навантажень. Ці стійкові сервери Dell PowerEdge 17-го покоління для масової аудиторії постачаються у двосокетних версіях у форм-факторах 2U.
У двосокетних системах, таких як 2U Dell PowerEdge R770, кожен роз'єм підтримує 8 каналів пам'яті, загалом 16 каналів та до 32 модулів DIMM, тоді як односокетні системи, такі як 1U Dell PowerEdge R570, підтримують 8 каналів та до 16 модулів DIMM. Обидві платформи використовують модулі пам'яті DDR5 RDIMM зі швидкістю до 6400 MT/s при конфігурації з одним DIMM на канал (1DPC) та 5200 MT/s при конфігурації з двома модулями DIMM на канал (2DPC).
У статті порівнюються показники пропускної здатності пам'яті, виміряні на цих нових серверах з різними наборами пам'яті, із серверами попереднього покоління, що працюють на процесорах Intel Xeon 5.
Архітектура пам'яті Intel Xeon 6
Процесори Intel Xeon 6 покращують підтримку пам'яті DDR5, вперше представлену в Xeon 5. Завдяки дезагрегованій архітектурі чіплетів з окремими обчислювальними та вводно-виводними плитками, пам'ять працює зі швидкістю до 6400 МТ/с, що приблизно на 15% краще, ніж 5600 МТ/с, які підтримувалися процесорами Intel Xeon 5.
Тест пропускної здатності пам'яті
Тест пам'яті STREAM — це синтетичний бенчмарк, призначений для вимірювання стійкої пропускної здатності пам'яті, тобто швидкості, з якою дані можуть переміщуватися до пам'яті та з пам'яті в реальних умовах. Він широко використовується в середовищах високопродуктивних обчислень (HPC), штучного інтелекту та машинного навчання, де пропускна здатність пам'яті часто є обмежувальним фактором. Тест STREAM оцінює, наскільки ефективно система може обробляти великі передачі даних, що є критично важливим для робочих навантажень, які обробляють великі набори даних.
Спочатку ми розглянемо продуктивність пам'яті на PowerEdge R770. Ці дані охоплюють різні групи каналів пам'яті з 32-гігабайтними модулями DIMM, що працюють на максимальній частоті 6400 МТ/с.
Важливо зазначити, що на швидкість пам'яті впливає кількість модулів DIMM на канал (DPC).
На платформах Intel Xeon 6:
- Конфігурації 1DPC підтримують швидкість до 6400 MT/s.
- Конфігурації 2DPC зазвичай працюють зі швидкістю 5200 MT/s.
На платформах Intel Xeon 5:
- Конфігурації 1DPC підтримують швидкість до 5600 MT/s.
- Конфігурації 2DPC зазвичай працюють зі швидкістю 4400 MT/s.
Представлені тут дані були зібрані з налаштованими параметрами BIOS, що порівнювали налаштування SNC (Sub NUMA Cluster) з увімкненим та вимкненим. Наступні системи були протестовані з 2DPC:
- Dell PowerEdge R770 останнього покоління на базі процесорів Intel Xeon 6, оснащених до 16 модулями DIMM DDR5 6400 MT/s на роз'єм.
- Dell PowerEdge R760 попереднього покоління, оснащений процесорами Intel Xeon 5, та оснащений до 16 модулями DIMM DDR5 5600 MT/s на роз'єм.
Примітка:
- Повністю збалансований : усі доступні канали пам'яті заповнені модулями DIMM, що максимізує пропускну здатність та ємність.
- Майже збалансований : більшість каналів пам'яті заповнені таким чином, що наближається до балансу, пропонуючи майже оптимальну пропускну здатність з дещо зменшеною ємністю або симетрією.

Рисунок 1. Тенденції зміни сукупної пропускної здатності пам'яті системи з урахуванням кількості модулів DIMM для серверів PowerEdge на базі процесора Intel Xeon 6 з використанням налаштованих налаштувань BIOS та ввімкненого SNC.

Рисунок 2. Тенденції зміни сукупної пропускної здатності пам'яті системи з урахуванням кількості модулів DIMM для серверів PowerEdge на базі процесора Intel Xeon 6 з використанням налаштованих параметрів BIOS та вимкненого SNC.

Рисунок 3. Тенденції зміни сукупної пропускної здатності пам'яті системи з урахуванням заповнення модулів DIMM для серверів PowerEdge на базі процесора Intel Xeon 5 з використанням налаштованих параметрів BIOS та ввімкненого SNC.

Рисунок 4. Тенденції зміни сукупної пропускної здатності пам'яті системи з урахуванням кількості модулів DIMM для серверів PowerEdge на базі процесора Intel Xeon 5 з використанням налаштованих налаштувань BIOS та вимкненим SNC.
Примітка: Сервери Dell на базі Intel Xeon 5/6 не підтримують незбалансовані конфігурації пам'яті. Модулі DIMM, встановлені в незбалансованих каналах, будуть автоматично вимикатися.
Ключові висновки
Ці результати демонструють збільшення продуктивності на 20,6% у порівнянні з попереднім поколінням при повністю заповненій або збалансованій конфігурації пам'яті. Майже збалансовані конфігурації показали в середньому збільшення продуктивності майже на 21% порівняно з Intel Xeon 5. Це покращення сприяє стабільно високому рівню продуктивності системи, якого клієнти звикли очікувати від серверних рішень Dell PowerEdge на базі Intel.
Ці дані відображають постійний розвиток технології пам'яті DDR5 та досвід Dell Technologies у сфері платформи з процесорами світового класу Intel. Незалежно від конфігурації пам'яті, обраної для вашого стійкового рішення Dell Intel Xeon 6, продуктивність корпоративного класу залишається незмінною в усіх конфігураціях.
Для досягнення цих результатів було використано наступну оптимізовану конфігурацію BIOS:
| Налаштування | Значення/Статус |
|---|---|
|
Налаштування ADDDC |
Інвалід |
|
Коригований ECC SMI пам'яті |
Інвалід |
|
Самовідновлення DIMM (ремонт після упаковки) увімкнено Невиправна помилка пам'яті |
Інвалід |
|
Політика підкачки пам'яті |
Закритий пейджинг |
|
Технологія віртуалізації |
Інвалід |
|
Підкластер NUMA |
Увімкнено |
|
ТОВ «Попередня вибірка» |
Увімкнено |
|
Режим x2APIC |
Інвалід |
|
Керований турбокомпресор Dell |
Увімкнено |
|
Системний профіль |
Користувацька |
|
Управління живленням процесора |
Максимальна продуктивність |
|
С1Е |
Інвалід |
|
Держави С |
Автономний |
|
Політика енергоефективності |
Продуктивність |
|
Керування живленням шини міжпроцесорного з'єднання процесора |
Інвалід |
|
Керування живленням каналу PCI ASPM L1 |
Інвалід |
|
Тепловий профіль |
Максимальна продуктивність (Оптимізовано для продуктивності) |
|
Зсув швидкості вентилятора |
Максимум (+100%) |
|
Мінімальна швидкість FDan |
Користувацька |
|
Мінімальна швидкість вентилятора (ШІМ) діапазон X - 100 відсотків) |
100 |
Конфігурації сервера
| Модель сервера | Процесор |
Пам'ять |
|---|---|---|
|
PowerEdge R770 |
Intel Xeon 6787P |
32 ГБ 2R RDIMM 6400 МТ/с |
|
PowerEdge R760 |
Intel Xeon 8592+ |
32 ГБ 2R RDIMM 5600 МТ/с |
Тестування було проведено компанією Dell Technologies на сервері PowerEdge R770 з процесорами Intel Xeon 6 6787P та Dell PowerEdge R760 з процесорами Intel Xeon 5 8592+. Результати можуть відрізнятися в окремих випадках.
- Кластеризація Sub-NUMA (SNC) покращує пропускну здатність пам'яті, зменшуючи затримку завдяки кращому усвідомленню локальності. Коли ця функція ввімкнена, робочі навантаження, що підтримують NUMA, можуть досягати вищої пропускної здатності, оскільки доступ до пам'яті оптимізовано в межах менших кластерів.
