Avtobusufa.ru

Автобус УФА
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Как выбрать компьютер для работы с COMSOL; Multiphysics

COMSOL Multiphysics ® предназначен для решения широчайшего спектра задач различного типа, поэтому невозможно предложить универсальное аппаратное решение, оптимальное для всех вариантов применения COMSOL Multiphysics ® . Кроме того, быстрое развитие программного и аппаратного обеспечения и большое разнообразие компьютерной техники разной мощности и стоимости являются дополнительными факторами, влияющими на выбор конфигурации оборудования.

Оперативная память

Самыми важными параметрами, от которых зависит максимальная сложность задач, доступных для решения в COMSOL Multiphysics ® , являются объём и скорость обмена данными оперативной памяти (RAM). Если компьютер располагает недостаточным объёмом памяти, производительность расчётов существенно снизится, как и работа компьютера в целом, независимо от характеристик остальных комплектующих. Также очень важно соблюдать требования оптимальной установки и настройки памяти.

Объём оперативной памяти, необходимый для решения конкретной задачи, можно оценить, постепенно увеличивая число степеней свободы (DOF) в используемой расчётной модели, сохраняя при этом неизменным выбор физических интерфейсов и прочих настроек модели.

В логе решателя фиксируются данные об используемом объёме памяти в зависимости от числа степеней свободы. Эти данные можно аппроксимировать с помощью функции вида A×(DOF) N , где A и N — параметры аппроксимации, а DOF — число степеней свободы. Эту аппроксимирующую функцию можно использовать для оценки объёма памяти, необходимого для решения крупномасштабной задачи. Значение показателя степени N обычно лежит в интервале от 1 до 2. Если в расчёте задействован итерационный решатель с многосеточным предобуславливателем, значение N будет ближе к 1, а для прямых решателей — ближе к 2. Значение коэффициента A зависит от разреженности матрицы задачи. Например, при моделировании теплового излучения степени свободы связаны нелокально, поэтому значение A будет намного выше, чем при моделировании теплопроводности, когда учитываются только локальные связи между степенями свободы.

Стоит помнить, что объём используемой памяти и число степеней свободы могут сильно изменяться в зависимости от типа задачи, поэтому имеет смысл повторить описанную процедуру для всех типов задач, которые планируется решать. Рассчитанное таким образом значение даёт нижнюю оценку для объёма оперативной памяти, которая должна быть установлена в компьютере. Также имейте в виду, что увеличение объёма памяти до значений, существенно превышающих действительно необходимый объём, не даст никаких существенных преимуществ. Убедитесь, что в компьютере используется тип памяти с максимальной скоростью чтения/записи, поддерживаемой выбранным вами процессором.

Читайте так же:
Какая высота трактора Т 25?

Производительность расчётной станции зависит от того, как именно ​​модули памяти установлены в компьютере. Обмен данными между процессором и оперативной памятью осуществляется через многоканальную шину. Если модули памяти установлены не оптимальным образом, скорость обмена данными значительно снизится. Рассмотрим, для примера, компьютер с одним процессором, четырёхканальным контроллером памяти и четырьмя блоками памяти (по одному блоку на канал), причём каждый из этих блоков имеет четыре разъёма, таким образом, можно установить 16 модулей DIMM, как показано на схеме ниже.

Схема компьютера с одним процессором, четырёхканальным контроллером памяти и 16 модулями DIMM

Обычно, скорость обмена данными снижается, если в любом из блоков используется более двух модулей памяти. В некоторых системах, однако, замедление происходит даже при установке двух модулей в любом блоке. Соответствующую информацию можно получить у поставщика оборудования. Таким образом, чтобы в описанную выше систему установить, например, 16 ГБ оперативной памяти, используйте либо четыре модуля DIMM по 4 ГБ, либо восемь модулей DIMM по 2 ГБ, при этом убедитесь, что задействованы все блоки памяти. Выбор четырёх модулей DIMM ёмкостью по 4 ГБ каждый даёт возможность расширить объём памяти в будущем, а также позволяет максимально эффективно воспользоваться преимуществами многоканального контроллера. При установке модулей памяти задействуйте все каналы, чтобы избежать снижения производительности системы. Возможно, для этого придётся приобрести больше модулей памяти, как показано на схеме ниже.

Рекомендуемая схема установки модулей памяти

Другие факторы, влияющие на общую скорость работы программного обеспечения

Существует сложная взаимосвязь между производительностью, типом процессора, его базовой частотой, кэшем, количеством CPU, количеством ядер CPU и стоимостью оборудования. В программном коде COMSOL реализовано множество алгоритмов, на эффективность которых масштаб решаемой задачи влияет по-разному. Поэтому в зависимости от типа задачи и от её масштаба (числа степеней свободы) производительность вычислений будет в разной степени зависеть от тех или иных характеристик оборудования. Учитывая вышесказанное, очень сложно дать конкретные указания по выбору комплектующих. Поэтому ниже мы приводим лишь некоторые общие рекомендации.

Тип процессора

Сегодня на рынке представлены центральные процессоры (CPU) разной архитектуры, которые отличаются своими возможностями и стоимостью.

Высокопроизводительные процессоры, такие как Intel® Xeon® Gold и Platinum или AMD® EPYC®, имеют межпроцессорные соединения, которые обеспечивают совместную работу нескольких процессоров на одном компьютере, позволяя процессорам обмениваться друг с другом данными и работать с очень большими объёмами памяти. Такие процессоры имеют самую высокую пропускную способность памяти, то есть обмен большими массивами данных между оперативной памятью и процессором осуществляется очень быстро. В этом состоит главное преимущество данного типа CPU при работе с COMSOL. Потенциал высокопроизводительных процессоров лучше всего раскрывается при использовании двух-, четырёх- или восьмипроцессорных конфигураций. Применение подобных систем целесообразно в случае, когда расчётные модели требуют большого объёма оперативной памяти, или если требуется одновременно выполнять множество расчётов в непрерывном режиме.

Читайте так же:
Какое масло лить в двигатель мотоблока Лифан?

При работе с одной расчётной моделью увеличение числа процессоров также будет способствовать повышению производительности вычислений, однако относительный прирост производительности будет определяться размером решаемой задачи. Наибольшее увеличение скорости вычислений на многопроцессорных системах будет наблюдаться на моделях с большим числом степеней свободы. Если вы решили приобрести рабочую станцию с четырьмя или восемью процессорами, обратитесь за дополнительной консультацией в службу технической поддержки COMSOL.

В процессорах среднего уровня, например Intel® Xeon® W или AMD® Ryzen™ Threadripper™, межпроцессорные соединения отсутствуют, следовательно, процессоры этого типа являются оптимальным выбором для однопроцессорных компьютеров. Тактовая частота и количество ядер этих CPU сопоставимы с процессорами более высокого класса, так что данный тип процессоров можно назвать универсальным и привлекательным решением.

В процессорах начального уровня, например Intel® Xeon® E, используется двухканальный контроллер памяти, нет межпроцессорных соединений и эти процессоры не могут работать с оперативной памятью большого объёма. Для этих CPU характерна низкая пропускная способность памяти, но при этом они могут работать на высокой тактовой частоте. Данный тип CPU не очень подходит для параллельного решения нескольких моделей одновременно, однако одиночные задачи на этих CPU можно решать довольно эффективно и быстро.

Перечисленные выше процессоры — это процессоры текущего поколения, предназначенные для профессионального инженерного сообщества. На потребительском рынке представлены и другие модели процессоров, которые имеют сопоставимые функции и производительность и продаются, как правило, по более низкой цене.

Тактовая частота

Чем выше тактовая частота процессора, тем, как правило, выше скорость работы программного обеспечения во всех аспектах. Если сравнить производительность двух компьютеров с идентичными комплектующими, то быстрее будет работать система, имеющая CPU с большей тактовой частотой.

Кэш-память

Кэш-память встроена непосредственно в процессор. Чем больше объём кэш-памяти, тем лучше. При прочих равных условиях производительность процессора с большим объёмом кэш-памяти будет выше.

Читайте так же:
Какой аккумулятор ставить на Лада Гранта?
Количество ядер

Чем больше ядер имеет процессор, тем больше параллельных потоков он сможет обрабатывать одновременно — эта технология называется multithreading. COMSOL автоматически использует все доступные ядра, однако это требует дополнительных вычислительных затрат. При параллельных вычислениях с использованием избыточно большого числа ядер возможно даже замедление работы, правда, обычно, этот эффект наблюдается только при решении небольших моделей (при малом числе степеней свободы). Некоторые типы задач, наоборот, быстрее считаются в однопоточном режиме. В целом шести- или восьмиядерные системы являются хорошим универсальным решением, однако для эффективной работы с несколькими моделями в параллельном режиме и при использовании прямого решателя PARDISO предпочтительно выбирать процессор с большим числом ядер.

Общие рекомендации

Параметрические исследования

Если вы планируете проводить многовариантные расчёты для разных геометрических моделей, сеток, наборов материалов и других параметров в рамках одной модели, значит вы будете использовать функцию Parametric Sweep. К примеру, чтобы получить решения для десяти вариантов размера детали, изготовленной из десяти различных материалов, при десяти различных значениях параметров модели, одну и ту же задачу нужно будет решить тысячу раз. Если запускать расчёт как одно задание на одном компьютере, то общее время решения многовариантной задачи увеличится почти пропорционально, то есть примерно в тысячу раз.

Время, необходимое для решения многовариантной задачи, можно сократить, если расчёт вариантов будет проводиться параллельно. Этот режим доступен как при работе на одном компьютере для любого типа лицензии, так и на кластере при использовании сетевой плавающей лицензии.

Для решения многовариантной задачи в параллельном режиме на одном компьютере используйте функцию Batch Sweep. Параллельное выполнение параметрического исследования на одном компьютере рекомендуется только в том случае, если все варианты модели можно разместить в оперативной памяти одновременно. Например, если для решения одного варианта задачи требуется 3 ГБ оперативной памяти, тогда на компьютере с 16 ГБ имеет смысл параллельно запустить четыре задания. При работе с моделями, не требующими большого объёма памяти, будет заметно ускорение при одновременном выполнении числа заданий, соответствующего числу ядер процессора. Ускорение вычислений при использовании Batch Sweep будет зависеть как от самой модели, так и от характеристик компьютера.

Читайте так же:
Как определить сколько полос движения имеет дорога?

Для решения многовариантной задачи в параллельном режиме на кластере используйте функцию Cluster Sweep. Ограничений на количество параллельно выполняемых заданий нет, кроме числа доступных расчётных узлов кластера. Расчёт можно проводить на собственном или на арендованном кластере. COMSOL сотрудничает с рядом компаний, которые предоставляют расчётные кластеры в аренду. Каждый узел кластера должен соответствовать требованиям для запуска одного варианта модели. Дополнительные комментарии и рекомендации по кластерному оборудованию можно найти в базе знаний: Выбор оборудования для вычислительного кластера, решение 1116.

Стоит отметить, что применение алгоритмов, представленных в модуле «Оптимизация», может избавить от необходимости проводить лобовой перебор параметров.

Операционная система

При использовании ранних версий COMSOL Multiphysics ® (до версии 5.4) на некоторых процессорах с большим числом ядер производительность вычислений на операционных системах Linux ® и macOS могла оказаться выше, чем на операционных системах Windows ® .

Жёсткий диск

Общая производительность системы, работающей на твердотельном диске (SSD), выше, чем на жёстком диске (HDD). Чем выше скорость чтения/записи диска, тем лучше. Однако если при работе с моделью операционной системе приходится задействовать виртуальную память (файл подкачки), то лучше увеличить объём оперативной памяти, чем тратиться на приобретение более быстрого диска.

Графическая карта

Мы рекомендуем использовать современные дискретные видеокарты на базе графических процессоров от AMD или NVIDIA. Список протестированных на совместимость видеокарт можно найти на странице с описанием системных требований. Чем больше графической памяти доступно графическому процессору, тем более сложные модели можно будет визуализировать. Обращаем внимание, что между требованиями к объёму оперативной и графической памяти нет прямой связи, то есть если для решения модели требуется большой объём оперативной памяти, это не влечёт за собой необходимость использовать видеокарту с большим объёмом графической памяти, и наоборот.

Графический процессор

Вычисления с использованием графических процессоров в текущей версии не поддерживаются.

Как узнать частоту оперативной памяти

Показатель можно посмотреть в Виндовс:

  1. В поиск системы набрать cmd, чтобы запустить окно команды.
  2. Ввести wmic memorychip get Speed и подтвердить действие ENTERом.

Если у пользователя в PC установлено несколько модулей, этим способом можно узнать показатель каждого.

Также можно воспользоваться специальными программами.

Как определить частоту ОЗУ в AIDA64

Софт расположен в публичном доступе на официальном сайте. Платить за него не нужно.

Читайте так же:
Как узнать год выпуска шины Michelin?

Как определить частоту работы оперативы с помощью CPU-Z:

  • Запустить программу и на главном экране найти «SPD».
  • Отыскать параметр «Max Bandwidth». Он покажет как максимальную скорость, так и фактическую.

Как посмотреть частоту оперативной памяти в CPU-Z

AIDA64

Один из самых эффективных тестировщиков состояния компонентов. Есть бесплатный вариант с меньшим количеством функций, чем в платной версии.

Как узнать частоту ОЗУ с помощью AIDA64:

  • Открыть ПО.
  • Найти «Системная плата».
  • Перейти в «SPD» и отыскать нужную информацию в «Скорости памяти».

как посмотреть частоту оперативной памяти в БИОСе

Посмотреть в Биосе

Еще один хороший метод. Но он для продвинутых пользователей. Без знаний в подсистему лучше не заходить, чтобы случайно не ухудшить работу системы.

Можно ли разогнать ОЗУ

Результаты

Ключевая функциональность, предоставляемая GPUDirect Storage в том, что она формирует DMA доступ из хранилища непосредственно в память GPU. Тесты GPUDirect Storage показали следующие его преимущества :

  • Пропускная способность в 2-8 раз выше благодаря передаче данных напрямую между хранилищем и графическим процессором.
  • Явная передача данных, которая не вызывает сбоев и не проходит через буфер отскока, также снижает задержку; есть примеры с уменьшенной в 3,8 раза сквозной задержкой.
  • Предотвращение сбоев с помощью явной и прямой передачи позволяет задержке оставаться стабильной и постоянной по мере увеличения параллелизма GPU.
  • Использование механизмов DMA в привязке к хранилищу обладает наименьшим влиянием на загрузку ЦП и не влияет на загрузку ГП.
  • Тестирование показало (авторы не показали это на графиках в блоге), что влияние на графический процессор остается близким к нулю, когда сторонние механизмы DMA загружают или извлекают данные в память графического процессора.

Графический процессор становится не только вычислительным механизмом с самой высокой пропускной способностью, но и вычислительным элементом с самой высокой пропускной способностью ввода-вывода, например 215 ГБ / с против 50 ГБ / с процессора.

Все эти преимущества достижимы независимо от того, где хранятся данные — обеспечивается очень быстрый доступ к петабайтам удаленного хранилища, даже быстрее, чем кеш страниц в памяти ЦП.
Полосы пропускания к памяти графического процессора от системной памяти процессора, локального хранилища и удаленного хранилища могут быть объединены, чтобы соответствовать пропускной способности графических процессоров.

голоса
Рейтинг статьи
Ссылка на основную публикацию
Adblock
detector