工程仿真的高性能计算和云计算研究:深入了解成功实施和扩展云计算和高性能计算 (HPC) 计划的最佳实践。
摘要
在工程应用中,云计算可以提供按需计算能力,以便在整个设计周期内更频繁地运行日益复杂的仿真。在自动驾驶汽车、数字化制造、下一代飞机等颠覆性新技术和系统的开发过程中,仿真技术发挥着越来越重要的作用。快速、高保真仿真和分析是设计和测试这些系统的关键部分。
我司于 2023 年 3 月代表数字工程公司为工程和仿真软件解决方案的领先供应商 ANSYS 公司和亚马逊网络服务公司(AWS)开展了云仿真研究。这项研究旨在更好地了解在开始或扩大使用高性能计算和云工程仿真时遇到的障碍、驱动因素和最佳实践。
这项研究的受访者总数超过 740 人,包括安世和非安世客户。调查结果显示,24% 的受访者目前正在使用云技术进行工程仿真,另有 24% 的受访者计划在未来 12 个月内使用云技术。在最重要的云仿真功能方面,57% 的受访者指出,提供按需迸发功能极为重要/非常重要,其次是使用不同软件产品进行仿真的能力(52%)以及与其他团队成员协作的能力(51%)。
为了更好地了解那些采用高性能计算云计算进行工程仿真的公司是如何成功克服实施障碍的,我们询问了他们是如何加强云计算计划以确定最佳实践的。当被问及在为仿真工作负载购置新的高性能计算硬件和基础设施之前,哪一项举措最为重要时,前三位的回答分别是
提供模拟工作负载将带来的好处的证据
量化业务价值和预期投资回报率
在为特定仿真环境指定理想硬件配置时获得帮助
本白皮书将探讨企业如何在云上使用高性能计算和仿真,如何应对挑战,以及如何向公司决策者证明其优势,以实现其潜力。
24%的受访者使用云技术进行工程仿真。57%的受访者指出,提供按需突发功能的能力非常/非常重要 。无论是大公司还是小公司,都在利用云技术来实现仿真软件的优势。
共享仿真挑战
在仿真和分析领域,云计算的使用范围不断扩大。根据 Grand View Research 的预测,从 2023 年到 2030 年,基于云计算的仿真软件市场的复合年增长率将达到 15.4%,比普通仿真市场(同期复合年增长率为 13.6%)高出近两个百分点。
自 Ansys 和 Digital Engineering 于 2020 年发布上一份关于 HPC 和云计算在仿真中的应用的报告以来,目前正在使用云计算进行工程仿真的受访者从 17% 增长到 24%,而计划在未来 12 个月内使用云计算进行仿真的受访者从 20% 增长到 24%。
需要访问更多计算资源以满足仿真需求,这推动了基于云的高性能计算在工程领域的应用。根据对调查的反馈,用户正在运行冗长的仿真,经常要排队数小时才能使用共享的计算和软件资源。公司正在对更多物理特性进行更大规模的分析,分析频率也更高,而基于云的仿真资源可以帮助这些公司以更灵活的方式更快地完成分析。
虽然工程师们越来越频繁地利用工程计算基础设施中可用的更多核心数来加速仿真,但时间限制仍然是一个挑战。自 2020 年的上一次研究以来,使用 13 个或更多内核进行并行处理的受访者从 44% 增加到 50%。尽管受访者中使用更多 HPC 内核的人数略有增加,但更多的 CAE 用户(2023 年为 30%,2020 年为 21%)表示,他们最频繁的仿真是通宵运行(耗时超过 9 小时)。这些更长时间的运行通常是运行更大型、更复杂仿真的结果。
以下哪种说法最恰当地描述了您在运行工程仿真应用程序时最典型的计算使用情况?
37% 只在的移动 PC 或台式工作站上运行
29% 工作站/PC 和本地或部门服务器集群上运行
10% 在工作站/PC 上运行,但在第三方云计算基础设施上运行计算要求较高的工作
17% 主要在公司的高性能计算数据中心上运行,在本地工作站/电脑进行前后处理。
5% 主要在公司的高性能计算数据中心运行(含前后处理)
3% 主要在公司的高性能计算数据中心运行,但也在第三方云计算基础设施上运行计算要求较高的工作
1% 其他
工程仿真工作通常仍在工作站上完成,但市场正开始转向共享 HPC 资源和第三方云计算平台。虽然有 37% 的受访者在笔记本电脑或台式机上运行仿真,但这一数字已从 2020 年的 43% 下降到了现在的水平。数据显示,工程师通常混合使用工作站、本地高性能计算集群和云计算。
小型公司往往更依赖于个人电脑,45%的公司完全使用个人电脑,而在大型公司中,这一比例仅为29%。各种规模的公司利用第三方云资源的比例大致相同–约 10% 的公司在使用工作站的同时还使用云,约 3% 的公司使用云/数据中心组合。
最常执行的工程模拟需要多长时间?
工作排队等待资源的最长时间是多少?
除了冗长的运行时间和排队时间外,当前计算基础设施的局限性也直接影响了仿真的使用和建模质量。调查显示38% 的受访者表示,由于硬件限制,他们限制了仿真模型的大小和细节数量。28% 的受访者表示,计算等待时间过长降低了高保真模型的实用性(2020 年为 19%)。仅有 10% 的受访者表示他们有足够的能力及时完成高保真模型–与 2020 年的 12% 相比略有下降。
38% 限制仿真模型的大小和细节量,以适应我的硬件,但这在结果保真度方面是可以接受的
28% 偶尔创建保真度较高的模型,但计算等待时间较长,使这些模型对我的用处不大
18% 偶尔创建保真度较高的模型,并有足够的能力在我的项目所需时间内完成这些模型
5% 限制仿真模型的大小和细节量,以适应我的硬件,但这导致结果保真度较低
10% 经常创建保真度较高的模型,并有足够的能力在我的项目所需时间内完成这些模型
1% 其他
受访者还提供了有关他们最常见的设计挑战的数据,排在前三位的分别是缩短完成设计周期所需时间的需求(54%)、生产更高质量的产品以区别于竞争产品的需求(34%),以及开发新产品以抓住市场机遇的需求(28%)。
哪项最能说明您目前对仿真的使用?
您认为哪些业务需求对您的设计活动最具挑战性?
54% 要求减少完成设计周期所需的时间
34% 要求生产与竞争对手产品不同的更高质量产品
21% 要求生产更可靠的产品,从而降低与保修相关的成本
28% 要求针对市场机遇开发新产品
21% 要求生产更低成本的产品
3% 其他
在被问及由于周转时间限制而限制仿真模型的大小或细节数量的频率时,78% 的受访者表示他们几乎总是或超过一半的时间这样做。52%的受访者表示,缺乏细节导致仿真度较低,对他们的设计实验不太有用。这两个数据点在不同规模的公司中都是一致的。
硬件方面的限制进一步阻碍了仿真技术在这些组织中的应用。48% 的受访者认为,缺乏足够的 IT 硬件和支持仿真的基础设施阻碍了仿真技术的推广应用,44% 的受访者表示,他们的设计团队/或 IT 支持小组不具备推广使用这些工具的专业知识。
由于周转时间的限制,您会经常限制仿真模型的大小和细节数量吗?
这种限制仿真细节的需求会导致低保真结果,从而降低设计实验的实用性吗?
总之,工程师面临着缩短设计周期和加快创新速度的压力。然而,由于计算能力不足,导致模型保真度较低或完成分析的等待时间较长,从而阻碍了这些工作的开展。这些计算制约因素也会限制在整个组织内推广使用工程仿真的努力。
云仿真崛起
如前所述,自 Ansys 和 Digital Engineering 于 2020 年对用户进行上一次调查以来,云仿真的使用率已有所上升。计划将云资源用于工程仿真的受访者人数也有所增加。(见下图)。
对于有意将更多仿真活动过渡到云服务的公司来说,用户似乎更关注如何加快产品开发和提高灵活性。当被要求对评估或使用云服务时最重要的云仿真功能进行排序时,57% 的受访者认为,向云扩展以获得额外计算能力的能力极为重要或非常重要,而 51% 的受访者则强调了协作能力。强调了协作能力。大约一半或更多的受访者还认为,支持多种类型的仿真软件以及与其他企业软件应用程序的集成也很重要。
在评估或使用云计算服务时,对以下支持云的仿真功能的重要性进行排序
在需要额外计算能力时,能够向云扩展 按使用付费的软件许可
服务,包括基于云的数据管理
支持虚拟桌面基础架构 (VDI)
利用与公共云提供商(AWS、Azure 等)的现有合同
国际军火交易条例 (ITAR)云合规性
结合公共云和私有云(即混合云)的能力
使用两个或多个公共云计算服务/供应商
能够执行来自多个独立软件供应商 (ISV) 的仿真软件
与其他团队成员合作,以监控状态、检查趋势并验证设计方案
将仿真结果与其他企业应用程序(CAD/PDM、PLM、MBSE/系统工程、MES、优化)集成并同步。
在减少建模和保真时间限制方面,受访者似乎认为,利用新的内部硬件和云解决方案的混合方法可以改善他们的分析活动。约有一半的受访者认为,更换现有硬件、升级现有硬件或增加高性能计算许可证以更高的核心数运行模拟是一种有效的方法。在云解决方案方面,32% 的受访者青睐公共云平台,25% 的受访者认为由 ISV 管理的 SaaS 解决方案会有所帮助,17% 的受访者选择了由合作伙伴管理的云解决方案。
您认为哪种解决方案最能减少影响仿真模型和结果的周转时间限制?
25% 使用由独立软件供应商 (ISV) 管理的软件即服务 (SaaS) 解决方案(如 Ansys Cloud)
17% 使用合作伙伴管理的云解决方案(如 Rescale)
32% 使用公共云解决方案(如 AWS)
50% 用性能更好的新硬件替换现有硬件
50% 升级现有硬件(如增加内存、增加 CPU 或 GPU 加速器、固态硬盘)
47% 增加高性能计算软件许可证,以便以更高的核心数运行仿真
11% 不确定/不知道
对这些公司来说,高性能计算和云计算基础设施投资的成本论证也很重要。在被问及购买新高性能计算硬件/基础设施时不同因素的重要性时,71% 的受访者认为证明对仿真工作负载的益处极为重要或非常重要,其次是量化业务价值和投资回报率(68%)。做出投资决定的其他重要因素包括:能够获得帮助以指定理想的硬件配置(59%)、拥有管理更复杂硬件配置的资源、克服与新硬件部署相关的操作时间/风险,以及了解第三方硬件(即云解决方案)如何满足公司需求(均为 55%)。(更多信息,请阅读博客https://www.ansys.com/blog/survey-reveals-substantial-roi-for-hpc)。
根据贵公司为仿真工作负载购置新的高性能计算硬件和基础设施的重要性,对以下陈述进行评分:
我们的仿真工作负载将体验到的好处(如更大的扩展性、周转时间缩短)的证据
我们公司的领导者,倡导以模拟为重点的高性能计算资源
量化高性能计算投资的商业价值和预期回报
帮助为我们的仿真环境指定理想的硬件配置
管理更复杂硬件仿真环境的资源
克服与部署新硬件相关的运营时间和风险
了解由他人拥有和运营的硬件(如 “云 ”计算)如何满足我们公司的需求。
调查的其他部分也反映了这种不同的方法,并非每个用户都会以相同的方式或程度将云计算集成到其仿真工作流程中。如前所述,基于工作站的仿真仍占用户群的最大部分(但正在缩小),但许多受访者正在混合使用工作站、高性能计算数据中心和云平台。
在云中运行仿真作业的公司混合使用不同的云提供商,47% 的受访者几乎总是或一半以上使用 AWS 等公共云解决方案,其次是 ISV 管理的解决方案(36%)和合作伙伴管理的云解决方案(30%)。(见下图)。
您在以下云计算平台上运行仿真作业的频率如何?
独立软件供应商 (ISV) 管理的软件即服务 (SaaS) 解决方案(如 Ansys Cloud)
合作伙伴管理的云解决方案(如 Rescale)
公共云解决方案(如 AWS)
这种情况因公司规模而异。小型公司更倾向于使用公共云解决方案(60%),而非 ISV 管理的解决方案(33%)。中型公司使用公共云和 ISV 解决方案的比例相当,66% 的公司表示几乎总是或超过一半的时间使用这些平台进行模拟。大型企业一般不太可能使用第三方云服务,只有 13% 的企业一半以上的时间依赖 ISV 解决方案,33% 的公司利用公共云解决方案。
以下略
如需英文完整原版,V或钉 pythontesting.
声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/423656.html