评估HPC工作负载管理解决方案时的主要注意事项(三)

2021/5/18 10:57:38

本文主要是介绍评估HPC工作负载管理解决方案时的主要注意事项(三),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

使用IBM Spectrum LSF套件为企业解决HPC应用许可相关的挑战

对于汽车、航空航天和半导体行业等工业市场的客户来说,高性能计算企业部署中最昂贵的支出不是硬件或工作负载管理系统。实际上,IBM Spectrum LSF Enterprise套件的成本通常只占整个环境成本的1-3%,整个环境包括计算机硬件、存储、电力和管理人员。

但是,在硬件采购决策中,由于选择错误的工作负载调度器而不能有效地管理其他应用程序(如计算机辅助工程(CAE)应用程序)的许可证所带来的业务成本总是被忽视。这可能是一个遗漏,可以花费数百万在额外的应用许可软件支出。

IBM Spectrum LSF Enterprise套件包括强大的软件许可证优化功能。这将提高10%到20%的HPC效率,通过提高利用率和更好地跟踪这些昂贵资产的使用,可以减少应用许可的总体超支。IBM Spectrum LSF Enterprise Suite可以通过以下方式防止超支:
•能够比较预测许可能力和利用率,以完善项目的未来预测
•以跨集群的方式仲裁许可证的智能方式,从而使工作不会流失或许可证不会浪费。
•不需要了解申请工作的人何时会核对实际的许可证,并且不会因为“持续时间”而遭受生产力的损失。
•一种正确管理用户的方法,以维护可预测的许可证环境和防止滥用。
•一种简化提交的方法,同时保持许可证使用/复杂许可证需求的可见性。
•一个简单的方法来防止重复计算(浪费的许可证)的许可证,检查和在许可证无需定义持续时间和预测作业的运行时间
•防止错误的工作分派,一个更强大的方式来处理申请提供的许可证管理系统的缺点
•允许工程经理查看谁正在获得许可证

分析结果与总结:

对实时业务数据的日益依赖使得高性能计算成为工作负载组合中不可或缺的一部分。传统的工作负载调度软件不能有效地处理这种复杂程度的工作负载。虽然有一些替代方案支持基于hpc的工作负载调度,但是对功能、特性、易用性和成本的审查缩小了选择范围。

在这篇文章中,爱迪生比较了IBMSpectrum LSF Suite for Enterprise和一个开源替代方案的总拥有成本。造成这些费用的是一些组成部分,包括:
•集群硬件和维护
•HPC工作负载和资源管理软件
•安装费用
•电力成本
•未预料到的成本
•IT管理人员
•终端用户生产力机会成本。
从本质上说,两个替代方案之间的差异直接影响了特定的成本组成部分,进而影响了最终结果,具体地说TCO:
•IBM Spectrum LSF Suite for Enterprise的硬件成本更低,因为它需要更少的硬件(400个节点)来执行与开源相同的功能(500个节点),也就是说,它更高效,性能更好。
•软件成本是免费的开源,而不是免费的IBM Spectrum LSF Suitefor Enterprise。
•安装、培训、配置成本不适用于IBM Spectrum LSF Suite forEnterprise,因为它们包含在软件成本中。它们适用于开源。
•开源软件的电力成本更高,因为执行相同的任务需要更多的硬件。
•非预期成本是与软件集成相关的成本,缺失组件,与开源相关的咨询时间。
•与IBM Spectrum LSF Suite for Enterprise相比,开源替代方案的IT管理人员明显更多。这是由于高度训练有素的人员需要额外的努力来支持开源。
•最终用户生产力机会成本是支持任一环境所需要的努力。需要更多的开源支持,比例为420:1。

底线是,已经确定使用IBM Spectrum LSF Suite forEnterprise而不是开源替代方案,可以在4年的时间内节省31%的成本

上面的TCO分析考虑了一个包含400-500个节点的大型HPC环境。使用HPC的组织可能从小型环境开始,但它们的规模通常会随着时间的推移而增长。因此,上述考虑对于着眼于未来增长的HPC初学者来说也很重要。

建议IT高管认真考虑IBM Spectrum LSF Suite for Enterprise,而不是开源的替代方案,因为它具有更小的基础设施占地面积、更好的性能和更少的对训练有素的人员的依赖,从而可能节省成本。

通过完全集成的UI最大限度地提高管理员和用户的工作效率,同时通过高级工作负载调度帮助控制成本。IBM Spectrum LSF Suite有3个版本,提供了从小型组织到大型企业客户的不断提升的功能,并提供了以下好处:
•通过简化,提高了用户和管理员的工作效率

•集成的、强大的报告仪表板

•更快的集群准备时间-简化安装过程

在这里插入图片描述
图1:按版本增加 IBM Spectrum LSF Enterprise套件的功能

除了企业版的LSF套件外,IBM Spectrum LSF系列产品也可以按需提供:
*IBM Spectrum LSF Analytics
IBM Spectrum LSF分析
技术计算工作量的高级分析

*IBM Spectrum LSF
IBM Spectrum LSF
为苛刻的、任务关键型计算环境完成工作负载管理

*IBM Spectrum LSF Application Center
IBM Spectrum LSF应用中心
以应用程序为中心的工作负载提交和管理

*IBM Spectrum LSF Data Manager
IBM Spectrum LSF数据管理器
使用缓存的数据传输优化集群吞吐量

*IBM Spectrum LSF Explorer
IBM Spectrum LSF 资源管理器
用于IBM Spectrum LSF集群的强大的轻量级报告解决方案

*IBM Spectrum LSF License Scheduler
IBM Spectrum LSF许可调度程序
支持全球项目团队之间的许可证共享,确保许可证可用性按工作负载/用户/项目进行优先排序。

*IBM Spectrum LSF Process Manager
IBM Spectrum LSF进程管理器
在共享的分布式计算环境中运行和管理业务关键型工作流

*IBM Spectrum LSF RTM
IBM Spectrum LSF RTM
用于IBM Spectrum LSF环境的高级报告、跟踪和监视

*IBM Spectrum LSF Session Scheduler
IBM Spectrum LSF会话调度程序
高吞吐量计算能够在更少的时间内运行更复杂的模拟

以上就是我们为大家带来的关于LSF 的分享内容,如果想要更多了解LSF,可以搜索:江苏信瑞一芯科技有限公司,与我们取得联系。我们将为您带来更多的干货知识~~~



这篇关于评估HPC工作负载管理解决方案时的主要注意事项(三)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程