当下的力量:利用性能密集型计算基础设施获得深入及时的洞察
Published on 08 Feb 2023
基于数据驱动的洞察,企业可以在当前和未来实现竞争差异。在外部,竞争差异化是通过推出新商品和服务或通过新的用户交互和体验增强现有商品和服务来实现的。在内部,差异化可以通过减少和改进企业流程来实现。数据驱动缩短了价值洞察的时间,为组织带来顶线和底线效应。
性能密集型计算基础设施 (PIC-I) 是扩展人工智能 (AI)、大数据和分析 (BDA)、建模和仿真 (M&S) 以及电子设计自动化 (EDA) 等工程应用所必需的,它在大型和小型企业以及所有组织实体(公司、政府、大学、非营利组织)中越来越受欢迎。基础设施的关键服务级别目标是实现规模性能。
为了让组织从大量和/或异构的数据集中获得有意义的见解,必须自下而上地创建高性能基础设施。此外,企业通常会将 PIC-I 与企业 IT 基础设施分开实施,因为这些应用程序的执行效果应该很好。
性能密集型计算 (PIC) 系统通常以批处理为导向。不过,它们正越来越多地被重新设计以包含 (实时) 流式分析组件,这使得底层基础设施的服务质量变得更加重要。无论它有多现代或多高效,用于一般用途的基础设施并不旨在支持 PIC 应用程序。相反,它旨在通过提供业务和任务关键型创收应用程序所需的服务质量来确保公司运营的稳定。
PIC 工作负载的可扩展性、性能和安全性已在多个公共云安装中得到验证,企业可能经常在这些安装中进行初步开发和测试。IT 购买者有兴趣在本地或主机托管设施中部署 PIC-I 解决方案。他们的目标是专注于具有与公共云相同的价值、性能/功耗、安全性和可持续性目标的业务成果。值得庆幸的是,IT 供应商正在迎接挑战。例如,AMD 等硅片制造商及其 Supermicro 等解决方案合作伙伴已经为 PIC 应用量身定制了基础设施解决方案。
根据 IDC 的数据,许多 PIC 项目(例如 AI)失败的主要原因是需要更多知识,而专用基础设施的投资不足。企业还必须认识到,要使 PIC 项目有效,必须在部署决策中考虑数据重力和相关性的影响。企业必须投资适当的基础设施堆栈作为其 IT 战略的一部分,以克服广泛和安全实施 PIC 的障碍。
构建高性能计算基础设施
之前确定的几个用例需要三步方法才能投入运营:技术、组织(人员)和程序。缺乏对成功所需的关键人员、流程和技术能力的认识是公司在实施许多新工作负载时面临的主要障碍,特别是在管理应用程序和相关数据的生命周期时。此外,安全性和能源效率在 IT 议程上越来越重要。
它需要新的流程和组织方法,例如投资于业务和技术团队之间以及开发和运营团队之间的沟通。以人工智能为例,企业必须扩展其人工智能运营,包括工作流协作、模型原型和训练、模型部署、模型性能评估和持续的模型监控。
作为 PIC-I 战略的一部分,企业必须评估五个技术领域。他们必须采取综合战略,考虑以下几点:
- 软件解决方案和平台为进一步的应用程序开发提供基础功能,并有助于弥合开发人员、数据科学家和 IT 运营团队之间的差距。
- 专用基础设施能够提高性能,以满足应用程序日益增长的计算和数据持久性需求
- 基础设施部署位置,以实现无处不在的消费和组织范围的分析
- 硅级安全解决方案使企业能够采用现代策略来减少对宝贵资产的威胁、减轻恶意软件并防止内部和物理攻击。
- 投资于符合公司环境、社会和治理 (ESG) 目标的技术(通过实施节能设计,IT 业务可以在满足业务需求的同时帮助实现这些目标。)基础设施是任何 PIC 任务堆栈中最容易被误解和低估的组件之一。
这也是 PIC 计划失败的主要原因之一。例如,IDC 的研究表明,在 AI 发展的早期,企业并未就最适合执行其 AI 工作负载的基础设施达成一致。因此,他们尝试了所有方法,但结果往往令人失望。具有 AI 功能的云服务提供商和超大规模数据中心可以使用大量通用服务器来扩展其 AI 和 HPC 工作负载。他们还雇用了大型 IT 团队来确保基础设施的服务质量。
大多数企业无法模仿这种方法,而这样做的努力往往会导致他们的 AI 项目在生产中失败。为这些性能密集型应用和工作负载构建更注重性能的基础设施是最好的答案,因为在通用基础设施上运行它们无法提供获得重要见解所需的规模,因此无法获得竞争优势。
下载 IDC 的白皮书,仅在在线白皮书上了解有关云基础设施服务的更多信息。