现代Kubernetes环境的分布式和复杂性要求持续的优化,这是云原生生活的一项基本事实。在任何治理要求下,总有空间可以更高效、更具成本效益、更安全地管理资源。
PerfectScale 旨在以持续和自动化的方式提供所需的 Kubernetes 优化控制。该公司的 Kubernetes 优化和治理平台旨在为 DevOps 环境中的平台工程团队提供工具,改善其所谓的“完整 K8s 环境”在实际生产中的稳定性。但在此背景下,Kubernetes 的完整性到底指的是什么呢?
节点能优化到什么程度?
在这里,我们讨论的是 Kubernetes 优化,现已达到高级的节点级优化。这种更细粒度的底层控制,再加上即将推出的 GPU 支持,希望能简化 Kubernetes 性能,使团队能够智能优化整个技术栈的资源。
这种级别的优化需要能够有效分配资源(包括 CPU 和 GPU 资源,以及内存和存储)的管理工具技术,以便将工作负载均匀分配、合理规划并分配到特定节点,这些节点可能具有特定的硬件或软件配置,目的是提高成本和性能的效率。此外,还包括管理容器“资源调整”和优先级调度的系统控制,这种实践还涉及“节点亲和性”,即实施控制 Pod 放置的规则,以实现相同的优化目标。PerfectScale 将专注于这些内容。
公司指出,关于 Kubernetes 资源浪费的研究显示,过度分配的节点空间是导致浪费的常见原因。无论一项研究发现 30% 的浪费,另一项研究发现 51% 的浪费,重要的是内在的资源分配效率低下现象并不罕见。
精确识别空闲容量
PerfectScale 提供了其品牌的 Infrafit 推荐服务,提供基于数据的节点分配和利用率洞察。其核心概念在于帮助组织减少浪费、降低云成本并减少环境影响。现在,PerfectScale 在 2024 年 KubeCon + CloudNativeCon 美洲大会上宣布了 Infrafit 的最新版本,组织可以获得有关最优节点类型和资源配置的量身定制建议,从而精确识别空闲容量并有效规划预算。
PerfectScale 的首席执行官兼联合创始人 Amir Banet 说道:“PerfectScale 的旗舰解决方案 PodFit 旨在自动调整和扩展 Kubernetes 工作负载,帮助客户减少成本并增强系统弹性。但我们的使命更进一步——简化日常 Kubernetes 操作的复杂性。随着 InfraFit 推荐的加入,我们现在提供完整堆栈的 Kubernetes 成本和性能优化解决方案。”
PerfectScale 的 InfraFit 和 PodFit 解决方案与 ClusterAutoscaler(一个自动调整 Kubernetes 集群大小的组件,确保所有 Pods 都有运行空间,并避免不必要的节点)和 Karpenter(一个知名技术服务,增强节点自动扩展效率)集成,以进一步节省成本。
高级 GPU 利用
随着越来越多的组织采用 AI 和大语言模型(LLMs)来驱动应用,GPU 的使用急剧增加,推动了云成本的上升,并带来了新的资源管理复杂性。
PerfectScale 的首席技术官兼联合创始人 Eli Birger 说:“GPU 对组织来说是一项重要投资,可能占到每小时云成本的 75%。然而,管理 GPU 资源,包括其分配和优化,是一项复杂的挑战,因为需要在确保工作负载性能的同时平衡资源分配。不当配置可能导致系统不稳定,因此,组织必须有效地监控和调整 GPU 使用情况,而不影响工作负载的效率和可靠性。”
PerfectScale 在 2024 年 KubeCon + CloudNativeCon 美洲大会上宣布了即将推出的 GPU 支持,旨在为每个节点上的工作负载提供实时的 GPU 分配和利用率可见性,识别空闲资源并突出显著的节省成本机会。公司表示,这一新功能为数据驱动的 GPU 分配建议和自动优化奠定了基础,确保组织能够有效平衡工作负载中的性能和效率。
PerfectScale 邀请早期用户加入候补名单,提前体验这些 GPU 优化功能。











