慧为计算集群管理系统
为要求严苛的高性能计算和人工智能应用提供密度优化型专用计算管理工具
安全可靠,易于管理
慧为计算集群管理软件提供了友好的用户界面,操作简单,便于用户进行集群监控与具体的集群管理。例如,在监控界面中,页面上将显示了集群的GPU利用率、节点总数、CPU利用率、网络状况等。当某项数据异常时,告警将启动报警机制通知用户,并在UI上以颜色改变的形式进行提醒(如变成红色等)。
主要特性
平台提供任务在线调试、错误报警、日志管理、性能检测等功能,显著降低了平台的日常运维难度。同时,它还支持MPI、RDMA网络,可满足企业对大规模计算任务的性能要求。支持仅通过一个终端全方位的控制整个集群
- 提供用户统一管理界面
- 提供可视化的集群监控面板
- 支持至多250个节点扩展
- 集成资源调度模块
- 支持节点故障时的根据镜像快速恢复
- 支持容器化的应用模块功能
产品构架
硬件设备层
硬件设备层以常规服务器为基础,兼容主流X86服务器,支持TCP/IP,InfiniBand 高速互联网络。 方案可支持分布式存储、集中式存储。
平台层
慧为计算集群管理软件可直接部署在物理机上,快速构建HPC集群系统,集成多种资源调度器,可以实现资源的高效利用与细粒度的监控与管理
通过集群管理系统
显著降低运维难度 提高整体利用率
客户在管理与使用现代计算集群这种庞大且复杂的系统时,不仅难以有效利用资源,且要花费大量时间。
慧为计算为客户提供全面的软件解决方案组合,旨在帮助您获取最佳的系统性能,加速取得成果。
资源利用率
0%
集群易用度
0%