大家好,欢迎来到IT知识分享网。
HAMi安装与配置完全指南
HAMi Heterogeneous AI Computing Virtualization Middleware 项目地址: https://gitcode.com/gh_mirrors/ha/HAMi
项目基础介绍及主要编程语言
项目名称: HAMi(异构人工智能计算虚拟化中间件)
项目地址: https://github.com/Project-HAMi/HAMi
主要编程语言: Go
HAMi,原名k8s-vGPU-scheduler,是一个旨在管理Kubernetes集群中异构AI计算设备的一体化解决方案。作为CNCF沙盒项目之一,它支持设备共享、内存控制、设备类型和UUID特定调度等关键特性,简化了在云原生环境中部署和利用如GPU这样的复杂硬件的过程。
关键技术和框架
- Kubernetes (K8s): HAMi深度集成于Kubernetes,通过扩展其调度能力来管理和分配异构设备资源。
- Webhooks: 实现统一的更改请求处理,以适应设备分配策略。
- Device Plugins: 为不同的AI设备提供适配插件,实现资源的容器化管理。
- Virtualization Techniques: 在容器内部采用不同技术虚拟化各种异构AI设备。
安装与配置步骤
准备工作
- 环境要求:
- NVIDIA Drivers: 至少版本440。
- Docker/NVIDIA-Docker: 版本大于2.0,并确保container runtime是nvidia。
- Kubernetes: 至少版本1.16。
- glibc: 版本2.17到2.30之间。
- Kernel Version: 至少3.10。
- Helm: 版本3.0以上。
- 安装NVIDIA Container Toolkit:
- 确保所有GPU节点已安装NVIDIA驱动器。
- 配置Docker或Containerd以使用
nvidia-container-runtime
作为默认运行时环境。
GPU节点配置示例
- 对于基于Debian的系统(包括Docker和containerd):
echo 'deb https://nvidia.github.io/libnvidia-container/stable $(lsb_release -cs) main' | sudo tee /etc/apt/sources.list.d/nvidia-container-runtime.list sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
- 修改容器运行时配置(Docker示例):
{ "default-runtime": "nvidia", "runtimes": { "nvidia": { "path": "/usr/bin/nvidia-container-runtime", "runtimeArgs": [] } } }
重启Docker服务后生效。
- 对于containerd,修改
config.toml
并重启containerd服务。
标签GPU节点
- 给GPU节点添加标签以便于HAMi调度:
kubectl label nodes <节点名> gpu=on
HAMi安装
- 添加Helm仓库:
helm repo add hami-charts https://project-hami.github.io/HAMi/
- 检查Kubernetes版本并安装HAMi(假设服务器版本为1.16.8):
kubectl version helm install hami hami-charts/hami --set scheduler.kubeScheduler.imageTag=v1.16.8 -n kube-system
- 验证安装:
kubectl get pods -n kube-system
确认
vgpu-device-plugin
和vgpu-scheduler
都处于Running
状态表示安装成功。
升级HAMi
- 卸载现有安装:
helm uninstall hami -n kube-system
- 更新仓库并重新安装最新版本:
helm repo update helm install hami hami-charts/hami -n kube-system
至此,您已经完成了HAMi的安装和基本配置,可以开始利用HAMi在Kubernetes集群中高效地管理和分配异构AI计算资源了。
HAMi Heterogeneous AI Computing Virtualization Middleware 项目地址: https://gitcode.com/gh_mirrors/ha/HAMi
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/141451.html