【Docker 新手入门指南】第十五章:常见故障排除

【Docker 新手入门指南】第十五章:常见故障排除一 前期准备 收集关键信息在排查问题前 建议先获取以下系统数据 便于精准定位故障 1

大家好,欢迎来到IT知识分享网。

一、前期准备:收集关键信息

在排查问题前,建议先获取以下系统数据,便于精准定位故障:

1. 系统基础信息

# 查看 Docker 版本(确认是否为最新稳定版) docker version # 查看 Docker 系统配置(存储驱动、Cgroup 版本等) docker info # 查看 Docker 守护进程日志(定位守护进程启动异常) journalctl -u docker.service -xe 

2. 容器运行状态

# 列出所有容器(包括停止状态) docker ps -a # 查看容器实时日志(添加 --follow 追踪最新日志) docker logs [容器ID/名称] # 获取容器详细配置(网络、挂载、资源限制等) docker inspect [容器ID/名称] 

二、常见问题分类排查

1. 安装与初始化问题
典型症状:权限错误、守护进程启动失败、服务无法初始化

  • 权限不足
# 将当前用户加入 docker 用户组(需重启终端生效) sudo usermod -aG docker $USER newgrp docker # 立即生效权限变更
  • 守护进程状态异常
# 检查服务状态(active/running 为正常) sudo systemctl status docker # 重启/启动服务 sudo systemctl restart docker sudo systemctl enable --now docker # 开机自启并立即启动
  • 依赖缺失(Linux 系统)
    • Ubuntu/Debian:确保安装 apt-transport-httpsca-certificatescurl 等依赖
    • CentOS:安装 yum-utils 并配置稳定仓库源

2. 网络连接问题
典型症状:容器无法联网、端口映射失效、跨容器通信失败

  • 网络配置检查
# 查看默认网络(bridge 为默认网络) docker network ls # 检查容器所属网络配置(IP、DNS、网关) docker network inspect bridge
  • 端口冲突
# 查看宿主机端口占用(替换 <端口号>) sudo lsof -i :<端口号> # 更换映射端口(例如将容器 80 端口映射到宿主机 8080) docker run -p 8080:80 nginx
  • DNS 解析失败
    • 修改 Docker 守护进程配置(/etc/docker/daemon.json):
{ "dns": ["8.8.8.8", "8.8.4.4"] # 配置公共 DNS 服务器 }
    • 重启 Docker 服务使配置生效

3. 存储与磁盘问题
典型症状:磁盘空间不足、数据卷挂载失败、镜像无法删除

  • 清理无效资源
# 清理所有停止的容器、未使用的镜像和网络 docker system prune -a -f # 查看磁盘占用详情(镜像/容器/数据卷分布) docker system df 
  • 数据卷异常
# 列出所有数据卷 docker volume ls # 检查数据卷挂载路径(宿主机路径是否存在) docker volume inspect [卷名] 
  • 镜像残留清理
# 删除悬空镜像(无标签的临时镜像) docker image prune -f # 强制删除镜像(包含依赖标签) docker rmi -f [镜像ID] 

4. 性能与资源问题
典型症状:容器卡顿、CPU/内存占用过高、宿主机性能下降

  • 资源监控
# 实时监控容器资源(CPU/内存/网络/IO) docker stats [容器ID/名称] # 查看容器内进程(排查异常进程) docker top [容器ID/名称] 
  • 资源限制配置
# 限制 CPU(0.5 核)和内存(512MB) docker run -d --cpus="0.5" --memory=512m nginx # 限制磁盘 IO(示例:读写速率 10MB/s) docker run -d --device-read-bps=/dev/sda:10mb --device-write-bps=/dev/sda:10mb myapp 

5. 镜像构建与拉取问题
典型症状:镜像拉取超时、构建失败、镜像标签错误

  • 仓库连接问题
# 登录私有仓库(检查账号密码是否正确) docker login [仓库地址] # 使用镜像加速器(国内推荐腾讯云/阿里云镜像) sudo nano /etc/docker/daemon.json { "registry-mirrors": ["https://mirror.ccs.tencentyun.com"] }
  • Dockerfile 构建错误
    • 检查构建上下文路径(避免包含无关文件)
    • 添加 –no-cache 跳过缓存重新构建:
docker build --no-cache -t myapp . 
    • 通过 docker build –progress=plain 查看详细构建日志

6. 安全与权限问题
典型症状:容器以 root 运行、镜像存在漏洞、访问控制失效

  • 非 root 用户运行容器
# 指定 UID/GID 运行(需镜像支持非 root 用户) docker run -d --user 1001:1001 nginx 
  • 漏洞扫描与修复
# 使用 Docker Scan 扫描镜像漏洞(需先安装 Trivy) docker scan [镜像名]:[标签] # 查看镜像敏感配置(如特权模式) docker inspect --format='{{.HostConfig.Privileged}}' [镜像ID] 

三、常见错误代码与解决方案

错误信息

可能原因

解决方法

Error response from daemon: conflict

容器名称冲突

docker rm [冲突容器名] 或指定新名称

port is already allocated

端口被占用

更换端口或终止占用进程

OCI runtime create failed

内核参数不支持

检查 Cgroup 驱动(docker info 确认)

manifest unknown

镜像不存在或标签错误

确认镜像名/标签是否正确,重新拉取

driver failed programming external connectivity

防火墙或网络配置错误

关闭防火墙或配置 iptables 规则

四、最佳实践与维护建议

预防措施

  1. 定期备份:对重要数据卷和 docker-compose.yml 进行版本控制
  2. 资源隔离:使用 docker-compose 管理多容器应用,配置 cpu_shares/memory 限制
  3. 版本管理:固定镜像标签(如 nginx:1.23-alpine),避免使用 latest 标签

日常维护

# 每周清理无效资源 docker system prune -a -f --volumes # 每月更新 Docker 和镜像 sudo apt update && sudo apt upgrade docker-ce docker pull --all-tags nginx # 强制更新所有标签镜像 

日志管理

  • 配置日志驱动(如 json-file 或接入 ELK 系统):
{ "log-driver": "json-file", "log-opts": { "max-size": "10m", "max-file": "3" } }

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/179891.html

(0)
上一篇 2025-06-03 11:26
下一篇 2025-06-03 11:45

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信