大家好,欢迎来到IT知识分享网。
补充:2024.07.27本人遇到新的问题,因此如果第一个问题并没有解决的朋友可以查看第二个问题。
目录
运行时卡主的问题一:
问题表述:
当运行TabularPredictor的这一段代码时,其结果卡在
info worker.py:1743 — started a local ray instance. view the dashboard at
这行信息上。如下图所示。
在等待半小时后仍然无反应,并且加上time_limit限制都没用。
在近半日的排查以及搜索后,终于通过github上的一篇issue [1] 解决了该问题。
本人环境:
AutoGluon Version: 1.1.1
Python Version: 3.9.0
Operating System: Windows
Platform Machine: AMD64
Platform Version: 10.0.19041
CPU Count: 16
Memory Avail: 4.08 GB / 15.42 GB (26.5%)
Disk Space Avail: 229.84 GB / 249.51 GB (92.1%)
问题分析:
首先通过唤醒cmd,输入pip list查看自己的ray版本。(AutoGluon会使用到这个库,ray的2.10版本一般是autogulon自己安装的,但不清楚为何会产生这个问题)
如果是相同的问题,相同的ray版本则可以考虑安装最新版ray解决这一问题。
问题解决:
直接通过pip uninstall ray卸载旧版ray库,再用pip install ray重装,自动下载最新库即可。
重新安装完成后,返回运行TabularPredictor代码,发现可以正常使用,问题解决。
运行时卡主的问题二:
问题表述:
本人在Linux服务器下运行TabularPredictor时,报出如下错误:
(autoscaler ) Error: No available node types can fulfill resource request {‘CPU’: 112.0}. Add suitable node types to this cluster to resolve this issue.
经过半日的排查后,终于受github社区一篇帖子 [2] 启发,找到问题所在。
(奈何autogulon社区不够庞大,自己经验缺乏,导致总是遇到问题)
本人环境:
AutoGluon Version: 1.1.1 Python Version: 3.8.10 Operating System: Linux Platform Machine: x86_64 Platform Version: #73-Ubuntu SMP Mon Jan 18 17:25:17 UTC 2021 CPU Count: 112 Memory Avail: 717.82 GB / 755.31 GB (95.0%) Disk Space Avail: 32.97 GB / 50.00 GB (65.9%)
问题分析:
涉及ray相关的内容我不够了解,因此没办法分析出问题产生原因。如果能有朋友知道该问题原因,可以在评论区告诉我。
问题解决:
在TabularPredictor代码前加入下面三行代码
import ray ray.shutdown() ray.init(num_cpus=112, num_gpus=1)
如下图所示
当初始化ray,并指定cpu与gpu数量后TabularPredictor即可正常运行。
相关内容:
[1] [Core] ray.init() stuck at “Started a local Ray instance.” · Issue #37373 · ray-project/ray · GitHub
[2] https://github.com/real-stanford/scalingup/issues/6
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/148520.html