Llama_factory部署踩坑之旅

记录一个很巧的报错,说来也巧,2024.11.18和同门在新机器上部署代码跑模型,早上在我工位电脑远程成功跑起模型,由于工作需要先在我电脑终止,下午在同门笔记本远程连接后同样的conda环境和路径命令跑不了了。重新创建conda环境拉取代码后一直报一个typo模块缺失的错,手动安装并永久添加到系统环境也无法解决,但是在吃饭的两个小时时间段有人提了一模一样的issue,第一反应是问同门是否是他提的

No module named ‘tyro’

1
2
3
4
(llama_factory) liujiayao_20240823_91@dase314cxl:~/LLaMA-Factory-main$ python -c "import tyro; print(tyro.__version__)"
Traceback (most recent call last):
File "<string>", line 1, in <module>
ModuleNotFoundError: No module named 'tyro'

解决:

1
pip install tyro==0.8.14

https://github.com/hiyouga/LLaMA-Factory/issues/6060

version GLIBCXX_3.4.32’ not found

1
[rank0]: ImportError: /home/liujiayao_20240823_91/miniconda3/envs/llama_factory/bin/../lib/libstdc++.so.6: version GLIBCXX_3.4.32' not found (required by /home/liujiayao_20240823_91/.cache/torch_extensions/py310_cu124/cpu_adam/cpu_adam.so)

解决方案很多,因不想降低scipy的版最终通过在对应conda环境通过 conda install -c conda-forge gcc 来解决。
https://zhuanlan.zhihu.com/p/637165718?utm_medium=social&utm_psn=1842275695461552129&utm_source=wechat_session
可能有用的教程:
https://stackoverflow.com/questions/76974555/glibcxx-3-4-32-not-found-error-at-runtime-gcc-13-2-0
https://zhuanlan.zhihu.com/p/685165815
https://zhuanlan.zhihu.com/p/142718039

pip速度太慢

临时使用清华镜像

1
pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple

Llama_factory部署踩坑之旅
http://sjx.com/2024/11/27/Llama-factory部署踩坑之旅/
作者
sjx
发布于
2024年11月27日
许可协议