训练日志保存到SFS盘的方法

网友投稿 528 2022-05-28

在专属池+自定义镜像+SFS场景下,部分用户希望能够将训练作业的日志保存到SFS盘,以供后续使用、查看。

同时,对应日志也可以在挂载的SFS盘的ECS节点(或Notebook)里,通过Python/shell脚本或专属工具做日志的洞察分析。

下面介绍日志保存到SFS盘且不影响UI界面回显的命令

训练日志保存到SFS盘的方法

# training V1 (Deprecated) cmd 2>&1 | tee /sfs/${user_path}/logs/${BATCH_TASK_CURRENT_INSTANCE} # training V2 cmd 2>&1 | tee /sfs/${user_path}/logs/${MA_CURRENT_INSTANCE_NAME}

此命令添加到客户启动脚本中,替换原启动命令即可。

其中,cmd为原启动命令,一般为形式为:"python train.py --epoch=100 ...";MA_CURRENT_INSTANCE_NAME(或BATCH_TASK_CURRENT_INSTANCE)是训练任务的id+实例id,保证每个训练节点、训练任务都有唯一的值,方便后续通过训练id来查看。

列表页训练id如下:

详情页训练id如下:

弹性文件服务 机器学习

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:手撕“汉诺塔算法”之详细图解
下一篇:Git 的命令行接口 #yyds干货盘点#
相关文章