昇腾学院 | 案例分享 Atlas500 /home/mmc目录消失问题分享

网友投稿 877 2022-05-28

问题现象描述

硬件配置: Atlas 500

问题现象:

1.         Case1:客户服务放在了/home/mmc目录,硬盘在/home/mmc目录,一段时间后,该目录消失。客户不确定期间是否有reboot操作,且日志已经无法收集。

2.         Case2:没有挂载硬盘,客户升级固件后寄到客户现场,客户开机发现客户署服务的/home/mmc目录消失。

关键过程、根本原因分析

关键过程:

1.         一键收集日志,目前只支持chrome浏览器。

2.         客户通过df -h确认了根目录的分区没有满。

3.         客户没有异常操作,也未发现有异常日志,告警等。

4.         客户没有使用华为提供的6个微服务。

5.         通过df –h命令查看,客户的/home/mmc目录放在p2分区。

根本原因分析:

1.         客户数据放在了p2分区,开机时发生了切区,系统启动目录切换到p3分区,所以客户看到的现象是home/mmc目录消失。其实是因为p3分区启动时,p2分区默认是umount状态,客户的数据并未消失。

结论、解决方案及效果

结论:

1.         客户数据放在了p2分区,开机时发生了切区,系统启动目录切换到p3分区,所以客户看到的现象是home/mmc目录消失。其实是因为p3分区启动时,p2分区默认是umount状态,客户的数据并未消失。

解决方案:

1.         切区可能会导致p2或p3分区下的文件夹不可见或丢失;

2.         建议客户把数据放在/opt或者外挂硬盘,不要放在p2或p3区;

3.         外挂硬盘必须通过网页来挂载,若使用/etc/fstab 自动挂载,升级固件后会刷掉fstab。

经验总结、预防措施和规范建议

1.         目前没有方式通知客户发生了切区,后续web界面增加当前区通知。客户主动可以通过df –h查询当前启动所在分区。

2.         发生切区场景及影响

切区场景

影响

原来在p3区,异常掉电后,开机后会自动切到p2区;原来在p2区,掉电后仍从p2区启动。

原来p3的数据仍存在,mount p3后可访问。mount p3区,仍可访问p3区数据。

升级后切区,因为升级时在另外一个区升级,reboot后切区

Reboot开机后,当前区会对另外的备区进行整区覆盖。例如原来从p2区启动,升级后切到p3启动,p2区数据会被刷新为与p3相同。

主区启动失败,会到切区到备区启动

主区数据不会丢失,mount后仍可访问。例如原来从p2区启动,切到p3后,mount p2区,仍可访问p2区数据。

3.         主动切区的方式

l   升级固件,发生切区;

l   根目录下执行命令:

touch /home/data/region_a,reboot后切成P2;

touch /home/data/region_b,reboot后切成p3。

−           如果当前p2: mkdir -p /mnt/p3 mount /dev/mmcblk0p3 /mnt/p3 umount /dev/mmcblk0p3

昇腾学院 | 案例分享 Atlas500 /home/mmc目录消失问题分享

reboot后没有切区。

备注

1.         客户实际使用时异常掉电情况很多,有可能会导致切区,BMC的解释是:异常掉电时,记录启动分区的芯片会掉电,所以会默认从A区(P2)启动。

在文档中有说明各个分区的使用注意,但是系统无法限制客户在p2和p3区存放数据

昇腾 人工智能 Atlas AI

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【图文结合】全网最全的MySQL索引讲解,万字长文由浅入深带你认识索引
下一篇:详解GaussDB(DWS)数据库智能监控运维服务如何定位SQL执行问题
相关文章