改变从一决定开始

网友投稿 950 2022-05-29

2019年,是我进公司的第11个年头。

最初我只是一个只会跟数字和单板打交道的物料管理员,十年前的一个决定改变了我的人生轨迹,我成为核心网环境服务的一名研发支撑人员。经历了2G、3G、4G再到现在的5G的核心网运维,每一次技术升级和变化都是一次历练,我拥有了更多的机会贴近业务,服务业务,也有机会站在了离构建万物互联的智能世界更近的地方。

十年历练,十年风雨,如今回首,我从未后悔十年前的那个选择。一个决定也许不能改变我的一生,但改变一生往往是从一个决定开始。

从产线工人向技术人员转身

2009年,GSM&UMTS实验室小组试点“实验室管理专业化”,实验室的领导找到我,问我愿不愿意去做一下大家都没有做过的产品核心网,当时我只是一个与数字和单板打交道的物料管理员,主要做研发实验室内的物料申购、报废和管理。我想的是,可以学习研发产品知识,况且还有导师教,这么好的机会,肯定要接受挑战,于是一口答应下来,开始了向与研发技术有关的核心网维护专员转身。

然而,从产线工人向技术人员的转身,过程是痛苦的。产品运维需要对所有产品都非常了解,最开始我翻着一本本产品资料,通过自学了解产品架构、网元特性、协议信令流程……,但是对于一个专科生来说,一味死记硬背的学习让人很痛苦,也很茫然。所幸,迷惘之际导师给我指点了迷津,他教会了我使用一个学习方法,让我快速成长。

这个学习方法也并不特别,就是“善于记录,问题汇总,带着问题去学,理论+实践”,直到现在我都在使用,受益匪浅。比如协议流程全是英文,那些通信的英语词汇我压根看不懂,我把它们全部记录到一个本子上,一个一个查字典,再不懂的就积极去向他人请教。那段时间仿佛着魔似的,每天满脑子都是信令协议流程,以至于有时候导师还特意考我一些协议术语的缩写,我都能脱口而出。付出也得到了回报,我自己慢慢能看懂信令,也会分析流程了。

光学不练是假把式,理论还得和实践结合才能真正提高。一次有一个3G核心网与无线控制器(BSC)的IU接口配置问题,师傅让我主导处理。我表面满口答应,但内心是有些畏惧的,因为核心网牵涉面太广,如果搞错了可能整个研究所的测试环境都会出问题,但是人总要学会自己走路,我和研发同事一起开始配置对接,我配置核心网上的IU口,他配置基站,然后一起对接调测验证,定位解决问题,第一次的成功实战让我总算是摸到了研发的门槛。其实对接并不难,很多时候,畏惧只是因为未知,因为我们没有踏出那关键的第一步。

不久后,我第一次开始脱离师傅指导和协助,独立支撑升级UMTS部门核心网网元分组网关(GGSN9811)。这是我熟悉的设备,第一次独立支撑业务的我依然紧张,但是我已经不像之前那么容易害怕了。

我拿着便携,坐在机房的地上,呼吸着设备吹出来的热风,升级,第一次失败,我没气馁,接着第二次,还是失败,我这才开始慌了。不想这么快就求助,我强压住心里的慌乱,开始回忆平常学习和总结的网元特征,想起曾经在周例会上有同事分享过类似情况的处理办法,我赶紧翻出小本本,开始尝试使用串口升级,第三次,升级成功了!业务配置也顺利交付。从此GSM、UMTS、NodeB等研发部门无论何时只要对核心网有需求,几乎都有我在。1小时响应,24小时闭环是我给自己定下的目标。随着处理问题的增多,也算把自己推广出去了,开始慢慢建立起自信来。

从毛坯房开始搬迁几万个业务

2009年到2012年,上研所搬迁新基地,实验室团队成立了无线公共核心网维护组,我开始专职投入核心网运维,首要职责就是,专职规划和建设新基地核心网,保障搬迁中核心网所有网元零故障;支撑研发搬迁环境对接调测,提升研发效率。

在开始搬迁前几个月,我就提前进入了新基地,搭建调测核心网环境,从毛坯房开始投入到公共核心网机房的场地/网络规划、传输设备调测及CN环境建设中,顺利保障核心网搬迁、搬迁后环境恢复及端到端验证调试,支撑了上研无线公共核心网到各个部门几万个终端的业务环境恢复。

经历一年多的搬迁,我更加熟悉各个网元设备的业务,对各网元架构和传输也有了较为深入的理解。搬迁后,也正式迎来无线2G、3G向4G技术的演进,我们怎样才能更快响应研发诉求?3G和4G如何做好衔接?3G/4G的互操作网元架构怎么建立?可能很多人觉得这不是研发人员的事吗,和实验室管理人员关系很大吗?事实上,实验室使用中存在大量的公共网元,专职人员长期从事相关工作,运营效率会更高一些。通过实验室专业化的运作,比如传输优化、数据标准化,2G/3G/4G新老平台核心网替换等方法,终于使无线GUL核心网整合,满足了业务诉求,实现研发“0”投入,支撑研发效率明显提升。

女生不适合做环境维护?

很多人说实验室管理员的岗位,女生不适合做,特别是核心网环境维护这块。因为岗位紧贴业务,需要随叫随到,7x24小时待命,半夜三更一个电话会议就得爬起来支撑更是家常便饭,尤其是有了自己的小家后,经常是接完公司的一个电话,娃娃早已熟睡。虽然家人曾有过埋怨,但看我喜欢这份工作,更多的是理解和支持。

记得2013年的五·一,我接到一线电话,海外某国一个镜像回国测试项目,镜像环境出现问题,我紧急赶回公司,折腾了一天多,解决了演示中MOCN用户无法接入及GUL的切换问题,最终保障了演示的顺利完成。还有一次,一个出差墨西哥参与一线保障的同事,给我打电话,墨西哥和国内有十来个小时的时差,打给我时是半夜两点多,对方需求很紧急,说4G的用户上行灌包不通,在场产品专家搞了好久都没解决,我一听,这类问题是实验室常见问题,我把几个排查方向给他们一一分析,后来问题很快得到解决。听到电话那头同事连说了好多谢谢,虽然没有到一线,但能为一线提供服务,能够通过自己的努力服务研发,支撑业务交付成功,还是很有成就感的。

改变,从一个决定开始

以为是终点,转头又是起点

2016年5G业务入驻成研,我也转岗到了成都,承担起5G核心网的维护工作,5G核心网和原来GUL完全不是一个平台和架构,我在新的起点上又开始了新的挑战。

2017年初,我正式投入5G 核心网规划建设,基于之前4.5G核心网云平台的建设经验,一步一个脚印摸索5G产品知识,如期交付第一套5G-SOC 2.0核心网建设并验证通过,保障5G的测试活动如期开展。

核心网虽已交付,但是由于5G还处于新产品阶段,种种问题接踵而来。记得当时遇到最紧急的事情是,SOC2.0的CPE样机交付关键时期,大量样机用户出现接入14秒后被核心网“踢出去”的概率性问题,用户突然无法入网。我赶紧分析并协调端到端专家联合来分析,但眼看着交付时间逼近,这个问题还是没有得到解决。大家都束手无策,先采用了临时的解决办法,在核心网侧手动删除用户残留信息,重新入网注册,但是问题还是时时复现,阻塞测试。

我想了想,在实验室这么久,之前也出现过类似的问题,于是我大胆提出“用户分流”的方案,先把200+非样机用户分流到另外的核心网上,只保留500+CPE样机用户。这样可能会解决样机用户无法入网的问题,但被分流的非样机用户需要重新配置基站数据,调测传输和重新验证,万一有问题,还要花很长时间去调测,可能原来的问题没解决,新的问题又出现了。与几位业务领导专家沟通后,大都认为风险太大,但是前期产品专家定位迟迟没结果,只能尝试一博。我一边定位,一边开始着手把部分评估后的非样机用户分流出去,并保证重新配置后非样机用户调测通过。之后,问题竟然真的解决,顺利保障CPE样机如期交付。问题虽然解决,我还是带着满脑子疑问,为什么分流后问题就解决?后来我协调多方产品专家来分析复盘,结论是某个网元产品Bug,数据残留导致用户拥塞,从而带来了问题。后来我们在下一个产品版本中彻底解决了此类问题。

每一次解决一个问题,就是一次技能的提升,我也在一次次的磨练中快速成长。2017年至2019年间,我交付了6套5G核心网,满足研究所5G内场实验室/外场所有测试场景。过程中还顺利保障了成都多个5G项目局点演示,甚至还有南非客户慕名打来电话求助解决相关问题。

世界每一天都在进步,原地踏步就是在退步。我又开始思考如何持续更好地保障业务。我梳理了日常比较机械繁复的工作,思考是否可以利用工具来支撑,经领导认可后,我和实验室SRE团队一起开发了核心网开户的自助服务工具,以前开户100个用时需20分钟,有了这个工具后开户只需1分钟,效率杠杠地。通过自助开户服务平台解决只有我一个能开户的瓶颈问题,实现研发测试员工都可以开户。用户使用成本低,效果也很好。

这十几年,一路走来,有成功的喜悦也有失败的挫折,感谢公司为我提供的广阔平台,让我幸运地从一个物料管理员转身为可以从事基层研发支撑的普通员工。这个岗位并不起眼,我没有过人的才华,也没有傲人的成绩,有的只是一颗踏踏实实做好本职工作,认认真真做好每件事的初心。人生路漫漫,走好每一步,我会在这个普普通通的岗位上继续前行,不惧挑战,不畏将来。

本文为《华为人》版权所有,未经允许不得转载。如需转载请联系编辑部hwrb@huawei.com

华为人期刊

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:#化鲲为鹏,我有话说# 鲲鹏服务器信息巡检脚本
下一篇:[mongo] {第七部分} mongodb sharding
相关文章