有你有赞 | 冬瓜:态度决定未来的宽度
发布于 4 年前 作者 ming21 1174 次浏览 来自 分享

“这份工作还是让人很有获得感的,它最大的价值是保障商家的服务稳定运行,帮助业务解决问题的同时争取不挖坑,让方案能更加长久高效。”

我是冬瓜,现在是有赞的一名运维工程师。与这个岗位结缘,是最初刚毕业参加校招的时候,我的校招面试官是一名运维工程师,他向我详细介绍了运维工作所涉及的内容及领域:大到IDC风火水电,小到系统细节优化。所介绍的内容让我对运维工程师这个岗位蠢蠢欲动,感觉可以接触到很多自己不了解的东西,而且运维的工作内容直接与生产相关,也很有挑战性,同时,各种优化经常能获得巨大的收益,容易获得成就感,实现自我价值。于是乎,我就顺理成章的搭上了运维这趟列车。

(一)

来有赞之前在阿里工作了三年,一直做单一产品的运维工作,我的求知欲让我想了解、想接触更多维的东西。于是,通过同事的介绍,我结识了有赞。面试下来的整体感受是在这里工作接触面会更广一些,面试官的提问很有力量,而且同事的反馈说这里的小伙伴们为人处事都很靠谱,所以就来了。身处场景之中,感受到了同事之前所描述的那样,小伙伴们非常有活力,无论是平时的团建还是公司的活动,还是日常的工作交流,大家都很有意思。团队小伙伴都比较靠谱,技术型,喜欢深究,作为理工男,最直观的感受就是“来对地方了”!

新人阶段,团队给予了很多干货的输入:公司系统的介绍、初创快速发展试错阶段、满满一个矩阵的当前系统用的中间件到现在还在脑海清晰可见。与我而言,短时间内爆发式输入,面上确实广了很多,没几个听过用过的,对于自身压力还是比较大。

不过我们常说:车到山前必有路,没路可以先开路,开路就得更乐观,愚公因此敢移山。当下必然会担心这样的状态会不会容易变成杂而不精,广而不专,但既然看到了当下的短板,那就去做好了,没有什么可犹豫的!忘记熬了多少夜去花时间学习熟悉各种系统、理解原理、对比特性······像分布式系统,基本原理等原来有基础的但没有很精的知识,也算是有机会再次温习了一遍课堂所学;其次,原来我是云产品的运维,来到有赞后,摇身一变成为云的用户,会站在不一样的视角去理解产品的逻辑,感受到很多不一样的乐趣。受这种氛围影响,我渐渐明白一个道理:只有不断的充电和学习,丰富自己的业务技能,才能在这个跟原来不一样的赛道里跑的更快。


(二)

在运维这个行业内,有一个比较流行的口号:“1分钟发现问题,5分钟定位问题,10分钟解决问题”。这句口号也是我们系统稳定性建设的目标。因为运维工作必然要对系统稳定性负责,追求系统稳定性是SaaS公司必然坚持追求的目标,作为运维工程师这也是我们要去追求的。责任重担子大,压力肯定也小不了~

在这过程中,需要克服很多困难,记忆比较深刻的是之前对接一家公司的业务系统:他们的业务很传统,与现有公司的体系差异化比较明显,可维护性相对较低。同时,伴随着业务体量的不断增加,调用接口时经常出现不稳定的情况,如此下去会影响业务流程。“管他什么系统包袱,管他什么周末!背着电脑走你!”不间断出差,连续几天闭关,对系统进行梳理,重新开发、升级,优化配置,最终接口调用终于稳定。回过头来看,虽然系统有很多包袱,内心也很忐忑,害怕过程中出现疏漏不能完成对接,以至于造成损失和影响。但只要心怀阳光,遵循内心所坚定的信念-系统稳定性高于一切,前行的方向也更加铿锵。

记得还有一次,一家云厂商的网络出现异常,有赞部分用户受到影响,借助于有赞多活机房的结构,我们快速将异常流量切换到正常机房,10分钟后,受影响的用户访问恢复。

日常中我们所面临的往往都是这类紧急的问题,所以我把这句话“1分钟发现问题,5分钟定位问题,10分钟解决问题”写在了企微个性签名上,去激励自己和团队朝着这目标前进。当然,达到这个水平,还有挺长的路要走,责任越大动力越大吧。



让我持续保持这种处理问题的态度,很大一部分原因也得益于我的Team Leader。刚加入有赞那会,Team Leader会比较严肃,经常在群里面给我们强调运维标准的重要性。他有一句很深入人心的口头禅:“这个问题需要我们关心”,他总是帮助我站在稳定性角度去分析问题,也更愿意主动承担很多的责任,以至于长期给我们强调“运维规范的重要性”相关话题成了工作群里的家常便饭。经常能在群里接收到一些文档,印象最深刻的是在我们遇到yum包管理的问题和消息堆积的报警运维要不要关注的事上,我们反复沟通:“只要系统保稳定,调频battle永不停。”

这些持续的“言传身教”对我在工作中产生了非常正向的影响,因为我原本主要维护一个产品,对接的人比较少,东西也比较简单,个人标准化意识没那么强,后续维护更多系统、并和更多人打交道后才发现这种意识是有多么重要。

(三)

其实做运维的事情本身并没有多么难以解决,难的是在这过程为保障系统稳定性而处理问题的心态。我经常在团队群里鼓励小伙伴们要勇于尝试,不要担心"外部"压力和胆怯,我们还建立了一个“翻车群”,目的不是为了让大家“翻车”,而是潜移默化的让大家知道,遇到问题,心态摆正,只有通过不断地改进才能收获成功。这或许也跟我比较喜欢看王小波和余华的书有关——如果我会发光,就不必害怕黑暗。与我而言,拥有一颗正向积极的心能让自己更好的投入工作,也可以缓和紧张的工作气氛。这种态度使我在面对比较有挑战的工作场景时,让自己明确更清晰的目标,找到更好的工作思路,让处理事情变得简单高效。

转眼间,在有赞五年多了,这五年的状态如果用一个词形容的话,那就是:爬山过坎。做中间件的这几年,犯过错,也出过故障,但大部分的中间件都接触摸索了一轮。在对中间件有一定了解后,开始考虑怎么完善中间件的功能来服务业务开发,虽然有时也会脱离实际,也会提一些不符合当下的需求。

而现在,机缘巧合下我逐渐开始尝试向业务运维改变,在业务运维自己还是个初学者,开始更多了解实际的业务场景,也更多的以业务视角尝试去换位思考。因为中间件运维的经历,让自己更好的成为业务和中间件的桥梁,成为业务运维后,需要向业务输出匹配业务的运维标准,这个对于自己来说是个新的挑战:业务线波及更多,问题也更复杂,标准更难以确立,沟通和对外输出的能力要求更高。在大家的帮助下自己也在不断的摸索和成长。

每一次的转变对自身的要求也更高了,个人想法也愈见成熟。起而行动方能平定心中的惶恐:勇于承担责任,胆大心细;注重问题总结,持续改进!在行动中不断摸索,不断试错,越过阻碍,去找到那正确的方向!

如果你想和我们一起Enjoy,那就来加入我们吧!

点击→加入我们

1 回复
回到顶部