目录

Giles 的个人博客

里面空无一物,充满了声音和狂热

X

事故

起因

目前公司数据库全部部署在一台服务器上(就叫S1吧)(主要是正式库和测试库),导致目前服务器磁盘压力太大,领导提出,将测试库与正式库分离,将测试库迁移到另一台服务器(S2)。

操作

梳理S1上所有的测试库,像同事询问他们的测试库,然后将所有的测试库备份,之后还原到S2上面,之后协调同事进行测试。测试完毕之后再S1上进行操作,干掉所有测试库。期间处于谨慎七月低到八月中旬,一直再以各种方式再群里或者私聊和同事进行沟通,知道所有的测试走完之后再溜了大概一周多的时间进行测试。

数据库命名

由于刚到新公司不久,对应各种数据库还不是特别清楚。

像同事询问过程中总结出:

正式库命名:DP_库名;

测试库命名:T_DP_库名;

帖个图吧

image.png

image.png

事故

9月2号,正式对S1的测试库进行删除,之后,平平无奇的到了今天,然后同事开始找我,说数据库有问题。

image.png

客户访问出现问题,系统崩溃,之后看到是因为删掉的一个T开头的库,然后黑人问号???当初跟我讲好的是测试库可以删,现在???

没办法还好有备份,然后还原、测试,解决。

反思

1,沟通不到位。

2,干掉测试库之前没有好好和同事沟通。

3,公司测试库和正式库表述不清晰,库名都是随便起的嘛

4,新人,对现有业务还是不太熟悉。

改进

1,多沟通有些不确定的东西好好好沟通协调。

2,规范数据库命名规则。

3,尽快熟悉现有业务系统。

END

还是太嫩啊,唯一值得欣慰的就是还好tmd备份了,要不然真的就是那就话了----人和数据库(代码)有一个能跑就行。

但是还是好鸡儿难受啊。。。呜呜呜。。。


标题:事故
作者:Giles
地址:https://www.gilesblog.com.cn/articles/2021/09/03/1630638987913.html