紧张的一天
早上系统数据库索引意外出错,运行p_manage_01时,错误的选择了记录范围,导致系统全部的索引都被清空。发现问题后,当时有两种解决方案,一是恢复昨晚备份的oracle索引表部分,今天的新增记录留到五一期间重新更新索引时来解决,二是全部用昨晚的备份数据库来进行恢复,新增数据需要其他部门重新做。权衡之后,采用了第一种办法。
通知业务部门暂停编目服务之后,我尝试用昨晚备份的表进行数据恢复,第一次导入没能成功,表索引报错,重建索引不成功,第二次导入成功,但表索引不成功,第三次都成功,但是还是无法检索到任何数据。经和公司人员联系,确定我们的做法是正确的,但没有人尝试过,只能说理论上可行。
在后台手工单条更新数据索引成功,可以检索,尝试用z980去更新z98,发现可检索到的记录数逐渐增加。确认之后开始操作,这就埋下了一个隐患了。因为大量的数据update操作,在oracle的归档模式下,导致oracle的归档空间满oracle报错。
尝试停服务,关闭oracle的归档模式,结果居然报错,NND,实在是让人郁闷。正常的操作居然导致错误的结果,更可怕的是在cluster的环境下,两台机器的oracle都无法启动起来。无奈之下,先将oracle从cluster的资源组中删除,然后来尝试启动,解决oracle的归档空间问题,第一步调大归档空间、第二步运行一次vertias,然后通过其调用rman将归档删除,第三步重新启动oracle成功,第四步停止oracle,将其加入cluster资源组,通过cluster来管理oracle,启动服务,测试正常。
发现这工作有时候实在是让人精神紧张,不过越紧张越没用,关键时刻还是要冷静下来才能解决问题。
祝贺呀……
系统部人员屁股下就象有个火盆呀,随时烧坏你的裤裆!
系统管理员的工作,才是真到不是人干的。
深切问候。
To 村夫:裤裆烧不破,尿得憋着倒是真的。
To 流水:你的硬盘好了,我的系统崩溃了!握手啊