流年不利,万事小心
昨天晚上下班的时候把手机落在公司了,没有手机担心系统有什么异常的话就收不到了,于是12点睡觉前又打开电脑去check一遍。果然有个库由于在大量导数据,空间快不够了。正在加datafile的过程中,另外一个AIX5305上的库又因为异步IO的问题宕机,alert记录如下:
Errors in file /u01/oracle/admin/ningoo/udump/ningoo_ora_577896.trc:
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control01.ctl'
ORA-27091: skgfqio: unable to queue I/O
ORA-27072: skgfdisp: I/O error
IBM AIX RISC System/6000 Error: 12: Not enough space
Additional information: 1
Mon Feb 25 23:56:38 2008
Errors in file /u01/oracle/admin/ningoo/bdump/ningoo_ckpt_712718.trc:
ORA-00206: error in writing (block 3, # blocks 1) of controlfile
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control02.ctl'
ORA-27070: skgfdisp: async read/write failed
IBM AIX RISC System/6000 Error: 12: Not enough space
ORA-00206: error in writing (block 3, # blocks 1) of controlfile
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control01.ctl'
ORA-27070: skgfdisp: async read/write failed
IBM AIX RISC System/6000 Error: 12: Not enough space
Mon Feb 25 23:56:38 2008
CKPT: terminating instance due to error 221
Instance terminated by CKPT, pid = 712718
微软即将发布SQL Server 2008
微软在全球伙伴大会 (Worldwide Partner Conference) 上宣布将于2.27在洛杉矶一股脑儿发布Windows Server 2008,Visual Studio 2008 和 SQL Server 2008。
从2000到2005到2008,SQL Server的发布频率在加快,这两年通过SQL Server 2005,微软在企业数据库市场应该是尝到甜头了,不知道这次的2008有多大的改进值得让人惊喜一把的。
在CSDN上有个SQL Server 2008的专题,有兴趣的可以去了解一下。粗略的看了一下,没有什么很吸引人的亮点,基本上就是SQL Server 2005的一个精细修正版而已。
有压力,要坚持
DBA未必是一个高薪的职业,但绝对是一个高压力的职业。
昨天晚上,数据仓库一个4节点的RAC+ASM系统,在进行新加节点操作的时候,发现新节点的ASM实例无法mount diskgroup,报ORA-15042错误。后来尝试将整个库重启,结果所有节点的ASM实例都出现同样的问题了。这个教训告诉我们,在遇到问题没有搞清楚具体原因之前,千万不要轻易重启数据库。
但是问题既然已经发生,自然要想办法修复。这是一个将近7T的生产系统,虽然目前只供内部使用,也不可能接受长时间的停机,所以重建diskgroup然后从备份恢复的方案只能是最坏情况下的打算。那么,当务之急,是要尽快查出问题所在,对症下药。
工欲善其事,必先利其器。这次问题的解决,得益于oracle的kfed工具。从dump出来的结果看到,报错的两个disk的头信息确实已经损坏,另外一点比较奇怪的就是,正常disk header中记录的disk number和path信息,和从v$asm_disk查出来的已经不一致了。这个现象可能由于两个disk的头信息损坏,导致AMS Instance读取相关信息的整个机制出现了混乱。
使用kfed工具查看ASM disk header信息
从v$asm_disk中可以看到disk的很多状态信息,但有时候这些信息可能还不够,而且在我们的一个案例中,在一次报ORA-15042错误后,v$asm_disk中的信息甚至都是错误的了。Oracle提供了一个kfed的工具提供更详细准确的信息。
这个工具默认是没有编译的,需要手工编译
make -f ins_rdbms.mk ikfed
使用kfed dump出裸设备头信息,还是比较容易看懂对应的内容的
常用标签: oracle life Oracle11g MySQL blog 新特性 Cognos dba wordpress ASM
最新评论 | Recent comments
- westlife_xu on Data Guard与nid: 进来顶顶,提高知名...
- yanggq on AIX平台升级到Oracle10.2.0.4的几个问题: 10.2.0.2 in hp-ux also have the issue of the free space, it often prompt free space size > total...
- 大头刚 on 惊回首,五年秋: 5年,真快...
- xueji03 on 惊回首,五年秋: 原来ningoo毕业才5年啊,真厉害,文采也不错...
- anysql on 江南十分美,绍兴有几分: 看得书多,文采不错啊...
- NinGoo on 江南十分美,绍兴有几分: 还有很多地方没玩到,下次你要做地陪...
- NinGoo on 惊回首,五年秋: 谢谢,呵...
- Betty on 江南十分美,绍兴有几分: 那是!俺的家乡还是不错滴~~...
- 小荷 on 惊回首,五年秋: 5年的成长,有这样的成就,了不起! ps:界面又改了哈~~很清爽...
- august on MySQL命令行的几个用法: 不错。都是很实用的...
- clark on 转载:恕道: 严重支持,虽然我也姓余,虽然我以前很喜欢他的散文...
- yxyup on 惊回首,五年秋: Y的,真是人才 ^_...
- 我的梦想 on 关于Dreamhost合租: 我真准备开个合租的呢,郁闷,杂就找不倒人呢?? http://www.520if.cn/?p=35...
- sf on 本站使用的wordpress插件: 试...
- onlyring on Dreamhost惊魂记: 我的BLOG经常受到垃圾评论的影响,有没有好的解决方法? ======================...