AIX上如何配置异步IO

AIX上如何配置异步IO

AIX的异步IO需要bos.rte.aio文件集的支持

#lslpp -l bos.rte.aio
  Fileset                      Level  State      Description         
  ----------------------------------------------------------------------------
Path: /usr/lib/objrepos
  bos.rte.aio               5.3.0.62  COMMITTED  Asynchronous I/O Extension

如何启用AIO

#mkdev -l aio0
aio0 Available

#chdev -P -l aio0 -a autoconfig='available'
aio0 changed

[继续阅读全文]

流年不利,万事小心

昨天晚上下班的时候把手机落在公司了,没有手机担心系统有什么异常的话就收不到了,于是12点睡觉前又打开电脑去check一遍。果然有个库由于在大量导数据,空间快不够了。正在加datafile的过程中,另外一个AIX5305上的库又因为异步IO的问题宕机,alert记录如下:

Mon Feb 25 23:56:37 2008
Errors in file /u01/oracle/admin/ningoo/udump/ningoo_ora_577896.trc:
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control01.ctl'
ORA-27091: skgfqio: unable to queue I/O
ORA-27072: skgfdisp: I/O error
IBM AIX RISC System/6000 Error: 12: Not enough space
Additional information: 1

Mon Feb 25 23:56:38 2008
Errors in file /u01/oracle/admin/ningoo/bdump/ningoo_ckpt_712718.trc:
ORA-00206: error in writing (block 3, # blocks 1) of controlfile
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control02.ctl'
ORA-27070: skgfdisp: async read/write failed
IBM AIX RISC System/6000 Error: 12: Not enough space
ORA-00206: error in writing (block 3, # blocks 1) of controlfile
ORA-00202: controlfile: '/u01/oracle/oradata/ningoo/control01.ctl'
ORA-27070: skgfdisp: async read/write failed
IBM AIX RISC System/6000 Error: 12: Not enough space

Mon Feb 25 23:56:38 2008
CKPT: terminating instance due to error 221
Instance terminated by CKPT, pid = 712718

[继续阅读全文]

AIX基础知识:系统资源控制器(System Resource Controller)

要理解SRC(System Resource Controller),首先需要介绍另外两个概念:子系统(Subsystem)和子服务器(Subserver)。Subsystem是一组相关可独立控制的进程或者程序的集合,而Subserver则就是其中的某一个进程或者程序,一组相关功能的Subsystem则属于一个Group。SRC则是用来控制Subsystem或者Subserver的一个后台守护进程。对于各个Subsystem的启动,停止或者查看状态都提供了统一的接口,有点类似于windows里的net start/net stop命令来控制windows的服务的意思。SRC可以控制本地或者远程系统。

SRC的守护进程是/etc/sbin/srcmstr,通过/etc/inittab随系统自动启动。

NinGoo:/>#ps -ef | grep srcmstr
    root   82706       1   0   Nov 20      -  0:00 /usr/sbin/srcmstr
    root 2999112 2847112   0 23:19:01  pts/0  0:00 grep srcmstr

NinGoo:/>#grep srcmstr /etc/inittab
srcmstr:23456789:respawn:/usr/sbin/srcmstr # System Resource Controller

启动一个Subsystem或者Subserver使用startsrc命令,如果要启动的Subserver所属的Subsystem没有启动,则在启动Subserver前会先启动对应的Subsystem。

启动Subsystem
startsrc [ -a Argument] [ -e Environment] [ -h Host] { -s Subsystem | -g Group}
启动Subserver
startsrc [ -h Host] -t Type [ -o Object] [ -p SubsystemPID]

[继续阅读全文]

AIX 5L errpt错误报告

在AIX中,errpt用于报告系统软硬件相关的错误日志信息

先来看一个实际的输出,不带参数简单列出所有的错误

#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
A2205861 1214144307 P S SYSPROC Excessive interrupt disablement time
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213234807 T H ent1 ETHERNET DOWN
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213233607 T H ent1 ETHERNET DOWN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN

[继续阅读全文]