|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=25341 S B$ J* t: S8 P
+ c4 e4 I3 K7 Q# B6 U/ }
从IRQ到IRQL(APIC版)# Z6 [" b; y+ a8 A' ?8 \! G) p
& J# }! g" s4 V( W1 u* l7 ]
作者:SoBeIt8 _9 {* d$ L7 p6 V# e. {, F0 F
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502: h4 ~# ~1 D5 Z
日期:2005-02-04' ~- p* v2 y1 w# d9 g: G. S
1 J3 z) G- M7 h8 V4 C& S
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
: q1 ?4 R3 T/ p1 X+ z6 O. C6 o/ A; U; R1 B1 S
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
6 m% @3 U+ {; v4 j$ X4 K! |0 W; E; \: v3 ]& A; Y1 J
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。3 e3 r6 |" t6 T( [
6 R+ x1 u2 k! z& |* ^# E
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:8 j. l: ?& Z( W& C
& F* `2 d- i3 l. ^4 D( u% p
#define ZERO_VECTOR 0x00 // IRQL 00
/ n+ m9 O; ^- c1 i' `#define APC_VECTOR 0x3D // IRQL 01" x) P/ x+ t9 R- Y1 X
#define DPC_VECTOR 0x41 // IRQL 02
9 a, l/ |& I+ }( N+ D#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
& L% z4 l5 U$ g" [; ]9 g: i' U#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
: n1 G- K( G& s1 T ^2 X7 {% i; X#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
* i9 O1 \! v' k# l% M* Z% h/ o. ]8 |#define APIC_IPI_VECTOR 0xE1 // IRQL 29
8 ^; c6 G2 |8 D9 n#define POWERFAIL_VECTOR 0xEF // IRQL 30
3 k8 h1 r z4 K/ ~#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
7 @5 ?4 A4 K, b* r7 R6 y2 Y1 }" R' I9 T2 Q, u: }- u
1 ?0 Y5 k$ ^' p' B a5 z' Q现在看一下一些重要的数据:. R- f. }& h J
5 |$ U( k2 ~. k这是我写的代码输出的IO APIC重定向表内容:
& p: l$ _! a; h( d. m
3 R6 }! u3 u$ R5 C7 DRedirect Table Index: 0x17
# P3 _. P% E% t4 t6 p2 w. U8 ^- gRedirect Table[ 0]: ff
/ V2 }5 T, R2 O2 L5 {, V6 oRedirect Table[ 1]: b3; c3 m# z0 g: O. U( t- M+ _
Redirect Table[ 2]: ff$ `" `; G) H. I0 @5 H8 _
Redirect Table[ 3]: 510 |# a. n2 R& U! E7 h+ J
Redirect Table[ 4]: ff
; p7 Z3 R9 w% Q+ J/ F C [; ~Redirect Table[ 5]: ff
& X( S/ K, @% v4 b4 i/ J% ~+ \- YRedirect Table[ 6]: 62
! ~8 M' \. t3 p+ ?Redirect Table[ 7]: ff5 R" V! p9 n' y$ B3 P! o2 R
Redirect Table[ 8]: d1( o3 d. j( y P0 s a
Redirect Table[ 9]: b14 l! Z, x, X2 B6 C. @
Redirect Table[ a]: ff$ n9 ~1 ?) t z9 v' J; P
Redirect Table[ b]: ff
: h* {. j# J2 A( XRedirect Table[ c]: 52( d, P* G! u) B# G6 I3 X% a
Redirect Table[ d]: ff
, q2 X- M7 b6 k9 f) V* qRedirect Table[ e]: ff: T3 J' F0 @0 z; K$ Z3 l
Redirect Table[ f]: 92
, o9 l; r6 R% M) r ORedirect Table[10]: ff
6 I" v* U" @0 k+ I' l9 ARedirect Table[11]: a3
' P9 y8 s, F+ X) a5 NRedirect Table[12]: 83
0 L) } P( m$ z6 `9 bRedirect Table[13]: 93- k( E: N' ]+ W9 A
Redirect Table[14]: ff8 @1 N n. U3 i. r
Redirect Table[15]: ff
! V6 h: O* O8 w4 g' L3 ]6 ]Redirect Table[16]: ff8 Z0 |: A! e6 l* A0 v& y; C
Redirect Table[17]: ff
: P7 i4 s- `/ ]' j0 U- B/ o1 H9 g: [0 `
这是IDT表中被注册的向量:
( {: w7 v$ B) }3 s7 F% f/ o% a; v1 N/ p( u: Y0 Q2 x
1f: 80064908 (hal!HalpApicSpuriousService)
- t: r! r' a! `4 q3 J3 x37: 800640b8 (hal!PicSpuriousService37)
3 Z5 z+ |, s: k- Z" J6 r3d: 80065254 (hal!HalpApcInterrupt)) n2 ^4 G* O" D2 F. d; A
41: 800650c8 (hal!HalpDispatchInterrupt)
% X% n5 d( L ?+ U- d50: 80064190 (hal!HalpApicRebootService)* z+ r7 S; \2 n
51: 817f59e49 y/ x* A7 W2 K8 W3 L! \+ D
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))8 E% n* W4 c' ]- A# m- r4 a" K
52: 817f5044 % }& r$ P. k$ k5 E9 s
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
7 P0 Q8 {5 I4 N2 @$ c5 a83: 817d2d44
9 \) c( }7 b1 I* G(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
5 \+ r4 y4 I8 o" w0 _92: 81821384
9 r$ _) [7 ]. P(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))5 e4 |6 J' ]! n, I) d
93: 8185ed64 % o* w- S5 c: K; R/ R
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))6 h' U4 s4 }3 t7 a1 Y
a3: 8186cdc4 ) F- P1 [% Z) r; f5 i! H
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))0 x8 C7 d; q/ K( P( B& R
b1: 818902e4 & o/ p/ O' g2 h# y. b2 q3 C% a" u
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))/ l; q" Y$ w' j
b3: 81881664 1 Y1 {& F' I6 Q9 t( h& R" x
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
6 F* _( p4 n; ?$ Q9 yc1: 800642fc (hal!HalpBroadcastCallService)
( B: l2 m0 y1 h: Z# A, F$ Ld1: 80063964 (hal!HalpClockInterrupt)) j! r0 M. I' H! b2 o
e1: 80064858 (hal!HalpIpiHandler) m; I$ l- O9 B( x* ?
e3: 800645d4 (hal!HalpLocalApicErrorService)+ ]' N" m" e( L9 S: e
fd: 80064d64 (hal!HalpProfileInterrupt)& A9 l0 I8 m6 }7 R
fe: 80064eec (hal!HalpPerfInterrupt)9 | d5 t G- C) K& J* P! |* w# @
6 k8 v$ ]8 V& `, i象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
# v0 q8 W5 [5 n" T& ^0 ?' W4 E2 k
+ i, [5 E9 y6 a0 {9 e1 a这是几个重要的数组:
- U7 H: K$ n' ?* E* |. C) {9 w$ P3 l3 F9 k) a
HalVectorToIrql(这个数组是以向量除于16做索引):* r7 a) d; y. K
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e) U" s5 F7 U4 e' o4 i3 a( J
" B- W' q' B/ V1 K$ t0 FHalpIRQLtoTPR:3 I5 ^) K- c/ \! r( q% t
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
; z2 E) F5 l' \% j9 @1 \8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff$ ^) ?$ \5 w# Q4 Q( R
8 t/ n$ D( u) A1 X4 z W& B
HalpINTItoVector:
2 c- |# q' j; Z$ B; B: ?/ n4 ^+ x8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92& Q7 E/ H5 l3 j4 [; ~
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
' Y( C+ G+ {% D1 O0 X5 N
0 }4 s2 |$ A' E m1 zHalVectorToINTI:4 I" [% i5 d9 r" A, H3 }5 a6 z
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ k4 }. y; [7 |/ n
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff5 ]9 {) ] Z) ]7 \4 O5 M
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' k M0 C- @% f' S7 u( b6 A
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- G" G. ^/ m: s3 e3 x' A: r, p8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' u0 g( R* b6 n4 `# W! Q
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff7 U% x4 T2 p0 c( K( a( N
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
2 j" e8 }9 U! i7 i' a/ E8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff0 v/ `3 b6 c# d# V. o
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff8 ?) `' {" A2 P* H7 X6 ]& b
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff9 e- o* h+ U" d
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff( c6 p& h! a8 H
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff" ~) V& T I Y+ n1 R9 F
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 V: ^7 r7 t6 {! D/ T
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ J7 M. K5 J+ @ S8 B
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff3 W: W8 W" T% B) B- e
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 6 h& z1 ]) |( a3 C
4 m0 b3 N# P" D6 v4 c4 n1 Q
5 x6 E8 P+ U( \0 a- J* h% u6 [vBucket:
" f% g& i" R; z9 ?5 C& [8006ae30 02 02 02 03 03 03 039 t: J. h/ t K, c$ _6 h9 Z
9 f; @ Z$ s- ^) W 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
, n9 H' c i: a4 k7 @
* a9 h3 V; ~3 r3 T vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
) }* A P/ k# {8 o
9 h4 @, w8 C2 d: v; M" X# ~; z IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
; e8 {% r$ R' d' E/ [. u+ l
' B6 [" N& t, H: i: m$ q# ` 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|