|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
+ s# f& M% h& Y. Y
5 w! W" o/ J! P7 i5 f0 d从IRQ到IRQL(APIC版)
; p5 s8 c: ~& h9 |
/ |) w3 l0 l. { k) ]0 v0 f作者:SoBeIt' |4 {6 ?. q/ p
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=455023 v/ y0 i' y# g2 m9 {
日期:2005-02-04+ Y2 M, o; R* P5 }' O$ { D
% n; {9 u+ j- c i1 _: `# q3 W
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
2 {; \/ T# g- e
# c( }5 B* h0 W3 T/ G 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
/ w+ d' A, ]; e& x0 d- k& q( `
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
; ?* M, I C6 |. w h4 d! e$ B/ `" v+ m, F* s# |7 c. ^
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:
) {0 H: q8 I: H! P. M, ~3 ~3 ^% Z6 Y G' \* G) _ ^! B e+ @
#define ZERO_VECTOR 0x00 // IRQL 00
; S2 S% b, x) l; ]" {( e' c#define APC_VECTOR 0x3D // IRQL 01
6 \" R% G5 l" W# P/ F#define DPC_VECTOR 0x41 // IRQL 02/ E. ?- y$ p5 V* e
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 271 Q+ i4 F6 I. f4 [' r4 i F! d8 } H
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
2 I, N# D( ^5 B) I#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28+ J! H! e5 r3 J5 S. ?" i5 K
#define APIC_IPI_VECTOR 0xE1 // IRQL 291 j0 d0 b C+ {' }- T
#define POWERFAIL_VECTOR 0xEF // IRQL 306 {- L& Y- c& t; A2 x! w! u; j) t
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
" O8 g+ U# g5 D7 q* I7 `0 \! B/ E/ U
# Y. Y5 m' _% n- S现在看一下一些重要的数据:
' E1 X" R8 h& x$ n: s! N2 w1 f0 y! w" z* f2 |( J- C8 M8 p: O v
这是我写的代码输出的IO APIC重定向表内容:
) y* C2 R8 e9 A3 R! h: E" X6 X4 @! `$ U8 o* w2 S; r* {* r* x9 B
Redirect Table Index: 0x172 w8 Z) Z) ~$ \. X) B/ A! G
Redirect Table[ 0]: ff
- u5 N0 v2 [5 S0 |Redirect Table[ 1]: b3' r4 J" {' Q6 h7 B# _9 D
Redirect Table[ 2]: ff; K3 @' ]: d3 x& q0 @
Redirect Table[ 3]: 51
4 t+ p: P0 s; A) I# A3 RRedirect Table[ 4]: ff
3 R4 g0 Z; e! q8 {* u- ZRedirect Table[ 5]: ff6 R4 y! d0 G9 G. W
Redirect Table[ 6]: 62
4 ^9 P' h1 U+ i& b& K/ w( ARedirect Table[ 7]: ff/ t* r7 E8 J! l# A
Redirect Table[ 8]: d1
5 }; e: h7 P" p: m, nRedirect Table[ 9]: b1
8 ^2 j& e" l" P- qRedirect Table[ a]: ff
- V/ l+ M3 [1 w- {1 v" JRedirect Table[ b]: ff! \! G7 s5 u) W" k
Redirect Table[ c]: 52
$ v, V! s. P* j# ARedirect Table[ d]: ff" H/ Z5 }/ E) V: m% o
Redirect Table[ e]: ff
' n% s9 o6 G- L3 t6 ]; F" E1 YRedirect Table[ f]: 923 n& p2 K+ W5 c# j
Redirect Table[10]: ff" o( p! ~" y2 b
Redirect Table[11]: a38 m* I. H" T: _7 d
Redirect Table[12]: 83( G; P, p. m. Y0 k% b
Redirect Table[13]: 93+ N' d/ q: `( K) ]
Redirect Table[14]: ff
' d6 y& K- r- BRedirect Table[15]: ff* W. X S6 f2 b2 T
Redirect Table[16]: ff+ q: C3 M% C1 Y% I) j6 j
Redirect Table[17]: ff4 ^; Y4 a# r% {5 R
+ P0 L. _( v. [这是IDT表中被注册的向量:0 ~9 ^8 K: a0 y* S8 ?0 @
( l1 E/ ?% F4 ~+ Q1f: 80064908 (hal!HalpApicSpuriousService)' [ t* K4 b9 D" W
37: 800640b8 (hal!PicSpuriousService37)
, J' R- P9 _0 } m3d: 80065254 (hal!HalpApcInterrupt)
+ _2 _ F) {3 D# C6 }41: 800650c8 (hal!HalpDispatchInterrupt)7 K3 ^8 `- u0 l: x. n) n
50: 80064190 (hal!HalpApicRebootService)
# K6 G( B7 ^8 b# s |# H7 W51: 817f59e4
9 `; e3 s3 s9 Y: W+ `4 ?! W, [(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
, | L8 L" G# E( r7 A52: 817f5044
+ |. V- Q( _) j# Q( g6 f(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
6 ~% ~0 A1 X% A- N2 |83: 817d2d44 # F) _/ H7 _5 k) E$ r. ]
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
1 y# n! ]* C: q1 \* b92: 81821384
?% `) y; J* F. O' j(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))4 z0 W9 k5 s/ B N e' Z
93: 8185ed64 & @9 z: p( t6 V0 a: D5 A
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))' }4 t: Y& k* M
a3: 8186cdc4
t/ V4 y- E: l4 h& n1 q$ T; u(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))1 O/ N) W* t/ M# z6 f! a! l2 z
b1: 818902e4 6 t2 B8 N5 P) A6 ~1 g! W
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
+ l6 R4 K5 A' J$ |: `" bb3: 81881664
$ v) U! T/ F9 f4 _: O(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
7 g6 U2 ~( `3 D. q$ X+ S$ G4 Z$ ?c1: 800642fc (hal!HalpBroadcastCallService)5 z2 r' }3 r/ Q( y' O6 F/ C/ t
d1: 80063964 (hal!HalpClockInterrupt)
7 I' s: Z) L! n6 \/ h2 le1: 80064858 (hal!HalpIpiHandler)3 Q: }0 j1 K4 D: x$ b: b
e3: 800645d4 (hal!HalpLocalApicErrorService)
8 @7 u5 R' @- ?; `% v% F$ R: o. Z; D" zfd: 80064d64 (hal!HalpProfileInterrupt)9 m8 z( l# s, }: ~- G* }
fe: 80064eec (hal!HalpPerfInterrupt)
- L5 [- n( G. C; c3 q t7 M% E% I) M, J g3 w! {
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量) ?1 S& Y& X2 H5 x+ G* d
, c6 |2 ^) s, ~- n( d5 j这是几个重要的数组:
: k: u5 p7 x2 x, }
0 g8 E* e# _- LHalVectorToIrql(这个数组是以向量除于16做索引):
1 |4 r, L2 i E8 s! H+ i2 }8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
; G: g8 R" L9 h8 V$ g
% a5 R( |3 c$ ^4 A+ ?; LHalpIRQLtoTPR:
/ z. Y4 d1 K5 n' K& V/ Y8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
' d) o+ l; M1 w8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
0 A0 l2 f+ N g3 U) Q
6 M9 ?9 Y s# {. uHalpINTItoVector:
8 S \& u! f+ A2 h4 e% Q/ E' G( r4 h8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92$ ]( h0 D2 _6 d B' r) r
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00# ?, g) Q8 }. x+ ^* _
4 z7 r6 n, I) ^0 U
HalVectorToINTI:1 B7 I# Z; u9 q' ?- y
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, C) F4 L% S5 W7 n2 E- i0 [8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; e3 k0 x0 k, T; h& _
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; b0 X% C( b' x) q; b3 l' m: W2 o2 b8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff* H" V9 d; P* m/ `. g' l' L5 F
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- [' z$ {# ~! m4 d% [. l! A
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
, b0 ~7 ~ K# P% q8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff }+ k! l+ ]' r4 `' |! c6 k- J4 V
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff; T( o; J. `$ a$ h. k8 G0 y$ g
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff8 b6 s& [2 C' Y& C
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff, T0 L+ V! q4 b& `; k& ~
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
8 {: ~" q! Q6 e8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
& K4 S# }& N& l8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff9 E5 A+ ~+ M+ e' e% K3 g B4 K+ v
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ l$ {2 w! C/ ~0 g3 q* P$ {" f8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
6 \! L. s" V3 H0 ]' V8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff + x) d- j: D7 U+ @1 l- j
7 ^6 L8 }' m8 @7 n
1 n7 Q$ |, e" A* bvBucket:
. c" i9 w& r( D8006ae30 02 02 02 03 03 03 03
& F# W. |2 Q: N8 E3 Y& h: O
g/ ~ s( i: M9 `1 U6 u 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
& }$ V: Q2 m7 U. o- `6 J
5 |: D& Q' c& Z8 B: F M8 z vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
! U, s+ Y, E$ G3 Z& [% k; `* V; W0 R, h4 Z; r# W+ |3 x) w; `
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
( G' q: t$ v$ d% Z7 c2 w4 A0 Q1 G
3 |' C1 E. G' I; T5 T. Y; L* [, T 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|