|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534: |0 c( n$ |6 z$ Y
5 h8 }# M" [6 ?# T3 k( [从IRQ到IRQL(APIC版)
9 e6 H; p: R% i+ q0 b* N( W
* y+ y+ b8 M% L/ x* g. w6 |2 w- l作者:SoBeIt
4 o* n! `4 N5 R# ~出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
1 D" f) s4 y$ r, U' u$ d日期:2005-02-04
( M" P6 Q' Z1 W( j) @* j7 K$ J3 E$ ?9 j! d. G4 [
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
+ {0 g% m- ^: P/ I- T; N% M$ Z
, t; U% u; e# b# M 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
8 T- p" H& h( V9 [
7 d) Z4 f0 n5 ]1 K5 f$ h 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
0 t1 }: P. G/ k) ^
$ a' { r$ j: K2 H+ u 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:0 U2 r( C7 N2 ]) X" }8 ^1 x9 ]
}% v* R$ K$ t5 R- s, S' M7 {#define ZERO_VECTOR 0x00 // IRQL 00
1 F. g( l0 z8 B" ^1 W% {#define APC_VECTOR 0x3D // IRQL 018 }- W# G8 S6 d- t4 I: W! q8 b
#define DPC_VECTOR 0x41 // IRQL 02
. O, z& j9 k7 W; m$ j8 T+ d#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27! v2 s1 [. \9 c5 n7 E7 N
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28" w( M' e, Q- q- i* Y
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
. R$ O7 M; ^4 A* h1 V4 V+ ?#define APIC_IPI_VECTOR 0xE1 // IRQL 29! j9 O r2 }- c
#define POWERFAIL_VECTOR 0xEF // IRQL 30& f/ l# b6 n8 k0 g$ D
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
) d y$ H3 X2 h( Z0 \7 P
* j: ^; h* [0 p8 B* [+ a/ w t7 _( x4 A% h# a6 {& Q- b( x! e
现在看一下一些重要的数据:
$ T5 I6 t* U# C' J/ G' y( G. c$ [
$ J! h' C6 }8 e6 N% V这是我写的代码输出的IO APIC重定向表内容:
: t7 \. Q+ a* |4 F7 _1 Z5 q' W/ O* W2 v/ \$ p
Redirect Table Index: 0x17
% b0 m" S0 B2 w- e8 |Redirect Table[ 0]: ff* y4 F6 C/ M* T* t9 x6 n) [
Redirect Table[ 1]: b3- q; |- `. r( X' |4 B; D9 q
Redirect Table[ 2]: ff+ [" j: u+ a+ f. T' ^# o9 R7 Y! ^
Redirect Table[ 3]: 51
0 U% m; h* m& l4 V/ W' m' c* VRedirect Table[ 4]: ff
; H" o( Q5 E( G9 Y! S+ G! i1 C( l3 ^Redirect Table[ 5]: ff
, V: d/ T* S* o: n' C/ JRedirect Table[ 6]: 62
! t# l5 m A1 J% I' aRedirect Table[ 7]: ff
! w: I7 m! v n3 o+ N+ I* ?Redirect Table[ 8]: d1' ], K: ?% U* r+ X, H
Redirect Table[ 9]: b1
5 f2 n4 n2 `5 W! d' N9 D6 rRedirect Table[ a]: ff
5 _/ w+ y# h7 p) N! m( JRedirect Table[ b]: ff- Q6 w& k6 U i* {7 r' V- V
Redirect Table[ c]: 52
& Q& A6 b5 G; l/ tRedirect Table[ d]: ff' p6 a& y, ]7 F
Redirect Table[ e]: ff# v& q3 ?1 g8 [; d
Redirect Table[ f]: 92
, b8 N$ n6 }# p/ i( xRedirect Table[10]: ff
5 v6 g# S8 M4 H4 p# D/ {Redirect Table[11]: a3
" e+ @& |" Z4 N h5 jRedirect Table[12]: 83
; Y6 y, M5 a- ]/ ?8 P/ V) `8 kRedirect Table[13]: 939 u. h( ^/ Q2 D! `& t k
Redirect Table[14]: ff6 s- m" h Q% f% I1 J
Redirect Table[15]: ff
4 V0 H, i { Y& C& g/ u/ iRedirect Table[16]: ff
1 X- b7 l& Y; E1 {7 N+ ^9 E7 pRedirect Table[17]: ff! v+ D( r# s+ {" ]* Y' x% A
6 Z ~/ c# A |+ E& b% K, E7 X
这是IDT表中被注册的向量:7 K) m9 z4 K4 S& { Z! H0 `
# Q! a! U4 | f. L; Q+ K
1f: 80064908 (hal!HalpApicSpuriousService)( ]% I* h7 U7 n" O& a
37: 800640b8 (hal!PicSpuriousService37)
- z. j x8 h5 R1 R# A3 [5 x3d: 80065254 (hal!HalpApcInterrupt)
0 t4 e2 U& m$ f1 T! X' A% V/ c- ~3 f41: 800650c8 (hal!HalpDispatchInterrupt)4 ^# D. R# H- }/ x, s
50: 80064190 (hal!HalpApicRebootService), ~/ z9 c8 k8 U0 P3 a2 B; n4 Z
51: 817f59e4" ?% r2 D, f- v3 U+ C ]
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))% f' r! Q0 D) `% T2 J' y
52: 817f5044
: s" |+ e C# P p(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
- m" \% E3 J4 M" O. O/ M7 h83: 817d2d44
, i' `7 {8 C5 V# H$ j+ ](Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794)): k! w& t! @ J7 n4 y5 p% }
92: 81821384 2 ?" P* o$ k* G; S* a; O. Y
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))8 x) i3 z* g0 X' I9 B; G
93: 8185ed64 7 }; x' R" t! }$ `3 e
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))6 i ~( R2 Y4 u& F
a3: 8186cdc4 # h- P7 O5 e' ~
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
3 v" o- }% K2 h, eb1: 818902e4 0 g, N" D: p) p, q7 }. p2 x
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))% F$ P/ q# u; P
b3: 81881664 $ y- e% K: L F2 Q1 n
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
% V' ?! E- ]$ J) J/ g/ W2 Q2 Jc1: 800642fc (hal!HalpBroadcastCallService): ?' R0 }1 f4 I6 g! x; h
d1: 80063964 (hal!HalpClockInterrupt)
2 M. E8 |: m2 \7 se1: 80064858 (hal!HalpIpiHandler)
8 O2 h# N. C4 K1 _: n# ce3: 800645d4 (hal!HalpLocalApicErrorService): s' O9 I. @0 M9 t+ C
fd: 80064d64 (hal!HalpProfileInterrupt)
8 U- Q) d7 X- q+ K! e6 }fe: 80064eec (hal!HalpPerfInterrupt)! T( m0 b! W# h. M* V
2 e. B0 G3 H; u+ b7 L/ R4 i
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
* z' ^9 K+ }! ?) g+ i0 x% S/ t4 V( W5 q
这是几个重要的数组:, ]6 {6 @4 X7 J# ~6 S& p T* q: q6 o
% m6 m7 y$ _$ I3 L2 l9 o# t
HalVectorToIrql(这个数组是以向量除于16做索引):
; p+ x7 F! b3 |. E% L; x' b8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e& H: T4 o* _6 [4 [6 @
$ v6 N, x: O) }% f: b) pHalpIRQLtoTPR:
& y5 H+ G- [+ d0 h3 `, u( n8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
& @2 `* \7 ~' v1 m1 e; g8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
5 P# O6 \: x" j5 P$ q0 w. G5 c6 ? g
HalpINTItoVector:2 ^# I2 z: O6 l( j$ Y9 B8 U% {$ ]
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
. G; _5 o6 d5 F* j: M" M" z8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00" D6 C+ J' D1 ]- Q. F/ x
$ D5 Q2 B* ~. J2 P* S1 RHalVectorToINTI:
1 s0 y: J+ }, n" g3 q3 u( E( @. m9 s8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ L5 V: Y- ~* r( B5 B! n
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ m K' p+ {5 E8 {$ D7 O0 X8 g8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' u0 o& ~& w( j" G H/ ~" e4 h1 ~; R
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
1 a' n/ Z. d/ M- f% ]1 H% W" I8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 h0 U: Y; U1 j2 L' O& S$ L8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
* l1 ?# d; }/ F9 n2 r7 _8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff( E/ B# ?. A2 }4 a* ?
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
& w; n$ ?. x: D' _7 Z8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
" C8 S0 } c! u3 M+ z" u8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff6 f* V" j& r" i. w% S
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff/ V+ O& ]4 n) y- r1 @
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff' [" |( B% s; n9 F2 t7 M$ k: B+ F
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( ^* x2 T3 |+ I+ a# H, N
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% D, Z# L* [9 \# s8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff# ?* | P, o# Q. x( C5 d8 T" q
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 8 c; f4 c- @, I" z8 @8 }
* a Q9 S' N% f
" x0 Y; c* \! ^2 Q( e; U2 g& g& ~* xvBucket:4 V& _1 S: _1 I/ c" E1 ?
8006ae30 02 02 02 03 03 03 03+ e- J4 Z9 i8 b) v2 P$ ^* N
6 ~" y! V6 \% T4 H4 O! J: K 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
, Q. ?7 V- R6 o* [
9 M* B; Y% V- Q& Z; c' A- ]. ~ vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
" k& a% G1 |: @4 r& L% E& d' h/ y, q+ L7 C# a3 P2 k. N
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。2 P5 E# ]" l& d$ {
i1 `6 v! }' ?2 H 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|