|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
8 `. L5 g$ O$ w6 A, K5 V8 z+ I T& T) P K" w2 d
从IRQ到IRQL(APIC版)" a/ y) Z7 k3 a2 o5 S0 ]
5 {- q- N- A M: X$ @% v Y+ K作者:SoBeIt
+ f9 r9 T0 v; r1 s4 y2 \出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
& d6 H3 x) k: o$ `8 k日期:2005-02-048 T0 \! H6 J- ?
9 v1 D, h9 A- K事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。& t4 ?& @. N+ w7 J9 ^' y
0 B! p+ l+ t: E! Q+ O
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
. i0 f* a; K2 W+ ?4 x8 A' g. `- @4 j* s: R
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
6 ^4 y! ^# k$ u0 Y" ?2 g ]' D/ b$ R- x$ w0 v- Q# e% Z
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:; ~. _8 P( Z- k5 J
9 z2 P% q4 h& Y" Z7 D
#define ZERO_VECTOR 0x00 // IRQL 00 : a* W3 X4 i3 R. f: }! Y% V
#define APC_VECTOR 0x3D // IRQL 01
$ q0 n0 M. C! L' n$ f. J9 w#define DPC_VECTOR 0x41 // IRQL 02
' r; o0 v3 {: W* [$ g. h3 d#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27! A; Z( ~: b$ C; _0 Y
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
, h% c6 n+ Y- l5 {7 `9 R#define APIC_SYNCH_VECTOR 0xD1 // IRQL 281 Q6 x) I5 V& F
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
9 k& Z- ^- ^" p0 c Y5 Q- j: s#define POWERFAIL_VECTOR 0xEF // IRQL 30
* S+ z4 ^5 q7 X% z% y: }#define APIC_PROFILE_VECTOR 0xFD // IRQL 315 D& H) b+ S9 ~$ }. b, y6 W
; c2 ^% {; e0 t5 E9 L! z2 J6 U; K m/ w
现在看一下一些重要的数据:4 {# r5 M/ W& a; f+ x: Q
6 R6 L1 m0 `$ h' A- x7 K这是我写的代码输出的IO APIC重定向表内容:
6 O/ E$ d% Z+ j' K1 l0 l
! n+ q, k3 D" f9 H0 T* DRedirect Table Index: 0x17
* I! R' ?) ~; n0 Y* S/ ERedirect Table[ 0]: ff
% e0 ^) @6 Y- C, ?+ }" YRedirect Table[ 1]: b3$ e+ m9 Y" n4 K( K; R1 j1 C2 s
Redirect Table[ 2]: ff. h. r+ a: Y( \% J' ^
Redirect Table[ 3]: 51
" W$ j- x3 i5 s I$ u5 Z2 rRedirect Table[ 4]: ff Z% u7 R4 m1 O5 C- u: k
Redirect Table[ 5]: ff
A2 o; @, a1 Q9 nRedirect Table[ 6]: 62& k, q" z' x: P) Y
Redirect Table[ 7]: ff, C: L% [' W9 m9 J, m; }( J
Redirect Table[ 8]: d1
( f! T) l3 ^/ \+ g- ~8 q7 T+ PRedirect Table[ 9]: b1
% V9 |- g2 s/ C7 R) b7 U2 s3 LRedirect Table[ a]: ff
6 X" ?2 R {, _7 ^7 b: Z2 jRedirect Table[ b]: ff
' q* [$ c5 {1 t7 IRedirect Table[ c]: 52
" A. \3 ~8 O/ u5 R* dRedirect Table[ d]: ff, j# l+ H$ s6 E# |- ^+ R& H; Z! ^
Redirect Table[ e]: ff
6 f# \0 r9 _& f# hRedirect Table[ f]: 92
% W+ Q* r, n2 W# c8 d- uRedirect Table[10]: ff
- k# x* N% t) m' }Redirect Table[11]: a3+ ]" }+ C' V, z4 {2 u5 y
Redirect Table[12]: 83
' j. R8 |2 }" ^9 }6 r" A, u/ WRedirect Table[13]: 93
# {# s5 Z4 n' [) ~0 GRedirect Table[14]: ff. z7 I4 C }# [9 s/ e9 O* C
Redirect Table[15]: ff
; C, ]. T4 [8 _9 qRedirect Table[16]: ff
3 f3 P8 M2 t2 v- N* M* [! W$ W+ W: `Redirect Table[17]: ff5 ]* R# f8 a+ M" c2 E( f" h
/ y$ H5 D" Z( V& z( v L+ I这是IDT表中被注册的向量:
; H8 R K+ L9 Q$ v9 W; o, s1 x2 E& f, c2 R7 ~" Q0 }( k
1f: 80064908 (hal!HalpApicSpuriousService)
' Z. M5 O/ V7 V8 M6 C: g0 w. A37: 800640b8 (hal!PicSpuriousService37)
3 b3 p( j5 _# r9 ~8 n+ o$ `3d: 80065254 (hal!HalpApcInterrupt)# @8 l+ L$ s0 I7 \% ^
41: 800650c8 (hal!HalpDispatchInterrupt)
" t8 i7 s9 O7 w# e50: 80064190 (hal!HalpApicRebootService)* ~4 x. S& Q' i) @3 E
51: 817f59e4, q) x. u: m" ~4 r
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))2 S7 o2 B5 j* L- _# E' j# W
52: 817f5044
' p3 H" A4 o: ]& l" S: g; A8 |(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c)), w+ _6 x( D3 T+ v
83: 817d2d44
# X# ]& V, X! ?" {$ ]. \(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))' G& o9 u, s Q+ ~
92: 81821384 # o f5 M( c. i2 a P
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))3 q9 B, [( r! t; ?
93: 8185ed64
) @" L- b) N, O0 k8 z2 D(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))- E5 Y7 S3 e3 j3 H3 Z& o5 [
a3: 8186cdc4
7 Z: D7 m i, M& a(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
/ n4 k* O! ^: Lb1: 818902e4
; _3 U9 d1 v k/ ?(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
) u3 i" z2 R8 `. v; v( X! Yb3: 81881664 0 C+ A& I& c# B* U6 B" F1 Z
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
8 V4 h$ ~8 ?' R6 ~7 {4 `! e9 Ic1: 800642fc (hal!HalpBroadcastCallService)
' P4 I/ M% L$ z" Xd1: 80063964 (hal!HalpClockInterrupt)4 J/ I7 x9 m6 j6 L; N0 R9 H) g3 ]
e1: 80064858 (hal!HalpIpiHandler)
; i+ `0 x" A. L% Z2 be3: 800645d4 (hal!HalpLocalApicErrorService)
% Z& ]7 i+ D& K1 O4 d0 dfd: 80064d64 (hal!HalpProfileInterrupt)
7 [4 I8 \ H4 L1 tfe: 80064eec (hal!HalpPerfInterrupt) w; b5 d5 b7 F6 ?
8 J0 m7 Y$ [8 m3 n象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
+ ?4 E5 o$ f. s
; @% e- ?! H) ?7 T% k5 i这是几个重要的数组:; P. Y5 @6 s6 T* k. o
2 c) v% k' W: E3 {1 k/ Q+ _& a1 IHalVectorToIrql(这个数组是以向量除于16做索引):
: o* m9 n2 t9 b+ `- L5 ~8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e2 M/ f. x& c: o2 k: \! S6 j$ X
& c) { b. z$ }3 m/ i
HalpIRQLtoTPR:5 C3 b, s) M0 U% o; e( n3 n: x
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
. L4 ^2 C3 O$ l1 y8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff+ z# Z( ]3 s% ?, K4 V, u
2 z5 `# k: }6 ]5 q4 THalpINTItoVector:
* J) S1 E/ E- a* _5 [8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
$ v% d7 G1 T3 T. E. o8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
6 Q6 @, f: A1 ~0 [8 R* j7 t, Z
, X/ ~5 y1 M+ c2 OHalVectorToINTI:, d5 j( @. q+ F) J! m* o
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 O3 e1 Q% O3 l/ F0 }1 {7 r. W8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 ?7 ?% c7 [' P+ b( w8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% n. ?. W2 ^* P; t- {, v9 l
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff$ L7 @8 K$ }& P: l% F- l: |
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ s0 ?" }! B9 U/ r
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff# m3 x6 O0 H4 P j: i
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 ]3 v- C$ J; o8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff; F% V- D6 W- q. U! H! K) {
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
" `4 @) ~! m Q% R% n! m; L; X8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
7 b `$ X' Y a9 P8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff5 F/ @: d1 k+ m5 }# C# a% ]
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
' A8 p' G; w1 h% l8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 }2 m- d! H+ K# r$ ~3 O
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! V1 v4 _2 b6 c0 }0 m/ ^8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff# _' S0 e3 Z( r2 N [
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
6 ]. b( T) C# }; r4 f+ _9 W
: y; w, z; D8 x& `/ y4 i' z) G1 @' H
vBucket:/ C- O8 C: @* |: V0 E; q/ s; Y
8006ae30 02 02 02 03 03 03 03
* t7 Y0 R* O7 q5 h) q
3 C( x [5 ~5 @$ g 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
, [0 X" W+ x: C% r! d% m; Z# v$ v$ ^
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。6 U3 v0 w" y k9 i i0 _0 I
% B+ v1 o8 L+ ^4 z5 d6 S7 ~% a& o
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。5 M% L9 a, E. y4 D c% I
' {5 g b1 B/ j) r
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|