|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
2 x; K9 L" W7 Q6 \6 `
9 C' V% a. \3 e8 o: H9 S9 N$ Z从IRQ到IRQL(APIC版)
! O: w( D* |& N$ O# [ @. ]" K" O4 `1 e' A
作者:SoBeIt
5 x1 q* [: \8 E5 t出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
; |) f0 V* W d$ \. t. `日期:2005-02-04
6 N0 O9 k# k1 M! ^" c% `; W. N
# F! s5 o5 x6 b) W事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。- g3 v3 Q/ y4 T" V- m% p' k; g
: s5 q' h' D+ }" B 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。# x* K" M# W; {$ a% c0 c6 K
f ^/ E" Y2 x) d9 h& I 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
! E6 H6 ]9 _7 K7 H3 i" _- F/ c6 N5 _
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:) J6 `& _7 a/ F
; _' i7 ?6 B n- [5 I7 _ m9 I
#define ZERO_VECTOR 0x00 // IRQL 00 - |) N% v$ M. E6 ^3 C
#define APC_VECTOR 0x3D // IRQL 01
: t0 F2 |7 g- n K+ V/ \3 k$ `# b#define DPC_VECTOR 0x41 // IRQL 02, z' i! ]2 ^! l6 O: X) k+ {
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27+ W, e/ R: T+ K7 Q
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
9 U6 `8 n9 s$ b#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
" @; K9 R' I" U/ H& Z4 {) o#define APIC_IPI_VECTOR 0xE1 // IRQL 296 j+ a: n+ g/ \" f7 E' H5 ^& b
#define POWERFAIL_VECTOR 0xEF // IRQL 30
$ B, t0 C* |! |! G4 a+ V#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
/ d7 @) y; ~9 X& @# E
, c1 j: W6 x4 r* o
2 H/ @: A% a7 p' l& e现在看一下一些重要的数据:
# _% N; L: E' [% |9 L) J" B5 c0 P( C5 e/ v* P
这是我写的代码输出的IO APIC重定向表内容:
. ]+ i% `1 `8 y3 ^% c7 S, [* \, l; K' l! S- J8 ]9 k
Redirect Table Index: 0x17- A( W) P/ O* c) }5 Q
Redirect Table[ 0]: ff
; Z% N4 Q7 P, m) [. K) dRedirect Table[ 1]: b3
: D, c' R; A/ L3 j! B, URedirect Table[ 2]: ff
3 w. p8 s3 @/ i z+ M. r: O% \" t" KRedirect Table[ 3]: 51& {$ ]7 w$ V; a! S0 q
Redirect Table[ 4]: ff4 m# Y4 U) Q4 I
Redirect Table[ 5]: ff
0 c* }8 \8 l0 k2 P3 nRedirect Table[ 6]: 62
- P" Q8 L" L: q7 pRedirect Table[ 7]: ff
" W( b3 I0 g9 T$ q1 Q3 _& CRedirect Table[ 8]: d1
, d6 |8 p, i4 N) F' hRedirect Table[ 9]: b1
6 D1 [; K2 v# \/ j! ]* E3 xRedirect Table[ a]: ff4 Y' v; G3 G( y9 F+ M
Redirect Table[ b]: ff
8 v4 d+ i, [/ I5 ^: ^2 [& FRedirect Table[ c]: 52
) F9 `& O X; l1 }/ c; \Redirect Table[ d]: ff
9 M) B ~ k! W9 BRedirect Table[ e]: ff$ @+ {. I- ~! k, r* i
Redirect Table[ f]: 922 I& |: l( {7 p2 i
Redirect Table[10]: ff
4 s3 v% _' L J1 J: j6 A" rRedirect Table[11]: a3
+ |, ] _3 a; g) h, R. M4 hRedirect Table[12]: 83
+ ?# F* s3 |: u# h* ]6 K$ aRedirect Table[13]: 93
# b5 k. O1 e, \' O9 M/ z: w$ O/ O- GRedirect Table[14]: ff+ d, j. s6 x* m$ }
Redirect Table[15]: ff
9 a# ~ G& n7 ?! `Redirect Table[16]: ff; f; z) D/ \, K" V0 O3 V+ b
Redirect Table[17]: ff' M5 a" Z# R0 m
) M+ e8 m, U& U( R* |
这是IDT表中被注册的向量:
( @/ ~& Z% |. ]& f+ N" A3 K: m: G; B8 g; x
1f: 80064908 (hal!HalpApicSpuriousService)" s f3 A# E) h" C7 N [7 [0 c
37: 800640b8 (hal!PicSpuriousService37)9 S7 S2 R6 s4 Q' A( D7 \
3d: 80065254 (hal!HalpApcInterrupt)& A0 V* m) @5 }" A! M
41: 800650c8 (hal!HalpDispatchInterrupt), e( j! g8 r5 f O/ S, d1 o6 v( c
50: 80064190 (hal!HalpApicRebootService)
) b1 J' j& @2 [5 T; r6 D8 a- E5 X' c51: 817f59e4. e% O! J1 W* z, w
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))5 }1 Y" _3 a$ d1 Q
52: 817f5044
& G2 F/ S& u3 D0 U; T" \: k(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
" B, W* _" |+ {9 O" d/ [. X83: 817d2d44
) R" X% R- a0 z% |$ J; a! R& w p6 s(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
+ ]# A& m7 V6 q0 v9 c2 E$ m2 j, `92: 81821384 ' V# S% j& @. w: M ^/ T
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
3 t3 |& Q* h" `% s2 b$ I93: 8185ed64
* _' t. O4 d& o V- M1 w(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e)), f3 @7 x9 c Q( J: B) [- @
a3: 8186cdc4
& Z" | x% _' P+ M(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)): Y, g0 Q& t: J) B1 ~
b1: 818902e4 0 F6 w' V) z" q( q8 B
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
5 R% t* f1 ]3 e! _' nb3: 81881664
) V) D: |% Y2 `(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
8 K0 t5 P/ O. O% ?* Ac1: 800642fc (hal!HalpBroadcastCallService)
8 V; M% _# x8 E5 V, Cd1: 80063964 (hal!HalpClockInterrupt)
4 v9 v4 N; ?. t D) `e1: 80064858 (hal!HalpIpiHandler)
( J7 ?+ W+ r5 Z9 y% R: X/ Xe3: 800645d4 (hal!HalpLocalApicErrorService); {/ Q0 R! Q5 [5 l$ X% E
fd: 80064d64 (hal!HalpProfileInterrupt)
& Q: G9 B' J7 Pfe: 80064eec (hal!HalpPerfInterrupt)
( E$ `3 V5 [5 @. g3 v0 R; d- U$ B% Q: `0 k V
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量; b5 ^. r" w5 D/ P" {7 l* U
/ z0 X- u$ Y! X" _* c+ J9 a/ G这是几个重要的数组:
* c7 F3 F- K$ H e; S/ h! C. d
9 H- D& k, @( B0 l9 m0 v( M; iHalVectorToIrql(这个数组是以向量除于16做索引):7 Z: N/ C1 K: R- h& _; g( b ~
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e, b( U9 F* X7 B2 g0 A! }' C& |) t. k2 I
8 L( [( r2 K' m! O8 u& R( u
HalpIRQLtoTPR:
" C. f& {2 \$ b" x8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
. @0 q3 ^ p8 _8 j& V8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff. T$ S( O+ r5 Z# q) l5 o! j
. S9 `/ u- P) n E' DHalpINTItoVector:; S: \0 P, Q' g2 k" o& ^
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 921 [1 }, \! ]9 w* D+ |8 `* Q! L
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
( f& B- v; \/ {/ X0 S; J0 W4 `( ~4 D* w7 |, g% ~9 B
HalVectorToINTI:
9 Z/ d" X7 c7 T4 r8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 Y" J4 S) @0 v% w' ]( C) l8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; `/ w; x6 S$ [ D3 I) x8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ d2 C$ |- N7 e; `' l8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, I( ^& F4 ]8 t: M: d; Y) u; f8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) R& Z! c, m! x# c& N9 o3 z
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ G* O0 Z# d5 W! J" a. _8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
# C9 L1 }7 }9 D& h, Q) S& M8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff# O8 r- b# X8 f8 N
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff3 n+ I5 _, T/ \
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
0 b' C+ G9 k' V0 }8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
- Y! b$ @$ g4 Q+ R+ `6 _. ~8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff) l# L7 t7 |% E6 E
8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
c7 H& ? }$ M8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ Z6 j- ~$ {( [: R8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff8 w- s- ?8 M, a. {
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ) x J# f* ? d" w
! J2 P, |+ w; a5 Y$ U; h( ]
$ h5 `8 L4 [. Y2 @* ~vBucket:
. U& Q3 J) u0 J7 k( z$ q8006ae30 02 02 02 03 03 03 03( j6 W0 Q8 V: U7 i$ Q/ x e& {
) R& m7 J, B! s" Z* V* V 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。3 S. B, u |+ }$ O+ x K! b4 A* Q
9 C; H% X& Z/ h) [& D! o' i0 X
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
& l1 r$ F2 \6 a8 r/ d, B) u1 B: R. ~7 b1 }
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
6 @& B. z5 D3 ^# C, P6 p7 j. n7 ]. m! B- j2 t
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|