|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
8 _/ e1 }; G8 M& E7 b, w4 m5 E W, m4 C) c% V& W8 v
从IRQ到IRQL(APIC版)
2 }8 F V0 y: ]- ^9 I# Y. U$ Q5 a0 w; m6 k0 D2 W. n$ [
作者:SoBeIt) F' a+ L2 t2 j
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=455022 A8 |% E& h% F
日期:2005-02-04
5 G# {' Y% b: q" `
6 E: D5 `$ @1 X+ c4 [/ K事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
3 o% @2 l4 N1 t" a: U# }; @; _ O C& r* C8 V5 M3 H4 [& S
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
6 t0 i& l: g I: B: ]" P0 M. Y7 x4 @& }$ z! R' ]) L7 f0 p
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
1 h) i" n+ R% {' }, q8 f% v! x9 {1 |6 Z4 J% z3 a' N
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:4 o' a# G* Y# e9 m
: j, Z' |' f. M# b' s3 h9 F
#define ZERO_VECTOR 0x00 // IRQL 00
! B3 v5 O$ I+ @3 r" Y5 I) B#define APC_VECTOR 0x3D // IRQL 01
7 u$ O; B! Z. L#define DPC_VECTOR 0x41 // IRQL 02
* {& Q/ y7 `2 a#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27( v, L! G9 j: H2 {: G, J) y P2 y
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28" s4 U: Q) M6 ?/ ]' B
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 283 ~4 q& {1 V( h0 Q! _
#define APIC_IPI_VECTOR 0xE1 // IRQL 295 X6 w) i7 ?$ A
#define POWERFAIL_VECTOR 0xEF // IRQL 306 Z) N2 P! B5 k/ X1 Z
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31; O" W7 F$ A' v# m4 ?
0 k b1 m h7 \+ E7 ?# `* D/ b9 X9 s0 ^9 P1 h5 r
现在看一下一些重要的数据:
" s8 _" L9 P- r2 ]% G4 F% M/ p5 H
d3 ?% V% c7 L$ v: f2 f这是我写的代码输出的IO APIC重定向表内容:
8 U5 b% O7 G( ~7 n6 F) F7 w3 p) p& R; c* I6 U: c
Redirect Table Index: 0x17
) n. K# I( n9 r! Q# j$ j. A8 t2 D* dRedirect Table[ 0]: ff
& d3 h, K/ T% U% mRedirect Table[ 1]: b3( V9 F& }- l- W" s
Redirect Table[ 2]: ff
' k% M8 \3 q, c* v4 p8 zRedirect Table[ 3]: 51
5 {7 v4 ? K; WRedirect Table[ 4]: ff
% B% t2 o& M3 X0 w) h; QRedirect Table[ 5]: ff/ ~+ \, q* H7 {8 t* J
Redirect Table[ 6]: 62
* B9 N( k8 H. |: Y# W& b {Redirect Table[ 7]: ff
8 Z; ?! J9 a$ [! [Redirect Table[ 8]: d1
# L* R/ m' q9 f2 e- E5 B8 lRedirect Table[ 9]: b1/ d3 T8 e3 s- S
Redirect Table[ a]: ff
1 \/ J! R3 ]. ~9 o, p6 MRedirect Table[ b]: ff6 v( k$ {' n/ k! J
Redirect Table[ c]: 52) c$ \2 B' Y0 t; K; T, n) @
Redirect Table[ d]: ff
' k7 w# t3 i! S' @6 P5 z+ ERedirect Table[ e]: ff
/ I( A! a9 B$ ^7 kRedirect Table[ f]: 92
, p6 y* J4 h: _% @4 k5 ZRedirect Table[10]: ff
9 h, Z' B+ d& u( q6 CRedirect Table[11]: a3
- P; }) w! X2 iRedirect Table[12]: 83# T" C( j) U& j- _/ t$ n h
Redirect Table[13]: 93- ~# ~% n+ l% Y E7 f
Redirect Table[14]: ff6 E' B* I% A: z2 X" O6 s
Redirect Table[15]: ff: M0 a# F1 j( k' M4 F* c0 o
Redirect Table[16]: ff
y: p# m5 \% tRedirect Table[17]: ff5 b$ @+ F1 n' r% G
& s2 ]) D5 R6 ?* {6 D( h这是IDT表中被注册的向量:& B p3 X; ~2 c4 n
. q: }0 m" g' I5 V& `
1f: 80064908 (hal!HalpApicSpuriousService)# X' n, h% |) |3 J4 g
37: 800640b8 (hal!PicSpuriousService37)
3 y" W* r! Y8 O! ~8 i3d: 80065254 (hal!HalpApcInterrupt)! ]* Y6 A8 Y4 W+ b: A8 G9 N/ R
41: 800650c8 (hal!HalpDispatchInterrupt)& B9 f4 R) V, Q2 g" Y
50: 80064190 (hal!HalpApicRebootService)+ z2 v) k# q u* s# {
51: 817f59e4& j: s9 U$ d. n- T
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))' @8 a F b; E
52: 817f5044 / P4 z) |9 R2 C5 [+ x& w
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))7 V Z2 J2 B+ r" q! y6 ^2 Q
83: 817d2d44
: |8 H, S$ E1 u' ?! C( g(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794)): D2 H7 O% D9 J+ ^# u
92: 81821384 7 G- v, o1 J- ]8 Z4 T& Y
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
' @6 @5 B( Q0 ~2 ]/ C+ g' V; W$ u, K93: 8185ed64 1 M& l! l' `4 ^( q& |9 k5 F$ T
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
' I* C4 t0 m) `( E* }! r; O3 ~a3: 8186cdc4
* U2 I. ^/ Q' h2 t; d; T6 p(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))- O+ [) T' ?' P# U/ N, w
b1: 818902e4 / ]1 q! N# W* z) t5 w
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
/ `6 K; p. _8 o! [4 pb3: 81881664
. C2 N' ]: l' U0 ]8 ?- q7 z" k# k(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))) b/ E, k3 z) B3 i9 c" h' M8 ^( Q
c1: 800642fc (hal!HalpBroadcastCallService); [( U7 b' }' p4 D% L/ b
d1: 80063964 (hal!HalpClockInterrupt)
! [" x; k ^/ @' z& _1 ve1: 80064858 (hal!HalpIpiHandler)
! N7 }( k) p+ S: x5 Te3: 800645d4 (hal!HalpLocalApicErrorService)9 g0 T" |* ?3 M6 M+ B: P
fd: 80064d64 (hal!HalpProfileInterrupt)9 U$ b9 _- g b9 V# X2 s( B
fe: 80064eec (hal!HalpPerfInterrupt)& _% q) J; `4 n
$ G: }1 H3 R5 U1 O" T
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量+ j9 c& j. V( n d
, a5 X1 J5 K( }5 @! n& g! }
这是几个重要的数组:; Y& }- X4 f* e
$ V9 y* h3 o+ I7 d8 E0 h- A
HalVectorToIrql(这个数组是以向量除于16做索引):5 l V, D, c7 F1 b
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
V' g4 Z0 v) q+ k8 R5 r' x5 @6 ?. Z6 P$ p: J6 o
HalpIRQLtoTPR: |$ V3 D# \5 i7 g) [% O( K
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b15 }) Q; r+ H1 y* @! T
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff {4 O9 v" ^4 |4 O& H
1 u1 j9 o! I& ^& Q. G/ l( nHalpINTItoVector:
8 d+ I- T% k, l6 `! a8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92# X5 r* I% o: ]5 _8 m
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00/ ]( s |5 L- O; D" S" w5 d5 L4 p
. S! ?# L( V6 {/ N& k9 a a, f' G
HalVectorToINTI:+ z8 K! T1 Q' U8 @, ^
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 l1 a5 U9 ~+ |& Q( t/ w. q8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ _* x, b1 H2 S# N8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ s7 o* {6 r( u- F- }8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
# r9 P2 w4 K2 a, m0 y' s4 z8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 I% ^) I1 _& k& ^+ X: u* U7 C4 C8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ g! \: _- v, R8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 X6 D+ D! ?/ o6 a* d% q6 q `9 G8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff P# v8 [. `0 |5 k
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff2 I$ K# ?. W7 x: d% a
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
/ L2 o; X( v8 i8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff. F* |; n* r* ?
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
# i- J4 s) r Y1 L3 I8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff, r( w! \8 u) D9 r+ P+ [
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% P% h ~! [1 h7 r! B9 @8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ z: ]8 n$ H1 m0 m& n- L8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
+ a; X3 o/ |7 B( I
" x2 p. p1 r! ]) P" @) k* d$ p& W+ V- k# G. e P" ]
vBucket:4 H2 {% P- N' t- b" X5 |+ K
8006ae30 02 02 02 03 03 03 03! i5 ~! ]* \4 e9 W/ ^
/ y* B/ a+ L/ O& H9 u" x/ A 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
% h7 s* d9 ^- h7 [8 u0 u* E4 u9 z8 s) F6 u9 X7 V
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。 V5 k! z8 ^/ |: o, L
$ w& s& A3 v0 D" s+ @4 k( ^; S2 ^ IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
6 X( o4 s1 ~* E1 }4 ?. H. ^
! ^1 ?# A) n, F0 q3 j' W 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|