|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534' t! G' _, i0 e+ C3 X* h; ^3 P$ C1 ^' p' j
' z" S9 n0 h4 {( x从IRQ到IRQL(APIC版)
$ V4 X6 W- _+ {" i" C3 x; S5 d& Q g' T& g( |, G
作者:SoBeIt
, n' @3 O' F2 [) Y5 s4 S出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
+ z K! d W: r# Y, v. D6 I3 u日期:2005-02-04" k) @! F+ {9 W
, C* n$ Z/ F+ o; D' _) R) W事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。 e5 j1 q& U! S
. T& s5 U [# P( [- H/ S$ V 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。3 F' H0 X, F, s4 Q
5 U( y- X1 s/ Y+ S n8 v& S 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
# q' E4 S* A9 V2 z) W9 i; r6 J; A$ H1 ?3 y/ B" S* ~- k+ Q
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:6 s" Q9 }& D; k
7 E- m3 R4 U- V/ Y
#define ZERO_VECTOR 0x00 // IRQL 00 8 M. N6 y5 `6 o9 ^0 q
#define APC_VECTOR 0x3D // IRQL 011 b. Y% S8 e8 ? X6 g% W, `6 s
#define DPC_VECTOR 0x41 // IRQL 02
1 E; P$ N% d& q) c, y#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
( N% l# \$ o+ ^, j5 a#define APIC_CLOCK_VECTOR 0xD1 // IRQL 284 A8 }; F9 l6 t5 I O: }& m3 o5 h
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28/ `2 C& k! J" h) l V0 z
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
) p8 k4 y+ s7 C6 q#define POWERFAIL_VECTOR 0xEF // IRQL 30
" p! a! b) [2 P1 H3 E1 l#define APIC_PROFILE_VECTOR 0xFD // IRQL 31% C/ d( _ |4 y6 r5 ~/ E+ ~
( i7 s# y9 k; z2 U/ \/ P4 Q" D( T N) M) Z" s' ^
现在看一下一些重要的数据:4 q# C% |* X* `! u a3 t
- D/ w( W# s5 L, D6 x- L这是我写的代码输出的IO APIC重定向表内容:
$ @% x- l+ P3 N8 s: @
4 P3 K8 x( G+ p# h/ @4 q6 oRedirect Table Index: 0x17' M8 h; }8 O, Z
Redirect Table[ 0]: ff
" d: K6 `: ?- v' d+ YRedirect Table[ 1]: b3
$ C, m r8 ^8 h. f# b- TRedirect Table[ 2]: ff9 Z2 d: ]+ I r
Redirect Table[ 3]: 51
" I9 `; n* |5 m8 _1 rRedirect Table[ 4]: ff$ u2 \( [- V. u8 N, @, l3 Z; l0 b
Redirect Table[ 5]: ff2 B4 {( P4 _& N$ W- O, p4 _! U
Redirect Table[ 6]: 62
, c W& @, E3 p# oRedirect Table[ 7]: ff
! {+ x( H3 k: v7 dRedirect Table[ 8]: d1
+ q9 d8 k5 Q; T, _1 nRedirect Table[ 9]: b1 l% b7 F& z$ q1 S3 V# W
Redirect Table[ a]: ff& v. |* x. W+ X# V8 o1 l( @
Redirect Table[ b]: ff
% w# u c! R3 G0 d9 ^Redirect Table[ c]: 52
4 U$ g! p" v& B; ?4 Y4 u* S8 dRedirect Table[ d]: ff/ s3 p6 Q% D' o* P
Redirect Table[ e]: ff4 g/ m- a0 U# W1 V6 e, [
Redirect Table[ f]: 92
7 u8 G$ H* e! ?5 wRedirect Table[10]: ff% I$ D2 c1 i/ e9 v+ T' A- g5 h8 }$ u
Redirect Table[11]: a3, P; P9 e- |$ `* ` `
Redirect Table[12]: 83
) B2 J) q7 P4 e; [: B0 LRedirect Table[13]: 935 o9 x; t; l: M( y5 Y' u, l$ U; n$ V
Redirect Table[14]: ff
* M( {5 p, J k- E6 oRedirect Table[15]: ff
9 {7 d2 c) C8 qRedirect Table[16]: ff
9 S. z: x6 U: e; v. i5 f1 QRedirect Table[17]: ff
- g H0 a( ^& [6 L
/ I% a; j7 N2 c/ z. t) c9 H这是IDT表中被注册的向量:9 ]% r- H3 [7 a; K& Q
; v3 v, B& U: p q$ y
1f: 80064908 (hal!HalpApicSpuriousService)) _& p( U2 z1 ]* p1 }1 I% `
37: 800640b8 (hal!PicSpuriousService37)" R8 E; P2 j7 [; C5 [ J
3d: 80065254 (hal!HalpApcInterrupt)6 F& t* I; |( r! q% K+ g" A
41: 800650c8 (hal!HalpDispatchInterrupt)6 M S; E) @0 m/ k6 N8 Y8 w) y& K% [* c
50: 80064190 (hal!HalpApicRebootService)6 R. [1 e& I: m1 j6 t
51: 817f59e4- g2 L+ J5 L5 _2 Y: k# K
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
% D; s' m* r [% I' O' E4 v% q52: 817f5044
' @3 g3 i7 s. P/ z% ~" P$ A(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))% U: c. @: I0 { c% ]- y! g* h
83: 817d2d44
0 _3 i" Q/ i6 e: j5 I, ?4 |(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))- r0 n! J8 u2 s2 N! h$ H: k4 [
92: 81821384
1 r( Q+ ~" I' g9 u4 {4 ^(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))4 z' V# }& }# @2 g- V% [
93: 8185ed64
0 k z/ R/ k, X( l( o& Z- Z# P$ t(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))4 J n1 _6 e( j4 Q: m$ L
a3: 8186cdc4
; M; ]6 l# ^- e3 {(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)): ?4 e: }- K J5 J1 N3 {5 ~
b1: 818902e4 7 a0 F k6 q6 X" _9 s+ X
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
0 z+ o' L- c3 n, |, C, r# Y- kb3: 81881664
8 h" }5 ^% ^$ \# i(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))7 D# D2 s" }; D6 b* _& t5 [
c1: 800642fc (hal!HalpBroadcastCallService)9 j- z9 E* f# F! R9 E9 S6 l! ?" q
d1: 80063964 (hal!HalpClockInterrupt)4 p) w- c) r [7 I$ p* [
e1: 80064858 (hal!HalpIpiHandler)* n8 O1 I1 U$ E7 }2 @2 C
e3: 800645d4 (hal!HalpLocalApicErrorService)" l9 l# [& ?1 h3 b9 A
fd: 80064d64 (hal!HalpProfileInterrupt)6 S+ E; d% i& i- L- f! }
fe: 80064eec (hal!HalpPerfInterrupt)1 j; }" Q# Y/ v/ f6 B2 O
0 T$ m1 Y' o: z# U* i
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量, S$ ~9 Y' ]1 `* k* Y& p! r5 O
# F2 Y$ m& H5 \$ L6 [这是几个重要的数组:
z l; [6 o# I9 P; w, M& u u& o
HalVectorToIrql(这个数组是以向量除于16做索引):& G& F/ i! p& X
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
* H/ C9 ^8 J6 `1 t! d% Y' }7 z, h$ c) k( h
HalpIRQLtoTPR:$ [0 V5 ]7 }( J5 U
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
5 q& Z: i4 l3 k, c8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
9 X/ a/ C! J" h
, Z* z6 s8 N7 z' }: M; [2 uHalpINTItoVector:
- P' }: e$ I% ^7 |( r" a8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
* r8 c$ k# v; k R; M) @7 B8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00 D" n! A- l6 J- r. d
% j8 Q: @# A1 O+ \
HalVectorToINTI:
$ {+ Q$ G, `/ e' y3 D8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
, N8 q7 P6 @3 ]& u! |) C2 s7 W8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff: R! W& A. m$ \8 X2 G$ S
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ U- x% Q- q* T, M
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff: }- t h( q7 c$ t/ {8 C
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) l6 p. L7 f) S: {3 u C
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff0 x2 U* T$ Q4 d, @
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
' w. O: t+ P" e2 n8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff$ |) a& j5 o. _* k" }
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff. O/ K7 z+ m! O3 [" \
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
, ~, B# ^" Z0 a0 {) ]+ C0 s, }8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff; y5 C8 l: j, @# R6 x& y r8 C
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
& C: v5 c' d D. Y4 B" ?' d8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff0 K! K; Z. k9 z" x) O; g+ i
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff8 D( D* O5 @& W8 n3 h$ y3 p( P
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff3 N3 t g; q8 |: e! g. \$ u
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
" J; M8 x; ^$ s5 m# w: _
& l& v9 G* a% U5 g- M1 F' q
% }, t0 y% h8 K8 U+ fvBucket:
( l) u5 ]/ P7 E7 Y; F8006ae30 02 02 02 03 03 03 03' \2 S0 ~4 b" t6 T5 y
* Y# ~2 L+ {7 h! g4 Q( f- S. l$ J3 y
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
+ ?$ i7 k4 }. `
4 P" s: P2 _; V vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。) M+ v/ B3 A# L
8 U K3 d, q% S8 | IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。+ `1 e1 n) i& X
1 H& Y. ^' ~& Z, n 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|