|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
8 G& I# E5 L; x
7 e3 T' k7 i i ~% A. E从IRQ到IRQL(APIC版)
: W( m: b. Q) e0 p( a0 V8 S( q* X
& {+ {" z1 ]! Q, r8 U8 {7 S作者:SoBeIt% o7 g" b1 F4 Z* s
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=455022 }5 @' w' k: N% p( S: x1 Z$ w* u4 d
日期:2005-02-04
* M& \! m% t+ a( [+ x& E X& x& b. T4 c8 ^
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
/ h. Z X) e8 ]1 `) e( S! }7 ^* y7 X0 I7 H z
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。! O. n5 t2 `+ e8 d! I% z$ O
! L0 D5 o6 x# |# X: [ 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
P; |2 _* l$ C/ s1 w! U4 l" P, Q( G
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:% I5 n/ q& T- [
4 s" \7 N$ g; c1 L& n+ ~0 R
#define ZERO_VECTOR 0x00 // IRQL 00 ; V2 C% U" l9 A) H( y
#define APC_VECTOR 0x3D // IRQL 01# E9 b( M: ]; y7 m; q# W5 h3 C
#define DPC_VECTOR 0x41 // IRQL 02
( M: ?( v( U3 G/ ]#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27& w: v6 C5 q0 k1 Y; ~' e# ?7 f/ d V4 V) m
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
7 q$ b0 N8 x* s#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28
: d7 B# H8 }6 I6 u$ E#define APIC_IPI_VECTOR 0xE1 // IRQL 29. s' Y. h( G( j, W. }. Q$ X
#define POWERFAIL_VECTOR 0xEF // IRQL 30! {9 \2 Q, H' O7 {5 ~
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
5 B# z0 y! f+ H* C" {4 p1 k. P. v: F3 Q9 a/ a* B
' Z7 T/ T5 K2 O, |# Y5 D6 O现在看一下一些重要的数据:: ^' I% w& B& O4 H+ _! ~5 S
) i( M) k4 i% V
这是我写的代码输出的IO APIC重定向表内容:
# g: `2 c7 f* I0 v: R- e1 Z3 r
. q d$ k$ X% M+ I; r+ L2 Q8 o5 @Redirect Table Index: 0x17
! B0 X5 d: q% \7 S0 ZRedirect Table[ 0]: ff3 j, `$ z6 J, L. ]: x: ?% P
Redirect Table[ 1]: b3' q1 Z; ?2 K. N3 K
Redirect Table[ 2]: ff0 B0 a1 @4 l/ [1 m R
Redirect Table[ 3]: 51
$ e0 B+ w; x. x- O1 |3 T# ?' C( @Redirect Table[ 4]: ff
# g) |. o3 G+ @* uRedirect Table[ 5]: ff
% Y, W* B9 u8 @( \& n @3 K" ^Redirect Table[ 6]: 62
, j2 U+ H, g& j) YRedirect Table[ 7]: ff
/ _8 A& k" p N9 w+ CRedirect Table[ 8]: d1
; }6 C$ y- b( U7 P5 P9 N. ERedirect Table[ 9]: b10 M0 ?4 W! C4 i5 k2 m
Redirect Table[ a]: ff
; x# M( y+ e* m3 U$ d# J; TRedirect Table[ b]: ff
1 p8 W( U( D' I, u6 @5 f1 _; g3 gRedirect Table[ c]: 52
% m7 D( C2 W7 ?. ORedirect Table[ d]: ff" m4 `" h& r4 C! ^4 J' X
Redirect Table[ e]: ff/ k/ ?' |6 f. O/ v
Redirect Table[ f]: 927 o' h \0 U6 U1 e$ ~6 ?
Redirect Table[10]: ff6 P& F$ q8 c& K, E U4 B# Z ]
Redirect Table[11]: a30 l; [$ |( o& D4 z- P$ ~
Redirect Table[12]: 83+ I/ H6 i$ n' e' q
Redirect Table[13]: 93
2 v* w7 ^% S# Z8 C3 fRedirect Table[14]: ff
1 G/ R; o' [$ ERedirect Table[15]: ff
& d2 B4 K X: H1 }7 URedirect Table[16]: ff
T! z( o1 J2 rRedirect Table[17]: ff% D8 N4 }% o2 e( F! ~1 P& z& l
8 Z: s( z* Y4 T2 L
这是IDT表中被注册的向量:
% y- V/ B+ F0 ]5 z6 K5 w4 Q, E6 `% O* N
: R& o6 ]; d4 [; q1f: 80064908 (hal!HalpApicSpuriousService)
( o3 n/ n) W' J( l G6 J( s37: 800640b8 (hal!PicSpuriousService37)1 e! R% I* Y0 P& j9 p
3d: 80065254 (hal!HalpApcInterrupt); G+ f3 \ C+ E* R& b7 C
41: 800650c8 (hal!HalpDispatchInterrupt)
* m a. S# e( v1 H; l2 G50: 80064190 (hal!HalpApicRebootService)4 @+ |# R5 @; J# J) |+ o9 P! d
51: 817f59e4% X! r9 ?1 G+ o1 |
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7)); p) g/ |+ j7 m5 l
52: 817f5044
- [: m1 T$ ^' u+ t# g# @! [( b& ?(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))7 `8 i. N m( u
83: 817d2d44
) O$ s- V$ ^6 c+ V(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
, g! d a2 C8 Z5 H92: 81821384
. \% {- S6 a o+ u" l" K(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
; j% R, x' n/ |, ?' F93: 8185ed64
& V8 s6 Y6 m- o4 U2 g8 Y5 V(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e)); Z5 K: q& N% F" y) c9 |) t" C
a3: 8186cdc4
( x, A: A1 z* M(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
/ O. Y3 p. C" h! F. r2 ]. z* Lb1: 818902e4 2 j' b! ]% J ?8 L
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
- ]8 x) M9 n) wb3: 81881664 3 h- K) b+ F8 ]
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))3 ]& p. d/ f. C+ E+ ~/ S% f1 m
c1: 800642fc (hal!HalpBroadcastCallService)
4 V+ t; S3 r4 b1 D. T3 Nd1: 80063964 (hal!HalpClockInterrupt)9 u/ m; I+ W$ M% @2 G' T
e1: 80064858 (hal!HalpIpiHandler)
) B2 t. ?! [& n: L8 n6 te3: 800645d4 (hal!HalpLocalApicErrorService)
: \3 n" f6 {/ f) K- Z* B+ Bfd: 80064d64 (hal!HalpProfileInterrupt) g* w( [3 {; ?! Y- ]* G+ G$ K6 j
fe: 80064eec (hal!HalpPerfInterrupt)
; C$ E7 X7 J2 g# u/ V' k# p/ E0 d! M: Y" `4 e
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量) Z7 d n# O$ q& h7 X% u5 y
]) k! e6 }! U2 ~% a2 v
这是几个重要的数组:
7 E" v0 d4 N7 F( R; Z1 v- W5 ~) t, N2 e& ^ P& }# F
HalVectorToIrql(这个数组是以向量除于16做索引):/ M: f6 M, v) w0 N
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e( g& U2 z. c. r, g2 m
/ U' [* D, C' n7 M: o" f
HalpIRQLtoTPR:5 i: B4 r1 C" G; S' C; g
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b16 w! w9 h: z* n7 y4 s
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
; I; t0 n8 \3 S: e
+ l2 ]; R* P: h; x$ W4 C3 p# sHalpINTItoVector:1 S: M- z5 n! d l \3 N
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92$ b2 r$ q0 u/ W
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
2 N3 a7 a3 J$ X8 c% V; ^. f# d8 n7 y" M' u6 Q B
HalVectorToINTI:
9 ~& q4 u( ~1 f% n$ @( J8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff5 i. h2 U( M' f; x) D
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- y" }8 G O% ?4 F7 n9 A8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
& Y9 o9 F& c6 e% z+ N8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
; Y |8 Q& G' ^" V8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff- D& }9 g$ a1 b& f/ f- D
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff; ~5 g5 o. j# w; r3 l% g, T; v
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff# r% x E# |1 `" p
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 o8 i' Z/ y" `3 M8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff( L) y* e- e* ~- s7 j
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff& d1 N' D! [: ^5 R, w k$ I4 F
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff# H/ D3 |! L1 X& G; u) X4 m% z. G
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
$ J' \. w% T7 x4 m3 h1 x) r8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff2 n- u" ?/ `% T* M
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff( y4 P9 h, M3 g% O7 f+ \
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
6 [' ]0 y/ r2 s- T' n8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
6 q \: H/ l5 s
7 h7 R1 h: {' L, C8 ~! E9 e9 d! @4 ^' f$ b7 E% b: f! `+ b
vBucket:
' G0 Y: {$ p: F4 p8006ae30 02 02 02 03 03 03 03
7 }$ m, H( W( B# `
$ V7 }$ a, T" O1 ] 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。5 l, ~$ N& ~$ X/ ]7 u6 ^9 G u
2 H+ ]/ j i! Y) S" D
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
6 y4 o# F' e5 Y/ ^5 a9 Z2 A, Y8 d, E- R4 D
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。5 [/ Y+ n/ g7 q% q5 z: p8 Y
) P8 I8 l: {- e7 z
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|