|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
8 [# {+ y1 h: c/ f8 \4 d
# H. x; Y T% \2 \) \从IRQ到IRQL(APIC版)0 g3 `8 x6 n! O/ r- I. w
9 ]2 D Z' x% K! @ ^, S( O2 {
作者:SoBeIt' i* d2 Y6 c2 x, W: z7 I7 ?
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
- Z, }- S% Y9 } M4 p2 y日期:2005-02-04
7 {4 O' ?+ y3 R( K9 d* }4 n" A* Z1 O
8 T+ Y& N' B# ~1 c/ m, y% ^1 p1 g事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
3 Q6 x. G3 [: h- u. E: o7 N6 Y: c8 _
8 U. s: _: ]# P0 N- k1 g 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
! V6 h8 L: ~) G; \( J, X$ }+ q9 f1 B" t
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。 M3 p1 P' T( d* A
( M: J4 ?" q, ]# W: A 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:/ d2 S4 f, ~9 w4 p: b& q0 l) e
# ?6 b' L1 o: b' n$ O#define ZERO_VECTOR 0x00 // IRQL 00 " G! G8 F/ m9 k+ x
#define APC_VECTOR 0x3D // IRQL 01- e: t& V0 N7 m
#define DPC_VECTOR 0x41 // IRQL 02
" m6 H- s3 D3 V |6 c( D) O#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
' N, a) J5 h2 B" S#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28& L' I2 X |9 Q! w$ V6 G, z
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 286 W2 X) t9 y: X+ q
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
( n2 P5 L3 s F, t#define POWERFAIL_VECTOR 0xEF // IRQL 30% |! B9 P8 ]! E, }9 |& y+ H
#define APIC_PROFILE_VECTOR 0xFD // IRQL 314 I. V) H* j& f' v$ Y* S
& @9 O5 m- h8 O' i7 |! W
$ |2 I4 ~6 \' A4 t3 Z- I; p4 v$ h现在看一下一些重要的数据:% T* W+ {1 G. `; K0 M$ s' x# U
0 \3 d5 y' q( e/ x1 J$ j. @- H Z
这是我写的代码输出的IO APIC重定向表内容:
2 w/ r( V0 ]: ^8 W$ B
6 @( O* u4 c( U0 h$ hRedirect Table Index: 0x178 ]+ Q! }6 E' Y# g8 E# Y. J
Redirect Table[ 0]: ff
, v5 M( ]; F: n& SRedirect Table[ 1]: b3
9 c0 h+ J2 B8 L: G% X5 MRedirect Table[ 2]: ff7 t6 n4 Z; E& C a% J+ f
Redirect Table[ 3]: 510 f V" C- ~, P" O; I4 u& a$ ]& x
Redirect Table[ 4]: ff
+ ]/ p- T9 M' URedirect Table[ 5]: ff
4 U) W& E+ l$ L; U9 ERedirect Table[ 6]: 62
6 o9 n5 t& V. ~. V& G8 v' bRedirect Table[ 7]: ff u8 g+ m( `5 f/ z& n
Redirect Table[ 8]: d1
5 B) x) X3 G7 p0 tRedirect Table[ 9]: b10 V, U$ \- K* j6 H7 X8 r1 B5 H* K
Redirect Table[ a]: ff! _3 u9 U6 ~) t; e# c8 |% i" O+ [) j; g
Redirect Table[ b]: ff: j1 `- [. v8 l
Redirect Table[ c]: 52
5 U, D2 D9 J( [9 U0 z- d4 k3 jRedirect Table[ d]: ff) b7 g; |1 J6 m9 ]% b+ G
Redirect Table[ e]: ff9 ?8 K- ?7 K8 u! d: O; V* t8 x/ ?
Redirect Table[ f]: 92
& t# Q' n' V% b7 mRedirect Table[10]: ff
4 R3 q! k6 [7 t2 G& V: PRedirect Table[11]: a3* H: s6 a1 K8 l0 ]# Q/ V
Redirect Table[12]: 833 C4 V) A8 F. `6 x
Redirect Table[13]: 93
K H" Y( s& z) w/ L3 ORedirect Table[14]: ff
7 t- n5 P# E, O- pRedirect Table[15]: ff
/ ] ?" z( x) r: O( ERedirect Table[16]: ff
/ g3 X$ q$ E3 `2 x5 MRedirect Table[17]: ff6 \! u, I- R: A6 T; Q0 s) h2 ]
' q2 ^: H; Y k& ?, r" P
这是IDT表中被注册的向量:% D& b( Z* [% e# c* y: D# D; N' E2 v
: B% e; r7 X6 I6 y: z1 m3 Z1f: 80064908 (hal!HalpApicSpuriousService)/ ~# K& W6 x1 s. [6 C6 B4 M
37: 800640b8 (hal!PicSpuriousService37)
& Q8 b4 i' Q: n$ C7 _0 D' q3d: 80065254 (hal!HalpApcInterrupt)
* r' |" v4 Z6 \41: 800650c8 (hal!HalpDispatchInterrupt)! {: }! ^7 u$ }
50: 80064190 (hal!HalpApicRebootService)! U* H: b6 C, R5 [/ ?/ v0 V2 v
51: 817f59e45 U7 }5 B5 w0 c* g' p/ ~* q* i
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))2 Z! A! S( Q; u+ \9 B4 D7 Z, f7 I+ y
52: 817f5044 / S2 j4 C2 s" U U) o! [2 B
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))$ e/ r4 J; c, [; N7 W/ F/ z% _4 ^2 [
83: 817d2d44 & l: X, F M9 h
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))% h: L/ W0 M1 q+ _+ R, n! U' I5 i! Z
92: 81821384 . e8 A+ g/ ^/ [( r, `, g
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))% I- @, ?9 w/ j ]7 c
93: 8185ed64 9 n2 k7 c4 M8 D' r
(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
" ^' C3 W5 J% _' C4 I) r; _a3: 8186cdc4
, r' ?. \! C- M) g9 X/ Y' J(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0)); S# `; F2 q- Z6 v& L; J
b1: 818902e4
# P4 S" j3 f% f/ b( I(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))1 ^& t6 Z$ h9 U6 w4 J
b3: 81881664
* \3 w% J) O& K& G& K9 g, z( U(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))3 N4 [. k+ _' m
c1: 800642fc (hal!HalpBroadcastCallService)
1 y- J8 F! [+ z. nd1: 80063964 (hal!HalpClockInterrupt)5 ~& _: w. P1 v& v, ~* u N
e1: 80064858 (hal!HalpIpiHandler)
9 V1 }4 d2 r% V9 b; Z% Y# ~: je3: 800645d4 (hal!HalpLocalApicErrorService)
. O# f; u) \7 lfd: 80064d64 (hal!HalpProfileInterrupt)
2 l) e. k% ]0 O4 y3 d, `& ]1 e0 rfe: 80064eec (hal!HalpPerfInterrupt)
$ @; m K/ g. `2 l
5 ^! B3 Y1 c9 f5 y( I9 C& [; X- o象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
( ~; `/ h- a0 ]- h- ^& v
- i' l5 s7 r/ s( ]% v4 c这是几个重要的数组:! i: Q: _' B8 k2 I) p+ l4 y
# J, {4 Y6 s) ?* I _
HalVectorToIrql(这个数组是以向量除于16做索引):
7 g1 N2 d4 C/ {5 L8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
9 y% f* ~2 h) r: l) X
K: ]. h2 C2 k) h6 oHalpIRQLtoTPR:
( w7 t6 k: {9 h4 x" H% _8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1& x$ b' E! n7 D$ a5 \
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
, `6 N9 b; d2 a1 m6 C1 X/ z* d. U2 }1 M, D5 l. i
HalpINTItoVector:' ~% d0 ]3 Y0 S7 B7 i+ O
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92" A& I' k( z4 V: C
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
3 M/ J( z) h2 `9 s; \( c/ ?) t1 L" d& H1 C. v
HalVectorToINTI:
9 X y& m7 t2 }$ k0 I5 m8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
" b5 B7 f0 M. p0 o! I8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff/ K7 T+ B8 B& n5 J7 r3 U! C
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff+ h/ P7 x2 v/ V# w' V4 H
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
9 i" ]- x8 Q7 M. i2 |8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff; n2 F7 b7 r9 Y0 X. ~2 z
8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 n& S! W+ |& j8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff( U& J% N5 F& ~( D w2 q
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff( K% H7 y# [/ R/ t* l
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
3 ]/ c: s/ P" }$ L8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff% P0 D5 ?; ~8 w2 i
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff t8 S) V/ i# a& l8 I
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
& o3 ]. f8 R+ E4 ~4 u8 F# [8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
5 v" L2 Q1 m: b/ t8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
+ O9 s% U3 f$ v/ \3 ]8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff$ U* k! L7 i$ W/ a4 \
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
4 K. K) }" s3 N6 Y$ Z5 U! q) v: Q3 l8 K/ z1 S- `& ?- G7 A
7 A/ W9 t1 D2 {% a. z& J; H
vBucket:, r' ]% t% M8 m2 G5 U( s
8006ae30 02 02 02 03 03 03 039 i5 J6 x# E" P
. m" p$ M- k- L8 s7 S* m/ u8 f 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。: E( } @ h# x+ U B( x; ]
% B R5 ]! `" A3 T vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
; n* T+ \; w& d2 J" l
1 C% y! F0 V$ U$ ~9 q( k* ?- ^ IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
' r! y" F5 r7 w# O
9 e6 p; a# N5 r6 X m) |$ T 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|