|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
4 [9 ^3 a9 L, E: P& Y d8 H$ O, S) a# p
从IRQ到IRQL(APIC版)* d4 ]( l; D4 L5 s* z
/ x1 E8 d: K; c4 |) e
作者:SoBeIt
2 C; p! S- `$ L- O8 z& u出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
! H/ U6 M6 w% b( L日期:2005-02-04 j9 Z, Y- z1 f+ s9 ~+ ]7 ?3 _8 ~
0 [5 H s& y H3 F+ b5 f
事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。* ]/ _3 N# b& D
# C! P/ z. m; o: G* F B4 P
现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
, C- g, E7 K! J* s- W. x
4 U0 R" _, j, Q, ~9 ^ 和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
8 M7 n: n5 J h" \
/ N* v$ T | [# A' c 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:" @; v7 }/ i! f
+ i% c- J, Z6 [' O$ M7 v7 T2 R$ ~#define ZERO_VECTOR 0x00 // IRQL 00 2 L0 Q2 E# M; i, H
#define APC_VECTOR 0x3D // IRQL 01
* G& i+ W% `0 Q8 _- H5 |; L#define DPC_VECTOR 0x41 // IRQL 02; J1 e% E! S: W- m) \8 o/ d, J3 i
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27' T$ u3 `7 Y3 n: J) |
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 280 e4 b. l1 i2 C
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28! C, [# l$ p7 ~1 V) j/ b6 Y
#define APIC_IPI_VECTOR 0xE1 // IRQL 29) s1 ~0 ^ m' g) I) B X* L8 o
#define POWERFAIL_VECTOR 0xEF // IRQL 30
$ ~* \& M) \* n#define APIC_PROFILE_VECTOR 0xFD // IRQL 31# J+ j% Y; D3 M3 Q
1 b& [2 S) P4 n2 L F Z
3 ?; d3 v! E1 N) v9 ~现在看一下一些重要的数据:
+ O: P" x0 n. v* s: V" y' C
! F7 ?( J9 x1 n3 s) a( ]这是我写的代码输出的IO APIC重定向表内容:
- [$ y3 l# b7 D/ }& f1 J) L, X* X% A: P7 ?3 ^5 |" @
Redirect Table Index: 0x171 `6 z! I8 h3 N. g4 [2 f" D
Redirect Table[ 0]: ff# R0 a7 g2 z6 a
Redirect Table[ 1]: b3" b( A7 P6 x& Z. K: D
Redirect Table[ 2]: ff
" i+ d/ r( |6 H- m; i# I5 R# hRedirect Table[ 3]: 51
P( N3 j1 ~0 N; LRedirect Table[ 4]: ff0 d1 J+ t! b& x$ d+ f& E
Redirect Table[ 5]: ff7 `9 `) P) N% q9 |
Redirect Table[ 6]: 62* j: G* M% L9 J. J/ c
Redirect Table[ 7]: ff+ b) E5 b7 D7 |5 h
Redirect Table[ 8]: d15 k/ c9 a6 ~0 _" Z
Redirect Table[ 9]: b17 L+ w1 d: Z$ m8 ~2 @, V$ |. `
Redirect Table[ a]: ff- K3 i; m7 G' F8 F- Z5 C
Redirect Table[ b]: ff& o3 D/ \+ {& {7 T+ O1 ~. X; e
Redirect Table[ c]: 52, a9 r: J4 x8 @* S2 x( T. `
Redirect Table[ d]: ff- O% x6 _4 v& K& ^- I6 s" i3 a) p- ]
Redirect Table[ e]: ff6 F# I3 b/ \6 r( }9 u9 j+ P
Redirect Table[ f]: 920 W8 p9 S9 Z: s8 S; ~
Redirect Table[10]: ff
% v, X6 p, g) Z+ p: lRedirect Table[11]: a3
7 t# j! W. G3 a7 ` CRedirect Table[12]: 83( F9 E3 e" v2 k5 A& k# N
Redirect Table[13]: 93
t) r5 L3 r, qRedirect Table[14]: ff
2 k, n# k3 N6 a0 ?. B: HRedirect Table[15]: ff
3 j! X- T% L) v# j! i4 R4 NRedirect Table[16]: ff5 n5 v! {: Q/ m. i4 z
Redirect Table[17]: ff$ |( I, U( ~& v- i2 g8 q4 z
' ], q0 Y: q ?% l8 F& h) K
这是IDT表中被注册的向量:
) K6 S9 V1 _6 W! i9 F" H% Z" R
: s4 q" s% [# @& W! p4 C# T9 Q1f: 80064908 (hal!HalpApicSpuriousService)+ c @0 y; }; ^+ S- B
37: 800640b8 (hal!PicSpuriousService37)
. O: e h1 b+ t+ B6 `$ }; A, p5 @3d: 80065254 (hal!HalpApcInterrupt)2 `$ ~" H F& v0 r* H( F' t" ^
41: 800650c8 (hal!HalpDispatchInterrupt)) H8 V1 Z2 g. y0 n( [9 C
50: 80064190 (hal!HalpApicRebootService)' g2 H9 H* ~* E
51: 817f59e4% P' b* a) i, u% X, O7 C
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
, v2 V/ u% p2 f! h+ E8 g7 t52: 817f5044
, K, H# x' \8 W(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))
* W( P2 }; K: z+ ~: O* r1 M83: 817d2d44
' A5 i* c+ _- f, P, v(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
' _$ S4 t2 ]( W& L. q92: 81821384
5 i( x) s7 F' ^+ |- O(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))' I& a1 s% }; I2 V O/ T- Y- K
93: 8185ed64
% s0 w4 Z2 h& Q% Z' b(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))* d9 W; p, s J" \
a3: 8186cdc4 - o& c9 O( X+ L. i# i# \
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))1 b( N9 l8 _4 l
b1: 818902e4
+ |- C6 k0 S6 v" d8 K0 k2 `(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
% A; P5 \' F0 Cb3: 81881664
( J# N# W" |2 J6 v$ p x% j& J(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))3 B) _& G+ `8 ]' A' C
c1: 800642fc (hal!HalpBroadcastCallService)) A; v6 B# r& Q% E* A6 U6 @
d1: 80063964 (hal!HalpClockInterrupt)( p+ J$ S. f6 o. K$ o
e1: 80064858 (hal!HalpIpiHandler)
! z5 g) X" r) s8 ?( I: ue3: 800645d4 (hal!HalpLocalApicErrorService)
2 U+ Z* T$ D& w% S. [3 W \* E8 lfd: 80064d64 (hal!HalpProfileInterrupt)
. w3 L; p: A; m# D+ yfe: 80064eec (hal!HalpPerfInterrupt)
; h0 ?2 F4 _1 B* a# ^: ^! I2 W" U) ]* ?8 e8 u9 N
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
; c! L2 j3 x n6 _7 d* Z1 j
6 M; F s- t+ G" K2 ]这是几个重要的数组:$ Z! Q& Q" ?. N0 d
( i$ h& k+ O) G, xHalVectorToIrql(这个数组是以向量除于16做索引):
/ H( D) s+ c( j, D" f) j9 K, D" s8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e' a7 }' N' G8 o" i/ b
6 J5 u( J) S9 D6 Y) E" g6 hHalpIRQLtoTPR:+ C# w1 Z4 L. U c3 w* N# l- x
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
) [" H2 s e m* F8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
: H& h: i" Z) A/ |- Z3 m- E# m" s
- T3 K; t. B* Y* M$ zHalpINTItoVector:, ^, a+ v D- s5 I
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92# Q# Q6 o& `9 X( {
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00& ^2 V, ~: c/ x
2 ^% _& t5 O% _8 |) `" }: N1 yHalVectorToINTI:
" O) o5 q9 l' t% V9 R8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
# ~" G& g; k6 I) e+ E8 J/ G: B8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. F; u) \4 o% i0 _( ^
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' |# W- F' h7 L8 k/ W
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
# a1 B2 Z' C8 h! {8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
. }' f8 J: S3 l! \3 `8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff1 A' ]5 L0 e# i; S
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff
o9 L- i1 e/ C1 C7 A8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff) g) m* c2 S1 e7 ?& d
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff3 ~# L+ ~1 ]5 B
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff2 w! ?1 v4 Y$ D) Y+ H5 O4 \: g
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
/ z& ]3 I- j2 Q3 u% p/ t8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
5 F; v. R6 u1 A2 f8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
- F+ T7 |" p$ U# d8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
/ |4 s7 b4 y- h9 x3 A: v! R8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 m4 T7 f5 B4 Q8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff
& K1 L. G# B' x W
K$ `% V+ d. N2 P+ V y+ D2 }" A$ U. s" v4 P$ {
vBucket:
7 x& s8 V+ O$ \( w. X% F6 ^( f8006ae30 02 02 02 03 03 03 031 n6 h$ X4 U% x
5 A: |' p( ^! p
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
' k6 c3 u7 G7 Q, J+ F
2 ]9 d4 B' J0 a3 K( U5 S { vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。5 r7 O* k# M9 ~6 R' p4 ]
0 Q1 [; O% Z6 \3 y& k4 Q+ P b IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。2 S! Z9 O5 ^- x7 [
0 z0 C0 {, A8 {/ ]* a' F) H5 I
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|