|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
$ c) N% G4 {% u9 ?0 Q* H) [
7 N& p" J. C# s- X" n! D. K从IRQ到IRQL(APIC版)
, A: h/ H! p: Z4 z8 u7 s. Y' A$ Q7 B( h/ o
作者:SoBeIt
6 ?. Z, l9 s* o A; l出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
" [/ ]7 A1 A6 X0 B8 B日期:2005-02-046 J. I& A1 `/ k6 x$ M* R3 k
5 r- Y3 K: n8 h. m( x1 w事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。. e( ~- B; U# a+ e
" ]6 U8 P- A' `" U' r w 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。
- h8 t+ N* H# _1 A5 P J2 J8 S- F5 P$ f. F0 J& E; j5 b
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。4 M$ V; |/ e2 C( h; @
+ {- [% Z. s9 u5 i {
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:. b6 J2 m/ d0 `
: }7 m1 Q! l( a0 C3 c
#define ZERO_VECTOR 0x00 // IRQL 00 7 G+ k. p; u" ~3 u
#define APC_VECTOR 0x3D // IRQL 018 G! s. E* Y L1 _$ V
#define DPC_VECTOR 0x41 // IRQL 02
$ z) X% [4 \: q, w' T& g( C" O#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27% t$ A; U: j$ r4 b# k
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
- }' \ S R* N$ p! N#define APIC_SYNCH_VECTOR 0xD1 // IRQL 28& N/ G, O5 ]& |/ ?5 Y' D
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
5 M: k* g1 }( w$ d8 v" q1 }4 X#define POWERFAIL_VECTOR 0xEF // IRQL 30+ ?& L/ Z7 t; V4 ~$ m8 Y
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31/ P& g" i) s2 E
& X) M( e6 o: ]. u ^/ I
9 k- S4 ?. }$ ]% X* p5 Q现在看一下一些重要的数据:
) g" T" h1 L: Q. m
! U% R5 U* o0 Q5 X# f这是我写的代码输出的IO APIC重定向表内容:, q+ ~3 E$ S5 X1 G
& w: m0 @9 b3 d; URedirect Table Index: 0x17$ B Z. T! ]8 M3 k9 K" n
Redirect Table[ 0]: ff
: a% G/ G6 x" D1 j0 b7 a# Q3 ^Redirect Table[ 1]: b3& y! ?9 L/ e# j
Redirect Table[ 2]: ff
7 {: P. J. P; Q& y# p# CRedirect Table[ 3]: 51
% b6 w9 Z: D7 z/ {6 \3 c% S. [& cRedirect Table[ 4]: ff
; i, }9 D5 ]- [* `Redirect Table[ 5]: ff# W1 K& I1 q' U0 }% `; U, [# V' I
Redirect Table[ 6]: 62
7 _9 [9 ~- {7 T' Q2 BRedirect Table[ 7]: ff9 [% b9 v- J8 P* S: k$ Y
Redirect Table[ 8]: d1
4 K0 N$ A, e, qRedirect Table[ 9]: b1
5 w4 g* p% }6 |8 i8 p7 `( `Redirect Table[ a]: ff
# i4 `" O6 ]$ Q# [' L. N FRedirect Table[ b]: ff
: m; t$ J8 H D- u( o2 S# dRedirect Table[ c]: 52
' k2 u2 P+ e8 u1 ?2 R5 W( LRedirect Table[ d]: ff
# l/ i- `- L2 Q3 V4 XRedirect Table[ e]: ff7 z2 P- S' g) }9 t0 b
Redirect Table[ f]: 92
% Z# b; T: Y# `1 T* I6 b' }Redirect Table[10]: ff3 L7 U4 U$ |: U" `( a
Redirect Table[11]: a31 K5 }8 j( n/ p! V- n
Redirect Table[12]: 83
0 N) H0 M4 s! MRedirect Table[13]: 931 ]2 q8 M% N) {$ _$ u' X( ^
Redirect Table[14]: ff- V" v! W4 F. H+ Y$ a+ x- u! K
Redirect Table[15]: ff# ~8 ?6 _/ ^: |& ]( \
Redirect Table[16]: ff+ h8 n5 E9 S# U+ N# `3 s6 \
Redirect Table[17]: ff
' o7 ?7 \/ ?9 n" w
; F1 C8 R: W8 ~7 K4 J2 H: k/ _6 h这是IDT表中被注册的向量:* c M% u* v" [2 K) t
2 ^0 ?" P; ^0 P+ ~3 d( i. ~: X1f: 80064908 (hal!HalpApicSpuriousService)
* [3 X$ Y6 D9 I3 D/ C% f* L+ n37: 800640b8 (hal!PicSpuriousService37)
! A7 o2 G3 w5 q' ~3d: 80065254 (hal!HalpApcInterrupt)0 ~( j! P6 j3 n4 ?# ~ a3 i+ c
41: 800650c8 (hal!HalpDispatchInterrupt)
" y1 i" `" \& e3 N' e$ H50: 80064190 (hal!HalpApicRebootService)' i2 h+ ?0 o% a7 k
51: 817f59e4
1 u& b! M, Z( a- v1 w& e( N(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))$ D! D' J7 F, p
52: 817f5044 + s, ?9 N0 V, ]. n) ?/ U0 |
(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))$ H ~. ?, ?. z
83: 817d2d44 1 S+ j& ^7 u( Y* F9 \3 p2 E2 h
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
}4 ^$ C- ^5 |1 p6 m: L92: 81821384
! |0 ~/ G" V8 `# M7 @(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
2 v8 l5 x* Q s. w2 U( U9 X93: 8185ed64
0 U7 ?5 Q8 V: K4 h" i0 Y(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
7 y+ G/ O8 e4 b' y9 Xa3: 8186cdc4 ' f! Y- C; s4 w3 |# y4 c
(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
% O/ Q' S& v/ M K4 z( l# X; Hb1: 818902e4 " {' ?+ s1 d$ n0 I! [; N( x9 b( q
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))0 i+ V* s( Y% @* c6 M
b3: 81881664
' |; C! W( s2 @# B% Y# ^(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))7 A' q, ~; P+ e) V
c1: 800642fc (hal!HalpBroadcastCallService)
" i) T( f! f+ o4 j0 Vd1: 80063964 (hal!HalpClockInterrupt)5 M3 T4 S( T1 @) @% [
e1: 80064858 (hal!HalpIpiHandler)
1 h# e6 N' _% P5 x, j5 @" P0 Ke3: 800645d4 (hal!HalpLocalApicErrorService)
: v* Z0 G9 p, d4 ]+ ^3 Wfd: 80064d64 (hal!HalpProfileInterrupt)
- _1 u# p1 @0 ` s v! \3 K9 Rfe: 80064eec (hal!HalpPerfInterrupt)* l1 i& f$ u4 }/ q
+ C6 e. o+ z2 A# R) m9 R- V象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
5 B& n; q r3 O: v1 y5 X8 k" E+ h; Q) f5 L3 R
这是几个重要的数组:- t5 n$ \. O" Q l( E0 Q6 J# o+ j
2 m+ q& g2 C; Q
HalVectorToIrql(这个数组是以向量除于16做索引):
! K6 z2 ?" r2 v) ^; N" k8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
; @+ {# v- C$ Q3 R4 ^3 a1 T- B) m. [; t2 B* c8 x4 {6 s
HalpIRQLtoTPR:
9 d. D' e, @4 K8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1
% z; T7 I4 @( A$ G7 R* X8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff, g0 ~/ M4 f: n+ v0 x0 W
8 N' ^5 o g$ D: _4 h; F! NHalpINTItoVector:7 Q8 q: [) o5 C" w% T: Q* E
8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
9 ?, o- H* I9 C1 G; Z7 N( R3 J8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 007 ]. @% F% t: U2 r( H# f
& n/ _0 m' j/ B9 _" nHalVectorToINTI:
/ J0 p% Y0 E1 s2 ^, r8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff% o% j/ d2 E0 p6 L
8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: x1 I6 X: z& i1 R! ~8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
' v8 D; O6 _- }% r+ S8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( P! l: j$ `8 O8 z* [8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
4 r3 p! ~+ U7 j% |8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
$ I, f/ R9 L% l+ R8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff4 z1 M# Z3 z( f! u1 i% i; T' A
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff/ G+ k7 Q: p0 ?: d, F5 D! G3 p: I1 I
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff5 p a1 q. L1 N; Q' w- a3 M
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
9 k3 D# P; W6 y, G0 z2 K" \8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff
9 n7 T2 I# j) t/ h& h8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
4 Q0 u, o3 ], r, e b: g# s8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff& M0 K( z* ]0 E" H. y3 _
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! L: Q3 V6 @4 D' W ~* w5 I4 x8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
7 O' M2 R0 k6 a3 C6 V8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 7 ^: }, N) N6 m! u8 G
+ t/ f/ D6 L- L3 z) L$ B
) d/ `/ L( p. {/ o0 x, A/ V
vBucket:
, K8 L2 i% i% J8 k8006ae30 02 02 02 03 03 03 03' k( i9 q" _. x% ?3 }+ x& \. @4 N
R7 m& b# |& e" R* U/ V
举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
2 V0 ~/ w W @6 ~7 I/ {' @/ A V
, o: c, J# b4 Q vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
6 v1 O# l0 S+ i5 z6 ~# \( F& x, N: e, _, V- V ]7 j: Q( y8 Z D) i
IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。% z! D2 H4 n: ~
F$ j: P' [4 F \( a
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|