|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534
: ?( l0 J: v2 Q: f/ Y" Y2 R, c5 `2 Y/ S" \# n8 H8 E9 M$ U- v
从IRQ到IRQL(APIC版)0 }$ }* u6 l0 N, _' g) F( R
+ J6 e. k4 m; @作者:SoBeIt2 F% v( e$ |: \% ?
出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
& r0 D' S, J* Z L: N: s& O日期:2005-02-04 K! w( B: {4 B( Y8 M3 C7 H. A0 g
5 ?, `( m5 I* i7 a事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
) h7 D. r- g7 v9 Y8 @
8 J; E7 ?, H9 z) e+ e 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。* T& _: u) S% n, y
6 |4 X* \% w6 t$ ?4 P* B+ n" J
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
, M- D" }. }' [7 i- ~) K* J. {! l4 {( |& m; m
在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:9 k. t1 b0 ~6 S7 U' `# l$ O% S
) _) n( I- ?! I0 {4 ~) V" F. f, m0 l
#define ZERO_VECTOR 0x00 // IRQL 00 / i& E2 B- m- j9 M
#define APC_VECTOR 0x3D // IRQL 01& g% Z8 I! C; f$ r# N( G, p
#define DPC_VECTOR 0x41 // IRQL 02
$ s$ z% T, V, {) Y' h#define APIC_GENERIC_VECTOR 0xC1 // IRQL 276 Y1 n; k% W K- u: f, b0 Q; ^
#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28; W3 O5 _' [& W3 o" @. K R
#define APIC_SYNCH_VECTOR 0xD1 // IRQL 287 C/ S8 R1 q- |8 a6 g; b. m$ |
#define APIC_IPI_VECTOR 0xE1 // IRQL 29
) H' P# {5 x9 I& @#define POWERFAIL_VECTOR 0xEF // IRQL 304 O0 O) r7 T$ r c% p1 {* j
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31
# `5 Y3 X3 Q& ~3 t u
' {$ ^; M# o7 M* I8 o& D& C+ t3 I
现在看一下一些重要的数据:5 d/ u; |* ]% M5 Y M: R
* ]2 y" O5 e- ?$ o9 g' h3 ~8 g- R
这是我写的代码输出的IO APIC重定向表内容:
# E) @8 k: U" C7 c' R& t4 H3 o7 M: @6 r, b# X+ n$ @4 E3 ^
Redirect Table Index: 0x17
5 m" K M; ?. z5 |9 SRedirect Table[ 0]: ff) g5 A8 g) P) v1 s% z# q: t. P
Redirect Table[ 1]: b3
& y: i: K5 g* { i+ i% K' RRedirect Table[ 2]: ff
( g7 y0 h6 R) q+ _5 B, g4 y: t3 mRedirect Table[ 3]: 51
- S. X' c/ p6 vRedirect Table[ 4]: ff
4 @4 D! }4 V/ w9 `" F+ @' iRedirect Table[ 5]: ff/ u4 V% Z+ v n0 w5 G9 T7 n- T
Redirect Table[ 6]: 62! I% D7 r1 \1 v8 E% K
Redirect Table[ 7]: ff
. t0 f! r; v# U2 fRedirect Table[ 8]: d1" d$ |* z! P/ o
Redirect Table[ 9]: b1
3 z. P! X1 ]% ^8 tRedirect Table[ a]: ff
/ \) r d% s7 H' Y3 f8 s) h2 J8 |Redirect Table[ b]: ff
" r8 ]( x5 [7 N% }! d4 BRedirect Table[ c]: 52
0 v$ y, c+ P1 h- `& X8 Y. YRedirect Table[ d]: ff
' [7 `7 ?6 S- iRedirect Table[ e]: ff
V% X: N7 q: u: p7 iRedirect Table[ f]: 92# {$ Q& K* Z+ N: c9 i; \( A' z
Redirect Table[10]: ff
) a( ~( Q, v) W% o uRedirect Table[11]: a3
# @8 l+ o/ r2 f& uRedirect Table[12]: 83
$ Y# C1 d+ C3 O4 C9 Q: xRedirect Table[13]: 93. i( u7 ?' ~; F9 |- @! z- {
Redirect Table[14]: ff; R e& O4 q6 E
Redirect Table[15]: ff3 |. ~7 I) R; W$ r9 J- Z4 L$ o
Redirect Table[16]: ff1 {: y: Y8 i4 B: [5 s- U
Redirect Table[17]: ff9 t: B! n: N2 O0 [+ o( U; R0 H
, P4 F( H- ^: v7 L# h4 i7 f
这是IDT表中被注册的向量:
# |( k) J3 R6 P7 d3 Z
/ K+ T+ l4 {+ z% _4 k' G1f: 80064908 (hal!HalpApicSpuriousService)
0 p0 K% Q( d* R( S& i) m- S37: 800640b8 (hal!PicSpuriousService37)
) I5 ^# `) X) q8 ?$ p0 B6 }. u3d: 80065254 (hal!HalpApcInterrupt)
; |" i/ |: W8 Y% N41: 800650c8 (hal!HalpDispatchInterrupt)
+ d+ U* k! {7 }8 P4 h50: 80064190 (hal!HalpApicRebootService)& k# t1 B4 t6 U5 |
51: 817f59e44 o B) W' r" ]8 U& x/ g j2 m# {
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
# ]8 ?, O3 q1 [* s7 {2 f1 T9 E52: 817f5044
6 A3 f: y0 Z2 ]+ y# v& O(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))/ t. b) ^! ~7 e" [# z( _/ a
83: 817d2d44 , N6 @3 V5 I0 Z( O" [
(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))* J" c/ Y9 z' k7 ~
92: 81821384 ' h( B5 U( f3 b( S/ q
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))* x7 T. M# y4 L% R$ r3 r' f# _/ ^
93: 8185ed64
. H( M1 y! o, F6 J$ ?7 M/ C8 M' U(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e)), F8 B* T; F- v" x+ R; n
a3: 8186cdc4
1 ~* E# |: q1 ?9 B3 J(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))
% T+ }% l: C9 o: p, R; cb1: 818902e4 2 b9 g. q3 G5 h% }
(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
0 T# j- T$ R9 m+ |b3: 81881664 6 ]- g4 a! }% [% P, I
(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
# x& @0 I5 }$ yc1: 800642fc (hal!HalpBroadcastCallService)- U6 W2 w0 q0 o7 S' D" P; R
d1: 80063964 (hal!HalpClockInterrupt)
% h7 S# V/ }# G" ve1: 80064858 (hal!HalpIpiHandler)
5 ~! j. i$ a% e; M% e% e0 {e3: 800645d4 (hal!HalpLocalApicErrorService)
0 u" J5 N. p- W, v2 Y( l# g) Y# yfd: 80064d64 (hal!HalpProfileInterrupt)
6 D. j1 _" x9 m' l2 Lfe: 80064eec (hal!HalpPerfInterrupt)
4 ~/ M+ d! E- r/ K' R- r h) H, o9 M9 z# z0 q. P' r# {; l
象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量2 A9 K& f& ?( [* c- Q" o. h; X5 M
8 r0 r0 T& l) P! D- ^
这是几个重要的数组:. o& @% P2 l- y! G1 Q5 ?
: l9 Q0 d# }" f- O) d- ^
HalVectorToIrql(这个数组是以向量除于16做索引):
' B8 e6 S% _1 i, q9 D8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e
; k- y: i5 w$ j. Q/ q
6 [! o/ v$ y, i+ n" GHalpIRQLtoTPR:) l$ B3 j1 G8 ^/ o% {; i
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b18 U3 m( K5 l' q+ q
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
j8 |5 [5 e8 f( L4 o9 V9 B
' \4 t9 k; P+ B& A( ?4 c- s/ THalpINTItoVector:
4 a P$ x& ^" E8 U4 E8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 927 O+ i, U3 r- U
8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 00
# S: }3 s( u! U5 w, I, B
& K4 y( Q4 ?" OHalVectorToINTI:# Y3 p0 c# a F% `% {0 C
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
( o' O2 f% N8 e1 B; i8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff6 o( E @4 x7 f8 z: z) N! _5 z3 ^! Q
8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 g; v9 o# ]7 M* E5 L& ~1 K; @8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
3 ?0 |; C* u& F2 T/ `0 G8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
! _+ g2 l4 T' |7 s8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff
( U$ v6 t/ e. u9 u$ e8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff! a/ _& P8 O4 d9 I6 P
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff& N$ z1 j( ~* M) P. Z! o+ `1 R" K" ~
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff1 c, D! O! G+ [
8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff
$ Y+ q" ~) l! F6 ^6 o8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff6 t$ z8 I8 W9 N- ]( R
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
. H; S% m/ u9 z" ]1 Y r4 T8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 v Q1 l2 e R7 E
8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff9 g$ z; p8 B. Z8 n
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff) u4 I4 i7 k/ \
8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 8 n0 ^7 l+ u" x1 s
$ l! v5 o$ G) r) v# Y9 t* d
4 H3 c9 L6 t, a5 m8 rvBucket:. ~! X- V/ r! B) a9 }& m
8006ae30 02 02 02 03 03 03 035 i* Z6 H1 X8 i! v2 B4 ^# e) a
+ @( K" B- L8 k; k9 A$ | 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。
% w' O* Z& z" q4 E' N2 ^8 e1 i( B7 y
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。+ c/ C% _1 X8 b4 `8 N% {
: U0 m' u1 X. q7 S4 C) U. \ IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
+ t* J, c5 ?- E! M) P8 s' J! w1 H7 F* j6 Z+ _0 J' \7 g) P
终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|