|
|
楼主 |
发表于 2008-2-27 14:35:05
|
显示全部楼层
从IRQ到IRQL(APIC版)
来自:http://www.nsfocus.net/index.php ... o=view&mid=2534, ~% z" X3 w! G. ^+ X6 `0 c
6 D% G( x `8 W+ P' N: S/ [( h6 x) \
从IRQ到IRQL(APIC版)
) B J$ Z& P* t
9 v: t3 F; n, C* j9 x' \' Z% j作者:SoBeIt
8 `* W, z5 l8 V9 ^( J& i, ~& \7 e出处:https://www.xfocus.net/bbs/index.php?act=ST&f=2&t=45502
0 d- h7 M, ^% i( V日期:2005-02-04
0 ^) R( r* `$ h6 D l4 Z* ~- ]4 U8 J
! |* P9 J3 D2 \' K事实上,老久的PIC在很早以前就被淘汰了,取而代之的是APIC。由于APIC可以兼容PIC,所以在很多单处理器系统上我们看到的PIC实际是APIC的兼容PIC模式。APIC主要应用于多处理器操作系统,是为了解决IRQ太少和处理器间中断而产生的,当然,单处理器操作系统也可以使用APIC(不是模拟PIC)。APIC的HAL和PIC的HAL有很大的不同,很突出的一个特点就是APIC的HAL不用再象PIC的HAL那样虚拟一个中断控制器,IRQL的概念已经可以通过中断向量的形式被APIC支持。事实上,因为被APIC所支持,所以在APIC HAL里IRQL的实现比PIC HAL那样虚拟一个中断控制器要简单得多了。
. \ A- } b: L) H: C8 F; S/ @$ J
) i# g! C2 s3 t+ u& u9 V 现在来简单介绍一下APIC的结构(关于APIC详细的描述请参考《IA-32 Inel Architecture Software Developer's Manual Volume 3 Chapter 8》)。整个APIC系统由本地APIC、IO APIC和APIC串行总线组成(在Pentium 4和Xeon以后,APIC总线放到了系统总线中)组成。每个处理器中集成了一个本地APIC,而IO APIC是系统芯片组中一部分,APIC总线负责连接IO APIC和各个本地APIC。本地APIC接收该处理器产生的本地中断比如时钟中断,以及由该处理器产生的处理器间中断,并从APIC串行总线接收来自IO APIC的消息;IO APIC负责接收所有外部的硬件中断,并翻译成消息选择发给接收中断的处理器,以及从本地APIC接收处理器间中断消息。7 A" ~! M+ R! K
6 ]) s' _/ Q* E) u9 c
和PIC一样,控制本地APIC和IO APIC的方法是通过读写该单元中的相关寄存器。不过和PIC不一样的是,Intel把本地APIC和IO APIC的寄存器都映射到了物理地址空间,本地APIC默认映射到物理地址0xffe00000,IO APIC默认映射到物理地址0xfec00000。windows HAL再进一步把本地APIC映射到虚拟地址0xfffe0000,把IO APIC映射到虚拟地址0xffd06000,也就是说对该地址的读写实际就是对寄存器的读写,本地APIC里几个重要的寄存有EOI寄存器,任务优先级寄存器(TPR),处理器优先级寄存器(PPR),中断命令寄存器(ICR,64位),中断请求寄存器(IRR,256位,对应每个向量一位),中断在服务寄存器(ISR,256位)等。IO APIC里几个重要的寄存器有版本寄存器,I/O寄存器选择寄存器、I/O窗口寄存器(用要访问的I/O APIC寄存器的索引设置地址I/O寄存器选择寄存器,此时访问I/O窗口寄存器就是访问被选定的寄存器)还有很重要的是一个IO重定向表,每一个表项是一个64位寄存器,包括向量和目标模式、传输模式等相关位,每一个表项连接一条IRQ线,表项的数目随处理器的版本而不一样,在Pentium 4上为24个表项。表项的数目保存在IO APIC版本寄存器的[16:23]位。APIC系统支持255个中断向量,但Intel保留了0-15向量,可用的向量是16-255。并引进一个概念叫做任务优先级=中断向量/16,因为保留了16个向量,所以可用的优先级是2-15。当用一个指定的优先级设置本地APIC中的任务优先级寄存器TPR后,所有优先级低于TPR中优先级的中断都被屏蔽,是不是很象IRQL的机制?事实上,APIC HAL里的IRQL机制也就是靠着这个任务优先级寄存器得以实现。同一个任务优先级包括了16个中断向量,可以进一步细粒度地区分中断的优先级。
. J. m& Z' [! i3 o- N
6 ~' [ c- p2 }5 [ 在HAL里虽然HalBeginSystemInterrupt仍然是IRQL机制的发动引擎,但是因为有APIC的支持,它和其它共同实现IRQL的函数要比PIC HAL里对应的函数功能简单得多。HalBeginSystemInterrupt通过用IRQL做索引在HalpIRQLtoTPR数组中获取该IRQL对应的任务优先级,用该优先级设置任务优先级寄存器TPR,并把TPR中原先的任务优先级/16做为索引在HalpVectorToIRQL数组中获取对应的原先的IRQL然后返回。若IRQL是从低于DISPATCH_LEVEL提升到高于DISPATCH_LEVEL,还需要设置KPCR+0x95(0xffdff095)为DISPATCH_LEVEL(0x2),表示是从DISPATCH_LEVEL以下的级别提升IRQL。HalEndSystemInterrupt向本地APIC的EOI寄存发送0,表示中断结束,可以接收新中断。并还要判断要降到的IRQL是否小于DISPATCH_LEVEL,若小于则进一步判断KPCR+0x96(0xffdff096)是否置位,若置位则表示有DPC中断在等待(在IRQL高于DISPATCH_LEVEL被引发,然后等待直到IRQL降到低于DISPATCH_LEVEL),则将KPCR+0x95和KPCR+0x96清0后调用KiDispatchInterrupt响应DPC软中断。否则做的工作就是和HalBeginSystemInterrupt一样的过程:把要降到的IRQL转换成任务优先级设置TRP,并把久的任务优先级转成IRQL返回。KfRaiseIrql、KfLowerIrql之类的函数也是这么一回事,把当前IRQL转成任务优先级修改TPR,并把原先TPR的值转成原先的IRQL并返回。而现在软中断的产生也有了APIC支持,APIC通过产生一个发向自己的处理器间中断,就可以产生一个软中断,因为可以指定该中断的向量,所以软中断就可以区分优先级别,如APC_LEVEL、DISPATCH_LEVEL。产生软中断的函数一样还是HalRequestSoftwareInterrupt,该函数会先判断KPCR+0x95是否和要产生的软中断IRQL一样,若是的话则置位KPCR+0x96并返回,表示现在IRQL大于DISPATCH_LEVEL所以不处理DPC中断。否则以要产生的软中断的IRQL为索引从HalpIRQLtoTPRHAL取出对应任务优先级,并或上0x4000,表示是发向自身的固定处理间中断,并用该值设置中断命令寄存器ICW的低32位,然后读取中断命令寄存器ICW的低32位是否为0x1000,确定中断消息已经发送后就返回,这时候软中断已经产生。值得注意的是APIC HAL里没有HalEndSoftwareInterrupt这个函数。HAL为软中断的IRQL提供了一个固定的中断向量:: p' p7 x. @3 B
; p4 X, D$ ^9 x+ c' r3 ^4 a H#define ZERO_VECTOR 0x00 // IRQL 00
! B2 p; _ n( w1 }#define APC_VECTOR 0x3D // IRQL 01" g0 g- Q; I' [
#define DPC_VECTOR 0x41 // IRQL 023 g* N( U5 I: ^2 f
#define APIC_GENERIC_VECTOR 0xC1 // IRQL 27
, g: L" {! h/ w; v' m1 P+ ^6 \#define APIC_CLOCK_VECTOR 0xD1 // IRQL 28
' b0 O8 e; n G t8 ` a6 u#define APIC_SYNCH_VECTOR 0xD1 // IRQL 281 e0 s" c6 L+ e. o G
#define APIC_IPI_VECTOR 0xE1 // IRQL 290 A) v( }" j @" _/ k$ w+ l# S2 [
#define POWERFAIL_VECTOR 0xEF // IRQL 300 X% o5 Q1 }1 C3 I9 y+ q* H4 K6 {
#define APIC_PROFILE_VECTOR 0xFD // IRQL 31- e" E% M' j: @- p7 v( F- Z
* p7 Q9 K: N/ z( o: v
. b/ s: o0 q1 X- F- m& `现在看一下一些重要的数据:
- _0 m; I: E/ M4 [5 r% B! t0 I! ~3 b. d, h/ B! u
这是我写的代码输出的IO APIC重定向表内容:# J0 H& r" H+ r8 n& b5 Z7 |$ x
" J4 x% F; r/ v, n+ e% f
Redirect Table Index: 0x17
; i8 {8 O8 w3 B# `* u: F* nRedirect Table[ 0]: ff
' g( s8 p* X, x0 KRedirect Table[ 1]: b3
# `1 _$ V) d, ?5 F! p0 XRedirect Table[ 2]: ff
8 e! n. Q9 y& tRedirect Table[ 3]: 514 ?$ L& Q" H2 Y# w8 m2 |4 ^& d' S
Redirect Table[ 4]: ff' f% {' K# A3 i2 o3 Q1 g5 q
Redirect Table[ 5]: ff
5 v8 ~0 U. V; L8 {) zRedirect Table[ 6]: 62
$ J2 N- V$ Z- M5 v) V5 _7 URedirect Table[ 7]: ff
8 _# I3 g3 `4 M( C3 G2 p fRedirect Table[ 8]: d1
5 N* c7 a; X& s2 _; r- @9 GRedirect Table[ 9]: b1
0 O8 ]9 ^1 {4 b- N9 i' b+ Q- ~) WRedirect Table[ a]: ff, W; O' _/ L; b8 W1 @ j
Redirect Table[ b]: ff4 [1 f8 b; ^6 a) w; | F
Redirect Table[ c]: 52
+ l/ q2 t% a7 F: J; Y8 D8 bRedirect Table[ d]: ff
3 L% T6 j/ H7 C& G- k% PRedirect Table[ e]: ff
) b! k- R+ [! p; }Redirect Table[ f]: 92
7 e+ ~" ~( l3 v8 E0 C/ o+ kRedirect Table[10]: ff1 y0 ?1 A- Y: B
Redirect Table[11]: a32 w6 F8 k1 p. h0 q% m) Q- }
Redirect Table[12]: 83
. D8 V9 n- M5 w5 T- ORedirect Table[13]: 93# Q+ g* s# W9 h& `2 n. a
Redirect Table[14]: ff3 ^' ]; w* w6 ]
Redirect Table[15]: ff6 [; U/ a- m5 P- U9 B
Redirect Table[16]: ff
2 a' j$ T1 A6 C4 lRedirect Table[17]: ff
+ `3 f8 S6 S. Q+ Q
6 w( B. |2 \4 L4 s* O3 a这是IDT表中被注册的向量:$ U6 L/ L9 v$ E! t- z' S' i
) H3 q, P" G$ B3 @8 m1 d" `! v1f: 80064908 (hal!HalpApicSpuriousService)
- A) A' e4 D. T% G; i8 h37: 800640b8 (hal!PicSpuriousService37)
6 `/ v5 D g4 A. O, y3d: 80065254 (hal!HalpApcInterrupt)4 O% a, z# ]2 I1 j4 k2 \/ H( L
41: 800650c8 (hal!HalpDispatchInterrupt)
, {6 q( b' w: R: R4 B) H& J50: 80064190 (hal!HalpApicRebootService)& S% ?( O4 C. @; d6 r6 z1 `$ [
51: 817f59e4. \9 C; w+ R. f: s1 s6 ^
(Vector:51,Irql:4,SyncIrql:4,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:serial!SerialCIsrSw(f3c607c7))
( e/ z$ V9 v$ m$ P$ W+ A; Y52: 817f5044
; Y: V# V+ Y5 u% K2 f! q& ~(Vector:52,Irql:4,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042MouseInterruptService(f3c57a2c))+ [6 M9 D& L' e0 w( Q) Y7 }( n/ F. ?
83: 817d2d44
: I" z! d8 M3 k- R3 }; ]' J; u& ^7 L B(Vector:83,Irql:7,SyncIrql:7,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:NDIS!ndisMIsr(bff1b794))
8 o8 R: i. T) i92: 81821384 " J, I8 \4 K) G
(Vector:92,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:atapi!ScsiPortInterrupt(bff892be))
" Y+ M5 O! U* y! T93: 8185ed64
+ R$ g2 h7 j2 `; Q$ Y(Vector:93,Irql:8,SyncIrql:8,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:uhcd!UHCD_InterruptService(f3f0253e))
0 y E) t" u0 p& P [' ]. V2 n$ Ta3: 8186cdc4
" }, O- z" j8 Z(Vector:a3,Irql:9,SyncIrql:9,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:SCSIPORT!ScsiPortInterrupt(bff719f0))- m5 {2 g9 n/ z. t7 J
b1: 818902e4
7 }6 _+ u: [' G. W(Vector:b1,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:TRUE,Mode:LevelSensitive,ISR:ACPI!ACPIInterruptServiceRoutine(bffe14b4))
* A8 Y$ _8 s5 W' Y4 y3 W( }b3: 81881664
|3 Q9 y. [" t" }+ r2 \* @(Vector:b3,Irql:a,SyncIrql:a,Connected:TRUE,No:0,ShareVector:FALSE,Mode:Latched,ISR:i8042prt!I8042KeyboardInterruptService(f3c51918))
- h6 ?& Q% n8 q9 rc1: 800642fc (hal!HalpBroadcastCallService)
' n" H3 {) K: P3 @2 bd1: 80063964 (hal!HalpClockInterrupt)
6 i' V) Q) o4 {! |2 p7 r3 [, je1: 80064858 (hal!HalpIpiHandler)
7 |% ?) |% @( b; @8 xe3: 800645d4 (hal!HalpLocalApicErrorService)
3 w. b0 k0 V9 G8 \1 Ffd: 80064d64 (hal!HalpProfileInterrupt)# f2 o; \+ O9 f) t; r% _# z
fe: 80064eec (hal!HalpPerfInterrupt)/ C( J R% w3 K& P# P
+ q; M& Q' W1 O! N3 \象a3、b1这类输出内容很多的是被硬件注册的中断向量,而象d1、e3这种输出内容少的是注册为了的HAL内部使用的中断向量和本地APIC中断向量
$ O t, s' N6 u. X" V- T5 d) W( o5 _: ?
这是几个重要的数组:) U* W' {& Q( D7 {& W$ ?
$ T: ]/ d8 E+ j( E
HalVectorToIrql(这个数组是以向量除于16做索引):- P, U% y2 B6 D+ P1 v4 { ?
8006a304 00 ff ff 01 02 04 05 06-07 08 09 0a 1b 1c 1d 1e8 ^- @8 O/ y4 d
! t) L7 h" O; ~5 z3 Q
HalpIRQLtoTPR:$ O: E9 P4 w: `/ F( ^6 s
8006a1e4 00 3d 41 41 51 61 71 81-91 a1 b1 b1 b1 b1 b1 b1/ [. f- U3 F( c
8006a1f4 b1 b1 b1 b1 b1 b1 b1 b1-b1 b1 b1 c1 d1 e1 ef ff
5 F4 J* A* o+ A+ Z$ S! d, |% S5 O3 ]! n& ?
HalpINTItoVector:
/ }1 K5 j1 o' v/ ~8006ada0 00 b3 61 51 a2 b2 62 91-a1 b1 71 81 52 82 72 92
$ g1 i3 `( E2 ?" a8006adb0 00 a3 83 93 00 00 00 00-00 00 00 00 00 00 00 001 P& |% ^! @6 L; _7 K8 Y2 Q
% Z4 _5 t8 `& N8 iHalVectorToINTI:9 s& s, L' u6 ` S! N$ u
8006a204 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% u+ q$ \& e, H. R- z8 v8006a214 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
% p- C# I3 f2 g* X; ~, r8006a224 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff. v5 q7 B4 ^9 U. x
8006a234 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff4 H% F& W. f* z; R
8006a244 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
: D+ F8 l! O8 ^+ f/ \: ?8006a254 ff 03 0c ff ff ff ff ff-ff ff ff ff ff ff ff ff: W, {9 Y- H2 |/ k; F
8006a264 ff 02 06 ff ff ff ff ff-ff ff ff ff ff ff ff ff) L- j- I! z7 \$ b/ y7 c
8006a274 ff 0a 0e ff ff ff ff ff-ff ff ff ff ff ff ff ff9 e$ h* \) R, K5 `
8006a284 ff 0b 0d 12 ff ff ff ff-ff ff ff ff ff ff ff ff
7 L8 e+ [# `" ?: {1 S, V8006a294 ff 07 0f 13 ff ff ff ff-ff ff ff ff ff ff ff ff% N) e6 b0 a1 p5 y. v
8006a2a4 ff 08 04 11 ff ff ff ff-ff ff ff ff ff ff ff ff+ u5 _. y' h- v: M8 o4 m: c
8006a2b4 ff 09 05 01 ff ff ff ff-ff ff ff ff ff ff ff ff
7 w4 _7 r. t8 ?2 T' s8006a2c4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
0 D! F7 c9 _# o8 M R" E8006a2d4 ff 08 ff ff ff ff ff ff-ff ff ff ff ff ff ff ff' l5 d* L: I2 ^1 Y& T
8006a2e4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff ff
8 G5 u$ f# X, D5 C8006a2f4 ff ff ff ff ff ff ff ff-ff ff ff ff ff ff ff 3 H, y3 P/ f2 u! D. t5 a" r
) Z3 \1 {1 y6 b+ t
9 t' a; L5 i5 _6 x5 Z, zvBucket:6 k6 ]+ J' C# f# K) l
8006ae30 02 02 02 03 03 03 03
: ^: D; j- j' k/ y! Y1 A b
5 r6 J1 i7 I* H, B/ e 举个例子来说明一下,在我虚拟机里SCSI Controller的IRQ是17(注意,已经大于16了),到重定向表中查找第17项,得到中断向量为0xa3,再看IDT,0xa3对应处理例程是SCSIPORT!ScsiPortInterrupt。$ V$ J5 Y3 e7 b0 a8 J* @
' t9 ~9 }8 i; A5 r
vBucket数组干啥用的?它就是用来分配新的向量。分配算法很简单,当要分配一个新的向量时,就在vBucket数组从右到左搜索最小的一个数i,该数对应在vBucket中索引为Index,新向量为(0x50+Index*16+i+1),新向量对应的IRQL为(4+i+1),同时会把vBucket中这个i加1,i不等大于16。象给出的这个vBucket,下一次计算时i=2, index=2。不过这些用于硬件的向量在IO系统初始化时调用HalpGetSystemInterruptVector分配好了,然后通过IoConnectInterrupt把IDT中注册的向量位置的例程注册为中断处理程序。这里并不是每个注册的向量都会对应中断处理程序,象上面给出的例子中,0xa1、0xa2、0xb1等向量就没有对应。
: T: O: c( K% b/ `% `! x
9 ]' ?) n7 ?5 b5 o IRQL机制为内核同步提供了很大的便利,既对驱动开发者隐藏了底层中断机制,也方便了驱动开发者的内核同步。LINUX从2.5内核开始引进的软中断和任务队列等机制,很大程度上也来自windows这套机制的借鉴。
, r( {$ B+ }7 W, B% ?* Q4 Z
' R( I% X r. W6 f' Y% [9 `5 f 终于考完试,解放了,呵呵。这个东西其实还有很多可写的,只是没空再深入去分析了。在未来的64位系统里,APIC这种基于中断引脚的机制很快也要被SAPIC这种基于消息的更强大的机制所取代 |
|