找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 33452|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

; y& F4 C# d+ G
  • Phenomenon, I  v1 o- T! t$ \$ S) H/ A. O/ d
" E6 _4 Z, m5 |0 B+ z- o5 C' l
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
3 y/ E( o+ J, Z$ l
1
  • Why???' g. K3 {2 r4 S( \$ V& U

; ]: a- N; T% A$ L9 S1 }8 o# V- `# H5 g1 q6 [) g. n; H, K
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

( z$ H  z8 Y8 Q// AC Change event4 ]- L- d! b0 i7 c
9 h( N" k# q, k- e- u, [. k
Method(_QXX)

5 x4 u. ~: g# [0 D: Q( @
8 C) `3 s8 C8 J" U2 i" Q* ~{
2 q; g+ W; |# u( Z

2 R1 \7 u2 q, x/ ], R% @$ {9 }Store(0x09, DBG8)
6 D1 |$ [2 D. ^- M. e
  k/ z) @& m0 [' h) h* _
Notify(\_SB. ADP,0x80)
0 n/ h. x7 }/ _5 f! o; [& h//Power Source status changed
& w% e# W% U5 o& r& n( r) r

' h8 r0 s$ L* G% m5 |9 EStore(0x0A, DBG8)

1 @/ u9 X. Y1 D' e, E3 o
: N. M# x# ?& i9 o/ a" q" k- N+ U( f( w1 V2 F
}
% [9 E' O3 V7 M$ h

0 l; g# [; B# P; @) e1 G8 ~

1 q# ~5 M$ h) H$ @# U7 G/ A9 g+ n6 w+ z1 h
Method(_PSR,0)
3 Q0 F$ m1 F6 W- Y8 D. S
! G. R5 T8 |/ l9 a

3 E% \9 S( e6 z" F: r{
( m8 J/ t! |+ y+ p

( C9 n  z; J9 V0 V2 n) R0 G  I' J/ Q6 c* S' y$ {. `% }3 e
Store(0x0B, DBG8)% @" o( e1 m* ]( r6 L. f
' ^% Y# K6 m1 i$ e5 s

' P! r* E, j% a  ?6 T* ZIf(ACST)
8 M3 o; ~6 l9 x- R  C//check AC status
3 w2 \7 g2 o1 b1 e( W; r2 @

: b: n8 r- L6 s{
; e; V- A; R# T! N% S
8 d3 e, Y2 e, I! b' L+ C; X

& b, s* B5 d" T) m, @' Zreturn(One)
; \" R' [, L, I8 K4 H// AC Present
2 N5 N6 p0 A2 q2 q

- h+ [) u! e' P}

, _& Y( o: c( v1 v& N  ^: e( [  y. h# E% D
else
: I8 O: C6 V# c
4 m# i& y8 i% g, R. s0 e" b
{
3 e; |* X2 r0 g  i
$ S' e7 L& H2 k. Q* U( k& Z- p
return(Zero)
, S  z' _( |9 P6 L// AC Not Present

# E8 I: a6 c! Z/ U0 f+ h5 s! W4 M, g' I- y" @
}
2 }$ z- K/ M- Z- U) m
( _3 N2 l/ u; k
Store(0x0C, DBG8)
" f( U7 e5 P4 w! C- ]% M% v! I
1 A) N4 m  a* r# q
}3 }3 B# p# ~+ p& p3 n& E8 `

; C9 N  K, U, I' H

, L" A6 c4 p. l/ w' {8 O, j" R  E我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
& X, ?! z5 d4 ^: \( M# l# j状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
6 R' B4 c* H6 i& w/ RMethod(_BST)
* s  [3 {: L9 n: u{
9 S9 s' g5 u/ G9 M7 C& n) E6 n3 d+ ], k+ e# K) a
Store(BSTS,Local0)
  ]+ {8 P! L2 `1 h& s# A
6 w  C7 B, l  f* g9 X) n* I9 T
) |' Z% e1 c) i' S- F+ O
If(LEqual(Local0,1)) //Check Battery Present Bit

8 S4 k  U% s1 `" |' x$ [1 J8 Y5 A& X8 v) P
{
% X- k, @* f0 X5 @+ k2 Q( R' D$ B3 P* l, e( s3 V+ o9 [) T3 ^) j
3 n; u9 l1 V9 H

/ t! o) o' Z+ v! }9 k) G% d. C# K& n  k  X
9 i. i2 F; M7 k9 `
//Read Battery information from EC
0 \% F& O' S8 p: `$ o+ {
' V" h' U+ @9 _! l5 a
… …

2 @6 j, b- J) X- T1 D- u% {5 f/ k) X' j5 H

2 D9 E! h5 {1 s2 }  y8 i  X}

6 S' e1 k" G' I! ?- \! h; Q# w% w% S  C7 O) U4 z
Store(0x0D, DBG8)
- c5 M4 B3 ?' n* z1 f
}
. y. s0 z# U9 F; G& h) T那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
# O. M# q0 t) z- L3 U7 f: c0 f那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
1 m$ R6 A' }  J2 b9 @1 b: e; K5 ^! {/ L

3 O6 E' j- |2 B

$ K$ y9 K4 t8 l' s4 l' r8 m/ V
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
- [+ a( v9 V. t; D* j) k0 O" I
7 `* u7 N5 a5 }, y" W* o3 Z
  • Solution

% ?0 N3 j: d/ v, r$ c; r5 e
0 [& }, n# O" v2 q% m2 C经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!; h1 i, a( Y$ H0 Q) x( M. j

8 ~+ z, P7 |' l) U5 k9 d
- [1 b; K# d7 a& O" P$ f

8 D5 j+ N! ^3 I* g0 f/ M7 t8 l
4 |7 J" M. n$ p" D; e- qThat’s all!5 t  x& _: n" [4 S+ f

' J: r5 t( G0 g& [3 wPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!/ n. h# R7 N8 X, C1 h

7 c1 |0 G: N, N% ]: X/ ~7 W, M% R: {谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
8 U/ ?* B8 s* |我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
6 ~4 ?% @  t( @$ r6 l很高心这篇文章能够对你有帮助。0 }. m3 g: `  j/ q' a6 O9 G# |2 u- Z6 e
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是' N: H& ~, N& ^
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
8 I+ Q1 i6 l4 H/ ^5 v简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。9 E4 x9 Y) E3 R- Y- d# T: O. P
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
8 g6 R# @: A; _% ]( Y( `7 }
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了  p9 G1 L; ?1 j
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
$ N" r% y6 ~8 V$ @, G8 {- z     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
; F+ q! P: P. |" ?* f' s1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
4 P% M; N" t/ Z- rchipset reset pci reset系统重启。
9 K  r+ I6 l$ ~/ A9 M! B2 y  j2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)  e2 |" p8 a! ?4 c8 z0 I
等等一些琐碎的动作。
. a/ g; ?+ A+ v1 h" R: B  F& q之前碰到问题比较多的地方就在idle这部分了。
& o4 x; A" L( P' c8 p1 [0 d2 I+ x你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
/ n6 Y( X9 W8 k$ l) n$ u) b/ p还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。$ f" w. B, a: R8 p; \2 b, l
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
/ G0 o/ p" t( L  M* p/ H    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
* [& R" r$ L3 w& p     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:# `2 |  U2 t7 {8 j: q$ J' }
BIOS发FE不是通过SCI,而是透过60h,64h port。
# l) ]1 B1 r. s* N+ ^: E  j2 `BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-12-1 00:54 , Processed in 1.535872 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表