找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 30730|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
) R5 }4 a$ H8 ~5 N) H" P
  • Phenomenon; ]% |! S  {! c: E; _" u

3 {9 ~+ r7 c$ _- O8 v4 ?/ B手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
5 r. {1 ^4 A  m, M
1
  • Why???6 }+ s5 g1 c  K' R, W* U5 B" l
$ e, q2 n. F* Y  z" f

$ W# B2 }+ B) ?. v- S; ]* y
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
8 o& \6 N: {! x9 H. K0 s
// AC Change event
1 j( T1 Q. \* m( `; q; g5 r
1 u1 @+ F5 O3 SMethod(_QXX)

' v9 X* U! s; q0 c: {4 }
3 d- i2 O- k1 V  T. F7 z{

) u# J$ q4 a; G- K+ K& X# s8 o' |1 v) ]( F: ~) L
Store(0x09, DBG8)
/ }( }) t, ]7 E# _" o& l

0 b! F5 P& t7 L' K6 U8 N+ C7 ZNotify(\_SB. ADP,0x80)' i  a# E& F- F$ U
//Power Source status changed
6 X  e# B/ k/ k( S/ ]# k
4 U7 |4 s/ K# b5 h# K; @
Store(0x0A, DBG8)
3 K" ]" K6 w( n  d3 |

& f" c% e; P# p& X; u! b7 {/ {6 Z. [! n% x9 ^' T
}

) P$ j) G+ H7 d9 ?' C2 `  w. N
( z) \* G5 t% K, V- x' Z; j+ v
6 r: F6 l' }% ]
4 L5 f1 {1 @) Y- z0 i& I
Method(_PSR,0)8 ]8 x  H0 O3 s( C0 s

, N5 a9 ?* J- y" A
5 v8 S" l" [4 R2 n{
! r2 E5 `8 i/ A
; ^1 ^5 k$ P* u! V4 t
" K* t1 L- x3 P
Store(0x0B, DBG8)' |. B! Q2 _& v3 \
7 |; y& O9 _/ t( \

( Q) T2 v! I2 x( k+ k, U$ VIf(ACST)
* M. ?* M5 A7 v5 h//check AC status
; m2 k  j0 h+ Q, \0 ]% M4 u7 X

7 M. N6 O- L. E8 Y$ z{
& g# h! h% d" t2 B" i$ R
& |- u& F7 T7 A7 O

4 J/ q) D3 z# g5 _3 Z. Q: [& \return(One)
+ d+ F, f3 i/ |& P  W5 ^// AC Present

/ C" h% c' ^2 V8 _. i
9 ]" ]+ `1 _+ [6 I( J}
9 S' }4 X2 q, w+ K# S# t

) J0 x1 Y6 E. S0 _3 Lelse

8 u5 `% K; J. ]+ y) `  [* U4 E9 ~( V4 K" v  G& a# _
{
5 F. ]7 d7 B4 }6 o1 C+ w

7 |/ N8 u0 M7 X. A, g7 A6 Lreturn(Zero)9 g5 _, P3 M: ~- U, B- a
// AC Not Present
% U: F& J1 c! `7 G

! C5 o9 b8 \% I6 u6 P& }}

$ T! C. R- H$ m
) L5 X; F  m$ n. R0 {7 HStore(0x0C, DBG8)
$ @. Z  f* |0 K# Q( |+ r

0 L3 z8 r) D6 k$ l/ x3 H; k}7 X3 a; f) Y' N# x
/ t! w! Y6 ]. q* f7 s  t

. Z0 }* M  w% w$ f' f( b8 x7 B我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。0 P! j: U( k/ b8 u7 m( r) ?
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
& M, l. B1 Z2 a/ H- A4 g' m( MMethod(_BST)
- G% c6 U3 ?8 t/ ]{
, y) o/ x  O( c
  H' z& i0 X1 k- D  _4 k8 z( i- KStore(BSTS,Local0)
  f6 j! L8 M; N3 q

% x: A- r( u" P- ?9 x. I( k
! L4 N; v( t/ x4 ]If(LEqual(Local0,1)) //Check Battery Present Bit

: z/ Z! j/ H. P" w; B/ s# B/ R# y; Y* E0 N, s' N, h
{
# ], Q2 ]- [' v) P% ~
3 n) ^. X- {; p: M8 Z0 C
: o/ T& d) s+ U& x
: P' V2 `& ?& p9 q# g- w+ _3 Q- c  b3 E9 p  s
1 X- @- k( t" Y4 Y7 E- m
//Read Battery information from EC

3 o7 w  {; Q# u1 G( L% {2 m
  D# O. d; ?; E% m* V$ `! E% l# G… …
  l. m$ r% n: A3 |! `) Z4 C

- ]+ U! ?) d% o
' O/ z, A, l/ i2 e* V}
1 s$ v" Z9 a' h7 O
. {5 b& x2 P' A2 y2 v2 e$ p( S5 P  z
Store(0x0D, DBG8)

5 x& S# N6 u) l/ T9 A}
' }  K7 F) ^0 r2 `那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。4 U7 Z+ ^% x4 q$ s, Y
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

# d' R) n. o: G8 X
3 ~$ ]4 {- J2 N, w/ g
* I1 ?* `0 j. ]9 p- d$ o$ |. o
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.$ L% }; ~5 @0 K

5 U) G8 A: I' d5 \  C% P1 \
  • Solution

/ V+ _' m7 F, z& P) F- k& A4 `2 t6 I& H! ]3 G
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
. X2 W! w( l0 X0 |0 q

3 a" k1 t( y# Z& {& A5 i( {- n- J3 r1 N$ @/ L$ T
9 v' Z, @" w) v

) H# R1 B) B( f4 SThat’s all!4 L3 \4 P! }9 |' B7 H  |* l
: ~2 z2 B9 E# X
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!" @. @+ c8 t  v0 c6 @1 P2 y

# v7 l- b# p9 l/ {$ k谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
' y: F. Y& R- p; z8 Q" I4 C+ Y2 l" g" ^我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...- n0 `+ x& N0 Q
很高心这篇文章能够对你有帮助。
3 |* I8 B; N/ y上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
2 @; Z, y3 }2 b( [1 `. h5 |ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.1 ]# J, O; r; m; ]2 N! a
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
5 a2 T/ v7 F8 M# m+ P4 D对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!! j! P+ {# |4 s, F- H) x  B
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了/ x' ]4 A, i) d! t
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!# L& U* x+ ?( o/ j2 n
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:6 `, D2 t7 y0 Q3 M* y- f
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
2 c$ i+ u- i2 v, a+ gchipset reset pci reset系统重启。/ \: L) @4 I# S! y
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)) H+ H: R. `! P+ [
等等一些琐碎的动作。
+ S4 a# b! o  V  n, c$ ?* e之前碰到问题比较多的地方就在idle这部分了。7 M: l9 e% \( b+ }- }* w* W
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
& x6 v  M7 V/ f8 e7 d* z还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。
4 g, b' J  W9 v, R1 {以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!1 `3 m# B9 p4 b, W) d; i
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
5 R/ m$ P( U5 A% U( S6 N     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:6 f  f& |, C, x/ r
BIOS发FE不是通过SCI,而是透过60h,64h port。/ d5 P. |( l. C) ]; u* ~
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2024-5-20 11:38 , Processed in 0.027022 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表