找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34041|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
; _7 t6 L& q2 w& q2 {  J% ^4 i
  • Phenomenon
    # X- G# _- V3 L  b
! M5 Y' y. z3 ^4 R) K5 x
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

7 w% P" v6 e, B) o9 O& C
1
  • Why???6 U; j0 i/ q9 a) `% o  D
1 _1 d% t% n- F" [
# U7 m- e" B. x( M0 ^1 e1 v% X# {4 ?
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

* q& L1 j: }( S7 U// AC Change event
& j! H$ ^) P# o( ?/ _( R4 @! J, F( Y  T
Method(_QXX)

! ^/ _/ t% ^& o( m" Q0 P
6 A, A1 ?3 t2 u) v{

$ _7 g+ l, K2 Q$ ^* y5 y
+ G& M5 r9 w2 r2 k- B( r$ Y. ^# B  m* ~Store(0x09, DBG8)
% j0 \' L  H$ q- t: j/ U7 _
+ N- _- H& \: Z0 k
Notify(\_SB. ADP,0x80), l* Z) \6 T: N/ M" r2 [$ ]* N
//Power Source status changed
( _/ [% z) r. V8 v/ {$ q

# a7 c5 z' s) d; IStore(0x0A, DBG8)
5 L* [& j- j2 N# [; f* h

8 s) d  v0 t' G. Q
+ m4 U/ X# v9 m}
+ ~' `* T& v* X  g8 @
9 F, _! z1 N* {2 T: x
  g4 W! i/ a: A1 G
8 n0 T) q  A5 j- v- j
Method(_PSR,0)7 z+ C3 e& x/ [- n, Z, O7 U

# d6 `6 ?' {2 ]& F/ W6 B8 y
6 L$ |; f% m! z' I( w( |{4 X1 O4 F! W% v* I/ ~/ q

& j3 _/ b& z8 ]4 e& _6 O2 Y" H" M5 L6 S4 F$ S+ A( M: v) z" L$ R+ T- P) G
Store(0x0B, DBG8)
3 u$ G2 _0 Z' g3 V! z. X1 ]* O) D
" ^! u# f8 J% Y8 K1 e" U

; }- I: }+ c3 J7 w9 f1 }! ~If(ACST)$ a$ y# Q3 P  ~5 X
//check AC status
# Y" x# R, L) A' l; p, f5 [% M5 g

) C; w& v+ f8 k4 U8 @) j{

, S# ?1 a4 ?. q  h  A  g$ p7 c7 F$ h0 r3 ^' G- c

5 q, Y9 }/ N6 X7 `return(One)
9 N6 X  K! o( {% H// AC Present
# L+ V9 J0 E) O% G

# _. {4 w# R3 K3 w5 T}

- d' B0 x* m6 O* k8 C- b; B( s! s2 A$ U. @0 F% R
else

0 M( c: r  p: W- ?+ s6 Z5 g4 A! F, n) H( r
{

. `, g3 A4 n8 s  Z( A# X$ B9 c: E2 R, P2 {
return(Zero)
) ]8 j8 l9 |/ M$ Y. ~, R% A. v// AC Not Present
+ t" \( |9 t5 t3 B
( ]  t% j6 ~) }" \( g
}
0 n4 F* M. ~: S: G2 |# |
& {7 i$ }# _* W# |! s
Store(0x0C, DBG8)
- ]* f7 B6 E& _. M

1 @& a/ q8 H6 L$ c/ V! t}9 U/ G9 W/ q9 Y! `4 d9 c' O& T
5 v( W1 @9 J" e- N+ F( Y% o

3 x% [  a' O6 Y2 ]- O我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
; ~5 P* z/ F7 X  c状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:4 P) Q% p# c' C
Method(_BST)
; J5 J3 ?2 ]9 z: _+ d- E{0 I) z+ o4 Y1 M

3 w7 R$ ^5 F" Y  D" W& XStore(BSTS,Local0)
+ O7 z; O1 Q/ h6 R
8 ^# f  X2 g" Y$ X& Q
/ t% R4 A' n5 t: T7 ^4 }8 D2 n
If(LEqual(Local0,1)) //Check Battery Present Bit
/ B) Q. }- c" }$ y

6 T( u" O2 M% V3 z) {{
" j9 r; M% ]8 [2 @. m1 Q( }
! R9 ~& n, w5 S  L1 h! V+ q+ n; T! b5 X5 I

, p" }7 k7 ], b1 L7 g. c; s( q! {% `7 @8 F

* ^" ~. M; t, C; P8 p# n! B//Read Battery information from EC
# X* j2 p5 X! J1 j( k
$ n8 A7 b7 f1 Z4 W4 {
… …

+ ^& X% T* Y% p8 A. N+ o9 \( A' B2 k; K3 R& t# Z+ Q# I

/ a6 o6 Q$ Z* s. f/ O$ b}
: ~2 v+ |8 u2 ]9 T/ c; M; h0 u

3 w7 z4 c) [( eStore(0x0D, DBG8)
* ]' w, \% H0 m# Y" e) c3 G
}
: p9 f, W4 e2 o( r7 w那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。3 L9 M; R4 ~! V' G7 Z$ l8 v2 E7 v
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
5 b& M$ q  S+ p3 g/ W" x

$ O) C# b0 z" d6 e! D' a* N) ?

% p+ z8 d9 _! |- ?" z) `
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.+ n/ q& ^* P! b

7 J# v" m" z, x  v% o
  • Solution

3 U0 L5 ]# H$ _/ i' N9 |$ N/ V7 K% m& E. T: e
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!* B( Y) Y9 L. V/ j# G
/ l; M. A9 S0 z& j3 u
: ]9 h' M- ~# H8 T# G! Q

) q  G+ Z7 P/ H5 R- y
# s! P( h5 }- Y) EThat’s all!$ l) X. Z  @1 w  _

3 _* |$ K4 I% |2 u( F' ^6 }Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!/ K% o: J" Q% d" h  }" t* ^

1 y2 E4 p7 y; p9 E( e1 g谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!4 A% @! R1 K. X, \! [  N8 Y
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...# ~% }6 u3 _) R( M
很高心这篇文章能够对你有帮助。
6 [! F. n! H' p# D* {0 q& Y上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是4 I( G) O* e$ k% U  U# M9 c
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.
: X" P! {  p4 F& Y简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
+ w# C; r7 x/ I对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!, t; ^7 w5 I: K4 b9 [) V- x
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了+ R- T0 [9 q( J
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!; {% ~6 }  }  I5 A
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:* }' [) L$ t1 X' ~
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock7 z' W# z' i' v$ B3 g! r
chipset reset pci reset系统重启。+ S& d/ A4 G+ C  |) z
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)  k: D( `1 x; v- R$ z* D
等等一些琐碎的动作。. x9 c; I, P' X- j4 b& F8 M
之前碰到问题比较多的地方就在idle这部分了。0 f7 |$ k, \; a  e5 m- w* k/ |
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
7 O8 Z2 u+ O( S& c' l: J* v2 Z还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。4 O, V5 v2 }/ T8 [
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
$ z2 D( |8 R4 \  E+ l* p    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
* j/ B& N: c+ v  p% P! v# D     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:! q2 P5 e6 M' m1 N. y
BIOS发FE不是通过SCI,而是透过60h,64h port。
1 P* }: Q0 M& o7 g* gBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-3-5 12:43 , Processed in 0.070611 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表