找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34046|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

8 q2 |: p6 d. q& F: I5 g; q
  • Phenomenon1 d+ R; F; j: l7 z- ~' S
" M- [1 W# K) F! V! W$ K% u) f9 X# ^, y
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
0 }, m" b0 W2 p9 M" R9 H! v- a
1
  • Why???
    5 q9 q$ T1 f7 m% ?# Y! v7 b2 w

/ i" [, Y9 h% a
+ T: ]' y8 v: P) Z2 b
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
: {, B4 Y3 _$ A/ c* I
// AC Change event1 V$ B4 J& w, O& k" W

5 `& x( U: z& oMethod(_QXX)

0 {) E# B- R" f/ W$ V' O9 I% j* G: D2 u
+ G4 C5 n# a( I3 y' M{
# s% i% e. i3 Q9 b7 ?
" i# \! Z) f, `8 Z
Store(0x09, DBG8)

: S+ \, K, p7 [9 i
( f) }. ^% P% e4 r3 f9 J) _. U8 z( dNotify(\_SB. ADP,0x80)6 x) u5 F9 h- u1 P4 m( a
//Power Source status changed
( e& a$ \, x% j4 V: e
7 y( O3 c' Z5 Z/ v
Store(0x0A, DBG8)
! y0 x, w& h* e
& G$ c! h0 ~1 I9 m

0 R+ t% c8 Z' _}
: ?2 b) M5 G. C+ X; j7 |% W

% e0 @* C0 l4 S

1 v( m* r3 l" k) U1 a. q  m; k2 y1 d& D/ b
Method(_PSR,0)2 H' Z9 b; M8 R. W0 v
3 r3 n5 W9 K- o, r7 s( F

/ z. z) v+ ^9 [{" @% M9 Q8 V9 F+ q! \
9 X8 n1 d( @$ o* g0 G
- ?% C- b3 ?. u% _
Store(0x0B, DBG8)" _, h2 N, P6 H' H* U

; k9 k, l2 o7 b. V6 f* f9 C2 \$ _! ]- d2 x; l: z
If(ACST)3 C9 g9 I9 B7 S
//check AC status
6 i: P" W( T! x: G- Y( [' M) K
! U1 {- p2 o; {$ A+ i& _' k
{
, G1 O( {& `: _* R5 W: v# P

1 b% S/ `/ W( P( ^3 v
6 T& W8 b: X! X% w9 H/ J4 D$ \return(One)
: q/ l) U- @! Z- N// AC Present

: L4 b' @9 X' [* P( T; j( E0 h4 B; i- j
7 y; [8 y9 W4 ~! C5 W0 [}

( K- R: W* d; {' U( ]
7 E. z' \, B% |9 relse

8 Y8 |& z4 J+ D3 S! M7 j. ~, g" o- S- r. O" R
{
- i: j8 D- F. {: H9 \
% E$ ^# @6 J" b) G5 m9 M7 U8 b/ J
return(Zero)% A0 T3 D! U0 i7 \4 b0 ~
// AC Not Present

! E# h# n' M9 i7 ?/ T' G9 S+ \* ~/ q% B$ E
}

( b; ]) L/ p$ i6 `. w
4 q3 G* i5 k7 C5 b" cStore(0x0C, DBG8)

1 y( ~  l: L7 j& s$ _6 j7 h6 a% O/ U0 f0 D2 k% `5 F
}, u8 k6 W3 S. E6 i9 F1 y1 I9 V* D

+ k( f4 r1 m- b$ [/ y" q) F( e" }
8 o' m7 s' O; H6 w
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
& ^" \2 s8 e+ m! x8 U- F状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
/ T/ i6 U4 R  o! [- p& l' gMethod(_BST)1 E' f8 f$ P, t  {; r
{
0 ^/ v! I5 X& ]' j, Q/ X7 e8 s8 j% X5 w& [) y' f
Store(BSTS,Local0)
. _7 J2 d1 {% q4 W$ c- \. f& i. P+ S

. }9 w2 d. }" d; Z% w5 `: t) x, L2 c  p
If(LEqual(Local0,1)) //Check Battery Present Bit
3 w9 d3 q; G0 i% F

1 u! Q. @7 s) T$ _, m{8 Z! E8 G7 _/ A* d

9 A6 \4 B" |% G0 v; e8 ]9 Y
: |+ n$ g4 p6 v( @
9 m: M  {; g# c7 G4 r; p2 t
2 d+ w+ }0 M$ i7 N9 S' z" m2 \5 u% n& |" p# |9 C  h
//Read Battery information from EC

% ]* G% |4 ~9 e, W; J, A! n+ M9 O9 B8 Y" G; O) q5 @
… …
4 a8 D/ R1 p  D9 `

( ^; Y) R5 v5 t" i' ^& M* x2 b5 r
5 I( Y) t3 ^" u0 C( i/ E0 v}
% [" U# w2 q4 a1 E! d) I0 z0 J5 S

( Q9 d4 Q% H0 O! k; d( T+ G) dStore(0x0D, DBG8)

5 [  k' Z9 U3 B; H7 L2 ^} + f# s2 L$ j/ _& q1 i
那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
! c! _  L6 X) j! \那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:
4 o$ T3 |- T$ e7 r" l1 x. b" J

* H/ M9 ~2 j; h3 u

! L# e; ~7 w! v& P/ [/ d
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.; K: j3 H2 ^9 k/ C* y/ g4 [

( b# D5 p: D4 n% ?6 }- z7 B; L
  • Solution

) @5 ^- A$ y# t, k! B( L' W
- L* \  {: n0 R/ V经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
3 m6 Z+ c. r) K- \: W) R7 E

- u, b, _! r9 M2 B; I# L, t" u4 M( Y4 _  G: f) ?$ k
/ F+ ^% O9 A+ g! M" F5 m3 \. O

" D& f  Q3 g* O+ B* uThat’s all!
3 \- a7 j- r) t4 X
7 \9 i7 r( t2 _- x% g, lPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
) T# Y( c2 ]# V- M! v
0 [, j- d# K& K8 B4 R; |谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!8 ]% X* G9 e( {1 {* k
我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe..." R7 [, W  x5 `+ i8 |3 M
很高心这篇文章能够对你有帮助。; T+ x/ S! C0 n- K
上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是7 o! P. d/ T5 l
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.0 W3 \9 X& L6 d1 C" t
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
  p9 X7 [, _/ t4 A/ d+ \对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!$ `. I( e6 w( |6 o
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了0 C; q/ ]4 x6 X. @# S
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!3 o# d% W8 C0 O# h$ l
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:+ H  W" |5 e( w3 v
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock# o1 f; _6 D4 h4 Z* X
chipset reset pci reset系统重启。4 ~& |9 W$ q+ q
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
, @+ ?  b0 A* K6 z& i3 o等等一些琐碎的动作。
9 T0 X% m- @" W9 @8 e. h  O之前碰到问题比较多的地方就在idle这部分了。8 @# l4 M" Y; g7 d+ ~
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...' Z) F: L8 L( p3 I5 C0 {
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。( }8 H. q3 J% K, R" ~+ n' ~0 x
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!  M5 C! [  F8 E( t0 B
    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
$ v+ U) i8 z% Q* y! n9 |     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
4 p, c% k% Q9 N% o* V: n' }& n7 DBIOS发FE不是通过SCI,而是透过60h,64h port。
# {: U0 y; h0 x! n7 |BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-3-5 16:00 , Processed in 1.677530 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表