找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34228|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response

3 q6 d( R' h5 Q! n
  • Phenomenon5 I+ \; B4 K% ^6 T. n4 s6 X7 r

- h, G3 f( i; V0 c4 e0 }手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

5 ?4 g6 F* |& U: ^$ F# c9 d$ p* {
1
  • Why???
    8 x6 j* n2 V' O$ ~% x2 B
; [4 l, y5 t$ E* Q6 c$ H" Y4 m
+ ?$ |# ~" |) r# ^" }4 }
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

; X; [: t" W8 w3 v// AC Change event  Z3 `+ X) Y6 H3 B% n
" e: \8 x  h0 X* X7 H, W
Method(_QXX)

3 o3 A! P, p; V/ O9 C1 {+ }0 t1 S1 i+ [5 r0 g
{

5 ]" j4 |9 }3 h; r# N
, o  N2 P5 w" D8 vStore(0x09, DBG8)

  G3 d/ u8 ~$ Z! v
4 W$ ?/ B8 Z. k% H: B8 KNotify(\_SB. ADP,0x80)
$ H- F& `: r% W0 U//Power Source status changed

6 d+ u8 \1 u5 h+ o: ?! V8 O
& U* c) i- Y# AStore(0x0A, DBG8)

. }: F" T) i/ T" M
+ r, _/ a5 |7 o/ P2 W- U
9 ~3 Q; [) z; Q1 @# b. C  ~' E}
. T  h+ r, g+ V6 D4 n' }. q
; Y3 b; N/ P5 {4 E3 t6 ~
1 o8 p* t5 v) ]

  Q8 m# n6 v; Y# EMethod(_PSR,0)
1 `* T, D# n0 U2 c9 T! p4 a

7 i" \# _- C- Q/ D4 @2 Z! L. ?, R5 W1 g2 E5 i" x6 }
{$ N0 }3 k" c) w# ]; [5 [4 T

7 d7 h5 c$ ?& A! J8 ]+ _- @0 A3 W5 ?5 [1 ?
Store(0x0B, DBG8): y( g6 v& B( _% }: @+ ~

; C8 m  W! X: r! T8 g* T2 w) {8 g  ^& m$ X+ E, v
If(ACST)$ a% b- F' J* {! I
//check AC status
/ A! n; l7 {7 d7 o

! U8 l, i( I7 e  A' t{
" h& v' U0 A- T) H0 C( H9 K
0 O% }1 X" Y7 |8 i8 c( D2 r; k

6 `7 s$ c4 j9 ?: T7 h9 ?return(One)( T1 U2 E1 _/ p; M
// AC Present
/ b8 i- t' `' O5 ?0 `) T% `( `5 T
6 j: y8 {+ Q& D! i* e8 O/ N8 r
}
4 |/ [/ m2 ~( t. f- h3 g) g9 W) |

- |& Z8 o1 F' E+ }" `' O6 G! Selse
4 Z3 L* q! t# U% @+ z
! \$ m1 N8 K0 l0 @4 i  {
{
5 J, {9 d6 w- s0 L" @7 `3 ~, I

; `/ \2 U1 L8 i- E4 k% e, jreturn(Zero)  X; @4 m0 ?, O
// AC Not Present
$ V+ ?- ?' b" m$ Q9 F

6 t0 f; F' K$ n}
5 R+ m: }; [; r9 Q3 e/ c

+ {$ |. W/ S  _/ AStore(0x0C, DBG8)

* s* ^, v( A& b, u; q  u9 N" t
' d$ v9 k5 R6 R" \/ E' V}
0 q1 Y1 C+ d% v5 q4 C0 y  V' j
# M1 O! x9 p9 M
* Q7 s2 X5 {6 D5 R+ B+ _2 }5 _9 I
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
) `, x: _3 _) R  W7 b  b状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:" e  T7 c, z2 V( d* B
Method(_BST)! y& L6 i' [* w6 u
{, G( @# K" H7 }( i8 G) S, C( C! _
* \, D* c6 Q+ c4 @6 D4 R
Store(BSTS,Local0)
6 w% C% |+ w+ V
' ?- e, |( ^  ]
7 u; P  v( n2 g4 E6 o* _& ]- f
If(LEqual(Local0,1)) //Check Battery Present Bit
" Q" z5 C( ^: [+ N/ I1 s
/ C- A7 _) h- e0 P$ o9 _! U% _9 D
{  `# a/ l+ z# V. W( X
1 o" C' _. r+ y/ W) Z1 ~
- {7 U, s  R0 i/ }2 h& U

7 O/ ^2 u3 Y6 K/ L1 A6 q
; F! \2 f! r4 Y8 v+ L
6 d1 d/ T6 ^: G1 e4 |8 G//Read Battery information from EC

- w% A/ y+ u9 b: ^! v# }' h5 ?3 b3 e9 i" q# E1 O9 ~$ D
… …
, Q$ U  J1 Q1 t$ I

$ q0 d. o; O2 o7 Q5 d; Q6 T8 y6 h: M: z
}

. }* U" K, {4 s2 }: b1 T/ \- \( t2 a
: j4 x8 e! J8 D5 I+ v; {4 a3 MStore(0x0D, DBG8)

! n3 P: k* G" H1 s! [. H}
0 W$ V" j( ~+ N% G' J那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
& z* f/ j2 y4 g' E" n: Z5 R6 q+ A那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

) _: n0 {- k1 \* b1 C- f7 M2 e# k; |. H9 p' V/ ?0 e

9 P0 p* r; d; z& r% ?. c( M" O
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
5 e: m& _  Q3 `
9 v2 s" T/ t) x( ~
  • Solution

$ [+ z" f$ F* h5 |
9 a  \% }' T+ b经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
% D; D, y' E/ g) O/ u2 L! a

% S. k. e& ?& S+ U+ i: V; J7 }5 ]2 v+ x/ H' K
9 c: n, v4 X1 i$ G# N

3 O5 o8 Z; q: }+ M" w8 o3 {/ kThat’s all!) W# ]: j4 f. l, x8 t( A& _
: W* ^. V  T7 E) R- k
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
- k' a8 [! `" A
8 e6 g& O( P: g5 V谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
3 b% ~8 ?, Y2 Z) }" p% S1 W: J6 `我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...  o: z$ g5 Y2 H
很高心这篇文章能够对你有帮助。
/ Z7 V5 s. g4 J8 ~$ o- h上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是, m1 A2 L4 |0 }, h7 l) V
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.( V0 D6 X2 ]1 y4 v& m# k
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。, I+ Y0 t- x9 x8 x
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!! H; e+ p! L2 E$ ~& y. E: B. I
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了9 F2 n! s" T! Z! x# Y
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
, }" r' P: v% i7 G) h9 r/ D% v& J     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:* `. q/ E0 Z; e- b6 `$ `% P# \
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
& G1 U; t% D2 r( Y, bchipset reset pci reset系统重启。
( d/ S/ F' e; f+ U2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)
4 e7 f2 V  `$ C5 z9 {' f5 F等等一些琐碎的动作。2 @$ c4 |: Q# \' g/ X8 ~  G
之前碰到问题比较多的地方就在idle这部分了。
3 c+ b0 N. h& \  M5 b' W) n  [你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
6 q; @# g' _- ]. f; {+ }还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。: ^0 i0 y* W1 @4 I1 U
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
' L" z% W% H" P    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
5 J" Y3 v9 x7 P0 d! f5 q     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
, z, o/ Z& i. F) XBIOS发FE不是通过SCI,而是透过60h,64h port。  U' L3 H& E# D( N( J) |
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-4-19 21:52 , Processed in 0.765418 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表