找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 30724|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
! h- d) Z/ V8 n6 W" u  z6 [
  • Phenomenon
    ( {1 D6 }0 e# q1 B

/ [. D* K# q& D& c手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:
4 G1 ]1 w! s6 [  s+ J2 W
1
  • Why???' I( C5 g7 S9 }0 Z
: k4 C& y2 y& o
8 C, u3 h' h7 j% ^3 r3 [. j* `: b
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
# b$ z0 V" Y4 j% K; m3 d: J
// AC Change event1 E8 z( L9 o3 d, m

! L2 u" F) Z: M! W! T0 N7 P. U( aMethod(_QXX)
- K7 Z* `9 [( L4 D8 L4 j3 J
, B  ]+ ^. F. R/ l1 J) O1 T
{
) y  Z. \  c. j! _: y/ `

# o  M+ F2 p1 L2 q- @8 Y. xStore(0x09, DBG8)

) q) M2 a8 R7 x5 J' o! f' X- L( A- \5 D. C# S( _5 e
Notify(\_SB. ADP,0x80)2 `; q' O- ~3 r" ]
//Power Source status changed

; H  \& R; M9 y9 \
( R* S; _, S$ K* Y& G$ nStore(0x0A, DBG8)

. B$ ^6 N& H6 `- ]9 \2 `/ O
0 ]' R& K1 |, R# l* K) c1 ?. U& ~* u& p8 u1 T8 G! L
}
; i8 t- j. W5 C9 o9 m' l

6 l5 d, m, t1 q
, d) t8 O% s, [; u! y6 R; F
' g2 H# U7 t8 U
Method(_PSR,0)
9 r- t' [6 M# a  O
9 B$ h1 F+ \1 Y7 M3 q$ Q5 x; B: f' r2 O
& _! E& g. K1 C& j7 t
{
( P6 E' E. q$ Q

  T! W) J3 o9 V/ |, B( C
8 g7 d0 P2 ^  g$ W# UStore(0x0B, DBG8)5 b+ h7 a5 U. `$ N$ N
# x8 ^9 o) F: Z3 ~! B( w' O1 B1 X
7 N0 @( r6 x3 u$ a
If(ACST)  u/ v/ S  l7 K. j
//check AC status
- P. W$ Y6 \8 H

' S0 w& o9 Q" p{
4 N0 _! B# T" v3 j* P5 z" s
5 O4 X7 \3 N% U  U7 c3 S
+ @. L. }4 ~; }4 ~# z; t* J+ a! k
return(One)  B# Z  v* f1 v) M8 a5 e1 t4 h
// AC Present

  N: u  [0 V! P' J* E4 ]% ^/ D& g$ r
}

3 O' Q/ X$ c' C. x: r& i% @/ O$ s7 k. J4 i
else
2 ]4 {. E$ [/ C  i9 y
9 C+ Q$ ~+ _* j2 m! A  ~
{
% m4 G# n( `9 U3 f# A' p
, H! [) V, u/ t$ H/ ]5 C
return(Zero)
/ [& a% {: Q1 G. H  \( H& A// AC Not Present

+ |0 X+ u2 A3 M) R) _5 h8 @3 F0 k, e( g" G( v# b6 Z
}
8 A' J$ Q3 N8 n3 F# o! o% K: W

" L5 C$ v& N# \( XStore(0x0C, DBG8)
* O# _2 p: P; R' w1 r0 B1 O$ |0 s
) m; s/ s7 p0 X
}
! B1 {$ T& L+ q, q
- Y% U  P/ |$ _9 ]0 Y

6 a, u7 A# E- ^我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。  E7 a. |( |( ]
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
! ?- C0 Q  p% n- ?3 w. x0 kMethod(_BST)
; T+ s8 G7 C: E{* h6 H- c2 V+ d$ O9 r( Y* Z3 o
: o( A7 j6 C! }' {. R# x
Store(BSTS,Local0)
& _) e' _/ ]& p8 `" e* U0 T2 X- g  O
3 r% v8 P: }2 k2 c( F

" \+ a. b# t! K, h* xIf(LEqual(Local0,1)) //Check Battery Present Bit
4 O6 E* t1 C, N9 _0 T
5 B" R! r# [2 R: G0 s. d: _. O% z% e
{
8 G8 e3 y( E7 K9 G/ E& O6 b
( |8 _$ r/ T0 _+ ~
' o- f& s  Y% e/ x& i! ~8 s8 c  F/ Y) [$ o& h# e& m+ O: x% }

7 a) G% ?; O, C: p7 u, i
1 l, y( b  a2 I% `4 G$ K' I- q4 F//Read Battery information from EC
. r5 v$ x& A% c3 p

3 l, A' Z* X' ^. J… …
2 Z9 H0 c* x3 u; P. r! L1 r0 C, u

  ^) c4 y* R" L1 n  u, P5 q4 B% t# D  H
}
8 \6 o5 Y7 B2 g

  @. \9 G+ V6 [) \' Q, e4 ZStore(0x0D, DBG8)
, F5 B! w6 ]# I6 D: X  F
}
/ f4 [3 M9 K, r! e- f+ ^6 m那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。/ I1 {! ~; h% A
那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

' a8 i7 ?" c3 I" u. y! s
6 m; B; M$ c; u# _
6 h: P2 z6 x: V
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
2 o) }0 [1 U0 j# ~6 l 4 P: M/ v' E" A- l( {7 ?
  • Solution
3 |2 n4 k0 k- h" g, v
+ T( O/ |! E2 y3 z. x+ r
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!- A7 j( E" K! A

+ H* v( \4 V/ K1 {) l6 V5 d% Z- O, n9 o
% `3 L% |* U/ B- x. I) O8 r) i
9 [* D0 L/ t) F: }2 }, q8 L8 m

& _+ M( B4 v7 S- K- x, z; ?That’s all!+ M) X" g: l4 V" |' G
) ]! c' S5 z7 T  n& G
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
3 Q) E( Q( ^: K# J% r. Y0 z7 N
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
. D: o% m: e1 Z4 m! M我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
: e2 `# p/ l, g( A' \) X很高心这篇文章能够对你有帮助。
7 p* z- A$ B4 R+ E" b* H' h$ o( }上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是3 @9 j6 l% K3 G" U3 F# _
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.1 J! N4 l% U. y
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
( O- }/ i7 x/ l$ D4 z% L对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
9 v5 F/ B/ U* k; C  N# h
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了+ z8 I6 O* J" ~- y9 t1 j
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!! h( v; `: u( Q
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:
0 _& T9 I( H8 Y% _1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock' T. y7 w" w9 M0 m
chipset reset pci reset系统重启。
* {, v$ \" x+ N$ T) q2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)9 i% Y# ^4 s4 ~, Q5 e
等等一些琐碎的动作。0 }; m! H5 e/ ~
之前碰到问题比较多的地方就在idle这部分了。* |* J: `: N( g3 X) }+ T
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...( `/ U/ b! J6 g
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。+ K; V; K3 v. A& P. w
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
( p& v, Z' `! W& V/ f" U+ l" q5 @    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
  O/ }, k; g. w4 o* L     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:  ?! I0 M5 k0 b1 R
BIOS发FE不是通过SCI,而是透过60h,64h port。
7 H9 x, J, C, {( p5 e$ y4 PBIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2024-5-19 04:52 , Processed in 0.020991 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表