找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 32789|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
1 g; n2 t% J6 O+ J% X
  • Phenomenon/ K; A& V9 I( }/ ], v2 Q$ |% O
3 s% ]' F, A% y3 R! B
手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

0 h$ T4 [3 U4 b0 D0 T' o8 l
1
  • Why???
    ' y! H. a  ?- |& r1 O+ b$ }

) ?9 k+ l) G, g0 n  `
* {5 A) D  s2 I& u2 [: Y3 r
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:
" {, L5 i# o; \
// AC Change event
: N: \% X: g6 [8 f: _4 n1 }6 k
6 w# m  G; O9 oMethod(_QXX)
! C8 d: u% }. m  V

) P  |# B8 }5 S{
7 `: |& y: j  ~( v

# p2 x. T2 }* H1 q2 D% TStore(0x09, DBG8)

2 M/ d0 J" z: {3 I( N: k$ [, u1 Q
Notify(\_SB. ADP,0x80)
, A2 Q+ j" z& r, U: O//Power Source status changed
5 S& h/ e& w4 {8 W# Q8 I! }0 b9 h1 ?

/ o" r" I' ]" }, [" t$ cStore(0x0A, DBG8)
# O; r" ^- G" j( G- m& w8 I
  |# H: P! }% r! J, P/ O( U

' F" ~1 ~- ?! ~" h; G# x}
6 p. P; H8 H- p1 l) Q# }5 K

) U( [; M. L: e

+ ~! ^  D8 \# `# d1 S' V  P1 o. T0 y
Method(_PSR,0)
* B4 ^+ M( W$ d, [

  ^2 E7 q* V+ ~" |% m3 i$ \+ V( R# a( v$ h' D" Z5 y5 r1 H% S* |
{
0 j, L6 l! ~/ }$ }, ^. `; M6 f0 r6 V( U- {
2 t" Z. g- K2 c

0 u/ N9 ^4 Y7 q; GStore(0x0B, DBG8)9 L0 T9 a. E0 f  x7 C

) T, k( H3 I1 m0 E' I
$ y; H# Z/ ^$ L- V$ K" q  lIf(ACST)2 [+ F4 Z( C( R; z' [/ V
//check AC status
3 f  k* g3 h% T# N1 r* [/ p. c

3 o4 {, Y8 [7 y% o( A$ x$ h& ?{
* V" c& g; f4 M& n$ O$ i

5 M5 X3 }# o8 }& j' P1 T: B- Z
return(One)
. E4 a# |- G: F4 E// AC Present
; x+ O5 Y% C# b; e& T

8 l/ i5 c9 r" L0 \}
/ ]! N* e( b$ _2 D( e2 y4 K

5 [' {) `' T1 [! o# [else

; }) a& N8 B# P9 R7 @/ c& E, G/ d! w" C1 j3 t, c
{
0 r" _! k7 S: A

" O" H0 r# W2 K3 B6 o9 P% i  ?return(Zero)
: n9 G1 t! u5 r: B// AC Not Present

8 @# W# f8 ^& V( \. H1 \; Q% w; a
}
1 `% W) }% I& L

' H9 W  R: E! X+ r: IStore(0x0C, DBG8)
8 U# l8 K: U8 S: u# g8 Y
* g7 ~7 k/ u. s/ R
}
" P  ~+ P) Z7 p
# J5 W! T" j& `  a/ u2 l# H- k

- L  P1 l- `; y2 J. ]* g我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。
+ L: P0 X" {3 [. ^- x& e( z6 c状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:2 i$ ^/ l4 o. z$ B/ _
Method(_BST), D. d4 e) u6 C
{
; O% \# L* d) A% x5 M% K$ \7 u3 p0 o/ d& }
Store(BSTS,Local0)
' y  b4 n; V0 ^9 O

! W, T0 H" j# P, q6 P: E6 ?' C* t  p) F" C! \. A( V6 I
If(LEqual(Local0,1)) //Check Battery Present Bit
4 D3 `4 _+ K+ e2 _

: V: z& G, o( ^{
, v5 v9 D8 y; e
1 b  K2 }, r; ~
% c8 A1 ^  h4 y! S2 z* V( R/ v' z! W" g$ c$ F7 j
2 ^. b" i4 P, w" b: V
, @$ J; Y4 t4 j3 Y; U5 R
//Read Battery information from EC

: p7 R5 Q7 C  K0 y! R7 |
4 G, @, R' Y( C… …

4 W/ Q+ R) r4 W! [$ w; W1 c; i% O3 l" ]
+ ]6 Z  V. R! K: r6 }+ k
}
; N0 |/ V- Q; T/ H1 i7 h( W

, |+ K' r1 R7 @  r; H7 m$ YStore(0x0D, DBG8)
( D& N3 t7 L; |6 T' `
}
8 d, f1 I/ s- t+ k那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
7 V+ f3 K- }; p$ l* ]( k0 [那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

/ o" e9 j* ^% [& E" U; K+ d
- w+ ?- b/ d/ W+ ?4 O% K

4 S8 \5 `8 a. j2 I( ^+ S, _2 j. N; t/ \
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.6 ~% Y3 _# m3 y. m2 U5 V1 u
4 y! c4 L1 G* r' C& j5 M2 Y8 j+ Q
  • Solution
4 U- u9 S9 t9 }# w  W6 o
! ^6 c* t$ N) v  ~5 V2 K  t2 B
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
! w3 w/ k1 X, L& R2 }

5 m4 N  b, }1 h
+ s9 V9 X/ ]% f* n( G
) h( T" M/ Z3 h1 |; G: a% v& z

: j) }: q4 q4 O1 y+ k* A  d  x4 _& CThat’s all!9 B+ Y2 ~; a0 C2 @: @

( Q) p0 C, ]4 u9 F6 L5 e# `' T) bPeter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
+ ~1 e% ?4 L& f, l+ m5 S' |/ S$ t& ], [( S6 x/ ?
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
+ p) e( ]% }4 y! @8 ?7 O! ?我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...# m1 S5 ~" X5 u" }  a: a9 y( Q
很高心这篇文章能够对你有帮助。
' t1 J8 T. l/ J; M上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是
& t0 q7 \$ k& l5 r5 PACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.) u2 u6 V2 C" |3 D
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。- K0 X( [" Y% D6 p# u/ B3 p; @; [
对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
& n6 j  l2 s! _; I
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了
9 m! j4 t5 v# t8 ~8 i呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!
" a  o1 R& U2 T1 g7 X, V     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:" P. l6 z" ~- K0 M7 J! n
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock
  [/ Z9 M( ?( ^* U1 y3 ^5 Lchipset reset pci reset系统重启。& ^0 I6 w% x8 x0 R7 e" J) R
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)0 g4 t, {! _6 e) f1 ?
等等一些琐碎的动作。
- D. [, a/ P, t, u  Q; |之前碰到问题比较多的地方就在idle这部分了。5 `* N2 x  F/ ^7 ^* J+ C
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...3 b' @% d0 n  A2 R" W$ D
还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。1 t/ z% s0 B4 o6 h3 B/ V
以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
+ `  P, Y/ @# J/ U& [    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
! o+ C( z& ^0 R/ C7 E* s$ ?) T8 `5 i     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:0 \- p! v7 O# O8 W
BIOS发FE不是通过SCI,而是透过60h,64h port。3 Q! I' e& `5 n. |
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2025-5-2 05:59 , Processed in 0.069816 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表