找回密码
 加入计匠网
搜索
热搜: BIOS ACPI CPU Windows
查看: 34230|回复: 30

[原创]AC In/Out OS Slow Response

[复制链接]
发表于 2009-5-19 08:11:52 | 显示全部楼层 |阅读模式
AC In/Out OS Slow Response
4 U) r2 ^+ O, H/ J9 \# l/ Q
  • Phenomenon
    2 d  C! ^( q+ B

: U' a0 l, c4 l* v7 s! d手上一个超薄NB的案子DQA报了这样一条bug:频繁的插拔ACvista右下角的power icon有时反应很慢,AC插拔过后有时需要等几秒或十几秒才发现power icon有变化。Power icon指的是下图红色圆圈标出的部分:

/ u$ n. c. L; |3 b: n* l
1
  • Why???
    ( v, k8 w) H2 \! X
) o. K6 s0 t1 ]( g" i" T% s
( p8 p- S$ o: y+ L' A' W
刚看到这条bug时,我有点不以为然,因为有些机种也有这样的状况,所以我以为这个有可能是不同的测试人员认知上差异。而且超薄NB为了解决好功耗、导热的问题都使用比较低的配置,我最初还觉得可能跟配置有关。但是他们找了个相同chipset的机器去试,反应很流畅没有这样的现象L!我的猜测站不住脚了,这时我觉得应该是FW有些地方没有处理好导致的了。随后我们开始debug,首先我们要理清AC in/out 过程中ECBIOSOS都做了哪些动作,我所知道的状况是这样:1. EC检测到AC in/out的中断,更新EC ram中的AC状态并引发SCI IRQ通知OS2.OS收到SCI IRQ后调用BIOS中的_Q method并通过Notify function通知OS power source change3.OS调用_PSR function获取AC的状态并据此更新power icon显示。上述過程sample code 如下述所示:

: F/ Z& W3 W2 p) M* C// AC Change event  }: Z) i0 S& K4 O
$ G6 d, g9 L0 a' _: R1 H0 \
Method(_QXX)

* _/ t' N+ }5 m9 r, |7 M. e
+ k0 z  m( u7 t% _0 |( P+ N{

- |! K: Q9 A3 [$ t, |" D/ M3 Z2 ]! B9 S! k6 V
Store(0x09, DBG8)

+ T  `. q' ~9 K: h2 j
. ?* Z# n8 n8 Q5 j6 h) Y% FNotify(\_SB. ADP,0x80)
! P" L2 q6 j- t) q- V//Power Source status changed
  `" M6 A: d- t4 Y* V& I9 d( {
- W$ D& m* k3 u
Store(0x0A, DBG8)

, }( b4 z, j7 q8 c. }( P: M $ C( g2 o% w; k7 T3 L, B! O. L

5 v1 B9 ]* Z2 H}

- I& f/ w6 j( K7 T
; w' L% t* D5 r7 _7 V- F6 {; L* }
, J; O" V( _/ f2 u3 E+ v

7 S2 i8 T3 K1 ]& g# o8 |- pMethod(_PSR,0)
9 j6 W2 u+ [* ]1 ~! Q6 c0 b: Z6 y% R

. Y. d& x" `9 A+ o3 v
  E/ L% f8 H) a. r  F9 y{
" O: N/ _9 k; n5 C; N

9 z, X4 |! d+ L2 [. g4 I7 K+ F4 H2 L# G$ o9 i
Store(0x0B, DBG8)- l5 b/ i$ g& Y& m( ]! r' \- s
  j% W1 S  \' J: _6 L

. i7 h& A/ i# n/ P+ V. O9 f- ^; \If(ACST)2 i5 B4 B# {' k& W+ B  L) h9 Z
//check AC status

- W; a7 G7 i( l2 p1 }0 F4 Y3 x* y0 k; g- X8 U+ o4 g$ @) [: [
{
) U  E4 X) @, y% j8 j9 @" M

# u+ v5 W9 T) V1 R( Q2 Y
0 _+ a; X4 l! t2 Nreturn(One)0 b' }# k' s) @1 `0 Y) i3 {/ i
// AC Present

& [! i1 Z$ p/ m- {" q/ _! V$ f, Z( Y0 L- `' w
}
8 w: D' D# N7 ]) a+ D

! F& @! M) ]" }$ E: ?, ?9 welse
, B. k3 U* ^8 ]' @3 V  h0 a7 k. i. u

# U( V/ K& W9 Z7 e' N, @1 k: J7 T{

# x9 }! X, C, U0 S9 F4 }& [9 ^$ ]3 S1 H
return(Zero)
: v9 u! y) T/ J3 `& G8 J( T// AC Not Present
; y, q6 d, u  C! J- j* f6 G# y
& E' B  S/ ^2 {5 _9 k$ w
}
. h  `* k0 @# [6 _
2 l/ s& Y5 Y0 r, J( b0 A0 h, A
Store(0x0C, DBG8)

) h* {9 A5 y1 y1 f/ K( s) B/ b! h. t7 E+ M! u  q
}
$ o0 K& \. G' r; Z: C0 p* f
' e' D7 C  y0 j5 W* |6 J3 b6 v8 w* g
) f  G" Z3 P8 d, u' X3 a
我能猜到的大概的流程应该就是这样了。那我们就从头开始追,先在AC change qevent中抛点,可是发现AC change对应的_Q method反应很快,一旦AC in/out debug card马上就会有显示。那么说明什么呢?跟EC没有关系吗?接着抛,又发现有时停在’0x0A’比较久才会出现,有时’0x0C’比较久。9 h: n. M8 R1 n3 C
状况不太一致;没感觉就把网撒大点,在几乎所有的ACPI method中都抛上点然后再try,试了几个回合以后有感觉了,我们发现一旦现象出现在Device Battery _BST method中停的久的几率非常高,也就是说AC in/out OS还会更新battery的信息。这段代码最明显的特征就是它会从EC ram中获取非常多的电池信息,sample code如下所示:
% H- S# V1 C' N! vMethod(_BST)
" n! i) t& C4 u0 T2 O{
9 l: I* K0 Y& f! n' q" L! |
3 m+ W$ U. ~/ ^2 P) V( R2 |7 lStore(BSTS,Local0)

, o# K2 \$ g; ~9 o. x% B8 R' D% z! ?- B7 F

# X, ]$ S# Y# E. q7 [If(LEqual(Local0,1)) //Check Battery Present Bit

- l: j4 m; K7 M6 d
( @7 V, Y* E7 D+ S0 e. s" M{  C% `- N9 f3 ~6 t* T+ W$ V

. e5 w$ I% d8 K# A8 |2 R1 b2 r4 S! q& h
' G- F' n1 n0 g2 \- o( y0 o
; K, i9 u; r1 R; m. Q
* x1 u" ^9 M( M% |( i6 K* v
//Read Battery information from EC
; `; O; `$ _5 `* l; r! q+ u1 O( f
* d7 J2 Z& Z0 a5 J7 u* {
… …
) d# f4 x7 ^/ h1 w) c

1 y: \" Q% @( u3 ]' b& r) t" h" N2 s( ?3 ?: i
}
" _% o! e! s% m. S' R

; d0 S  F* N" X4 O- B% dStore(0x0D, DBG8)
( O! B' [4 [+ m' o; f
}
5 p* h* |, j# x+ ?8 n( ~1 t) e) ^6 D那么问题好像是由读EC ram导致的,ACPI中读取EC内容的方式是发0x80 cmdox66 port,随后EC产生一个SCI通知OS,接着OSEC ram index发给0x62 portEC将数据送给0x62 port再产生一个SCI通知0S,接着OS0x62 port就获得了EC ram指定位置的数据了。我在EC 端加入debug信息,发现出现状况时0x80 cmd EC很晚才收到,0x80 cmdOS发的,所以貌似和EC也没什么关系吗?继续思考,EC产生一个SCI的目的应该是产生一个IRQACPI driver获悉前面的指令已经完成,ACPI driver可以继续送指令下来了。如果某一条指令慢则有可能是前一个SCI IRQ通知 ACPI drive driver还没有处理好导致,也有可能ACPI driver已经处理好但是EC没有ready所致。
( ^, {' u+ O5 x- m/ a那么SCI中断机制是怎样的呢?EC SCICFG register通常将SCI IRQ配置成HLHpulse trigger,而且L的时间通常设置成64us,如下图2所示:

: x; v, o# X- L5 ]
& t0 S- Q5 O9 P7 `& p

6 i, Z* G' p) r
BIOSSB SCI pin通常配置成low edge trig SCIpulse trig有个优点就是它能够自动复位,产生一个中断后SCI pinpull high。可是因为BIOS是下降沿触发,所以EC SCI保持64us低电平会不会太长呢?会不会导致ACPI driver收到IRQ后下命令给EC,EC SCI pin还没有复位而太久才收到?又或者说EC SCI pin保持低会影响到ACPI driver IRQ latency?有了这个想法以后,我就开始放大它,修改EC SCICFGSCI IRQ配置成128 us pulse trig,然后再做AC in/out的实验,嘿嘿病情加重了,fail率接近了80%之前只有10%;那我再将pulse width调整为16us再试,结果200次竟然没有一次出现症状J.
& c- p9 H! d8 \. t6 U" A 3 ?. [. H; o( v; N! g2 Z
  • Solution
- v3 `. c, Y, D9 i, n6 P
+ ]! N2 Z& m8 o
经过上面的分析,大概的原因已经清楚了。所以解决问题的方法应该是调整SCI IRQ pulse width,将保持低电平的时间调短,这样就可以有效的避免这条bug。通过这条bug我发现在分析问题的过程中需要理清问题的各个环节,并且对各个环节所涉及到的细节也要深入分析。不能够看到现象就轻易的下结论,更不能想当然,正确的态度是不放过任何蛛丝马迹,大胆假设多方求证!
6 U4 q, y% x; ?& M. @

/ m  }" e* n4 L' H8 G. t3 D& x* x, `* W: S) m
* c, l. O* h* Y0 W/ F

( n* y. J: R" ~; o1 P1 {That’s all!
) m9 c; e5 O$ \9 w  t1 j: A - ]/ {* e, y& {/ n; ]( A- ]
Peter

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入计匠网

×
发表于 2009-5-19 18:31:57 | 显示全部楼层
原来如此!!!
" S2 R2 b  j8 |# J7 D$ E. p: c" d  \, u4 a5 ~
谢谢!
回复

使用道具 举报

发表于 2009-5-20 08:52:57 | 显示全部楼层
Bug起因为本
回复

使用道具 举报

发表于 2009-5-21 14:42:55 | 显示全部楼层
好帖,学习了 谢谢!!!!!
回复

使用道具 举报

发表于 2009-5-21 22:48:47 | 显示全部楼层

好贴

感谢分享!真的很有用,以前我也遇到这个问题,还以为是OS的问题呢!真的好贴啊!
" }$ J/ B5 a# [! |3 a我看了您的分析代码,好像不是EC的代码吧!我现在就是OS-BIOS-EC三者的关系有点迷糊,版主能否指点一下!谢谢
回复

使用道具 举报

 楼主| 发表于 2009-5-22 07:53:35 | 显示全部楼层
hehe...
  H4 Q0 Y; L* p! Z" K很高心这篇文章能够对你有帮助。
$ I' v7 S  z: \上述代码是BIOS中的ASL code,理清OS-BIOS-EC之间的关系的最好途径就是6 ?4 u# G# r( L$ i
ACPI spec,没事翻翻ACPI spec会有不少收获的。
回复

使用道具 举报

发表于 2009-5-23 09:04:24 | 显示全部楼层

谢谢

感谢指导!谢谢!有时间经常关注你帖子。
回复

使用道具 举报

发表于 2009-5-23 09:18:01 | 显示全部楼层

请教一下,关于oemmain.c中的几毫秒中断问题

您好!我现在手上有一个小本项目!用的是华邦的代码!我发现在oemmain.c中的几毫秒中断中是不是不能添加太多的代码啊!打个比方我就在一毫秒中断里加的代码,而这些代码是执行时间加入超过了一毫秒,是不是会造成EC死掉啊!因为在我修改后的代码发现有时很不稳定!我想了想是不是问题出现在这!请指教一下
回复

使用道具 举报

 楼主| 发表于 2009-5-23 10:43:26 | 显示全部楼层
中断的处理通常分顶半部和底半部,很多driver都是这样处理的.2 E( z6 k# O7 n: x
简单来讲就是在中断到来时置flag,后续再处理(DPC).
回复

使用道具 举报

发表于 2009-5-23 13:09:50 | 显示全部楼层

感谢回复

谢谢了!刚才我又仔细的查看了一下我的代码!终于找到了!EC死掉的原因了,就是我在上电时序那加了一个类似看门狗的小程序!来保证开机的效率。结果硬件始终有一个S电没有上来才导致我EC死在那里。
9 `* [1 V9 P- g$ F. @对于您的解释我还是有点迷糊!对winbond的EC他的oemmain.c中的1MS,10MS,100MS,500MS,1000MS。它用的是中断还是轮询!!中断和轮询是不是没有什么太大的区别啊!我现在就是担心我在比如1MS的函数里加的代码太多,会不会出现在这段代码执行一半的时候,1MS的中断又来了。那代码不就不能完全执行了吗?
回复

使用道具 举报

发表于 2009-5-23 13:59:00 | 显示全部楼层

回复 10# zhanghmjm 的帖子

oemmain.c的是service,是具体的执行处理过程,而实际的中断呢,是由Timer 来触发的(有定时1ms),只要不在中断的Routine 里加太多东西,在 service 里加,应该没事。个人看法,呵呵
回复

使用道具 举报

发表于 2009-5-24 10:02:18 | 显示全部楼层
谢谢了!明天有时间我做个小的实验!我想就应该清楚了,到时与您分享!呵呵
回复

使用道具 举报

发表于 2009-5-26 18:20:08 | 显示全部楼层
为啥你们的是C,我的是汇编啊,
回复

使用道具 举报

发表于 2009-5-27 13:48:06 | 显示全部楼层

回复 13# amty.wang 的帖子

用汇编写才牛呢,呵呵
回复

使用道具 举报

发表于 2009-6-5 10:35:35 | 显示全部楼层
文章很精采,分析很透彻!
0 `4 S3 w" \, d5 m* e5 O
回复

使用道具 举报

 楼主| 发表于 2009-6-5 11:17:59 | 显示全部楼层
conol你也來這里了7 x/ K: i+ _8 \7 f( j; X( r
呵呵...
回复

使用道具 举报

发表于 2009-6-9 22:12:26 | 显示全部楼层

请教一个关于重启的问题

您好!, }9 p9 j# s7 C! l5 k. `5 r7 {# Z
     不好意思又打扰你了,我现在遇到一个问题就是在重启电脑时EC为什么会几率性的死掉!在重启的时候我们EC都做什么啊!现在真的有点头痛了!!!
回复

使用道具 举报

 楼主| 发表于 2009-6-10 07:53:53 | 显示全部楼层
之前有追过reboot它的大致过程是这样的:9 b+ D; f3 j2 [) S' ^
1.BIOS发FE给KBC,KBC pull low KBRST#一段时间,然后sb会将init# pin pull low 16个pci clock; d# y: Y  p, _
chipset reset pci reset系统重启。5 y8 D) q& O% u/ v
2.一旦重启后面的动作看上去正常开机没多少差别,对ec来讲无非是keyboard init、进出idle(update escd)$ K: r2 V  Q1 z# t
等等一些琐碎的动作。
- {3 R! j+ t! S* s7 R之前碰到问题比较多的地方就在idle这部分了。, |, C( Y  i7 D  E2 @6 b! m
你所说的EC死掉指的是所有的function 都失效吗?keyboard能不能用,hot key能用吗,四秒关机呢...
; P: t2 P7 e( N* Y7 F还有如果单台fail几率比较高,建议你接串口debug去看EC死在哪里。
# L; ?# u% V# j) ]6 U以上希望对你有所帮助。
回复

使用道具 举报

发表于 2009-6-10 21:45:30 | 显示全部楼层

重启死机

谢谢您的答复!
& B1 B( A/ U# X: ]    我在做重启的时候EC是死掉的,四秒不能关机。键盘和热键无效!至于死机的原因真的很难找的。因为串口debug调试的功能我还没有弄呢!
8 m' z; _% B) ]; d& {! d% s     对了您说的BIOS发FE给我们EC应该是通过SCI吧!请指教一下!
回复

使用道具 举报

 楼主| 发表于 2009-6-11 08:15:47 | 显示全部楼层
to zhanghmjm:
: V/ _. I/ W! w  {7 @8 ^6 d: jBIOS发FE不是通过SCI,而是透过60h,64h port。3 b4 W3 \, l" o0 a& D! U
BIOS应该没有办法发SCI给EC,而EC是可以发SCI给BIOS的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 加入计匠网

本版积分规则

Archiver|手机版|小黑屋|计匠网

GMT+8, 2026-4-19 23:48 , Processed in 0.190012 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表