- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
怎样才是最有效的IC故障诊断和失效分析
摘要:对一个复杂的设备进行故障诊断的时候,知识储备是最重要的。我们想要的并且需要去了解相关的一些问题。它包括正确的IC版本号,在哪里可以找到有关的参考资料,谁真正了解客户端发生了什么。帮助客户是我们最主要的关心的,IC的失效分析要求快速而正确的作出响应。但是我们是否应该期望在失效分析的时候,质量保证部可以测试所有条件下的每一个参数呢?不,根本不可能,也来不及。大多数是猜测分析。这可能会引起一些人的吃惊,但质量部门的人也是没有水晶球或者是读心术的。及时有效的IC故障诊断的唯一可能性是从客户端得到关于IC失效的正确信息。
IC的失效分析——它是在浪费时间
我们经常听到“观念是现实的。”当IC失效的时候或客户认为它失效了,我们必须做一个失效分析。为了更有效,我们必须得到准确的相关信息。这是避免猜测的唯一出路。让我讲述一个发生在很久以前的小插曲。一个器件由于失效被退回来,我们没有得到任何相关信息。我们对这个器件做了一系列验证,例如运行自动测试设备,台架试验,X光检查,及开盖检查。我们把这个器件浸在软性电子的环境中,放在电子显微镜下观察观察损坏的地方。我们使用液晶涂层来测量温度。这个器件是完好的。我们没发现任何的失效原因。因此质量部在报告中就写了,我们想知道为什么这个器件由于失效被退回来?
大约两个月后,我们几乎是偶然间了解到,当这个器件被加热到+60℃以上,客户的产品会失效。我们再一次做了失效分析。我们在室温下(+25℃)测试这个器件,什么都没发现。当这个器件在测试中被毁坏后,它不再有任何的功能。最终,这是一次返回事件,它没有再次发生。但这里有更重要的教训:没有关键失效数据,我们只能是个盲人,也只能乱加猜测。我们浪费了大量的时间和金钱。(参见附录—IC失效分析在国内的另一个更个人化的古董车故事,接地问题与另一个失效的IC。)
彻底的测试对QA来说是徒劳的
多次损坏的IC以至于无法确认损坏的根源。客户从总承包商哪里拿了一块板子回实验室。在实验室里,他们把IC从板子上面取下来,并且声明这个芯片是失效的。很可能,客户会得出一个结论,失效的根本原因是由于芯片本身。他们想要我们做一个失效分析,但失效的数据在哪里呢?当时的境况有被仔细记录吗?如何阻止将来的失效呢?我们又转回到先前的猜测中,而不是实际查看——对有效的失效分析来说,它几乎不是一个良方。
在这个案例中,客户集中在多个输出设备的三个引脚。这是我们所知道的:器件离开工厂的时候有几个部门与数十亿量的认证;在它失效之前,工作了数小时。它会是个初期的失效还是由于外部操作而损坏呢?它已经在客户的电路中了吗?是工作在参考电路环境下吗?是工厂的ESD弱化电路而导致后面的失效吗?也许这是由于运输员忽略了ESD而导致芯片损坏?可能因素的列表看上去是无止境的。
从客户那里收到最初的原理图不是很有帮助。它显示出的既不是什么导致器件失效也没有显示出需要去更改的。FAE需要去检查一下地的处理方式。它是不是有被正确的分割?从原理图上,你无法分辨地的连接。我们收到更多页的原理图,但是现在问题比答案还多。为什么客户仅仅查看很多输出中的三个呢?器件的任何输入或者输出已经和低阻抗连接到板上的引脚吗?电源和地平面是低阻抗连接吗?板上的ESD会有问题吗?我们还是在猜测中。
有效的失效分析——故障诊断是一个犯罪现场
现在我们想问,“怎样在一开始就获得正确的信息呢?”期待QA去做所有的条件下的每一个参数,它是合理的吗?特别是关于这个失效我们什么都不了解的情况下。不是。我们会帮助客户去理解为什么IC会失效,以及纠正它使用正确的应用电路。
显然的,这种做法与那些认为失效分析应该马上做的思路产生冲突。我已经听到,“失效分析经常是第一件要做的事情。在查看IC应用电路之前,先查看IC的内部。”我不能理解这个想法是源自哪里?我也不同意。失效分析不是第一要做的工作。相反地,调查“犯罪现场”和失效事件才是第一步要做的。
故障定位的信息是至关重要的,像警察调查员一样,我们应该竭尽全力去保护现场数据。第一件事是查看IC的应用电路,即,它在哪里失效。这样一个简单的事情,就像焊锡飞溅也可能是真正的答案。IC可能是部分工作,而不是完全失效。事实上,拆卸这颗IC可能会掩盖真实的问题。
对于一个有效的失效分析来说,我们需要查看客户的原理图和收集所有失效的情况,为什么它会失效。是的。这个流程可能会遇到客户保密的问题。这是一个常见的问题,它也就是为什么要有保密协议。这也就是这种情况,FAE作为工厂的眼睛和耳朵在世界各地。FAE可以查看客户的设备,评估他们的原理图,布线,以及应用的其他条件。为了保护客户的秘密,FAE只需要把客户原理图设计的相关部分发送给QA。而现在,QA将要使用这些可信的故障数据做最终处理。
成功的结果
回到我们之前的故事,当地FAE客户一起密切关注这个失效问题,当手里有了更多的原理图,我们可以看到:一个op amp连接着一个输出管脚,但由于10kΩ的串联电阻,它应该几乎不生效。通过使用一个共地,非分离地连接一个星点,供电噪声直接被耦合,虽然去耦电容连接着其他供电。最小的去耦电容是0.1μF,表面贴装0.1μF电容典型的自谐振大概是15MHz,高于它作为电感的频率且导致停止作为电容的功能。
从中有两个教训。首先,去耦电容是双向道的,如果耦合了有噪声的供电到一个干净的供电,那么噪声将污染了这个干净供电。其次,同样的事情也发生在有噪声的地线上:噪声将会污染干净的供电。有噪声的供电要和有噪声的地线配对,而干净的供电必须和干净的地线配对。交叉污染可损坏电源和地线。上诉的自谐振频率,使它变成了电感,也就是说,它不再传导或者衰减高频能量。
结论
我们兜了一圈重复我们初始的看法:在解决一个IC失效问题上,知识为王。从一个调查的开始,没有任何人能有当地FAE和客户一起肩并肩检查问题更有价值了。FAE必须要仔细检查整个系统,板子的Layout,原理图和应用,然后把数据传达回给QA。只有在这些准确的、详细的数据之下,我们才能解决IC失效问题,没有这些数据,QA只能被迫猜测“犯罪现场”。
附录——失效分析在后方
这里是一个相关的例子证明在一个失效的电路上为什么证明知识为王。没有完整的失效数据,根本不可能得到准确的FA。这个例子一开始并不是去解决一个IC失效问题的,但是很快IC失效问题就被卷进去了。
一个朋友有一个老旧的生产于1927至1931之间的Model A Ford汽车,他安装了一个从当地汽车零部件商店买来的收音机,但是它不能工作。他把这个收音机拿回给商店换了一个新的,再次安装进去之后结果还是不能工作。尝试了三次的“坏”的收音机之后,商家把钱退回给他了。
他向一个古玩汽车俱乐部成员述说他的遭遇,他们告诉他,Model A汽车有一个正极搭铁,所以收音机使它的供电颠倒。当收音机期望连接至正极电压时,它实际上连接的是一个负电压。如果半导体上供电颠倒,半导体将会冒烟。
这个Model A的故事还在继续,基于正极搭铁的知识,我们的朋友买了一个昂贵的定制的DC-DC变换器用于反转供电电压。为了测试,他在工作台上把电池连接到DC-DC变换器和收音机,结果收音机开始工作了。但是当他把所有东西都嵌入到汽车时,保险丝烧断了。最后,他只好请求他一个工程师朋友的帮助。
Model A的底座连接着电池的正极端子(按今天的电子器件来看,相当于负极供电)。在1956年之后,美国的汽车都是负极搭铁,电池的负极端子是连接底座的,生成正极供电。当今在汽车商店买的消费品是假定汽车是负极搭铁的。下面的图1在工作台上能工作是因为收音机没有螺栓固定在汽车的底座上。
此装置能在工作台上工作是因为没有把虚线部分的底座地连接到收音机上
在DC-DC变换器中没有一个地隔离以省成本;事实上,正极输入和正极输出被连接在底座地上。所以,当此装置在工作台上时,它能工作是因为没有把虚线部分的底座地连接到收音机上。一旦把收音机接到汽车上时,收音机被短路到电源,保险丝就会烧断了。
假设你是一个收音机公司的技术人员且被安排对这些返回的收音机做失效分析,而当地的商家只会告诉你他所知道的:“装上去之后不工作。”然后你打开收音机且发现很多被烧坏的器件。是什么导致这些问题?如果没有更具体的表现数据,你只能去猜测了。就如我们所说的,任何一个QA需要完整的失效故事才能得出有效的修复器件的建议。