航天时代公司771所排除隐患为航天员上天增添平安保障

发布时间:2003-06-04
前不久,771所接到一院一部紧急电话通知,该所为长二F火箭配套研制生产的故障检测处理器备份机15号机在分系统试验时出现死机现象,要求立即派有关技术人员赶赴现场排故。
紧急赴京
为了保证航天员的生命安全,长征二号F运载火箭上增加了自动故障检测处理系统,这套系统可以在飞船待发射阶段和上升阶段自动进行故障检测。按照总体部的要求,771所成功研制出故障检测处理器,它是故障检测处理系统的核心部分。
飞船从发射前到箭船分离,故障检测处理器一直监视火箭飞行的重点参数,对火箭是否有故障进行判断,发现故障及时处理,根据故障模式的不同,启动逃逸程序或向航天员报警,保障航天员的安全。如果火箭没有问题,逃逸系统误启动,则白白浪费一枚火箭;如果火箭真的出现了问题,逃逸系统接不到指令,不启动,则会酿成船毁人亡的重大事故。
虽然15号机是火箭故障检测处理器的备份机,但是,发射神舟飞船上的设备不能有丝毫隐患存在。接到电话后,所领导决定立即派该产品主任设计师冯骥、副主任设计师张延斌、软件设计师王宇水等三人赶赴北京排故。
在总体部的大力配合下,他们马上对15号机进行了现场分析,在复现了故障现象后,决定进行问题排查。由于现场条件有限,经请示领导,决定带15号机返所检查,继续排故。
初步定位
15号机返所后,所领导非常重视,立即召开了紧急会议,对排故工作进行部署,并成立了归零领导小组。
作为研制故障检测处理器的第一研究室,是排故归零工作的主要力量。他们积极行动起来,组织了经验丰富的青年技术人员直接参与工程组的排故工作,同时,老专家于伦政、陈作人等积极指导,使排故一线的技术力量得到了加强。整个排故工作始终紧张而有序地进行。
排故小组全体技术人员从大局出发,团结一心,艰苦奋战。在排故中,最担心的问题是故障现象消失。为了防止意外,他们在打开机箱检查前,制订了详细的计划和措施,严格按规定进行,排查的每一个步骤、每一个措施,都要进行测试和记录。
经过严密认真的试验分析,归零专家组认为,程序走飞的问题出在计算机处理器上,与其它部分无任何关系,故障定位在CPU板上。
疑点重重
为了进一步准确定位,在先不做任何改动的情况下,专家对故障进行了分析,制订了下一步的排故计划、措施及方法。同时组织软件专家,通过编制检查程序,检查可疑部件,通过逻辑分析仪跟踪等办法,分析、判断故障可能产生的部位。
分析是细致的,工作是艰苦的。针对CPU板,在大量的试验工作中,每做一步都要对飞行程序进行验证,每执行一次飞行程序都要耐心地等待很长时间。在进行了各器件之间互联线的导通性检查、各点的波形普查、存储器读写编程检查、时序检查、编程检查,又变换电源电压,制造局部高温和低温条件等二十多种检查方法后,仍不能准确定位CPU板上哪个电路存在问题,排故工作陷入困境。
在进一步的系列检测中,他们发现,存储器的性能下降是导致故障发生的原因。为了进一步确定性能下降的器件,他们将被重点怀疑的存储器电路取下,更换新的电路,此时故障消失。
归零除患
表面看来,更换新的电路,能够解决问题,但为什么同样的设计,同样的器件在其它设备上不出现故障呢?针对这种情况,经过分析确定,故障不是由于电路质量问题产生的,还有更深层次原因没有找到。
为了把故障机理彻底搞清,排故工作小组不放过任何疑点,细查引起数据线上冲突的深层次原因。他们围绕存储器又作了一些新的试验,先把存储器的读写信号分开,经过连续一昼夜试验,故障消失,对器件类别不敏感,机器运行正常。第二天,又将存储器的读写信号相连,写信号改用超前写控制,减少数据线上的冲突,故障消失,对器件类别不敏感,机器运行正常。问题终于有眉目了。
专家组与技术人员经认真分析,认为将读写信号分开是有效的,原设计方案是正确的,仅存在设计余量上的问题,不能覆盖所有厂家电路特性的需要。
至此,引起火箭故障检测处理器15号机深层次的故障原因终于搞清楚了。主份机14号机虽然在试验中未发现问题,但为确保万无一失,彻底清除隐患,他们坚决按照归零标准,举一反三,将14号机返所,也作相应改动,保持主份机和备份机的技术状态完全一致。
经过20多个昼夜的连续奋战,参与排故的技术人员疲倦的脸上终于出现了难得的笑容。他们为我国第一位航天员的安全飞行又增加了一份保障而欣慰。为了航天员的生命安全 ——771所计算机产品排故归零纪实
□ 翟卫平 梁来润
前不久,771所接到一院一部紧急电话通知,该所为长二F火箭配套研制生产的故障检测处理器备份机15号机在分系统试验时出现死机现象,要求立即派有关技术人员赶赴现场排故。
紧急赴京
为了保证航天员的生命安全,长征二号F运载火箭上增加了自动故障检测处理系统,这套系统可以在飞船待发射阶段和上升阶段自动进行故障检测。按照总体部的要求,771所成功研制出故障检测处理器,它是故障检测处理系统的核心部分。
飞船从发射前到箭船分离,故障检测处理器一直监视火箭飞行的重点参数,对火箭是否有故障进行判断,发现故障及时处理,根据故障模式的不同,启动逃逸程序或向航天员报警,保障航天员的安全。如果火箭没有问题,逃逸系统误启动,则白白浪费一枚火箭;如果火箭真的出现了问题,逃逸系统接不到指令,不启动,则会酿成船毁人亡的重大事故。
虽然15号机是火箭故障检测处理器的备份机,但是,发射神舟飞船上的设备不能有丝毫隐患存在。接到电话后,所领导决定立即派该产品主任设计师冯骥、副主任设计师张延斌、软件设计师王宇水等三人赶赴北京排故。
在总体部的大力配合下,他们马上对15号机进行了现场分析,在复现了故障现象后,决定进行问题排查。由于现场条件有限,经请示领导,决定带15号机返所检查,继续排故。
初步定位
15号机返所后,所领导非常重视,立即召开了紧急会议,对排故工作进行部署,并成立了归零领导小组。
作为研制故障检测处理器的第一研究室,是排故归零工作的主要力量。他们积极行动起来,组织了经验丰富的青年技术人员直接参与工程组的排故工作,同时,老专家于伦政、陈作人等积极指导,使排故一线的技术力量得到了加强。整个排故工作始终紧张而有序地进行。
排故小组全体技术人员从大局出发,团结一心,艰苦奋战。在排故中,最担心的问题是故障现象消失。为了防止意外,他们在打开机箱检查前,制订了详细的计划和措施,严格按规定进行,排查的每一个步骤、每一个措施,都要进行测试和记录。
经过严密认真的试验分析,归零专家组认为,程序走飞的问题出在计算机处理器上,与其它部分无任何关系,故障定位在CPU板上。
疑点重重
为了进一步准确定位,在先不做任何改动的情况下,专家对故障进行了分析,制订了下一步的排故计划、措施及方法。同时组织软件专家,通过编制检查程序,检查可疑部件,通过逻辑分析仪跟踪等办法,分析、判断故障可能产生的部位。
分析是细致的,工作是艰苦的。针对CPU板,在大量的试验工作中,每做一步都要对飞行程序进行验证,每执行一次飞行程序都要耐心地等待很长时间。在进行了各器件之间互联线的导通性检查、各点的波形普查、存储器读写编程检查、时序检查、编程检查,又变换电源电压,制造局部高温和低温条件等二十多种检查方法后,仍不能准确定位CPU板上哪个电路存在问题,排故工作陷入困境。
在进一步的系列检测中,他们发现,存储器的性能下降是导致故障发生的原因。为了进一步确定性能下降的器件,他们将被重点怀疑的存储器电路取下,更换新的电路,此时故障消失。
归零除患
表面看来,更换新的电路,能够解决问题,但为什么同样的设计,同样的器件在其它设备上不出现故障呢?针对这种情况,经过分析确定,故障不是由于电路质量问题产生的,还有更深层次原因没有找到。
为了把故障机理彻底搞清,排故工作小组不放过任何疑点,细查引起数据线上冲突的深层次原因。他们围绕存储器又作了一些新的试验,先把存储器的读写信号分开,经过连续一昼夜试验,故障消失,对器件类别不敏感,机器运行正常。第二天,又将存储器的读写信号相连,写信号改用超前写控制,减少数据线上的冲突,故障消失,对器件类别不敏感,机器运行正常。问题终于有眉目了。
专家组与技术人员经认真分析,认为将读写信号分开是有效的,原设计方案是正确的,仅存在设计余量上的问题,不能覆盖所有厂家电路特性的需要。
至此,引起火箭故障检测处理器15号机深层次的故障原因终于搞清楚了。主份机14号机虽然在试验中未发现问题,但为确保万无一失,彻底清除隐患,他们坚决按照归零标准,举一反三,将14号机返所,也作相应改动,保持主份机和备份机的技术状态完全一致。
经过20多个昼夜的连续奋战,参与排故的技术人员疲倦的脸上终于出现了难得的笑容。他们为我国第一位航天员的安全飞行又增加了一份保障而欣慰。为了航天员的生命安全 ——771所计算机产品排故归零纪实
□ 翟卫平 梁来润
前不久,771所接到一院一部紧急电话通知,该所为长二F火箭配套研制生产的故障检测处理器备份机15号机在分系统试验时出现死机现象,要求立即派有关技术人员赶赴现场排故。
紧急赴京
为了保证航天员的生命安全,长征二号F运载火箭上增加了自动故障检测处理系统,这套系统可以在飞船待发射阶段和上升阶段自动进行故障检测。按照总体部的要求,771所成功研制出故障检测处理器,它是故障检测处理系统的核心部分。
飞船从发射前到箭船分离,故障检测处理器一直监视火箭飞行的重点参数,对火箭是否有故障进行判断,发现故障及时处理,根据故障模式的不同,启动逃逸程序或向航天员报警,保障航天员的安全。如果火箭没有问题,逃逸系统误启动,则白白浪费一枚火箭;如果火箭真的出现了问题,逃逸系统接不到指令,不启动,则会酿成船毁人亡的重大事故。
虽然15号机是火箭故障检测处理器的备份机,但是,发射神舟飞船上的设备不能有丝毫隐患存在。接到电话后,所领导决定立即派该产品主任设计师冯骥、副主任设计师张延斌、软件设计师王宇水等三人赶赴北京排故。
在总体部的大力配合下,他们马上对15号机进行了现场分析,在复现了故障现象后,决定进行问题排查。由于现场条件有限,经请示领导,决定带15号机返所检查,继续排故。
初步定位
15号机返所后,所领导非常重视,立即召开了紧急会议,对排故工作进行部署,并成立了归零领导小组。
作为研制故障检测处理器的第一研究室,是排故归零工作的主要力量。他们积极行动起来,组织了经验丰富的青年技术人员直接参与工程组的排故工作,同时,老专家于伦政、陈作人等积极指导,使排故一线的技术力量得到了加强。整个排故工作始终紧张而有序地进行。
排故小组全体技术人员从大局出发,团结一心,艰苦奋战。在排故中,最担心的问题是故障现象消失。为了防止意外,他们在打开机箱检查前,制订了详细的计划和措施,严格按规定进行,排查的每一个步骤、每一个措施,都要进行测试和记录。
经过严密认真的试验分析,归零专家组认为,程序走飞的问题出在计算机处理器上,与其它部分无任何关系,故障定位在CPU板上。
疑点重重
为了进一步准确定位,在先不做任何改动的情况下,专家对故障进行了分析,制订了下一步的排故计划、措施及方法。同时组织软件专家,通过编制检查程序,检查可疑部件,通过逻辑分析仪跟踪等办法,分析、判断故障可能产生的部位。
分析是细致的,工作是艰苦的。针对CPU板,在大量的试验工作中,每做一步都要对飞行程序进行验证,每执行一次飞行程序都要耐心地等待很长时间。在进行了各器件之间互联线的导通性检查、各点的波形普查、存储器读写编程检查、时序检查、编程检查,又变换电源电压,制造局部高温和低温条件等二十多种检查方法后,仍不能准确定位CPU板上哪个电路存在问题,排故工作陷入困境。
在进一步的系列检测中,他们发现,存储器的性能下降是导致故障发生的原因。为了进一步确定性能下降的器件,他们将被重点怀疑的存储器电路取下,更换新的电路,此时故障消失。
归零除患
表面看来,更换新的电路,能够解决问题,但为什么同样的设计,同样的器件在其它设备上不出现故障呢?针对这种情况,经过分析确定,故障不是由于电路质量问题产生的,还有更深层次原因没有找到。
为了把故障机理彻底搞清,排故工作小组不放过任何疑点,细查引起数据线上冲突的深层次原因。他们围绕存储器又作了一些新的试验,先把存储器的读写信号分开,经过连续一昼夜试验,故障消失,对器件类别不敏感,机器运行正常。第二天,又将存储器的读写信号相连,写信号改用超前写控制,减少数据线上的冲突,故障消失,对器件类别不敏感,机器运行正常。问题终于有眉目了。
专家组与技术人员经认真分析,认为将读写信号分开是有效的,原设计方案是正确的,仅存在设计余量上的问题,不能覆盖所有厂家电路特性的需要。
至此,引起火箭故障检测处理器15号机深层次的故障原因终于搞清楚了。主份机14号机虽然在试验中未发现问题,但为确保万无一失,彻底清除隐患,他们坚决按照归零标准,举一反三,将14号机返所,也作相应改动,保持主份机和备份机的技术状态完全一致。
经过20多个昼夜的连续奋战,参与排故的技术人员疲倦的脸上终于出现了难得的笑容。他们为我国第一位航天员的安全飞行又增加了一份保障而欣慰。
(翟卫平 梁来润)