어렸을 적, 할아버지는 대한항공에서 안전을 담당하셨다. 지나가듯 들려주신 이야기 중 하나는 아직도 선명하다. 나사 하나가 일으킬 수 있는 거대한 사고. 그 작은 부품 하나가 하늘 위 수백 명의 생명을 위태롭게 만들 수 있다는 사실은 어린 마음에도 깊이 새겨졌다. 비행기에는 셀 수 없이 많은 부품이 들어간다. 그중 한두 개쯤 빠져도 괜찮겠지 하는 생각은 곧바로 위험으로 이어지며, 이처럼 거대한 시스템도 결국엔 작은 부품 하나로 무너질 수 있다. 그래서 나사 하나하나의 상태를 확인하고, 보이지 않는 부분까지 점검하는 과정이 안전운항을 지탱하는 기본이 된다.
바로 이런 사고의 가능성을 미리 예측하고 대비하기 위해 만들어진 기법이 FMECA(Failure Modes Effects and Criticality Analysis, 고장형태 및 영향분석)다. 부품 하나하나가 어떤 방식으로 고장 날 수 있는지, 그 고장이 시스템 전체에 어떤 영향을 주는지, 그리고 그 위험을 어떻게 줄일 수 있는지를 체계적으로 살펴보는 것이다. 거대한 항공기부터 일상의 자동차까지, FMECA는 작은 실패가 큰 재앙으로 번지지 않도록 막아주는 중요한 안전의 언어라 할 수 있다.
FMECA는 FHA (Functional Hazard Analysis)가 ‘기능 중심’으로 사고를 바라본 것과 달리, ‘부품(컴포넌트)’을 중심으로 시작한다.
질문은 단순하다.
“이 부품이 고장 난다면, 시스템 전체에 어떤 영향이 있을까?”
예를 들어, 자동차의 브레이크 시스템을 보자.
부품: 브레이크 페달 고장형태①: 페달이 헛돌아 작동 안 함 → 차량 정지 불가 → 심각도: Catastrophic 고장형태②: 페달이 지나치게 무겁다 → 제동 지연 → 심각도: Major
부품: 브레이크 오일 씰 고장형태: 마모되어 압력 손실 → 제동력 저하 → 심각도: Hazardous
이렇게 하나하나 쪼개어 살펴보면, 보통은 보이지 않던 “작은 고장”이 가져올 큰 결과가 드러난다.
FMECA는 말 그대로 고장형태·영향·치명도 분석이다. 시스템을 구성하는 여러 부분에서 생길 수 있는 모든 고장 형태를 확인하고, 그 고장이 어떤 영향을 주는지 평가한다. 여기에 더해 “이 고장이 얼마나 치명적인가?”라는 질문까지 포함한다.
즉, FMEA가 잠재적 고장을 찾고 영향과 대책을 정리하는 데 초점을 둔다면, FMECA는 그 고장의 치명도(criticality, severity)를 수치나 레벨로 표현해 우선순위를 더욱 명확히 한다. 이 때문에 오늘날 일부에서는 FMEA와 FMECA를 사실상 같은 말로 쓰기도 하지만, C(Criticality)의 존재가 차이를 만든다.
Note.
FMEA란 무엇인가 — 핵심 한 줄
“이 부품(또는 공정 단계)이 고장 나면 시스템 전체에 무슨 일이 벌어지는가?”를 부품(컴포넌트) 단위로 묻고, 발생 가능성·발견 가능성·심각도를 점수화해 우선순위를 정하고 대책을 세우는 예방적 기법이다. 기본적인 템플릿과 절차로는 프로세스 분해 → 고장형태 열거 → 원인·영향 작성 → O/D/S 점수화 → RPN 계산 → 개선조치 선정 등으로 진행된다.
1970년대 NASA의 아폴로 프로그램 이후, FMEA는 전 세계 산업의 기본 분석 도구로 자리 잡았다. FMECA는 미국 국방성이 신뢰성 분석을 위해 1949년에 만든 군사 규격 MIL-P-1629에서 시작됐다. 당시 목표는 명확했다. 새로운 무기체계를 설계할 때, 가능한 모든 고장 유형을 찾아내고, 그 심각성을 평가해 초기 단계에서 제거하자는 것.
이후 항공, 우주, 방위 산업을 거쳐 자동차, 전자, 에너지 등 민간 산업 전반으로 확산되었다. 오늘날에도 FMECA는 시스템 개발 초기, 특히 개념 설계 단계에서 가장 신뢰받는 분석 기법 중 하나다.
FMECA의 목적은 단순히 위험을 확인하는 데 있지 않다. 설계 초기 단계에서 신뢰성과 안전성이 높은 대안을 선택할 수 있도록 돕고, 모든 잠재적 고장과 그 영향을 체계적으로 기록한다. 이를 통해 시험 계획이나 시험 장비 요구도를 설정하는 기준이 마련되며, 향후 설계 변경 시에도 참조할 수 있는 문서가 남는다. 또한 유지보수와 운영 계획, 나아가 수치적 신뢰성 분석을 위한 기초 데이터까지 제공한다.
프로젝트에서 FMEA는 설계 초기부터 적용된다. 개념 설계 단계에서는 시스템 수준의 위험을, 상세 설계 단계에서는 실제 부품 단위의 위험을 점검한다. 제조 단계에 들어서면 공정 FMEA를 통해 조립이나 생산 과정에서 생길 수 있는 문제를 검토한다. 또한 시제품을 만들기 전이나 설계 변경이 있을 때, 심지어 사고가 발생한 뒤에도 FMEA는 다시 실행된다. 요약하면 “새로운 것이 나오거나 바뀔 때, 혹은 사고가 발생했을 때” 반드시 FMEA가 필요하다. 하지만 FMECA는 적용 영역에 따라 세 가지로 구분된다.
설계 FMECA: 제품 설계 단계에서 수행되며, 장비의 수명주기 전체를 고려해 고장을 줄이는 데 집중한다.
프로세스 FMECA: 제조, 유지보수, 운영 과정에서 발생할 수 있는 문제를 다룬다.
시스템 FMECA: 생산 라인과 같은 대규모 시스템 수준에서 잠재적 문제를 찾는다.
FMECA에는 두 가지 접근 방식이 있다.
Bottom-up 방식은 하드웨어 중심 접근이다. 가장 낮은 레벨의 부품부터 분석을 시작해 상위로 확장해 나간다. 모든 부품을 다루면 분석이 완료된다.
Top-down 방식은 기능 중심 접근이다. 시스템의 주요 기능에서 출발하여 어떤 고장이 발생할 수 있는지를 연구한다. 치명적인 기능 고장을 먼저 찾는 데 유리하며, 기존 시스템의 문제 영역에 초점을 맞출 때 자주 활용된다.
FMECA를 시작하려면 먼저 충분한 입력 자료가 필요하다. 시스템 블록 다이어그램, 회로도, 부품 목록(BOM), 기능 명세서 같은 설계 자료가 기본이 된다. 여기에 실제 사용 환경 정보, 과거 고장 이력, 시험 결과, 그리고 신뢰성 데이터베이스 같은 참고 자료가 더해져야 분석이 현실성을 가진다. 또한 신뢰성 요구사항이나 규제 문서 같은 기준도 필수적이다.
다음으로 중요한 것은 분석팀이다. FMECA는 다양한 관점이 모여야 제대로 된 결과가 나온다. 설계 엔지니어는 시스템의 구조와 기능을 설명하고, 품질·신뢰성 엔지니어는 고장 메커니즘과 데이터를 해석한다. 생산 및 공정 담당자는 제조 과정에서 생길 수 있는 문제를 짚어주며, 시험 엔지니어는 검출 가능성을 판단한다. 실제 현장에서 장비를 다루는 운영·정비 인력의 경험도 큰 도움이 된다.
분석을 정리하기 위한 도구와 포맷도 필요하다. 보통 FMEA/FMECA 표 형식을 사용해 고장형태, 원인, 영향, 검출방법, 심각도, 발생도, 검출도, 그리고 치명도(Criticality)를 기록한다. 계산은 보통 발생빈도, 영향, 검출 가능성을 조합해 치명도 지표를 산출하는 방식으로 이루어진다. 이를 엑셀 같은 범용 도구나, 전용 소프트웨어를 활용해 관리하기도 한다.
이 과정에서 빠질 수 없는 것이 평가기준이다. 심각도(Severity), 발생도(Occurrence), 검출도(Detection)를 각각 어떤 기준으로 점수화할지 미리 정의해야 한다. 예를 들어 심각도는 “치명적(Catastrophic) → 위험(Hazardous) → 주요(Major) → 경미(Minor)” 같은 단계로, 발생도는 실제 확률을 반영한 등급으로 정한다. 검출도 역시 현장의 점검·진단 절차를 기준으로 평가해야 한다.
마지막으로, 프로세스와 추적 체계가 필요하다. 분석은 시스템을 분해하고, 고장형태를 식별하고, 영향을 분석하며, 치명도를 평가하는 순서로 진행된다. 이후 개선조치를 정하고, 각 조치별 책임자와 기한을 명확히 해야 한다. 무엇보다 분석 과정과 결정 사항은 문서로 남겨야 한다. 그래야 설계 변경이 발생하거나 추후 사고가 일어났을 때 중요한 참고 자료로 활용할 수 있다.
결국 FMECA를 하려면 자료, 사람, 도구, 기준, 절차가 모두 갖추어져야 한다. 이 다섯 가지가 균형을 이룰 때, 분석은 단순한 문서 작업을 넘어 실제 안전성과 신뢰성을 보장하는 강력한 도구가 된다.
FMECA는 단순히 표를 채우는 작업이 아니라, 일정한 절차에 따라 체계적으로 진행된다. 가장 먼저 해야 할 일은 시스템을 분해하고 범위를 정의하는 것이다. 어떤 수준까지 분석할지(시스템, 하위 서브시스템, 개별 부품)를 정해야 효율적인 결과를 얻을 수 있다.
다음 단계는 고장형태(Failure Mode) 식별이다. 각 부품이나 기능이 어떤 방식으로 고장 날 수 있는지 가능한 한 구체적으로 나열한다. 예를 들어 전자 부품이라면 단선, 단락, 성능 저하 같은 형태가 될 수 있다.
고장형태를 찾았다면 그 고장이 가져올 영향(Effect)을 분석한다. 이는 고장으로 인해 해당 부품, 상위 시스템, 나아가 전체 시스템이 어떤 문제를 겪게 되는지를 의미한다. 작은 부품의 고장이 안전성이나 임무 달성에 직접적인 영향을 줄 수도 있다.
영향이 확인되면, 각 고장에 대해 심각도(Severity), 발생도(Occurrence), 검출도(Detection)를 평가한다. 여기까지는 일반적인 FMEA와 같지만, FMECA에서는 추가로 치명도(Criticality) 분석을 수행한다. 치명도는 발생 가능성과 영향도를 결합해 그 고장이 전체 시스템에 얼마나 중요한 영향을 미치는지를 수치로 표현한다. 이 단계에서 우선적으로 해결해야 할 문제가 명확해진다.
평가가 끝나면 개선 대책을 마련한다. 설계 변경, 재질 개선, 이중화, 품질 관리 강화, 정비 절차 보완 등 다양한 방법이 사용될 수 있다. 중요한 점은 단순히 대책을 제안하는 데 그치지 않고, 책임자와 일정, 검증 방법을 명확히 기록해야 한다는 것이다.
마지막으로, 모든 결과를 문서화한다. 작성된 FMECA 표는 향후 설계 변경이나 운영 중 발생하는 고장 분석에 활용될 수 있으며, 시험 계획이나 유지보수 전략을 세울 때도 중요한 참고 자료가 된다.
정리하면, FMECA의 과정은
① 시스템 분해 및 범위 정의 → ② 고장형태 식별 → ③ 영향 분석 → ④ 심각도·발생도·검출도 평가 → ⑤ 치명도 분석 → ⑥ 개선 대책 마련 → ⑦ 문서화 및 추적 관리
이 순서로 이어진다.
FHA(Functional Hazard Analysis)는 시스템의 ‘기능’이 실패하면 무슨 일이 벌어지는가를 묻는다. 예를 들어 “제동 기능이 사라지면?”이라는 질문이 FHA의 출발점이다. 하지만 FMECA는 기능보다 더 구체적인 ‘부품 수준의 고장’에서 시작한다. “브레이크 오일 씰이 마모되면?” 같은 질문을 통해, 작은 고장이 어떤 연쇄 반응을 만들지 살핀다.
FTA(Fault Tree Analysis)와 비교해 보면, 관점 자체가 다르다. FTA는 특정 사고나 장애를 결과에서 시작해 원인을 역추적하는 방식이다. 마치 사고 현장을 조사하는 탐정처럼, 최종 사건을 정해 놓고 그에 이르는 모든 가능한 원인을 트리 형태로 도출한다. 반대로 FMECA는 가능한 모든 고장을 먼저 나열하고, 그 고장이 시스템 전체에 어떤 영향을 끼칠지 미리 예측한다는 점에서 더 예방적인 접근이다.
정리하면, FMECA는 예방적이고, 부품 단위에서 출발하며, 치명도를 반영해 우선순위를 제시한다는 점에서 다른 분석과 구분된다. 다른 방법들이 특정 사고를 추적하거나 기능 단위에서 접근한다면, FMECA는 작은 고장에서 큰 사고로 번지기 전에 미리 위험을 차단하는 데 더 특화되어 있다.
사고는 언제나 거대한 폭발처럼 다가오지만, 그 뿌리는 작은 균열 속에 숨어 있다. FMEA는 그 작은 신호를 미리 듣는 귀와 같으며, 부품 하나하나의 목소리를 놓치지 않는 태도가 곧 안전의 출발점이다.
할아버지가 말했던 “나사 하나”는 단순한 비유가 아니다. 시스템 안전에서는 작은 부품, 작은 절차, 작은 신호가 결국 사람의 생명과 직결된다. 그래서 설계 초기, 수많은 가능성 속에서 더 안전한 선택을 해야 할 때, 우리는 반드시 체계적인 방법을 가져야 한다.
그 역할을 하는 것이 바로 FMECA다. FMECA는 작은 고장의 목소리를 기록하고 분석하여, ‘사고가 나기 전에’ 설계와 프로세스를 바꾸게 해 준다. 단순히 위험을 나열하는 데서 끝나지 않고, 어떤 고장이 가장 치명적인지, 무엇을 우선적으로 해결해야 하는지를 알려준다.
만약 FMEA가 시스템을 세밀히 진단하는 의사라면, FMECA는 환자의 상태를 단계별로 나누어 “지금 당장 어디를 치료해야 하는가”를 알려주는 지도와 같다. 결국 안전은 거대한 구조물이 아니라, 작은 부분을 허투루 보지 않는 태도에서 시작된다. 그리고 FMECA는 그 태도를 실무로 이어주는 가장 강력한 도구다.