그런데 이제 도구변수를 곁들인
Monash University R. Sweeney 교수의 The impact of health sector-wide approaches on aid effectiveness and infant mortality (2021)
https://doi.org/10.1002/jid.3548
1. 보건의료원조(health aid)가 인구집단의 건강에 긍정적 영향을 미쳤을까?
- 혼재된 결과, 하지만 SWAP이라는 사업 형태의 본격적 도입 이후라면 어떨까?
보건의료원조가 예방접종률, 질병 유병률, 영아/아동사망률, 특정 질병 사망률 및 기대여명에 긍정적인 영향을 미친다는 사실들이 다수의 연구들을 통해 확인되었지만, 어떤 연구들에서는 특정 원조형태에서만 효과가 있거나 (Han&Koenig-Archibugi, 2015; Wilson, 2011), 특정 시기(Herzer&Nagel, 2015) 등에서만 효과가 있고 이외에는 보건의료원조가 그닥 큰 효과가 없다고 알려져 있다.
그러나 여태까지 실시되었던 대체적인 보건의료원조 사업들의 효과는 SWAP(sector-wide approach) 사업이 본격적으로 시작되기 이전의 데이터를 활용한 경우(1993년 이전)이거나 '원조효과성' 측면에서 대두되었던 SWAP 사업의 본격적인 도입 이전에 활성화된 경우가 많았다. 이러한 근거로 SWAP이 본격적으로 대두되었던 시기 이후의 데이터를 사용해서 이를 살펴봐야할 필요가 있다고 하였다.
R. Sweeney는 이를 위하여 원조 효과성과 관련하여, 우리는 보건 원조 또는 보건 분야 개발원조(DAH)가 SWAp 환경에서 전달될 때, 그렇지 않고 개별 프로젝트 기반 원조가 이루어지는 환경보다 인구 건강(영아사망률로 측정)에 더 큰 개선 효과를 가져올 것이라는 가설을 세운다. 또한, 영아사망률과 관련하여, 보건 부문에서 기부자 및 기부금 조정을 위한 SWAp의 활용이 보건 원조의 효과성 개선 외에 추가적인 영아사망률 개선 효과를 유발할 수 있다는 가설을 제시한다.
이러한 가설들을 검증하기 위해, 본 연구는 1990년부터 2016년까지의 패널 데이터를 활용하여 SWAp을 시행한 국가와 시행하지 않은 통제 국가 각각 68개국을 잘 짝지은 샘플로 구성하고, 고정효과(FE) 및 고정효과 도구변수(FE-IV) 모형을 추정하고자 하였다고 연구의 목적을 밝혔다.
2. 그렇다면 SWAP이란 무엇인지?
SWAP이라 함은 1990년대에 poor coordinated aid에 대한 비판의 일환으로 생겨난 원조형태다. 1990년대는 보건의료분야 원조가 급격히 증대되던 시기였는데(Piva & Dodd, 2009; Ravishankar et al., 2009) 원조의 중복성이나 수원국 정부와의 코디네이션 문제로 공여국들은 상당한 어려움을 겪었다(Walt et al, 1999). 이런 프로젝트 중심의 원조는 도너들로부터 많은 비판을 받았다(Dieleman et al, 2014).
그래서 바로 SWAP이라는 게 생겨났다.
SWAp(Sector-Wide Approach)는 분절적이고 중복된 프로젝트 기반 원조의 가장 심각한 문제를 해결하기 위해 고안되었으며, 개발 파트너들 사이에서 원조 효과성 원칙을 이행하기 위한 메커니즘으로 널리 채택되었다. SWAp 프레임워크 하에서는, 보건 분야 자원(DAH 포함)이 비효율을 최소화하고 수원국의 보건 전략을 가장 효과적으로 실행할 수 있도록 전략적으로 배분된다. 기술적 효율성(technical efficiency)의 향상은 중복 제거, 보고 요건의 조화, 수원국 정부의 모니터링 및 책임성 체계 활용 등을 통해 이루어질 것으로 기대되었다(Brown et al., 2001; Jefferys & Walford, 2003). 자원의 배분 효율성(allocative efficiency)의 향상은 원조가 수원국의 보건 우선순위 및 질병 부담에 보다 정합적으로 연계됨으로써 달성될 것으로 기대되었다(Garner et al., 2000; Hill, 2002).
본 연구에서는 인구 건강 지표로 영아사망률(IMR)을 사용하였다. 이는 건강수명(HLE)과 같은 사망률과 이환율의 복합지표보다 다양한 국가에 대해 장기간 연도별 자료를 확보할 수 있다는 점에서 우월하며, 특히 빈곤층 관련 조건에 대해 생명 기대치나 아동 및 모성 사망률 등의 다른 인구 건강 지표보다 더 신뢰할 수 있고 민감한 지표로 간주된다(Mishra & Newhouse, 2009).
Sweeney가 SWAP에 대해 전제하는 것은, 그가 수행한 선행연구에서 주장한 것처럼 SWAP의 도입은 수원국에 들어가는 보건원조금이 국내 보건 지출을 대체하거나 crowd out하는 현상을 줄일 수 있으며, 결과적으로 증가한 총보건지출은 보건의료원조 수준에 비례할 것이라는 거다(Sweeney et al, 2018). 따라서 Sweeney는 보건의료원조 또는 해당 국가의 보건의료지출 수준이 높을수록 더 큰 SWAP 효과를 기대할 수 있다는 것이다.
그러나 이러한 관계는 반드시 일부 기술적 효율성 향상 항목에는 적용되지 않을 수 있다. 예컨대, 보건서비스 중복 감소 및 다수의 기부자 관리를 줄임으로써 확보된 자원의 금전적 가치는 SWAp 시행 이전 시기의 기부자 수, 계약 건수, 또는 프로젝트 수에 따라 달라질 수 있으며, DAH 및/또는 GHE의 절대 규모와는 무관할 수 있다. 마찬가지로, ‘기부자 이탈(donor-flight)’에 따른 DAH 감소는 SWAp 시행 이전의 기부자 분산도(fragmentation) 수준에 따라 달라질 수 있으며, DAH 및/또는 GHE의 금전적 규모 자체보다는 이러한 구조적 특성에 더 민감할 수 있다(Sweeney et al., 2014a).
OECD 개발원조 효과성 실무그룹(OECD Working Party on Aid Effectiveness, OECD, 2012)은 탄자니아, 말라위, 네팔, 말리, 에티오피아에서의 경험을 바탕으로 SWAp 도입 사례를 인용하였다. 각 사례에서 SWAp 시행은 보건 지표와 사망률, 특히 모성·신생아·아동 건강 측면에서의 개선과 연관된 것으로 나타났다(OECD, 2012; Vaillancourt, 2009). 반면, 다른 연구들은 SWAp이 여러 과정지표에서 기대에 미치지 못했으며, 이에 따라 건강 성과 개선에 대한 기대치가 낮아졌다고 평가한다. 예를 들어, 경험적으로 기부자들은 수원국의 재정 관리 및 책임성 시스템 사용을 꺼려할 수 있으며, 풀링된 기금이 반드시 정부 역량을 강화하는 것은 아니며, SWAp이 반드시 1차 보건서비스(‘frontline’ services)에 대한 지출을 증가시켰다고 보기도 어렵다는 지적이 있다(Chansa et al., 2008; McNee, 2012; Vaillancourt, 2009).
3. SWAP이 IMR(영아사망률)에 미치는 영향을 알아보기 위한 경로 설정
1) 보건원조의 건강효과 증가 (SWAP이 원조효과성에 미치는 조절 효과)
- 이 부분은 SWAP이 분배적 효율성을 개선한다는(Box B) 메커니즘 또는,
- SWAP이 수원국정부의 보건지출의 crowd out을 막을 수 있다는 잠재성을 지닌다는(Box C) 로 파악할 수 있을 것.
2) 국내 자원의 활용 확대, 국내 자원이 건강 성과로 전환되는 효율성 증가, 그리고 보건원조의 규모와 무관한 기타 SWAP 효과 를 통해 알아보았다.
4. 방법론
진짜로 SWAp 덕분에 IMR이 줄었는지 확인하려면, 단순 비교만으론 안 된다. 왜냐면
원조가 많이 들어가는 나라 = IMR이 높은 나라일 수도 있다.
IMR은 시간이 지나면 자연스럽게 줄 수도 있어서, 착각할 수도 있다.
어떤 나라가 SWAp을 도입하는지도 우연이 아님. 경제력, 정치 조건 등 여러 변수들이 관련됨
이에 단순 비교 대신 통계학 기법들을 써서 "진짜로 SWAp 때문인지"를 따져보았다.
1) 이중차분(DID) : SWAP 도입 전과 후의 변화를 보고, 그것을 SWAP 미도입국의 같은 시기 변화와 비교해서 SWAP의 인과적 효과 추정
* gamma1 : SWAP 도입의 자체적인 효과
* gamma2 : SWAP이 DAH의 효과를 얼마나 증폭시켰는지 보는 항(상호작용)
그러나 식에서 r1과 r2를 일관되게 추정하려면, SWAp 도입국(처치군)과 비도입국(통제군)이 SWAp이 없었더라도 유사한 IMR 추세를 보였을 것이라는 가정이 필요하다. 사전 분석 결과, SWAp 도입국은 비SWAp 원조 수원국 평균보다 1인당 GDP가 낮고 IMR이 높았으며, 이는 공통 추세 가정을 위협할 수 있다. 이를 해결하기 위해, 사전 특성(초기 IMR, 기대수명, 1인당 GDP, DAH 수준, 기부자 수(기부자 부담 proxy), 인구, 지역 등)에 기반하여 SWAp 도입 가능성을 추정하는 로짓 모형을 통해 성향 점수를 산출하고, 이를 기반으로 잘 매칭된 SWAp 도입국과 통제국으로 주 분석 샘플을 구성하였다.
매칭은 커널 매칭(kernel matching)을 활용하였고, IMR, 기대수명, SWAp 상태, DAH, 인구, 1인당 GDP 등에 대해 27개 연도 중 최소 19개 연도 이상의 완전한 연간 자료가 존재하지 않는 국가는 제외하였다. 중국과 인도는 국가 규모가 지나치게 크고 국가 차원의 SWAp 시행 가능성이 낮기 때문에 모든 분석에서 제외되었다.
4-1. Sweeney가 사용한 도구변수
해당 연구를 할 때 가장 치명적이었던 점은 DAH가 IMR에 영향을 준다고 주장할 수 있을까? 아니면 IMR이 높아서 DAH가 들어온 것일까? 라는 것이었다. 바로 내생성 문제가 발생한 것인데, 이를 해결하고자 도구변수 기법을 쓰기로 했다.
도구변수를 적용한 대상은 다음과 같다. 위의 식에서 log(DAH/capita) (1인당 보건원조) 및 SWAP * log(DAH/capita) (SWAP 상태에서의 원조효과 상호작용)을 살펴본 대상 항들이었다.
그럼 저자가 채택한 도구변수는 다음과 같다.
(1) DAH의 시차를 활용 : log(DAH/capita)에 적용
- 과거의 DAH는 지금의 DAH 예측엔 도움이 되지만, IMR에는 직접적인 영향이 없기 때문에 6~9년 전 DAH의 수치 (각 기간은 3년 평균 단위) 를 사용하였다.
(2) 공급측 결정요인 : "원조가 수원국 때문이 아니라, 공여국 사정 때문에 달라졌을 것" : log(DAH/capita)에 적용
해당 모든 변수들은 문화적 근접성(공용어 여부) 및 지리적 근접성(거리역수)로 가중치를 줘서 계산했다.
(3) 상호작용항 도구화 : SWAP * log(DAH/capita)에 적용
해당 상호작용항도 내생적이므로 도구변수가 필요했다. 이에 Wooldridge, 2010 이론을 기반으로, "내생 변수(D)와 외생 변수(Z)의 상호작용 D×ZD×Z는, D에 유효한 도구변수를 Z와 곱해주면 그것도 유효한 도구가 된다."에 따라 DAH 도구변수×SWAP 더미를 곱하여 새 도구를 만들었다.
(추가분석) SWAP 효과가 시간에 따라 또는 국가 특성(소득수준)에 따라 어떻게 달라지는지
Q1. SWAP을 도입하고 몇 년 지나야 효과가 나타날까? 점점 커지는가?
Q2. SWAP 효과는 소득수준이 낮은 나라일수록 더 큰가?
A1. SWAP 성숙도에 따른 효과 변화
기존 분석에서는 3년 평균값을 썼으나 해당 분석에서는 해마다 변화를 보기 위해 연도별 자료로 추정
도입 전에는 아무 효과 없어야 하고 (Γ2,Γ3 = 0),
→ 도입 후에는 시간이 지날수록 IMR 감소 효과가 커질 것으로 기대함 (Φ1~Φ6)
이 분석은 Granger 인과성도 같이 검정하는 효과가 있어서, 즉, “IMR이 먼저 줄고 나서 SWAp 한 게 아니라, SWAp이 먼저 도입됐기 때문에 줄었다”는 걸 확인하였다.
A2. 소득수준에 따른 SWAP 효과의 차이
- SWAP 도입 시점에서 저소득 또는 중하위 소득국
- 1990년 기준 소득 5분위 중 하위 2분위 국가들을 대상으로 다시 회귀분석하여 소득수준이 낮을수록 SWAP 효과가 효과가 더 큰지 확인하였다.
(추가) 강건성 검정
(1) 기존에 사용했던 커널 매칭이 아닌, 반경 매칭(radius matching)으로 바꾸어 재분석
: 반경매칭은 성향점수가 아주 비슷한 나라들끼리(0.01 이내)만 비교하는 방법
(2) 성향점수를 매칭하지 않고 분석
(3) SWAP 도입 연도가 명확하지 않을 수 있어, 도입 연도를 앞뒤로 바꿔보며 분석하거나 각 SWAP 도입국을 하나씩 빼면서도 분석
(4) 혹시 IMR이 높아서 SWAP을 한 것일수도 있으니, 도입 이전 시점에서 처치군(SWAP 국가)와 통제군(비SWAP 국가)의 IMR 추세가 비슷했는지 비교해보기 위해, 기존에 썼던 3년 평균 자료 대신 연도별 자료로 회귀식을 재추정
데이터 출처
보건 분야 SWAp의 도입 여부 및 도입 연도에 관한 자료는 기존의 SWAp 도입 효과 평가 연구(Sweeney et al., 2014a, 2014b)에서 추출하였다. 그 외 포함된 변수들의 데이터는 세계은행(World Bank), 세계보건기구(WHO), 보건지표연구소(IHME) 등 공개된 데이터셋에서 수집하였으며, 구체적인 출처는 부록의 표 A1~A3에 제시되어 있다. 이 데이터를 바탕으로 구축된 패널 데이터는 1990년부터 2016년까지의 기간을 포함한다.
5. 결과
1. 총 4개 모델을 분석한 결과
(1) DAH X SWAP 상호작용 : 유의미한 효과 없음 (SWAP 도입국에 DAH를 늘려도 IMR이 더 많이 줄지는 않았음)
(2) SWAP 자체 효과 : IMR이 약 8.1% 감소하였으며, 정부역량/부패/교육원조 통제시에도 7.5% 감소로 유지
(3) 절대효과 크기 : 평균 IMR(87.25명/1,000명) 기준 SWAP 도입시 IMR이 약 6.5-7명 감소
※ 기타 유의한 변수
- 정부역량이 표준편차 0.58 증가시 IMR 약 10.75% 감소
- 1인당 GDP 10% 증가시 IMR 1.3~1.4% 감소
2. 내생성 통제를 위한 도구변수 적용 분석
DAH의 내생성 가능성을 고려하여 도구변수(FE-IV) 분석을 수행한 결과, SWAp 도입의 IMR 감소 효과는 기존 고정효과 모형과 유사하게 나타났다. Lagged DAH를 도구로 사용한 경우, SWAp 도입은 영아사망률을 약 5.8~5.9% 감소시키는 것으로 추정되었다. 다만, 공급측 및 정치적 연관 변수들을 도구로 사용한 경우에는 도구의 약함(weak instrument)이 확인되어 해당 결과는 해석에서 제외되었다. 이는 본 연구 결과가 내생성 우려에도 불구하고 비교적 견고함을 보여준다.
3. Evolving SWAP effects
SWAP 도입 효과는 즉시 나타나지 않는다. SWAP이 시행된 후 4년 이상이 지나야 IMR에 유의미한 감소 효과가 나타났으며, 이는 SWAP 효과가 점진적으로 누적되며 시간이 지나야 건강지표개선으로 이어진다는 점을 시사하였다.
아울러 SWAP 도입 전에는 IMR 변화가 유의하지 않아 IMR이 먼저 줄어서 SWAP을 도입한게 아니라 SWAP이 먼저 도입되어 이후 IMR이 감소한 것임을 보여주었다.
내생성에 대한 우려도, 도입 전 두 그룹간 IMR 추세의 선행적 차이가 없어, SWAP 도입 결정이 사망률 변화에 의해 선택된 결과가 아닐 가능성이 높았다.
6. 결론
결과적으로 SWAP 도입은 평균적으로 8.1% 감소(고정효과 모형) / 5.8% 감소(도구변수 FE-IV 추정)하였으며, 시간이 지날수록 효과가 증가하였다. 특히 SWAP 시행후 4년 이상이 지나야 통계적으로 유의한 효과가 나타났다.
SWAP이 DAH에 비해 효과를 나타낸 것은 도너들간의 조정으로 보건부의 시간/인력/자원을 절감하여 행정 부담을 완화한 것과, 자국 재원(정부예산, 인력)의 효율적 재배분, 수혜국 주도의 보건계획 수립가능성 증가, 기존 프로젝트 기반 원조의 한계를 극복함으로써 일어난 것으로 정책적 함의를 들 수 있었다. 대신에, SWAP*DAH의 상호작용은 유의하지 않았다. 즉, SWAP이 DAH의 효과 자체를 크게 증폭시키지는 않았다는 것이다.
다만 해당 연구에도 한계가 존재하였으며, 1) SWAP을 이진변수로만 처리하여 정도나 품질을 반영하지 못했다는 점, 2) DAH 중 SWAP을 통해 전달된 비중 정보가 부족하여 메커니즘 분석에 한계가 존재했으며, 3) SWAP 시작시점에 대한 불확실성이 존재했다는 점(그러나 다양한 모델에서 강건성 확인)이 있었다. 즉, 완벽하지 않더라도, 보건분야에서 SWAp는 효과적이고 실행할 가치가 있는 접근법이다. 특히 SWAp의 구조적 특성과 정부 주도성 강화 메커니즘이 IMR 감소에 중요한 역할을 한다는 것이 본 연구의 결론이다.
강건성을 검증하기 위해 여러 방법을 사용했고, IV를 사용해서 SWAP과 IMR의 내생성을 해소하고자 했다. 결과적으로 SWAP의 IMR에의 긍정적 영향을 확인하긴 했으나, 이런 형태의 논문이 또 가능할지는. (디펜스하기가 쉽지 않을듯)