ESG
Determinants and forecasting of corporate greenwashing behavior
기업의 그린워싱 행동의 결정 요인 및 예측
1. 연구 목적과 배경
• 투자자와 이해관계자들 사이에서 기업 그린워싱에 대한 우려가 급증하고 있음(EY 2024 설문에서 85%가 “5년 전보다 더 큰 문제”라고 응답). 
• 그린워싱은 환경 성과를 실제보다 좋게 왜곡하는 행동으로, 기업은 자신의 진짜 환경성과를 알지만 외부 이해관계자는 나중에야 알게 되는 정보비대칭 문제를 야기함.
• 그 결과, 소송·평판 하락·주가 급락 등의 재무·비재무 리스크가 발생할 수 있음. 
이 논문의 핵심 목표는 두 가지야.
1. 어떤 기업 특성이 그린워싱과 관련되어 있는지(결정요인)를 실증적으로 밝히고
2. 이러한 요인을 바탕으로 그린워싱 위험을 예측하는 머신러닝 모델을 구축하는 것.
2. 이론적 기반 정리
2-1. 사용된 주요 이론들
논문은 그린워싱을 이해하기 위해 네 가지 이론을 같이 쓰고 있어. 
1. 제도이론 (institutional theory)
• 기업은 산업 규범, 법·규제, 동종 기업의 행동 등 제도적 압력(규범적·강제적·모방적)에 노출되어 있음.
• 실질적인 환경 개선은 비용이 크고 복잡하니까, 상징적 행동(예: 과장된 친환경 커뮤니케이션)으로 대응하려는 유인이 생김.
2. 정당성 이론 (legitimacy theory)
• 기업은 사회적 기대에 부합해야 “정당성”을 유지할 수 있음.
• 실제 환경성과가 기대에 못 미칠 때, 이미지와 현실의 격차를 메우기 위해 그린워싱을 활용할 수 있음. 
3. 이해관계자 이론 (stakeholder theory)
• 기업은 투자자, 고객, 직원, 공급업체, 규제기관, NGO 등 다양한 이해관계자의 요구를 동시에 관리해야 함.
• 이런 이해관계자에게 “괜찮은 환경성과”를 보여주기 위해 선택적·과장된 ESG 정보 공개를 할 수 있음. 
4. 신호 이론 (signaling theory)
• 기업은 자신만 알고 있는 내부 환경성과를 외부에 신호로 전달해야 함.
• 이때, 그린워싱은 실제보다 좋은 신호를 보내는 왜곡된 신호 전략으로 작동할 수 있음. 
2-2. 그린워싱 결정요인 카테고리
이론들을 바탕으로 저자들은 기업 특성을 다섯 가지 카테고리로 묶어 설명해. 
1. Green reputation (녹색 평판)
• ESG 점수, 환경(E) 점수, ESG 공시 점수, 배출 강도 등
• 친환경 이미지가 강하면 감시도 강해지고, 그 이미지를 방어하기 위해 오히려 그린워싱 유인이 커질 수 있음.
2. Size and visibility (규모와 가시성)
• 기업 규모, 애널리스트 커버리지 등
• 클수록 사회적·미디어의 주목을 많이 받아 상징적 책임경영 커뮤니케이션에 의존할 가능성이 커짐.
3. Capital dependency (자본 의존도)
• 현금/자산, 레버리지, 투자(Capex) 등
• ESG 민감한 투자자에게 자본을 얻기 위해 지속가능성 이미지를 과대 포장할 수 있음.
4. Risk and return (위험·수익 특성)
• ROA, 이익 변동성, 주가 변동성, 시장가치/장부가 비율 등
5. Other factors (기타 요인)
• 자본집약도, 지배구조(지분 집중도), 해외매출 비중 등
• 자본집약도가 높을수록 환경 리스크도 크고, 그에 따라 선택적 공시·그린워싱 동기가 커진다는 선행연구를 인용.
3. 데이터와 그린워싱 측정 방법
3-1. 표본 구성
• 대상: STOXX Europe 600 편입 기업
• 기간: 2011–2023년
• 초기 1,031개 기업에서 시작해 데이터 결측 등을 제거한 최종 표본은
• 기업-연도 6,654개 관측치,
• 746개 개별 기업,
• 이 가운데 377개 기업-연도는 그린워싱 혐의가 존재, 나머지는 0으로 처리.
3-2. 그린워싱 지수(Severity Score) 구축
1. 그린워싱 사례 수집
• 8명의 리서치 어시스턴트가 웹 검색엔진, NGO 웹사이트, X(트위터) 등에서 기업별 그린워싱 비판/고발 사례 1,254개를 수집. 
• 중복·질 낮은 사례 356개 제거 후, 최종 898개 정보원 남김.
2. 심각도 평가
• 4명의 연구자가 각 사례를 0(그린워싱 아님) ~ 1(심각한 그린워싱) 사이 점수로 평가, 평균을 기업별·연도별 점수로 사용.
• 한 기업이 한 해에 여러 건의 혐의를 가진 경우 해당 연도 최고 점수를 사용. 
3. 패널 데이터 구성
• 연속적인 그린워싱 행태가 있는 기업은 비어 있는 연도에 대해 보간(interpolation)을 실시해 연속성을 반영(43개 기업-연도 추가).
3-3. 산업별 그린워싱 현황
• 그린워싱 혐의 비중이 높은 산업
• Consumer discretionary(소비재) 29.4%
• Consumer staples(필수소비재) 16.2%
• Basic materials(기초소재), Industrials(산업재), Utilities(유틸리티), Energy(에너지) 합쳐 약 50%를 차지. 
• 평균 그린워싱 심각도(%)는
• Basic materials 79.0%,
• Energy 76.8%,
• Utilities 75.6% 등 고배출·자원집약 산업에서 특히 높음. 
4. 그린워싱 결정요인 실증결과
4-1. 분석 방법
• 종속변수: 그린워싱 severity score (0~1)
• 특성: 점수가 0에 모여있는 왼쪽 검열(left-censored) 데이터이므로
• Tobit 모형을 기본으로 사용,
• 비교를 위해 OLS 회귀도 함께 제시.
• 통제: 연도, 산업, 국가 더미 고정효과 포함.
4-2. ESG/환경 점수와 그린워싱의 U자형 관계
가장 중요한 결과는 ESG 점수·E 점수와 그린워싱 간의 “U자형 곡선 관계”야. 
• ESG 점수의
• 선형항(ESG)은 음(-),
• 제곱항(ESG²)은 양(+)이며 유의하게 양 U자형
• E 점수도 동일하게
• E는 음(-),
• E²는 양(+)으로 유의 환경 점수(E)와 그린워싱도 U자형.
해석
• ESG/E 점수가 매우 낮은 기업
• 환경 성과가 나쁜 기업은 정당성 위협을 받기 때문에 상징적 친환경 커뮤니케이션(그린워싱)에 의존할 유인이 큼.
• ESG/E 점수가 매우 높은 기업
• “ESG 우수 기업”이라는 녹색 평판(green reputation)을 지키기 위해
• 실제 성과가 기대에 못 미칠 경우 과장·선택적 공시로 이미지를 유지하려는 그린워싱을 할 수 있음.
논문에 따르면 이 U자형 곡선의 꼭짓점(최저점)이 0.5 이상에 위치해, 평균 이하 ESG/E 점수를 가진 기업들은 상대적으로 그린워싱 위험이 더 높다는 점도 보여줌. 
4-3. ESG 공시 점수, 배출, 규모 등의 영향
1. ESG Disclosure Score (공시 수준)
• 모든 모형에서 양(+)의 유의한 계수
• ESG 공시가 많을수록 그린워싱 심각도가 높게 나타남. 
• 해석:
• 공시가 많다는 건 “우리가 ESG를 잘한다”는 이미지를 강하게 밀어붙이는 전략일 수 있고,
• 이 과정에서 실제성과와 이미지 간 갭이 커지면 그린워싱 리스크가 증가할 수 있다는 의미.
2. 온실가스 배출(GHG intensity) 
• Scope 1(직접배출): Tobit 모형에서 일관되게 양(+)·유의 직접배출이 많은 기업일수록 그린워싱 심각도가 높음.
• Scope 2(간접 전력배출): 일부(2017년 이후 표본)에서 음(-)·유의.
• Scope 3은 통계적으로 뚜렷한 영향 없음.
• 특히 Scope 1 양(+)는 배출이 눈에 잘 보이는 기업일수록 이미지 방어를 위해 상징적 환경 커뮤니케이션을 사용할 수 있음을 시사.
3. 규모(Size)와 가시성
• 기업 규모(자산 log)는 모든 모형에서 강하게 양(+)·유의.
• 애널리스트 커버리지는 직접적으로는 유의하지 않지만, 규모 변수 제거 시 유의해짐 규모와 가시성 효과가 겹쳐 있음. 
• 결론: 큰 기업일수록, 더 눈에 띄는 기업일수록 그린워싱 위험이 높다.
4. 자본 의존도 – 현금/자산 (Cash-to-assets)
• 양(+)·유의: 내부 유동성이 큰 기업이 그린워싱을 더 많이 한다. 
• 해석:
• 잉여현금이 많으면, 실질 개선보다 상징적 ESG 활동(광고, 보고서, 캠페인)으로 “이미지 장사”를 할 수 있다는 Free cash flow 가설과 부합.
5. 자본집약도(Capital intensity)
• 양(+)·유의: 자본집약적 기업일수록 그린워싱 심각도가 높음. 
• 환경 피해 가능성이 크고 규제·감시도 높기 때문에 선택적 공시·이미지 관리형 커뮤니케이션 동기가 강하다는 선행연구와 일치.
6. 기타 변수들
• 레버리지, ROA, 수익성·변동성, 마켓-북 비율, 지분집중도, 해외매출 비중 등은 일관되게 유의하지 않음 그린워싱은 재무구조보다는 ESG 평판·규모·자본집약도·현금 여유에 더 밀접. 
5. 산업별 그린워싱 패턴
산업 고정효과 대신 산업 더미를 직접 넣어서, 어떤 산업이 다른 산업 대비 그린워싱이 많은지를 비교.
1. 소비자 대상(B2C) 산업의 높은 그린워싱
• 기준 산업을 Consumer discretionary 혹은 Consumer staples로 두면,
• 대부분 다른 산업의 계수는 음(-)·유의
• 소비재·필수소비재 산업이 다른 산업보다 그린워싱 수준이 높다는 의미.
• 고객 접점이 많고 브랜드 이미지가 중요하기 때문에, “친환경 마케팅”과 그린워싱이 함께 증가하는 구조로 해석.
2. 통신·부동산·테크 산업의 낮은 그린워싱
• Telecommunications, Real estate, Technology는 다른 산업 대비 그린워싱 정도가 낮은 것으로 나타남.
• 다만 이 산업에서의 그린워싱 관측치가 매우 적어(각 1~3개 연도 관측) 해석 시 주의 필요.
3. 환경 외부효과가 큰 산업(기초소재·유틸리티)의 높은 그린워싱
• Basic materials, Utilities는 통신·테크·부동산·헬스케어 대비 그린워싱 심각도가 높음.
• 그러나 에너지·산업재 등에서는 혼합된 결과가 나와,
• “고배출·고환경영향 산업 = 그린워싱 많다”라는 가설은 부분적으로만 지지됨.
6. 그린워싱 리스크 예측(머신러닝) 분석
6-1. 경제적 손실함수 프레임워크
논문은 단순 정확도가 아니라, 예측 오류의 경제적 비용을 고려하는 손실함수를 정의해.
• FN(거짓 음성): 실제 그린워싱인데 놓치는 경우
• 투자자에게는 평판 리스크·주가 충격·규제 리스크로 이어짐 비용이 매우 큼.
• FP(거짓 양성): 실제는 아닌데 그린워싱이라고 분류
• 기회비용(투자 제외, 재검토 비용) 정도 상대적으로 작음.
그래서 기대 손실을
EL = FN \cdot c + FP \cdot (1-c)
로 두고, 이를 recall(재현율 R)과 specificity(특이도 S)로 변환해서 가중 평균 w·R + (1-w)·S를 최대화하는 방식으로 최적의 모델과 분류 임계치를 선택함.
• 예시: c=0.99, q(그린워싱 비중)=0.05일 때 recall 가중치 w 0.84
재현율을 훨씬 더 중시하는 비용 구조.
6-2. 데이터 구성과 피처
• 기간: 2012–2022년 데이터를 학습·검증, 2023년을 완전한 외부 검증(Validation) 세트로 사용. 
• 타깃: Greenwashing severity score > 0 이면 1(그린워싱), 아니면 0
• 데이터 불균형: 양성(그린워싱) 비중 약 6%에 불과. 
• 피처(feature):
• 앞서 사용한 기업 특성(ESG 점수, 공시, 배출, 재무, 규모, 자본집약도 등)
• 여기에 과거 환경 관련 기업 스캔들·위반 이력(RepRisk, LSEG 등)과
• 1년 전 그린워싱 severity score(지연값)를 추가.
6-3. 사용한 머신러닝 모델
다양한 전통·딥러닝 모델을 비교. 
• 로지스틱 회귀(Logistic Regression)
• 랜덤 포레스트(Random Forest)
• KNN, SVM, 의사결정나무(Decision Tree), 그래디언트 부스팅(Gradient Boosting)
• FNN (Feedforward Neural Network)
• RNN (Recurrent Neural Network)
• LSTM (Long Short-Term Memory)
클래스 불균형은 ClassWeights, Up-sampling, ROSE 등 다양한 기법으로 보정.
6-4. 테스트·검증 결과
1. 테스트 세트(2012–2022) 성능 
• 모든 모델이 “그린워싱 비중만 보고 랜덤 예측”하는 no-information benchmark보다 훨씬 높은 성능.
• 비용비중이 매우 높은 경우(c=0.99, FN 비용이 FP보다 99배)
• RNN이 최고 성능:
• 재현율(Recall) 0.98, 특이도(Specificity) 0.58
• 즉 그린워싱 사례의 98%를 잡아내면서 비그린워싱 기업의 58%를 제대로 음성으로 분류. 
• 중간 수준 비용(c=0.90)에서도 RNN이 가장 높은 가중 정확도(TF)를 기록.
2. 검증 세트(2023년 실제 데이터) 
• 여기서도 RNN 및 다른 모델들이 단순한 Naive 예측(“2022년과 동일할 것”)과 no-information benchmark보다 명확히 우수.
• 고비용 환경(c=0.99)에서
• RNN: 재현율 1.00(모든 그린워싱 사례 포착), 특이도 0.464
• FNN도 재현율 1.00, 특이도 0.379
• 중간 비용(c=0.90)에서는 랜덤포레스트, 로지스틱, RNN, LSTM 등이 균형 잡힌 성능을 보임.
3. Feature importance (SHAP 분석)
• RNN 모델에서 그린워싱 예측에 가장 중요한 변수는: 
1. ESG Disclosure Score(공시 수준)
2. Energy management 관련 이슈(환경 관리 이슈)
3. 1년 전 그린워싱 severity score
4. 기업 규모(Size)
• 이들 변수 값이 높을수록 그린워싱으로 분류될 확률을 크게 끌어올리는 요인으로 나타남.
7. 논문의 실무·정책적 시사점
논문 마지막에서 저자들이 강조하는 포인트를 정리하면:
1. “ESG 점수 높으니까 안전하다”는 생각은 위험
• ESG/E 점수가 높거나 낮은 기업 모두 그린워싱 위험이 크다는 U자형 관계가 확인되었기 때문에
• 단순히 “ESG Top 기업”이라고 무비판적으로 신뢰하면 안 된다는 메시지. 
2. ESG 공시가 많을수록 그린워싱 리스크도 높을 수 있음
• disclosure score가 그린워싱과 양(+)의 관계를 보였다는 점은
• “공시가 많다 = 투명하고 진정성 있다”가 아니라
• 과장·브랜딩형 공시일 가능성도 염두에 둬야 한다는 의미. 
3. 소비자 접점이 많은 산업·고배출 산업에 대한 감시 강화 필요
• 소비재·필수소비재, 기초소재, 유틸리티 등에서 그린워싱이 많이 나타났기 때문에
• 소비자 보호, 광고 규제, 환경 공시 규제를 이 산업에 집중하는 것이 합리적일 수 있음.
4. 기계학습 기반의 그린워싱 조기경보 시스템 가능성
• RNN 등 모델을 활용해 기업의 미래 그린워싱 위험을 확률적으로 예측할 수 있고,
• 이를 투자자(ESG 펀드), 은행, 정책기관, 규제기관이
• 투자/대출 심사, ESG 펀드 편입, 감독·검사 대상 선정 등에 활용할 수 있음을 제안. 
5. 정책 입안자에게 주는 메시지
• 규제기관은
• 그린워싱 사례 데이터베이스를 체계적으로 구축하고
• 논문에서 제안하는 것과 같은 코스트 기반 예측모형을 설계하면
• 그린워싱 기업을 선제적으로 식별하고,
• 더 정교한 ESG 공시 규제·감사를 설계하는 데 도움을 받을 수 있음.
8. 요약 버전
• 그린워싱은 ESG 점수 낮은 기업뿐 아니라, 오히려 ESG 점수가 높은 “친환경 리더” 기업에서도 많이 나타난다.
• ESG 공시를 많이 하고, 규모가 크고, 현금이 많고, 자본집약적일수록 그린워싱 위험이 커지는 경향이 있다.
• 소비자 대상 산업과 일부 고배출 산업이 특히 그린워싱에 취약하며, RNN 등 머신러닝 모델로 그린워싱 위험을 상당히 높은 정확도로 예측할 수 있다.
Source :
Eckberg, J., Dorfleitner, G., Kathan, M. C., & Utz, S. (2026). Determinants and forecasting of corporate greenwashing behavior. Journal of Economic Behavior and Organization, 241, 107354. https://doi.org/10.1016/j.jebo.2025.107354
#jcncchatesgx
#esg창업
#기술창업
#제이씨앤컴퍼니
#esg컨설팅
#ESG보고서
#기후테크
#지속가능보고서
#그린워싱