brunch

You can make anything
by writing

C.S.Lewis

by 드라이트리 Jan 31. 2024

Safety for AI

AI 활용에 있어서의 안전과 윤리에 대한 문제 살펴보기

AI 안전의 중요성


인공지능(AI) 기술의 급격한 발전은 우리 삶의 많은 영역에 혁신을 가져왔다. 스마트폰에서부터 의료 진단에 이르기까지 AI는 매일 우리의 경험을 향상시키고 있다. 하지만 이러한 발전은 위험 관리와 안전 문제에 대한 새로운 도전을 제기한다. AI 안전은 이러한 도전에 집중하여, AI 시스템이 인간과 사회에 유익하고 해를 끼치지 않도록 하는 연구 분야이다.


AI 안전의 중요성은 AI가 우리 사회에 미치는 영향의 크기에서 비롯된다. 예를 들어, 자율주행차는 교통 사고를 줄일 수 있는 잠재력이 있지만, 잘못 프로그래밍되거나 조작될 경우 심각한 사고로 이어질 수 있다. 또한, AI는 개인 정보 보호, 편향 및 차별 문제에 영향을 미칠 수 있으며, 이는 사회적, 윤리적 문제를 일으킬 수 있다.


인공지능 안전은 악의적인 사용을 방지하는 것부터 인간의 의도와 일치하는 것을 보장하는 것까지 다양한 측면을 포함하는 다차원적인 문제이다. 주요 관심사는 인공지능의 급속한 개발과 배치의 의도하지 않은 결과 또는 사이버 전쟁과 생물 무기와 같은 분야에서의 오용과 같은 재앙적인 결과를 피하는 것이다. 이것은 엄격한 안전 기준과 국제 협력을 포함한 강력한 글로벌 거버넌스를 요구한다.


보안 및 신흥 기술 센터와 같은 기관들은 AI 시스템에서 견고성, 보증 및 사양의 중요성을 강조한다. 견고성은 낯선 환경에서 AI 기능을 보장하고, 보증은 AI 시스템에 대한 인간의 이해 가능성에 초점을 맞추고, 사양은 AI 행동을 설계자의 의도와 일치시킨다. 이러한 조치는 의도하지 않은 AI 행동을 방지하고 AI 시스템에 대한 통제를 유지하는 데 중요하다.


AI 안전과 윤리에 대한 논의들


Center for AI Safety에서는 AI 위험을 다루면서, AI 관련 잠재적 재난을 악의적 이용(바이오 무기 제작 등), AI 레이스(통제권 상실 및 사이버 전쟁으로 이어지는), 조직적 위험(안전에 대한 이익으로 인한 사고), 불량 AI 시나리오(AI의 목표가 걷잡을 수 없이 벗어나는)의 4가지 영역으로 분류한다. 이러한 위험을 해결하기 위한 예방 조치, 강화된 안전 기준 및 국제적 공조의 필요성을 강조한다.

https://www.safe.ai/ai-risk


AI 안전에 관한 CSET 문서는 AI 안전 문제의 세 가지 주요 범주인 강건성, 보증, 사양에 대해 논의한다. 강건성은 낯선 환경에서 안전하게 작동하는 시스템의 능력에 관한 것이다. 보증은 AI 시스템을 인간이 이해하고 분석할 수 있도록 만드는 것을 다룬다. 사양은 AI 행동을 설계자의 의도와 일치시키는 데 중점을 둔다. 논문은 AI 시스템이 안전하고 안정적으로 작동하도록 보장하면서 이러한 문제를 해결하기 위한 지속적인 연구의 필요성을 강조한다. 


특히, 심층 신경망과 같은 기계 학습 시스템의 경우 AI에서 해석 가능성의 중요성에 대해 논의한다. 해석 가능성은 이러한 시스템이 의사 결정을 내리는 방법을 이해하고 인간 운영자가 쉽게 이해할 수 있도록 설계하는 것을 의미한다. 이는 AI 시스템이 의도한 대로 작동하는지 확인하고 예상치 못한 행동을 설명하는 데 중요하다. 컴퓨터 시스템에 대한 전통적인 보증 기술은 현대 AI에 부적절하며, AI "추론"을 이해하기 위해 시각화 또는 영향력 있는 입력 특성 강조와 같은 새로운 방법의 필요성을 촉발한다. 이것은 특히 인간이 AI 예측에 의존하는 고 위험 환경에서 매우 중요하다.


https://cset.georgetown.edu/publication/key-concepts-in-ai-safety-an-overview/


백악관에서는 AI의 안전, 보안, 신뢰성을 보장하기 위한 기업들의 자발적인 약속을 강조하고 있다. 이 약속들은 AI 시스템의 안전과 능력에 대한 엄격한 테스트와 공개, 사이버 보안 강화, 공공 신뢰 증진에 초점을 맞추고 있다. 구체적인 행동에는 다양한 위험에 대한 레드 팀 구성, AI 안전과 보안에 대한 정보 공유, AI가 생성한 콘텐츠를 식별하는 메커니즘 개발, AI 모델의 능력과 한계에 대한 공개적인 보고 등이 포함된다. 이 계획들은 편견과 차별과 같은 사회적 위험을 해결하고 사생활을 보장하며 기후 변화와 의료와 같은 사회적 문제에 AI를 활용하는 것을 목표로 한다. 이 약속들은 AI를 위한 포괄적인 법적 및 정책적 프레임워크를 개발하려는 광범위한 노력의 일환이다.


https://www.whitehouse.gov/briefing-room/presidential-actions/2023/10/30/executive-order-on-the-safe-secure-and-trustworthy-development-and-use-of-artificial-intelligence/


스탠포드의 AI 안전 센터와 OpenAI와 같은 기관들은 엄격한 시험, 실제 피드백, 그리고 AI의 윤리적인 개발을 우선시한다. OpenAI는 AI 안전을 위한 사실적인 정확성의 지속적인 개선과 글로벌 거버넌스를 강조하는 반면, 스탠포드의 접근법은 형식적인 방법과 안전과 학습의 균형을 포함한다. 둘 다 투명성과 AI 시스템 이해의 필요성을 강조한다.


https://aisafety.stanford.edu/

https://openai.com/blog/our-approach-to-ai-safety


Alan Turing Institute는 책임 있는 혁신과 거버넌스 프로세스의 필요성을 강조하면서 공공 부문에서 윤리적 AI를 옹호한다. 이 접근 방식은 잠재적인 AI 해악을 이해하고 이를 완화하기 위한 조치를 실행하는 것을 수반하며, 공공 AI 프로젝트에서 윤리와 안전을 우선시하는 중요성을 강조한다.


특히, AI 시스템의 안전을 보장하는 데 있어 정확성, 신뢰성, 보안 및 견고성과 같은 운영 목표의 중요성을 강조한다. 오류율 및 애플리케이션의 특정 요구 사항을 고려할 때 정확성과 성능 지표는 매우 중요하다. 보안은 적대적 공격으로부터 시스템을 보호하고 정보 무결성을 유지하는 것을 포함하는 반면, 신뢰성은 AI 시스템이 의도한 대로 작동하도록 보장한다. 견고성은 적대적 개입 및 왜곡된 목표 실행을 포함하여 어려운 조건에서 AI 시스템이 작동하도록 보장하는 것이다. 본문은 모델 강화 및 데이터 품질 관리와 같은 전략을 통해 개념 드리프트 및 취성과 같은 이러한 목표에 대한 위험을 신중하게 관리하여 다양한 애플리케이션에서 AI 시스템의 안전성과 효율성을 보장해야 한다고 강조한다.


https://www.turing.ac.uk/sites/default/files/2019-08/understanding_artificial_intelligence_ethics_and_safety.pdf


AI 안전에 관해 ENAIS(European Networks for AI Safety)에서는 AI 기술이 유익하고 대규모 위험을 야기하지 않도록 보장하는 중요한 필요성을 강조한다. 초점은 재앙적인 결과를 방지하기 위해 AI 목표를 인간의 의도와 일치시키는 것을 포함하는 AI 정렬에 있다. 그 분야는 핵 전쟁의 가능성과 자체 개선하는 AI 시스템에 의해 야기되는 위험과 같은 체계적인 세계적인 위험을 다룬다. 그 포스트는 AI 정렬에 있어서 기술적인 연구와 AI 사용을 관리하고 그것의 오용을 예방하기 위한 정책 전략들의 조합을 지지한다. 


https://enais.co/blog/ai-safety


AI 안전을 위한 사회적 공론장의 필요성


AI 안전은 단순히 기술적인 문제를 넘어 윤리적이고 사회적인 차원을 포함한다. AI의 지속 가능한 발전과 긍정적인 사회적 영향을 위해서는 안전 문제를 신중하게 고려해야 한다. 따라서, 연구자, 개발자, 정책 입안자, 그리고 사용자 모두가 AI 안전에 대한 인식을 갖고, 이에 대해 책임을 공유하는 것이 중요하다. AI의 미래는 우리가 어떻게 이 기술을 관리하고 안전하게 사용하느냐에 달려 있다.

매거진의 이전글 희토류(희귀광물)을 둘러싼 미국과 중국의 대결
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari