brunch

초현실주의: 초현실주의적 사고와 비정형 데이터 처리

초현실주의적 사고와 비정형 데이터 처리

by jeromeNa

우리는 현재 AI 시대에 살고 있다. 그러나 이는 아직 매우 기초적인 AI 시대일 뿐이다. SF 영화에 등장하는 고도화된 인공지능 시대는 대부분 21세기 중반(2050년대) 이후로 예상되고 있지만, 그 도래 시점은 더 빨라질 수도, 늦춰질 수도 있을 것이다. AI의 작동 원리를 논하기 전에, AI가 탄생하기까지의 배경을 먼저 살펴볼 필요가 있다.


앞서 12장 다다이즘에서 '난수'를 설명할 때 언급했듯이, 컴퓨터 시스템은 실제로는 가짜 난수를 생성하여 무작위처럼 보이게 한다. 모든 시스템은 데이터를 기반으로 작동하며, 데이터가 없다면 실행할 것이 없다. 이러한 데이터는 주로 DB(Database)에 저장되어 있으며, 이는 우리가 흔히 사용하는 엑셀 시트와 유사하다. 행과 열로 구성된 각 셀에 데이터를 입력하거나 조회, 삭제, 수정할 수 있다. 이를 정형 데이터(Structured Data)라고 하며, 명확한 구조와 형식에 맞춰 데이터가 존재함을 의미한다.


그러나 현실 세계에는 정형화된 데이터만 존재하지 않는다. 소설책, 이메일, 이미지, 영상 등은 모두 비정형 데이터이다. 이메일은 어떤 내용이 올지 예측할 수 없고, 소설책 또한 어떤 이야기가 담길지 미리 정해져 있지 않다. 이미지와 영상은 더 말할 것도 없이 정해진 형식에 맞춰 생성되는 것이 아니다. 또한 대화, 감정, 꿈과 같은 것들은 전혀 정형화되어 있지 않다. 이러한 것들을 비정형 데이터(Unstructured Data)라고 하며, 이는 구조화되어 있지 않고 다양성과 모호성을 가진 데이터를 의미한다.


과거의 컴퓨터 시스템은 이런 비정형 데이터를 해석할 능력이 없었다. 정형화된 데이터만을 처리하도록 설계되어 있었기 때문에, 구조화되지 않은 데이터가 입력되면 오류를 발생시킬 수밖에 없었다. 비정형 데이터를 해석하기 위해서는 방대한 양의 데이터와 새로운 접근 방식이 필요하다. 수많은 데이터를 분석하고 패턴을 발견하여 의미를 추출해야 한다. 따라서 AI 시대 이전에 먼저 빅데이터 시대가 도래했다. 빅데이터 시대에는 엄청난 양의 데이터를 수집하고, 이를 분석하여 의미 있는 정보를 추출하는 것이 가능해졌다.




비정형 데이터를 분석하는 간단한 예제를 살펴보자.


positive_words = ['좋다', '행복해', '기쁘다', '즐겁다', '감사', '사랑']
negative_words = ['싫다', '우울해', '짜증', '미워', '화나', '불행']

def analyze_sentiment(text):
pos_count = sum(word in text for word in positive_words)
neg_count = sum(word in text for word in negative_words)

if pos_count > neg_count:
return "긍정적인 문장입니다."
elif neg_count > pos_count:
return "부정적인 문장입니다."
else:
return "중립적인 문장입니다."

# 예제 입력
user_input = "오늘은 기쁘고 행복한 하루야!"
result = analyze_sentiment(user_input)
print(result)


이 코드는 구조화되지 않은 자연어 텍스트를 입력받아 사전에 정의된 단어 리스트를 기준으로 감정을 분석한다. 사전에 긍정적인 단어와 부정적인 단어를 일단 정의한다. user_input에 비정형 데이터를 입력한 후 입력된 데이터를 긍정적인 단어와 부정적인 단어의 개수를 분석한 후 해당 텍스트가 긍정적인지 부정적인지 판단한다.




1916년에 선언한 ‘다다이즘’의 해체정신을 이어받어 1924년 안드레 브르통 (André Breton)에 의해 ‘초현실주의’가 선언되었다. 안드레 브르통은 의학과 심리학을 공부한 인물로, 지그문트 프로이트(Sigmund Freud)의 꿈 해석과 무의식 이론에 큰 영향을 받아 예술을 통해 "무의식의 언어를 현실 세계로 옮기는 것"을 목표로 했다. 이 말은 단지 예술의 양식을 바꾸려는 선언이 아니라, 인간의 정신이 구조화되지 않은 채 작동하는 방식, 즉 비정형적 사고와 감정의 흐름을 예술의 본질로 삼겠다는 말이다.


이런 초현실주의를 대중성과 시각적 상징성을 극대화한 인물로 스페인 화가인 살바도르 달리 (Salvador Dalí)가 대표적이다.


AD_4nXfBuUQrnBrWwuqOhHvPheaivRdatTRq-KrP0qpCHU8UzFOZG6nB_Nd0wCqDdYp_eIxAlzIQCb74yWUM_ciwNJJSZhcnQJJmNICZlwlWRDgsahyzgH-9tIt0PAfPuV46cILFWmFqbA?key=GdOjhPNd0mJvh694QQNh9_nX 살바도르 달리, <기억의 지속 (The Persistence of Memory)>, 1931, Oil on canvas, MoMA


대표작인 <기억의 지속>은 달리의 꿈속에서 영감을 얻은 이미지로 프로이트의 무의식 이론에 깊이 영향받은 작품이다. 녹아내리는 시계는 시간이 물질처럼 유동적이라는 무의식의 인식을 상징한다.


AD_4nXdxnEh-uPSmvuq5BiTg-Y4V6EaqSM0ey2fv9j4D4zvZieU2VF9pQxltpV0kmBgBkQrrxYzsWW1gmRyuCmk1uUn_YVfNjceeHGk4Zbi_okMmNf7YIveguADwBSHNGpqzDrlUwP3odw?key=GdOjhPNd0mJvh694QQNh9_nX 르네 마그리트, <이미지의 배반 (The Treachery of Images)>, 1929, Oil on canvas, Los Angeles County Museum of Art


벨기에 출신으로 철학적 이미지와 언어-이미지 충돌을 다룬 작가인 르네 마그리트(René Magritte)의 <이미지의 배반>의 파이프 그림 아래 작품의 글씨는 “이것은 파이프가 아니다”라고 쓰여 있다. 보이는 것과 실제, 기호와 현실 사이의 간극을 강조한 것으로 초현실주의가 지향하는 ‘무의식과 논리의 충돌’을 철학적으로 시각화한 것이다.


AD_4nXcSwGq1nIY57UEVo0QNiXfIMmXH8WxqaibAoRcm6bxAFdsi38cZaXJNf3sZA3h79W28onoQsu9UnGmTE1OE7ijMAmktNdcSj4UbNjJoS6Xj_onxzqGxE_sMVbHc0_55ooMqmiq7?key=GdOjhPNd0mJvh694QQNh9_nX 막스 에른스트, <숲과 비와 태양 (Forest and Dove)>, 1927, Oil on canvas, Kunsthaus Zürich (취리히 미술관)


독일 출신의 다다이즘과 초현실주의를 잇는 실험적 예술가인 막스 에른스트는 자신이 개발한 프롤타주(Frottage) 기법으로 우연한 질감을 이용하여 작품을 만들었다. 프롤타주 기법은 예술가의 의식적 통제를 최소화하고 우연과 무의식의 개입을 끌어내기 위한 방식으로 질감 있는 표면 위에 종이를 놓고 연필이나 목탄 등으로 문질러 찍어내는 기법이다.


작품에서 숲의 형태는 규칙적이지만 해석이 불가능한 환영 구조에 어딘가에 숨어 있는 새와 존재들이 꿈처럼 감춰진 세계를 상징한다.




초현실주의 작가들이 보이는 세계가 전부가 아니라고 믿고 무의식, 상징, 충돌, 우연 속에서 인간 존재의 진실을 탐구했듯이, 데이터 과학 역시 정형화되지 않은 정보를 새로운 관점으로 해석하기 시작했다.


이전까지의 예술은 정형화된 방식과 보는 관점의 차이는 있었지만 대체로 의식적으로 보이는 것을 표현했다. 그러나 다다이즘의 해체를 거쳐 초현실주의로 발전하면서 무의식을 표현하는 방식으로 전환되었다. 마찬가지로 컴퓨터 시스템도 정해진 정형화된 데이터의 한계에서 벗어나, 마치 무의식과 같은 비정형 데이터를 분석하고 패턴을 찾아내어 새로운 통찰을 제공하게 되었다.


현실 세계는 정해진 대로 흘러가지 않는다. 우리는 언제나 현재 상황에 대한 대응과 반응으로 살아간다. 정형화되지 않은 상황을 어떻게 인식하고, 해석하며, 판단하느냐에 따라 '자신'이라는 정체성이 형성된다.




keyword