brunch

AI 가 역사를 새로 쓰다
- 텍스트 이해 능력

-이기술의 능력은 과거에 대해 이야기하는 방식을 어떨게 변화 시킬까이다

by E Han

-요즘 많은 부분에 있어서 , AI 의 영향이 미치 지 않은 분야가 없다., 단순 질의 응답을 넘어서서 전문적인 엔지니어링 코딩이나 학술 해석 , 자료 PPT 작성과 준비까지 이전 같으면 몇몇이 밤을 새워서라도 만들어야 했던 방대한 자료에 대한 보고서와 요약 및 정리도 필요 한정보 입력과 제대로된 범주에 대한 질문은 한다면 현존 하는 AI Tool 들은 꽤많은 작업 성과를 보여 줄 것이다. 아래는 NYT 기고문중 하나로 , 미래및 과거에 대학 역사 분석에 대한 문헌 보고서로도 꽤 상당한 실력을 보여 줄 수 있음을 입증 하고 그 진화하는 속도는 우리의 두려움을 앞서 나가기도 한다. -때때로 -아래는 발췌 번역 본이다. 그 하단에는 원문이다.




잡지 편집자로 25년 동안 일하면서 제가 가장 좋아하는 일은 작가들이 이야기의 본질을 파악하도록 돕는 것이었습니다. 어디서부터 시작하고, 어디서 끝맺고, 무엇이 중요하고 새로운지 파악하는 것이었죠. 그래서 올해 초, 저는 맨해튼 웨스트사이드에 있는 구글 사내 카페테리아에 앉아 오랜 기간 함께 일했던 작가 중 한 명인 기술 저널리스트이자 역사가인 스티븐 존슨이 제가 아닌 AI로부터 그런 조언을 받는 모습을 지켜보았습니다.


---------------------------------


해적 공격 , 근대 경찰 제도의 도입 , 그리고 공중 보건의 탄생 에 대한 대중 역사서를 출간해 온 존슨은 19세기 중반 캘리포니아 골드러시에 대한 책을 구상하기 시작했다고 설명했습니다. 하지만 그는 아직 그 이상은 잘 모르는 상태였습니다. "제 반전이 뭐죠?" 그가 말했습니다. "말 그대로, 저도 잘 모르겠어요."


존슨은 이를 알아내기 위해 3년 전 구글 랩스 부서의 편집 책임자가 된 후, 연구자와 작가를 위한 앱인 NotebookLM에 자신의 자료 일부를 업로드했습니다. 이 앱은 그가 직접 개발에 참여했습니다. 대부분의 다른 AI 도구들이 훈련된 어마어마하게 방대한 양의 데이터에서 질문에 대한 답을 도출하는 것과 달리, NotebookLM은 사용자가 선택한 파일에서만 정보를 추출합니다. 대부분의 연구는 자료의 신중한 큐레이션을 통해 이점을 얻을 수 있다는 전제 하에 말입니다.



작년에 이 제품이 전 세계에 출시된 이후, 구글과 존슨은 회의 오디오 녹음에서 회의록과 핵심 내용을 자동 생성하는 기능부터 대학생들에게 AI를 더욱 적극적으로 활용하도록 장려하는 기능까지, 다양한 업무에 이 제품이 유용할 수 있다고 홍보해 왔습니다. NotebookLM의 가장 큰 화제는 자동 생성 팟캐스트입니다. 몇 분 만에 두 명의 기괴할 정도로 사실적인 목소리가 상세한 대화를 뱉어내어 원문의 핵심 개념을 끄집어냅니다. 하지만 역사 가끔 쓰는 저로서는, 방대한 양의 텍스트를 순식간에 꿰뚫어 보고 믿을 만한 요약을 제공하는 능력을 가진 AI가 역사 서술 방식을 어떻게 변화시킬 수 있을지에 가장 큰 관심이 있었습니다.


그날 저녁 구글에서 허드슨 강 위로 해가 지면서 존슨은 지금까지의 실험 결과를 보여주었습니다. 그는 골드러시에 대한 현존하는 가장 훌륭한 역사서 중 하나인 HW 브랜즈의 "황금의 시대"에서 발췌한 내용을 NotebookLM에 제공하면서 브레인스토밍을 시작했습니다. 그는 1850년대 요세미티 밸리에 살았던 아메리카 원주민과 백금을 찾는 사람들 사이의 갈등에 초점을 맞추고 싶다고 생각했기 때문에 1851년 밸리로 진군한 민병대인 마리포사 대대의 일원이었던 라파예트 호튼 버넬이 쓴 "요세미티의 발견"이라는 오래된 자료의 텍스트를 업로드했습니다. 다음으로, 원주민의 관점을 가져오기 위해 그는 퍼블릭 도메인 웹사이트로 가서 대대가 밸리에서 추방한 사람들에 대한 두 가지 기록을 찾았습니다. "아와니치: 요세미티 인디언 이야기"와 "요세미티 밸리와 그 주변의 인디언"입니다.


존슨은 NotebookLM과의 대화를 약간의 방향 감각으로 시작하며 자신을 저자 스티븐 존슨이라고 소개했습니다.이는 AI(훈련을 통해 ChatGPT와 마찬가지로 업로드된 소스에 대한 답변만 제한하더라도 인터넷의 거의 모든 것을 이해할 수 있음)가 자신이 쓰는 책의 종류를 파악할 수 있도록 하기 위해서였습니다.그런 다음 그는 질문을 쏟아내기 시작했습니다.토착민 경험에 초점을 맞춘 두 소스에서 다른 두 소스에는 무엇이 빠졌습니까?모델이 요약을 반환했을 때, 그의 눈은 "아와니치"가 개별 요세미티 인디언의 짧은 전기를 포함함으로써 "사람들을 부족 집단을 넘어 인간화하는 데 도움이 됩니다. 이는 '황금의 시대'와 버넬의 책이 하는 경향이 있는 것입니다."라는 관찰에 사로잡혔습니다.AI는 그들의 이름을 몇 명 나열했는데, 그중에는 요세미티 족장 테네이야의 손녀 마리아 레브라도가 있었습니다.


존슨의 관심이 쏠렸습니다. 그는 레브라도에 대해 더 많은 정보를 요청했고, 검색 엔진은 거의 600단어 분량의 전기를 제공했습니다. 그녀는 1851년 3월 대대에 의해 계곡을 떠나야 했던 72명의 원주민 중 한 명이었고, 결국 센트럴 밸리에서 화물 열차를 운영하던 멕시코인 남성과 결혼했으며, 1920년대에 한 백인 역사가에게 "발견"되어 요세미티 원주민의 마지막 생존자로 여겨졌다는 내용이었습니다.


존슨은 그녀가 훌륭한 캐릭터가 될 것임을 즉시 알아챘습니다. 특히 레브라도가 생의 마지막에 계곡으로 돌아왔다는 사실에 주목했습니다. "'타이타닉'의 [욕설] 구조가 뭐였더라?"라고 그는 농담했습니다. 존슨이 상상했던 대로, 이 책은 레브라도가 거의 90세가 되어 계곡으로 돌아온 감정적인 이야기로 시작해서, 그녀의 어린 시절, 더 다양한 등장인물들, 그리고 1850년대의 폭력적인 드라마로 시간을 거슬러 올라갈 수도 있었습니다.



존슨은 아직 이 아이디어에 완전히 매료되지는 않았습니다. 하지만 대부분 오픈소스 텍스트와 극히 적은 양의 인간 노동으로 작동하는 AI가 자신이 바로 활용할 수 있는 개념을 제시해 준 것에 감탄했습니다 . "제가 방금 보여드린 모든 것은 30분 정도 걸리는 작업입니다."라고 그는 말했습니다.


===========================================================================

대부분의 단어 관련 직업을 가진 사람들처럼, 저도 방대한 언어 모델이 등장하는 것을 매혹과 공포가 뒤섞인 시선으로 지켜봐 왔습니다. 그런 모델 중 하나가 저를 대신해 글을 쓴다는 상상만 해도 소름이 돋습니다. 하지만 AI가 저를 대신해 읽어준다는 생각에는 어딘가 매혹적입니다 . 인터넷 시대의 디지털 텍스트 폭발적인 증가가 어떤 주제에 대해 우리가 감당할 수 있는 것보다 훨씬 방대한 자료에 접근하는 논픽션 작가들을 얼마나 잔인하게 조롱하는지 생각해 보면 더욱 그렇습니다. 이는 현재 주제뿐 아니라 과거 주제에서도 마찬가지입니다. 역사 애호가라면 누구나 구글이 디지털화한 수천만 권의 책, JSTOR에 있는 끝없는 학술 논문, 그리고 특정 날짜의 수백 개 출판물을 키워드로 검색할 수 있는 신문 데이터베이스에서 온라인 검색 몇 시간만 해도 몇 달, 심지어 몇 년 치의 읽을거리가 쏟아져 나온다는 것을 알고 있을 것입니다. 모든 자료를 다 읽는 것은 불가능하지만, 일단 존재한다는 것을 알게 되면 읽지 않는 것은 무책임한 일처럼 느껴집니다.


만약 그 독서의 대부분을 다른 누군가에게, 혹은 다른 무언가 에게 맡길 수 있다면 어떨까요 ? AI가 방대한 데이터 세트를 분석하는 능력이 향상됨에 따라, 역사가들과 다른 논픽션 작가들이 AI에게 도움을 요청하는 것은 불가피해 보입니다. 사실, 지난 몇 달 동안 다양한 역사가들을 대상으로 설문조사를 진행하면서 알게 된 것처럼, AI를 활용한 실험은 제가 예상했던 것보다 훨씬 흔해졌습니다. 하지만 역사 텍스트를 검색하고 종합하는 이러한 능력이 쓰여지는 역사서의 종류를 변화시킬 것임 또한 불가피해 보입니다. 격언처럼 역사는 승자에 의해 기록된다는 점을 고려하면, AI 경쟁의 승자들이 머지않아 역사가들이 과거에 대해 이야기하는 이야기를 어떻게 형성할지 궁금해하는 것도 시기상조가 아닙니다.


제가 이야기를 나눈 역사학자들 중 가장 열정적인 실험가 중 한 명은 스탠퍼드 대학교 커뮤니케이션학과에서 강의하는 프레드 터너였습니다. 저는 정보 기술의 오랜 역사 속에서 AI가 어떻게 자리 잡고 있는지에 대해 인터뷰할 생각으로 그의 사무실에 도착했지만, 결국 우리는 대부분의 시간을 ChatGPT가 그의 최근 저서 프로젝트에 어떻게 도움이 되었는지에 대해 이야기하며 보냈습니다. 이 저서는 1970년대와 1980년대 뉴욕 예술계를 중심으로 전개됩니다.


그는 "출처 개요"라고 부르는 단계에 있었습니다. 이는 자신의 모든 연구를 집대성한 약 100페이지 분량의 문서를 의미하며, "제 생각에 이 책이 될 내용의 흐름에 맞춰 대략적으로 정리된" 것입니다. 이를 바탕으로 제안서를 작성할 계획이었지만, ChatGPT에 먼저 문의하기로 했습니다. 그러자 챗봇이 8장짜리의 그럴듯하고 세련된 구조를 제시했는데, 그의 연구에서 유용한 연결 고리를 찾아내고 프로젝트에 대한 더욱 간결한 서사를 제시했습니다.


--------------------------------------------------------------------------------------------------------------------

그는 덧붙여, "그 책은 제 꽤 학술적인 저작물을 평범한 목소리로 다시 읽어주는 역할을 했습니다. 제 저작물의 평균적인 부분 을 찾아냈는데 , 정말 흥미로웠습니다."라고 말했습니다. 그는 이어서 "마치 책을 시장에 내놓고 서점에 서서 관심은 있지만 전문가는 아닌 많은 독자들 앞에 책을 내놓고, 그들이 어떤 부분이 자신에게 맞는지, 어떤 부분이 맞지 않는지 말해주는 것 같았습니다."라고 말했습니다.


LLM 활용을 자신의 연구에 더욱 공식적으로 통합하기 시작한 학자들이 소수 있습니다. 그중 한 명은 온타리오주 윌프리드 로리에 대학교의 마크 험프리스 교수로, 그의 연구 프로젝트에는 캐나다 역사의 방대한 디지털 기록이 포함되어 있습니다. 한 프로젝트에서 그와 그의 학생들은 AI를 사용하여 18세기 후반과 19세기 초반 모피 무역에 대한 수만 건의 수기 기록을 분석했습니다. 이는 가족과 함께 캐나다의 많은 지역을 탐험하고 정착했던 광활한 무역상 공동체(현재는 통칭 "여행자")를 더 잘 이해하기 위한 것이었습니다. 험프리스는 "이러한 기록을 대규모 언어 모델에 전달하여 '알렉산더 헨리의 무역 파트너가 누구였는지 말해줘'라고 말할 수 있다면,"이라고 말했습니다. "멋진 점은 이름으로만 검색하는 것이 아니라 교차 참조를 통해 관련성을 찾을 수 있다는 것입니다."


목표는 특정 항해자 간의 일대일 거래뿐 아니라 인간 연구자들이 빠르게 만들기 어려운 상호 연결 고리를 찾아내는 것입니다. 험프리스는 "AI는 20초면 됩니다."라고 말했습니다. "대학원생이라면 같은 작업을 몇 주 동안 해야 할 수도 있습니다."


험프리스는 스티븐 존슨처럼 AI 실험이라는 심해에 발을 담그고 있는 게 분명합니다. 제가 연락했던 대부분의 역사가들은 그저 조심스럽게 발을 담그고 있을 뿐이었습니다. 퓰리처상 수상작 쿠바: 미국사』의 저자이자 프린스턴 대학교 교수인 에이다 페레르에게 연락했을 때, 그녀는 한 시간 후 최근 몇 주 동안 AI를 가지고 놀아보았다는 답장을 보냈습니다. 그녀는 "책을 마무리하는 중이었는데 제목을 정하는 데 어려움을 느껴 ChatGPT에 문의했습니다."라고 썼습니다. "제안을 계속 수정하면서 다양한 주제를 추가하고, 분위기에 대한 제안을 하는 등 여러 가지를 시도했습니다. 결국 제목 아이디어가 스무 개 정도 떠올랐습니다." (하지만 좋은 제목 아이디어는 하나도 없었고, 결국 그녀의 책은 제목 없이 남았습니다.)


페레르는 다른 많은 학계 역사가들과 마찬가지로 AI에 대한 그들의 태도가 학생들이 AI를 이용해 부정행위를 저지른 사건의 그늘에 가려져 있었다는 점을 지적했습니다. 이로 인해 AI를 만지기를 꺼리게 되었지만, 동시에 AI가 도구로서 얼마나 강력한지를 깨닫게 된 것 같습니다. 2023년 "자유의 지배: 연방 권력에 대한 백인의 저항 이야기"로 퓰리처상을 수상한 밴더빌트 대학교의 제퍼슨 코위는 "학생들의 AI 사용에 대해 얼마나 우려하는지 생각하면 제가 AI를 사용 하는 것은 위선적일 것이라는 사실에 괴로워요. "라고 말했습니다. 하지만 그는 "우리가 AI를 제대로 다루게 되면 몇몇 사람들이 놀라울 정도로 창의적인 용도로 사용할 것이라는 것도 알고 있습니다."라고 덧붙였습니다.




AI 역사의 미래, 그리고 이 기술이 온갖 다른 용도로 활용될 가능성을 둘러싼 당연한 의문은 결국 정확성 문제를 어떻게 해결해야 하는지에 달려 있습니다. 『1491』과 최근작 『마법사와 예언자』의 저자 찰스 C. 만은 미국 서부 역사에 관한 새로운 책 프로젝트를 연구하면서 다양한 모델을 실험해 보았고, 훌륭한 단서를 찾았지만, 잘못된 정보를 쉽게 되뇌는 것에 대해 불안감을 느꼈다고 제게 말했습니다. 만은 이를 인간의 엄격한 편집 과정과 비교했습니다. "기자로서 똑똑한 편집자가 '잠깐만요. 이게 말이 되나요?'라고 물었을 때, '맙소사, 말이 안 돼요.'라고 대답하는 순간을 경험해 보셨을 겁니다. AI는 그런 일을 할 수 없습니다. AI는 허튼소리 탐지기가 없습니다."


올해 5월, 타임스는 LLM들이 그간 이룬 역량 향상에도 불구하고, 이해할 수 없게도 환각 문제가 악화되고 있다는 충격적인 수치를 발표했습니다 . 예를 들어, 벤치마크 테스트에서 OpenAI의 새로운 o3 "추론" 모델은 33%의 확률로 부정확한 결과를 내놓았는데, 이는 이전 모델보다 두 배 이상 높은 수치입니다. 구글의 존슨과 그의 팀은 이 문제가 지속되는 것이 NotebookLM의 접근 방식을 정당화한다고 생각합니다. NotebookLM은 때때로 출처의 내용을 잘못 표현하고 (사실 확인 능력 없이 출처의 오류를 그대로 전달하기도 하지만), 연구 자료를 제한함으로써 주요 챗봇에서 여전히 나타나는 허위 정보 조작을 줄이는 데 도움이 되는 것으로 보입니다.


그럼에도 불구하고 존슨은 논픽션 연구에서 LLM의 가장 흥미로운 활용 방식은 결과가 항상 사실 확인을 거치는 방식이라고 믿습니다. 그는 AI를 학부 연구 조수로 보는 대신 다른 부서의 동료나 똑똑한 서적 에이전트 또는 편집자와 비슷하게 상상하며, 이를 통해 자신의 아이디어에서 가장 흥미로운 버전을 볼 수 있도록 도울 수 있습니다. 다른 역사가들에게는 이것이 전혀 고무적인 전망이 아니라는 점에 유의해야 합니다. 클레오파트라와 베라 나보코프의 화려한 전기 작가인 스테이시 쉬프에게 구조 를 정하는 데 AI를 활용하는 것에 대해 물었을 때, 그녀는 "AI에 구조를 맡기는 것은 속임수라기보다는 누군가를 고용하여 핫 퍼지 선데를 대신 먹게 하는 것과 같은 박탈처럼 보입니다."라고 답했습니다.



22Mag-AIHistory-02-articleLarge.jpg?quality=75&auto=webp&disable=upscale

신용 거래...enigmatriz의 사진 일러스트레이션


AI는 역사를 기록하고 이해하는 방식을 어떻게 바꿀 수 있을까요 ? 이 질문에 답하기 위해서는 LLM을 인간 지식 체계화 과정에서 오랜 세월에 걸쳐 일어난 변화 중 가장 최근의 사례로 생각하는 것이 유용합니다. 적어도 기원전 3세기, 칼리마코스가 알렉산드리아의 유명한 도서관(현재는 소실됨) 소장품을 목록화한 일련의 책인 "피나케스(Pinakes)"를 쓴 이후, 인류는 한 사람이 감당하기에는 너무 방대한 정보의 풀을 탐색하기 위한 점점 더 정교한 시스템을 개발해 왔습니다.


이러한 시스템은 학술 연구에 있어 필연적으로 양날의 검과 같습니다. "효율성"이라는 단어가 항상 지름길과 동의어가 될 위험이 있는 작업입니다. 적어도 1467년으로 거슬러 올라가는 장치인 책 속의 인쇄된 색인은 학자들이 각 책을 전부 읽지 않고도 관련 자료를 찾을 수 있도록 해주었습니다. 인간 지식의 관점에서 볼 때, 그것은 유토피아를 향한 한 걸음이었을까요, 아니면 디스토피아를 향한 한 걸음이었을까요? 558년이 지난 지금도 누가 알겠습니까? 듀이십진분류법처럼 우연을 불러일으키는 혁신은, 그 우아함 덕분에 한 권의 책을 서가에서 꺼내다 보면 종종 다른, 더 중요한 발견으로 이어지는 경우가 많습니다. 하지만 거의 필연적으로 자의성에 시달릴 수밖에 없습니다. 마리포사 대대에 관한 책을 브랜즈의 "황금의 시대"와 다른 골드 러시 작품(979.404)과 함께 분류하면, 대대의 희생자들에 관한 책("원주민, 여러 부족", 973.0497)으로 분류했을 때와는 매우 다른 이웃을 얻게 될 것입니다.


컴퓨터와 인터넷의 등장은 역사 서술 도구의 역사에 있어 전례 없는 전환점이었습니다. 과거에 대한 정보의 양이 기하급수적으로 증가했고, 동시에 그 정보를 걸러내고 검색하는 우리의 능력도 커졌습니다. 심리적으로 디지털 텍스트와 도구는 무엇보다도 "가용성"의 시대로 우리를 내몰았습니다. 이는 구어체적 의미(모든 것이 이용 가능한 것처럼 보이는 것)와 사회과학적 의미("가용성 편향") 모두에서 나타납니다. 우리는 단 한 번의 동기 부여된 검색으로 쏟아져 나오는 엄청난 양의 뒷받침 사실들에 압도되어 특정 주제에 대한 명확하고 완전한 그림을 가지고 있다고 스스로를 속일 수 있습니다.


학계 역사학자들 사이에서도 이러한 가용성은 AI가 더욱 발전시킬 가능성이 높은 방향으로 인센티브를 변화시켰습니다. LLM 폭발이 일어나기 수년 전인 2016년, 피츠버그 대학교 역사학자 라라 퍼트넘은 검색 기반 디지털 연구의 성과와 위험성에 대한 에세이를 발표했습니다 . 그녀는 특히 날카로운 문단에서 "역사학자들은 처음으로 어디를 찾아야 할지 모른 채 정보 를 찾을 수 있게 되었습니다 ."라고 썼습니다. "기술은 발견의 범위와 속도를 폭발적으로 증가시켰습니다. 하지만 우리가 찾은 자료를 정확하게 읽고 그 중요성을 평가하는 능력은 마법처럼 빠르게 향상될 수 없습니다. 발견을 통해 연결된 지역이 더 멀리 떨어져 있을수록 맥락적 지식의 일관성은 떨어집니다. 디지털 이전 시대의 역사 연구에 필요했던 장소 특정적 학습은 더 이상 연구 과정에 내재되어 있지 않습니다. 우리는 초보적인 실수를 저지릅니다."


퍼트넘의 글은 디지털 도구에 대한 비판이 아니었습니다. 디지털 도구는 그녀가 기억에 남는 표현으로 부르는, 한 분야에 전문 지식을 가진 역사가가 다른 주제에 대해 더 빨리 정보를 얻을 수 있는 능력인 "옆으로 시선을 돌리는 것"을 가능하게 합니다. 디지털 검색 덕분에 역사가들은 그렇지 않았다면 얻지 못했을 진정성 있고 강력한 연관성을 발견할 수 있었습니다. 하지만 그녀는 디지털화된 자료의 양이 계속 증가하고 있음에도 불구하고 여전히 대표성이 부족하다는 점을 우려했습니다. 영어권과 부유한 국가에 편향되어 있고, 특히 "공식" 자료(서면이 아닌 인쇄본, 소규모 또는 덜 공식적인 기록 보관소가 아닌 기관에 보관된 자료)에 편향되어 있습니다. 퍼트넘은 "디지털화된 것의 렌즈를 통해 과거를 바라보면 특정 현상은 두드러지고 다른 현상은 덜 두드러지며, 특정 인물은 생생하게 드러나고 다른 인물은 눈에 띄지 않게 됩니다."라고 지적합니다.


최근 그녀와 이야기를 나누었을 때, 퍼트넘은 이러한 변화를 보몰의 비용 병 (Cost Disease)에 비유했습니다. 경제학자 윌리엄 보몰이 지적한 비용 병이란, 기술이 특정 노동자의 효율성을 높이면 다른 형태의 노동은 더 비싸지고, 따라서 정당화하기 더 어려워진다는 현상입니다. 퍼트넘은 원칙적으로 디지털 도구에는 단점이 없다고 지적합니다. 전문 역사가들은 물리적 기록 보관소에서 시간이 많이 소요되는 연구를 충분히 수행할 수 있습니다. 하지만 실제로는 다르고, 더 빠르고, 더 연결성이 높은 유형의 연구로 인해 전통적인 작업이 상대적으로 전문적으로 "비싸게" 보이게 되었습니다. 출판 가능한 자료가 나올지 확신할 수 없는 먼지 쌓인 저장소에서 한 달을 야영하며 시간을 보내는 대신, 집에서 편안하게 접근할 수 있는 무한해 보이는 출처를 통해 실질적이고 강력한 지적 흔적을 따라갈 수 있다면 어떨까요?



퍼트넘은 직접 AI 연구를 시도해 본 적이 없으며, 그녀의 두려움은 이 기술이 학생 에세이 작성 기술을 파괴하는 것과 같은 방식으로 역사 산업을 파괴할 것이라는 기본적인 (그리고 어쩌면 옳은) 악몽 같은 시나리오로 이어진다. 즉, 인간의 작업을 무의미하게 만들 정도로 그럴듯한 텍스트를 작성함으로써 말이다. 하지만 설령 그 악몽이 사라지고 AI가 인간 역사가를 대체하는 것이 아니라 협력자가 된다 하더라도, AI 요약이 디지털 검색이 그랬던 것처럼 논픽션 글쓰기를 어떻게 변화시킬 수 있을지는 쉽게 짐작할 수 있다. 사용자들이 NotebookLM과 같은 도구가 방대한 양의 텍스트에 대한 출처나 의도는 크게 고려하지 않고 설득력 있는 요약을 제공할 것이라고 믿기 때문에, 개별 출처는 더욱 뒷전으로 밀려날 것이다. 이런 세상에서 놀라울 정도로 "싸구려"가 되는 것은, 한 사람이 평생 처리할 수 있는 것보다 훨씬 더 많은 양의 자료를 합성하려는 작업이며, 언어, 국경, 시대를 무차별적으로 넘나들며, 그 속도가 한 사람이 평생 여러 프로젝트를 완료할 수 있을 정도입니다.


그러한 변화의 잠재적 이점을 무시해서는 안 됩니다. 현재 대중 역사에서 가장 큰 드라마는 아마도 89세의 로버트 카로가 린든 존슨 전기의 다섯 번째이자 마지막 권을 완성할 수 있을지 여부일 것입니다. 그의 50년 인생을 소비한 거대한 작업입니다. 이미 뉴욕 역사 잡지에 기증한 그의 개인 서류는 현재까지 150피트(약 48미터)에 달하는 파일 박스를 차지하고 있는데, 만약 챗봇이 그 자료의 일부를 합성할 수 있었다면 카로는 50년 동안 얼마나 더 많은 엄청난 전기를 쓸 수 있었을지 궁금합니다. 하지만 모든 자료를 직접 만져보고, 그 모든 끊임없는 독서의 엄밀함을 산문에 쏟아붓는 열정이 없었다면, AI의 도움을 받은 로버트 카로는 로버트 카로가 아니었을 것입니다.


스티븐 존슨의 골드러시 역사 실험에서 가장 놀라운 결과는 그가 NotebookLM 챗봇에 자신만의 구조적 사고를 제시했을 때 나타났습니다. 존슨은 이를 " 롱 줌(long zoom )"이라고 부르는 기법에 심취했는데, 이는 찰스와 레이 임스 부부의 유명한 다큐멘터리 "10의 거듭제곱(Powers of Ten)" 처럼 시간이나 규모에 따라 기하급수적으로 변화하는 스토리텔링 방식입니다.


"이 책의 멋진 구성을 생각해 냈어요." 그가 챗봇에게 말했다. "아마도 대부분 마리포사 대대 사건, 즉 요세미티 밸리 침공으로 이어지는 이야기를 담은 여러 장으로 구성될 거예요." "하지만 각 장은 시간 단위를 가지고 있죠. 1장은 백만 년 전, 2장은 천 년 전, 3장은 백 년 전, 이런 식으로 10년, 1년, 한 달, 일주일, 하루 전이에요. 그리고 1851년에 전쟁이 시작되고, 그다음에는 긴 에필로그가 있어요. 각 장의 내용이 어떻게 될지 생각해 보세요. 그 부분에서는 큰 그림의 어떤 부분을 다루게 될까요?"


존슨은 이미 그 구조가 왜 효과가 있는지 알고 있었습니다 . 드라마의 핵심 요소(금, 최초의 인류, 19세기 중반의 특정 토착 민족, 침략해 온 백인 정착민)를 계곡에 부여한 시간 척도가 10의 거듭제곱에 걸쳐 있었기 때문입니다. 하지만 존슨이 직접 말하지 않아도 AI가 그 모든 것을 인지한다는 것은 놀라운 일이었습니다.


● 백만 년 전: 시에라네바다의 지질 형성, 금 매장지 생성, 빙하 활동에 의한 요세미티 계곡의 형성.
● 천 년 전: 초기 인류 이동과 시에라네바다에서의 토착 문화 확립, 환경 적응에 초점을 맞춤.
● 백 년 전: 요세미티 인디언 조상의 삶, 부족 간 관계, 유럽인과의 초기 접촉, 질병의 초기 영향.
● 십 년 전: 캘리포니아에서 미국의 영향력 증가, 멕시코-미국 전쟁, 캘리포니아 합병, 금에 대한 초기 소문.
● 일 년 전: 서터스 밀에서 금 발견, 금광 탐사자들의 급속한 유입, 광산 캠프 설립, 아메리카 원주민 부족과의 갈등의 첫 징후. 제임스 새비지와 테니야 추장 등 주요 인물 소개.
● 한 달 전: 고조되는 긴장, 무역소 습격, 정착민 민병대 결성, 그리고 마리포사 전쟁으로 이어진 협상 시도 실패.
● 일주일 전: 마리포사 대대의 조직과 이동, 갈등이 임박하면서 요세미티 인디언들의 관점.
● 하루 전: 마리포사 전쟁 발발 직전의 몇 시간. 양측 개인의 심리 상태와 기대에 초점을 맞춤.



올봄 초, 저는 캘리포니아주 마운틴뷰에 있는 구글 캠퍼스에서 존슨을 만나 그의 연구 진행 상황을 알아보았습니다. 존슨은 우주의 10의 제곱이라는 접근법을 고수하고 있었고, 이제 1851년보다 100만 년 전을 배경으로 첫 번째 장을 위해 자신의 개념을 다듬고 있었습니다. 그는 캘리포니아 참나무에 푹 빠졌다고 말했습니다. 참나무의 도토리는 초기 원주민들이 계곡에 정착할 수 있게 해 준 주요 생계 수단 중 하나였습니다.



회의실에서 존슨과 마주 앉았을 때, 그는 NotebookLM의 새로운 "마인드맵" 기능을 보여주었습니다. 이 기능은 소스 자료에서 자동 생성된 개념 트리를 생성하여 특정 질문을 작성하지 않고도 주제별로 탐색할 수 있도록 해줍니다. 그는 참나무들이 한 계절에 대량의 도토리를 떨어뜨리기 위해 협력하는 "마인드맵"이라는 현상에 관심이 있었고, 마인드맵에 대한 자료들을 도구에 추가했습니다. 그런 다음 그는 이 자료들에 대한 마인드맵을 생성했고, 이는 이 현상에 대한 다양한 주제들을 만들어냈습니다. 예를 들어, "마인드맵에 대한 가설"이라는 주제는 "포식자 포만 가설", "수분 효율 가설" 등으로 확장되었습니다. 존슨은 이 모든 것의 유용성을 퍼트넘이 "곁눈질"에 대해 이야기했던 방식과 유사하게 보았습니다. "저는 도토리 전문가일 필요는 없지만, 도토리에 대한 두 단락은 필요합니다."


마운틴 뷰에 있는 본사에서는 NotebookLM을 이 기술 대기업이 개발 중인 수많은 AI 도구 중 하나로 이해하기가 더 쉬웠습니다. 이 도구들은 모두 창의성이라는 주제를 중심으로 돌아가고 있었습니다. 불과 몇 달 만에 구글의 DeepMind 부서는 사용자가 작성한 프롬프트만으로 사실적인 오디오가 포함된 고화질 비디오를 제작할 수 있는 VEO 3를 선보였습니다. Google Labs의 또 다른 비디오 프로젝트인 Flow는 유망한 영화 제작자 팀이 프로젝트에 필요한 AI 요소를 제작할 수 있도록 지원하여, 다른 방법으로는 감당할 수 없었던 수준 높은 애니메이션이나 전 세계의 이국적인 배경을 활용할 수 있도록 했습니다.


존슨과 저는 구글 랩스 책임자인 조쉬 우드워드와 함께했습니다. 그는 AI가 두 가지 방식으로 창작 프로젝트에 도움을 줄 수 있다고 말했습니다. 첫째, AI는 "장벽을 낮춰" 자원 부족, 교육 부족, 또는 둘 다로 인해 기존에 할 수 없었던 프로젝트를 수행할 수 있도록 도와줍니다. 둘째, "한계를 높여" 기존 창작자들이 프로젝트를 한 단계 더 발전시킬 수 있도록 도와줍니다. "한계를 높여"라는 측면에서, 이 부서는 할리우드 배우들("이름을 들어보셨을 겁니다")과 협력하여 주요 영화의 특정 장면에 AI를 활용했습니다. 우드워드는 "물론 경제적인 측면도 있지만", 이러한 기존 창작자들은 이 기술이 "훨씬 더 많은 이야기를 훨씬 더 빠르게 탐구할 수 있게 해 준다는" 것을 알게 되었습니다.


이러한 도구들은 실리콘 밸리의 다른 곳에서 개발되고 있는 도구들과 마찬가지로, 창작 경제를 더욱 혼란에 빠뜨릴 수 있는 잠재력을 분명히 가지고 있습니다. 더 나아가, 이러한 도구들 중 다수, 특히 놀라운 비디오 생성 엔진은 인터넷 시대에 진지한 글쓰기의 중요성을 점점 더 떨어뜨린 문화적 변화를 가속화할 가능성이 높아 보입니다. 점점 더 많은 비언어적 활동에 쫓기는 일반 사용자들은 짧은 분량의 정보를 원하는 대로 받아보는 것에 만족하는 현실에서, AI가 역사학자들과 경쟁할 것이라고 걱정하는 것조차 순진했을지도 모릅니다.


우드워드와 존슨은 둘 다 자신들의 사업이 지닌 파괴적인 잠재력을 인지하고 있는 듯했습니다. 랩스는 개발 도구에서 인간 창작자의 이익을 최우선으로 고려했습니다. 존슨은 역사가와 다른 작가들이 앱을 통해 수익을 창출할 수 있는 방법을 오랫동안 고민해 왔습니다. 마운틴 뷰에서 진행된 인터뷰에서 그는 새로운 수익원을 제시했습니다. 역사 전자책에 NotebookLM과 같은 인터페이스를 추가하면 어떨까요?



그는 이어서 "각 장으로 구성된 선형적인 이야기"가 있다고 상상해 보라고 했습니다. 하지만 작가가 책을 쓰는 데 사용한 주요 자료들도 함께 제공된다고 가정해 보겠습니다. 이렇게 하면 "단순한 참고문헌 목록이 아니라 모든 원본 자료가 담긴 라이브 컬렉션"을 챗봇이 탐색할 수 있게 됩니다. 타임라인, "마인드맵", 주요 주제에 대한 설명 등 생각할 수 있는 모든 것을 제공할 수 있습니다.


아마도 AI 역사상 가장 머리를 쥐어짜는 비전일 것입니다. 지능형 에이전트가 과거에 대한 책을 쓰는 것을 돕고, 그 책에 무한한 미래까지 연결되어 독자들이 그 책을 해석하도록 영원히 돕는다는 것입니다. 인간 지식의 관점에서 볼 때, 그것은 유토피아일까요, 디스토피아일까요? 누가 알겠습니까?


읽은 사람로버트 패스

내레이션 제작:에마 켈벡그리고크리쉬 세니바산

엔지니어링:데빈 머피


위 그림의 출처 작품: Corbis Historical/Getty Images; Hulton Fine Art Collection/Heritage Images, Getty Images를 통해.

자세한 내용은 Alphabet Inc. , OpenAI에서 확인하세요


================================================================================

By Bill Wasik

Bill Wasik is the magazine’s editorial director.

June 16, 2025


During my 25 years as a magazine editor, my favorite part of the job has always been helping writers figure out what the story is: where to start it, where to end it, what’s important and new about it. So it was with no small amount of humility that, earlier this year, I sat in a Google corporate cafeteria along the West Side of Manhattan and watched as one of my longtime writers — Steven Johnson, the technology journalist and historian — received that kind of guidance from an A.I. instead of me.


Johnson, who has published popular histories about pirate attacks, the invention of modern policing and the birth of public health, had begun noodling on a possible book about the California gold rush of the mid-19th century, he explained. But he was still at the point where he didn’t know much more than that. “What’s my twist?” he said. “Literally, I don’t know.”


To figure it out, Johnson had loaded some of his sources into NotebookLM, an app for researchers and writers that he himself helped build, after becoming the editorial director of Google’s Labs division three years ago. Unlike most other A.I. tools, which draw their answers to questions from the mind-boggling infinitude of data they were trained on, NotebookLM draws only from files selected by the user, on the premise that most forms of research benefit from thoughtfully curating your source material.


Since the product’s worldwide release last year, Google and Johnson have been promoting its utility for all manner of tasks, whether it’s auto-generating minutes and takeaways from an audio recording of a meeting or encouraging a more licit use of A.I. among college students. NotebookLM’s most viral capability is an auto-generated podcast, which in a matter of a couple of minutes will spit out a detailed conversation between two freakishly realistic voices, drawing out the key concepts of the source material. But as an occasional author of history books myself, I was most interested in how A.I. — one of whose many superpowers is the ability to inhale large amounts of text in an instant and offer credible summaries of it — might transform the way history is written.


At Google that evening, as the sun went down over the Hudson, Johnson showed me the results of his experiments so far. He started his brainstorming process by giving NotebookLM excerpts from one of the finest existing histories on the Gold Rush, H.W. Brands’s “The Age of Gold.” He thought he might want to focus on the conflict between white gold-seekers and the Native American groups living in the Yosemite Valley in the 1850s, so he uploaded the text of an older source called “Discovery of the Yosemite,” by Lafayette Houghton Bunnell, who was part of the Mariposa Battalion, the militia unit that rode into the valley in 1851. Next, to bring in the Indigenous perspective, he went to public-domain websites and found two accounts about the people whom the battalion expelled from the valley: “The Ahwahneechees: A Story of the Yosemite Indians” and “Indians of the Yosemite Valley and Vicinity.”


Johnson started his conversation with NotebookLM with a little orientation, identifying himself as the author Steven Johnson, so that the A.I. (whose training allows it to understand almost the whole internet, as ChatGPT does, even if it constrains its answers to the uploaded sources) might get a sense for the kinds of books he writes. Then he started peppering it with questions: What in the two sources that focused on the Indigenous experience, he asked, was missing from the other two sources? When the model returned its summary, his eye was caught by the observation that “The Ahwahneechees,” by including short biographies of individual Yosemite Indians, “helps to humanize the people beyond being a tribal mass, which is something that ‘The Age of Gold’ and Bunnell’s book tend to do.” The A.I. listed some of their names, among them Maria Lebrado, granddaughter of the Yosemite chief Teneiya.


That piqued Johnson’s interest. He asked for more information about Lebrado, and the tool returned nearly 600 words of biography — that she was one of the 72 Native people forced to leave the valley by the battalion in March 1851; that she eventually married a Mexican man who ran a pack train down in the Central Valley; that she was “discovered” by a white historian in the 1920s and held up as the last of the original Yosemite Indians.


Right away, Johnson recognized that she would make a great character. He took note in particular of the fact that Lebrado returned to the valley near the end of her life. “I’m like, What’s the [expletive] structure of ‘Titanic’?” he joked. The book could open with what Johnson imagined was Lebrado’s emotional return to the valley at nearly 90 years old, before zooming back in time — to her childhood, to a broader cast of characters and the violent drama of the 1850s.


Johnson wasn’t sold on this idea yet. But he marveled at how A.I., operating with mostly open-source texts and a tiny amount of human labor, had delivered him a concept that he absolutely could use. “Everything I’ve just showed you is, like, 30 minutes of work,” he said.




Like most people who work with words for a living, I’ve watched the rise of large-language models with a combination of fascination and horror, and it makes my skin crawl to imagine one of them writing on my behalf. But there is, I confess, something seductive about the idea of letting A.I. read for me — considering how cruelly the internet-era explosion of digitized text now mocks nonfiction writers with access to more voluminous sources on any given subject than we can possibly process. This is true not just of present-day subjects but past ones as well: Any history buff knows that a few hours of searching online, amid the tens of millions of books digitized by Google, the endless trove of academic papers available on JSTOR, the newspaper databases that let you keyword-search hundreds of publications on any given day in history, can cough up months’ or even years’ worth of reading material. It’s impossible to read it all, but once you know it exists, it feels irresponsible not to read it.


What if you could entrust most of that reading to someone else … or something else? As A.I. becomes more capable of parsing large data sets, it seems inevitable that historians and other nonfiction writers will turn to it for assistance; in fact, as I discovered in surveying a wide variety of historians over the last few months, experiments with it are already far more common than I expected. But it also seems inevitable that this power to help search and synthesize historical texts will change the kinds of history books that are written. If history, per the adage, is written by the winners, then it’s not premature to wonder how the winners of the A.I. race might soon shape the stories that historians tell about the past.


Among the historians I spoke with, one of the more enthusiastic experimenters was Fred Turner, who teaches in the communication department at Stanford. I arrived at his office expecting to interview him about how A.I. fits into the long history of information technology, but we wound up spending much of our time discussing how ChatGPT has helped him with his latest book project, which revolves around the New York City art scene of the 1970s and 1980s.


He was at a stage that he called a “source outline” — meaning a document of 100 pages or so compiling all his research, “organized more or less in the arc of the book that I think it’s going to become.” From that, he was planning to write a proposal, but he figured he would ask ChatGPT first. In response, the chatbot rattled off a plausible, polished eight-chapter structure, one that surfaced useful connections in his research and also suggested a more streamlined narrative for the project.



Beyond that, he said, “what it did was give me my quite scholarly work read back to me through a middlebrow voice. It found the sort of average of my work, which was really interesting.” He went on: “It was almost as though I got to take the book to market and stand in the bookstore and hold it up in front of a whole bunch of interested but nonspecialist readers and have them tell me what was working for them and what wasn’t.”


There are a handful of scholars who are beginning to more formally incorporate the use of L.L.M.s into their work. One of them is Mark Humphries, a professor at Wilfrid Laurier University in Ontario, whose research projects involve enormous stores of digitized records from Canadian history. In one project, he and his students used A.I. to analyze tens of thousands of handwritten records about late 18th- and early 19th-century fur trading, in order to better understand the far-flung community of traders (now known collectively as “voyageurs”) who, with their families, explored and later settled much of what would eventually become Canada. “If you can pass those records to a large-language model and you can say, ‘Tell me who Alexander Henry’s trading partners were,’” Humphries said, “the neat thing is that it’s able to very quickly go through and not just search by name but do cross-referencing, where you’re able to find relationships.”


The goal is to find not just one-to-one transactions between specific voyageurs but chains of interconnection that would be hard for human researchers to make quickly. “It takes an A.I. 20 seconds,” Humphries said. “It might take a graduate student doing the same work weeks.”


To be sure, Humphries — like Steven Johnson — is swimming in the deep end of A.I experimentation. Most historians I contacted were only dipping a wary toe in the water. When I reached out to Ada Ferrer, Princeton professor and author of the Pulitzer Prize-winning book “Cuba: An American History,” she wrote back an hour later to say that she had just tried playing with A.I. in recent weeks. “I was finishing up a book and feeling stuck on a title, so I asked ChatGPT,” she wrote. “I kept tinkering with my prompt, including different themes, making suggestions about tone and so on. In the end, it probably gave me about 20 title ideas.” (None were quite good enough, however, and her book remained untitled.)


Ferrer sounded a note that many other academic historians did: that their attitudes toward A.I. lived in the shadow of their students’ cheating with it, which simultaneously made them reluctant to touch it but also seemed to have made them understand just how powerful it was as a tool. “I am haunted by the fact that it would be hypocritical for me to use A.I. given how concerned I am with my students’ use of it,” said Jefferson Cowie of Vanderbilt, who won a Pulitzer Prize in 2023 for his book “Freedom’s Dominion: A Saga of White Resistance to Federal Power.” But he added, “I also know that a few people will be putting it to astoundingly creative use once we get a handle on it.”


The obvious question hanging over the future of A.I. history — and the technology’s utility for all manner of other things — comes down to the strides it needs to make on its accuracy problem. Charles C. Mann, author of “1491” and, most recently, “The Wizard and the Prophet,” told me that he experimented with various models while researching a new book project about the history of the American West, and they turned up some great leads, but he became disturbed at how easy it was for them to regurgitate bad information. Mann contrasted it with the rigor of a human editorial process: “I’m sure you’ve had that moment, as a journalist, where a smart editor has said, ‘Wait a second — does this make sense?’ And you say, ‘Oh, crap, it doesn’t.’ That’s what A.I. can’t do. It has no bullshit detector.”


In May of this year, The Times published bracing numbers about how, inexplicably, for all the strides in capability that L.L.M.s were otherwise making, their hallucination problem was getting worse: For example, on a benchmark test, OpenAI’s new o3 “reasoning” model delivered inaccuracies 33 percent of the time, more than twice the rate of its predecessor. To Johnson and his team at Google, the persistence of this problem validates the approach of NotebookLM: While the tool does occasionally misrepresent what’s in its sources (and passes along errors from those sources without much ability to fact-check them), constraining the research material does seem to cut down on the types of whole-cloth fabrications that still emerge from the major chatbots.


That said, Johnson also believes that the most exciting uses for L.L.M.s in nonfiction research are the ones in which the results will always be fact-checked. Rather than seeing A.I. as an undergrad research assistant, he’s envisioning it as more like a colleague from another department or perhaps a smart book agent or editor who can help him see the most interesting version of his own ideas. It should be noted that, for other historians, this is hardly an inspiring prospect. When I asked Stacy Schiff, the author of decorated biographies of Cleopatra and Véra Nabokov, about the notion of consulting A.I. on how to structure a piece of writing, she replied, “To turn to A.I. for structure seems less like a cheat than a deprivation, like enlisting someone to eat your hot fudge sundae for you.”




Image

22Mag-AIHistory-02-articleLarge.jpg?quality=75&auto=webp&disable=upscale

Credit...Photo illustration by enigmatriz


How might A.I. change the way history is written and understood? To answer that question, it’s useful to think about L.L.M.s as merely the latest in a long series of shifts in the organizing of human knowledge. At least since the third century B.C., when Callimachus wrote his “Pinakes,” a series of books (now lost) cataloging the holdings of the famous library (now lost) in Alexandria, humanity has devised increasingly sophisticated systems for navigating pools of information too large for any one individual to take in.



Such systems inevitably have a double edge when it comes to scholarly research, a task where “efficiency” always risks being synonymous with cutting corners. The printed index in books, a device dating back at least to the year 1467, allowed scholars to find relevant material without reading each tome in full. From the perspective of human knowledge, was that a step toward utopia or dystopia? Even now, 558 years later, who’s to say? Innovations that cultivate serendipity — such as the Dewey Decimal System, by whose graces a trip into the stacks for one book often leads to a different, more salient discovery — must, almost by definition, be plagued by arbitrariness. Classify a book about the Mariposa Battalion with Brands’s “The Age of Gold” and other gold-rush titles (979.404), and it will acquire a very different set of neighbors than if it’s classified as a book about the Battalion’s victims (“Native populations, multiple tribes,” 973.0497).


The rise of computers and the internet were of course an unprecedented turning point in the history of tools for writing history — exponentially increasing the quantity of information about the past and, at the same time, our power to sift and search that information. Psychologically, digital texts and tools have thrown us into an era, above all, of “availability”: both in the colloquial sense of that word (everything’s seemingly available) and in the social-scientific sense of “availability bias,” whereby we can fool ourselves into thinking that we have a clear and complete picture of a topic, buffaloed by the sheer quantity of supporting facts that can spring up with a single, motivated search.


Even among academic historians, this availability has shifted incentives in a direction that A.I. is likely to push even further. In 2016, years before the L.L.M. explosion, the University of Pittsburgh historian Lara Putnam published an essay about the achievements but also the dangers of search-driven digital research. “For the first time, historians can find without knowing where to look,” she wrote, in a particularly trenchant paragraph. “Technology has exploded the scope and speed of discovery. But our ability to read accurately the sources we find, and evaluate their significance, cannot magically accelerate apace. The more far-flung the locales linked through our discoveries, the less consistent our contextual knowledge. The place-specific learning that historical research in a predigital world required is no longer baked into the process. We make rookie mistakes.”


Putnam’s essay wasn’t a jeremiad against digital tools — which can power what she memorably calls the “sideways glance,” the ability for a historian whose expertise lies squarely in one domain to get up to speed more quickly on other topics. Digital search has allowed historians to make genuine, powerful connections that wouldn’t have been made otherwise. But she worried about what was being lost, especially given that the pool of digitized sources, even as it keeps growing, remains stubbornly unrepresentative: biased toward the English language and toward wealthy nations over poor ones, but biased especially toward “official” sources (those printed rather than written, housed in institutional rather than smaller or less formal archives). “Gazing at the past through the lens of the digitizable,” Putnam notes, “makes certain phenomena prominent and others less so, renders certain people vividly visible and others vanishingly less so.”


When she and I chatted recently, Putnam compared this shift to Baumol’s cost disease — the phenomenon, noted by the economist William Baumol, that when technology makes certain workers more efficient, it winds up making other forms of labor more expensive and therefore harder to justify. In principle, Putnam notes, digital tools have no downside: Professional historians remain more than capable of carrying out time-consuming research in physical archives. But in practice, the different, faster, more connective kind of research was making the more traditional work seem too professionally “expensive” by comparison. Why spend a month camped out in some dusty repository, not knowing for sure that anything publishable will even turn up, when instead you can follow real, powerful intellectual trails through the seeming infinitude of sources accessible from the comfort of home?




Putnam hasn’t experimented with A.I. research herself, and her own fears run to the basic (and perhaps correct) nightmare scenario that the technology will destroy the history business the same way that it’s destroying the art of student essay-writing, i.e., by composing texts that are just plausible enough to make human work irrelevant. But even if that nightmare is averted and A.I. becomes the human historian’s collaborator instead of her replacement, it’s easy to see how A.I. summarization could transform nonfiction writing along lines analogous to what digital search has done. The individual sources would fade yet further into the background, as users trust tools like NotebookLM to offer cogent-seeming summaries of enormous troves of texts without much attention to their origins or agendas. What becomes staggeringly “cheap,” in such a world, is work that attempts to synthesize astonishing amounts of material, perhaps drawing on sources far beyond what a single human could process in a lifetime, ranging promiscuously across languages, borders and time periods, at a speed that would allow a single human to complete multiple such projects in a career.


The potential upsides of such a shift should not be discounted. At the moment, perhaps the greatest drama in the world of popular history is the question of whether the 89-year-old Robert Caro can finish the fifth and final volume of his Lyndon Johnson biography, a titanic undertaking that has consumed 50 years of his life. His personal papers, some of which he has already given to the New York Historical, so far constitute 150 linear feet of file boxes, and one wonders how many more prodigious biographies Caro could have produced over those 50 years if a chatbot had been able to synthesize some portion of that material for him. Then again, without a mania to touch every single source himself, and to pour the rigor of all that relentless reading into his prose, an A.I.-assisted Robert Caro would not have been Robert Caro at all.


In Steven Johnson’s experiments with gold-rush history, the most eye-opening result came when he floated a structural thought of his own to the NotebookLM chatbot. It drew on Johnson’s infatuation with what he calls the “long zoom” — a mode of storytelling that, like the famous Charles and Ray Eames documentary “Powers of Ten,” moves exponentially in time or scale.


“Just thought of a cool structure for this book,” he told the chatbot. “Maybe most of it is a series of chapters telling the story leading up to the Mariposa Battalion events” — meaning the invasion of Yosemite Valley — “but each chapter is a time scale. So Chapter 1 is called: a million years before; Chapter 2 is a thousand years before; Chapter 3 is a hundred years before, etc. etc.: a decade, a year, a month, a week, a day. And then the war starts in 1851. And then there’s a long epilogue. Sketch out what the content of each of those chapters could be? What part of the big picture story would we be telling in that segment?”


Johnson already knew why that structure could work: because the time scales that endowed the valley with the key elements of the drama (gold, the first humans, the specific Indigenous nations of the mid-19th century, the encroaching white settlers) stretched out over all those powers of 10. But it was astonishing to see that the A.I. perceived all of that, too, without Johnson having to tell it:



● A Million Years Before: The geological formation of the Sierra Nevada, the creation of the gold deposits and the carving of the Yosemite Valley by glacial activity.
● A Thousand Years Before: Early human migrations and the establishment of Indigenous cultures in the Sierra Nevada, focusing on their adaptation to the environment.
● A Hundred Years Before: The lives of the ancestors of the Yosemite Indians, intertribal relationships, early contact with Europeans and the initial impacts of disease.
● A Decade Before: The increasing American presence in California, the Mexican-American War, the annexation of California and the initial rumors of gold.
● A Year Before: The discovery of gold at Sutter’s Mill, the rapid influx of prospectors, the establishment of mining camps and the first signs of conflict with Native American tribes. Introduction of key figures like James Savage and Chief Tenieya.
● A Month Before: Escalating tensions, raids on trading posts, the formation of settler militias and failed attempts at negotiation leading to the Mariposa War.
● A Week Before: The organization and movements of the Mariposa Battalion, the perspectives of the Yosemite Indians as conflict becomes imminent.
● A Day Before: The final hours before the outbreak of the Mariposa War, focusing on the psychological states and expectations of individuals on both sides.



Earlier this spring, I went to visit Johnson at Google’s campus in Mountain View, Calif., for an update on his progress. Johnson had stuck with his cosmic powers-of-ten approach, and he now was trying to refine his concept for a first chapter, the one set a million years before 1851. He told me that he had become obsessed with the California oak, whose acorns were one of the main sources of subsistence that allowed the earliest Indigenous groups to settle in the valley.




When I sat down with Johnson in a conference room, he showed me NotebookLM’s new “mind map” feature, which creates an auto-generated conceptual tree from your source material, allowing you to explore thematically without having to write specific queries. He was interested in a phenomenon called “masting,” in which oaks sync up to drop large quantities of acorns in a single season, and he had added a group of sources on masting into the tool. Then he generated a mind map for them, which created forking thematic paths about the phenomenon: for example, the topic “Hypotheses for Masting” branched out to include “Predator Satiation Hypothesis,” “Pollination Efficiency Hypothesis” and more. Johnson saw the utility of all this in similar terms to how Putnam talked about the “sideways glance”: “I don’t need to be an expert on acorns, but I do want to have two paragraphs about acorns.”


Here at the Mountain View mothership, it was easier to understand NotebookLM as just one of a host of A.I. tools that the tech giant was developing, all swirling around the theme of creativity. In just a couple of months, the company’s DeepMind division would introduce VEO 3, which can create high-definition videos with realistic audio entirely from prompts written by users. Flow, a different video project within Google Labs, was helping teams of up-and-coming filmmakers create A.I. elements for their projects, giving them access to, say, a caliber of animation or exotic settings from around the world that they couldn’t have afforded otherwise.


Johnson and I were joined by Josh Woodward, the head of Google Labs, who told me that he saw A.I. as capable of aiding creative projects in two ways: First, it can “lower the barrier,” helping people undertake projects that they otherwise couldn’t, whether out of a lack of resources, lack of training or both; and second, it can “raise the ceiling,” helping established creators take their projects to new levels. In terms of “raising the ceiling,” the division was working with Hollywood talent (“you would know their names”) to use A.I. on particular shots in major films: “Of course there’s an economic dimension to it,” Woodward said, but these established creators were also seeing how the technology let them “explore so many more stories, so fast.”


These tools, along with those being developed elsewhere in Silicon Valley, clearly have the capacity to throw the creative economy into even greater turmoil. Beyond that, many of them — the mind-boggling video-generation engines, in particular — seem likely to accelerate the cultural changes that have made serious writing less and less relevant in the internet era. Perhaps it was naïve to even worry about A.I.’s competing with historians, when the typical user, amid a life increasingly consumed with other, nonverbal diversions, is satisfied to receive facts on demand in bite-size bursts.


Both Woodward and Johnson seemed aware of the destructive potential of their enterprise. In the tools it designs, Labs has tried to keep the interests of the human creators at the forefront. Johnson has been thinking all along about ways that historians and other authors could make money through the app. In our conversation in Mountain View, he put forward a possible new revenue stream: What if e-books of history came enhanced with a NotebookLM-like interface?



Imagine, he went on, that “there’s a linear version of the story with chapters,” but then the primary materials the author used to write the book also come bundled with it. That way, “instead of just a bibliography, you have a live collection of all the original sources” for a chatbot to explore: delivering timelines, “mind maps,” explanations of key themes, anything you can think to ask.


It is perhaps the most brain-breaking vision of A.I. history, in which an intelligent agent helps you write a book about the past and then stays attached to that book into the indefinite future, forever helping your audience to interpret it. From the perspective of human knowledge, is that utopia or dystopia? Who’s to say?



Read by Robert Fass

Narration produced by Emma Kehlbeck and Krish Seenivasan

Engineered by Devin Murphy


Source artwork for illustrations above: Corbis Historical/Getty Images; Hulton Fine Art Collection/Heritage Images, via Getty Images.




매거진의 이전글Maps: Tracking Wildfires