현재의 위기 속에서 취할 방법은 무엇인가
반도체 산업, 특히 반도체 제조업에서 '현업 중심'의 R&D를 한다는 것이 어떤 의미인가?
최근 출간된 신간 도서에 대한 추천사에서도 이 주제를 조금 언급하긴 했지만, 의외로 '첨단 테크'기업이라 부를만한 기업들의 R&D라는 것이 반드시 그 '첨단 테크'보다 더욱 첨단스러운, 즉, 최첨단 연구로만 점철되는 것은 아니다. 긴 글을 쓰기 전에 요약만 먼저 이야기하자면, 그 이유는 몇 세대 이후에나 쓰일 첨단 R&D에만 집중하기에는 현재의 그 첨단 기술이라는 것이 너무나도 문제가 많고 불안정한 기술이라, 그것을 꾸준히 이어가려는 의지와 프로젝트 관리가 뒤따르지 않는다면 그러한 기술들은 쉽게 사장되기 때문이다.
한 때는 전 세계 연구자들에게 가장 천국 같은 연구소로서 미국의 통신회사 AT&T 산하의 벨연구소라는 곳이 매우 유명했다. 벨연구소의 '벨'은 다름 아닌 AT&T의 설립자이자 전화기의 발명자 그레이엄 벨이다. (여담이지만 한 때 즐겁게 봤던 fox의 SciFi 드라마 시리즈 프린지에 나오는 끝판왕 격 IT 종합 대기업 매시브 다이내믹스의 설립자가 윌리엄 벨인데, 내 개인적 생각으로는 이 드라마에 나오는 매시브 다이내믹스사가, 만약 AT&T가 제대로 IT 기업으로 변신했다면 그렇게 되었을법한 롤모델처럼 보인다.) 사람들마다 반도체 산업의 효시를 무엇으로 정의하느냐는 조금 달라지지만, 그래도 공통적으로 언급되는 것이 바로 1947년 벨연구소에서 처음으로 발명된 트랜지스터다. 그래서 빌 게이츠의 타임트래블 소망 시점 중 하나도 바로 1947년 트랜지스터 발명 시점이기도 하다. 벨연구소는 형식상으로는 AT&T라는 거대 기업 산하의 종합 연구소였지만, 이 연구소는 특이하게도 원천 기술 단계를 넘어, 아예 물리학, 화학은 물론, 생물학이나 심지어 심리학 같은 기초/응용과학 관련된 다양한 분야의 연구를 폭넓게 다루면서도 또한 집중하는 특징을 가지고 있었다. 이 연구소에서 배출한 (잠시 지나쳐간 것을 제외해도) 노벨상 수상자만 13명이기 때문에, 웬만한 명문대보다 훨씬 높은 위상을 가지고 있기도 하다. 심지어 노벨물리학상을 수상한 우주배경복사 역시 벨연구소에서 일하던 두 공학자들에 의해 처음으로 관측되기도 했다.
벨연구소는 1925년에 설립되었는데, 벨연구소가 기업의 영리와는 별로 관련이 없어 보이는 기초 과학 연구를 그것도 다양한 분야에 걸쳐 장시간 할 수 있었던 이유는 모기업인 AT&T가 20세기 대부분의 시간 동안 미국의 장거리/가정용 통신 산업에서 독점적 지위를 누리며 막대한 수익을 거둘 수 있었기 때문이다. AT&T 입장에서는 벨연구소에 투자하는 연구비는 한 해 매출액도 아니고 그냥 순수익에만 비교해 봐도 그야말로 조족지혈에 불과했던 것.
사실 벨연구소의 재정은 2차 대전 이후, 벨연구소의 규모가 너무 커지고, 또한 AT&T에 대한 미 정부의 규제가 본격화되기 시작하면서 조금씩 정부 의존도가 높아지기도 했다. 그렇지만 사실 초창기의 벨연구소에 비해 2차 대전 전후의 벨연구소는 조금씩 창의성을 잃어가고 있었는데, 그 대표적인 사례가 바로 그 트랜지스터다. 트랜지스터 자체를 AT&T가 발명했으니, 당연히 순리대로라면 AT&T가 20세기 후반 들어 글로벌 최대의 반도체 기업이 되는 것은 당연해 보일 수도 있다. 그렇지만 우리 모두가 잘 아는 것처럼, AT&T는 반도체 기업으로 거듭나지도 못했고, 자체적인 반도체를 설계하거나 제조하는 방향으로도 딱히 좋은 성과를 거두지 못했다.
벨연구소가 그렇게 혁신적인 발명과 발견, 기초과학에서의 성과를 많이 거두었음에도 불구하고, 트랜지스터에서 빛 나는 잠재력을 놓친 이유는 무엇일까? 반도체 산업사에서는 주로 쇼클리 박사의 일화를 중심으로 이를 논하곤 하는데, 예를 들어 1947 트랜지스터 발명의 주역인 윌리엄 쇼클리의 쇼맨쉽과 리더십, 그리고 독재적 마인드가 이러한 diruption의 배경으로 잘 알려져 있기도 하다. 이 배경을 요약하자면, 쇼클리가 단독 발명한 것이 아님에도 불구하고 마치 자신의 업적인 양 포장해서 심지어 벨연구소는 물론, AT&T의 뒤통수를 치면서 자신의 기업을 만드는 방향으로 트랜지스터의 사업 분기가 일어났다는 식이다 (트랜지스터 발명은 1956년, 공동 발명자였던 존 바딘, 윌리엄 쇼클리, 월터 브래튼에게 노벨 물리학상을 가져다주었다.). 그런데 이는 반만 맞고 반은 아니다. 실제로 윌리엄 쇼클리는 1947년 최초의 트랜지스터 발명 이후, 1951년 샌드위치 타입의 접합(BJT) 트랜지스터 등으로 트랜지스터의 집적을 위한 기술을 차곡차곡 쌓아 갔는데, 이 과정에서 벨연구소는 물론, AT&T의 직접적인 자금 지원은 별로 많지 않았다. 야심만만했던 쇼클리는 결국 벨연구소 외부에서 자신의 연구개발을 위한 펀드를 찾으려 했고, 그 펀드 주체 중 한 곳은 당연히(?) 미 정부와 대학이었다. 아마도 실리콘밸리가 원래 AT&T가 있었던 동부가 아니라, 서부 캘리포니아에서 시작된 연유도 쇼클리가 벨연구소를 나와 1953년 학계로 이직한 대상이 다름 아닌 Caltech이었기 때문이었을 정도로, 쇼클리의 이직은 반도체 산업에서는 매우 상징적인 사건이기도 했다. 쇼클리의 이직과 1955년 소클리 반도체 연구소 창업, 그리고 그 이후 그의 회사에서 뛰쳐나온 직원들이 차린 페어차일드, 인텔 등으로 이어지는 반도체 무게중심의 이동과 변혁은 이미 잘 알려진 이야기이니 더 이야기할 필요는 없을 것이다. 여기서 한 가지 추가로 이야기해야 할 부분은 왜 1946-1953년 사이, 쇼클리의 트랜지스터 기술이 충분히 더 발전할 수 있었던 핵심 기술과 모멘텀을 AT&T, 특히 그 유명했던 벨연구소가 놓쳤느냐는 것이다.
벨연구소가 놓친 혁신적 기술은 비단 트랜지스터뿐만은 아니지만, 만약 벨연구소가 트랜지스터, 그리고 그 이후에 이어지는 집적회로와 반도체 화학공정 등으로의 기술에 더 전사적으로 꾸준히 투자했다면, 현재 우리가 알고 있는 반도체 산업의 지형은 사뭇 달랐을 것이다. 벨연구소는 트랜지스터뿐만 아니라, 태양전지, 광섬유, 스마트폰 같은 혁신적 기술의 원류를 탐색하고 원천 기술을 가지고 있기도 했지만, 결국 이 중 모기업인 AT&T가 사업화까지 바통을 이어받아 성공한 케이스는 극히 드물다. 만약 벨연구소가 처음 발명했거나 발견한 기술 혹은 현상이 단 2-3개만 사업화로 이어졌다면, AT&T의 현재는 통신 기업이 아니라 종합 IT 대기업이 되었을 것이다. AT&T는 2차 대전 이후, 독점적 지위를 놓고 끊임없이 미 연방정부와 다툼을 벌였지만, 1978년 법무부가 반독점법에 근거한 소송을 제기, 4년 간의 다툼 끝에 1982년 장거리 통신과 연구소만 갖는 방식으로 회사가 분할되는 판결이 내려졌으며, 결국 1984년 그 유명한 반독점법 소송에서 결국 패하면서 AT&T의 분할이라는 결말을 맞았다. 분할된 후에도 벨연구소는 AT&T를 모기업 삼아 남아 있을 수 있긴 했으나, 장거리 통신 사업이 점차 이동통신 방향으로 넘어가면서 수익성이 저하되고, 야심 차게 추진한 PC 사업도 IBM과 애플, 마이크로소프트에 밀리면서 결국 실패했다.
사실 AT&T가 분할될 때 남은 모기업이 통신 외의 다른 사업을 추진하고자 했을 때, 벨연구소에서 개발된 수많은 반도체 관련 기술들을 제대로 관리하고 그것을 사업화로까지 잘 이어갔다면 아마 AT&T는 변신에 성공했을 것이다. 그렇지만 트랜지스터는 물론, 이후 집적회로 설계와 공정, 장비, 부품 기술들, 특히 리소그래피와 관련된 광학 기술이나 레이저 기술 등이 사장되면서 AT&T는 그 성과를 제대로 활용하지 못했고, 그래서 반도체 기업으로 변신하는 것에 실패했다. 이러한 실패는 즉각적으로 벨연구소에도 영향을 미쳤는데, 더 이상 벨연구소는 연구자들의 에덴동산이 될 수 없었으며, AT&T가 아닌, 분사된 루슨트 테크놀로지에 인수되면서 연구 분야는 물론, 연구 인력의 규모도 대폭 축소되었다. 루슨트에서도 별 재미를 못 본 벨연구소는 다시 노키아에 인수되었는데, 노키아는 벨연구소 연구진을 완전히 이동통신 위주로 정리하면서 그나마 남아 있던 일부 기초과학 연구자들은 정든 직장을 떠나야 했다. 예전에 본 자료에 따르면 1980년-2010년 사이 벨연구소 alumni들이 대학으로 옮긴 케이스는 물경 1000명이 넘는다고 알려져 있는데, 그만큼 많은 연구자들이 벨연구소에서 연구하고 있었다는 뜻이기도 하고, 대학에서도 경쟁력 있는 수준의 연구자였다는 것을 방증하는 것이기도 하다. 이후 노키아 역시 이동통신에서 경쟁력을 잃어버리면서 현재의 벨연구소는 과거의 영광을 재현하지 못 한채 평범한 기업 부설 연구소처럼 되어버렸다.
어쨌든 벨연구소가 1947-1953년 사이, 그 중요했던 6년간의 숨 가쁜 트랜지스터 기술의 발전 과정에서, 쇼클리, 그리고 쇼클리 그룹의 연구원들이 개발한 트랜지스터의 중요성을 제대로 간파하지 못 한 이유는 벨연구소의 독특한 연구 풍토와도 관련이 있다. 당시 벨연구소 측의 IP 관리 부서와 변호사는 쇼클리의 트랜지스터, 특히 접합 트랜지스터 기술이 일종의 양자역학 (더 정확히는 고체물리학) 이론 체제에 기반을 둔 소재 특성 정도로만 생각했다 (이는 기술 내재 가치의 평가를 위해 충분한 전문성이 뒷받침되어야 한다는 중요한 사례이기도 하다.). 반도체 물질에 전기장을 걸어주었을 때 전자의 drift & diffusion 현상에 의거한 반응을 쇼클리는 꽤나 공들여 해석하려 했는데 (지금도 교과서에 나온다), 이는 오히려 경영진 측에는 역효과를 주면서 벨연구소 측에서는 이를 그다지 중요한 특허로 인식하지 못하게 했다. 당연히 쇼클리는 이에 대한 반발을 했고, 쇼클리 특유의 독재자 혹은 쇼맨쉽이 가미되면서 벨연구소가 이를 자신들 혹은 모기업의 사업으로 발전시킬 타이밍을 놓쳤다. 그렇지만 당시 벨연구소 측에도 이러한 부분에 대한 변명 거리가 없는 것은 아니다. 1950년대 초기의 트랜지스터는 우리에게 현재 익숙한 형태의 트랜지스터와는 거리가 멀었고, 진공관을 대체하기 위해 만든 커다란 스위치 정도에 불과했기 때문이다. 물론 그 개념상 충분한 제조기술과 정밀한 장비가 있다면 이를 축소시키는 것은 가능했지만, 당시의 벨연구소 IP 평가자들 입장에서는 이는 마치 뉴커먼의 증기기관이 발명되었으니, 현재의 가솔린차 수준의 이동수단을 상상하라는 것과 비슷한 느낌이었을 것이다. 벨연구소의 문화상, 뉴커먼의 증기기관 같은 새로운 물건을 처음 발명하는 것 자체는 환영하고 또 권장되었기도 했지만, 그것을 다시 정교하고 꾸준하게 트러블슈팅하면서 쓸만한 물건으로까지 발전시키는 것에는 별로 중요한 가중치를 주지 않았던 것.
연구자들 입장에서, 특히 경제적 가치나 상업화 등에 별로 신경 쓰지 않는 기초과학자들 입장에서는 벨연구소의 당시 연구개발 문화는 정말 천국 같았을 것이다. 기업의 재무담당 임원 등 고위 경영진이 '이거 개발해서 뭐해요? 그거 돈이 됩니까? 지금 이런 연구할 때에요? 이번 해 특허 몇 편 썼는지 실적 보고 하세요! 이런 장비 사서 뭐 합니까? 있는 장비 재활용하세요! 그 연구부서는 돈 되는 연구도 안 하는데 뭘 또 신입 직원을 채용합니까?' 같은 정상적인(?) 태클도 안 들어온다. 오히려 뭐를 개발하고 연구하든 그냥 연구자들이 알아서 하게 놔두고, 모기업이 별로 관심 없는 분야로까지 다양한 시도를 해 볼 수 있는 자유, 거기에 더해 풍족한 연구비와 다양한 연구 시설은 그야말로 이상적인 연구 개발 환경처럼 보인다. 하지만 문제는 전술했듯, 이러한 연구는 애초에 그 모기업이 이러한 연구개발 조직의 연구 성과와 상관없이 확실한 캐시카우가 장기간 보장될 때만 가능하다는 것이다. 생각해 보면 인류의 문명 역사 상, 그 어떤 기업이나 조직도 한 가지 분야의 기술 독점만으로 수백 년 넘는 장구한 세월 동안 독점적 지위를 보존한 사례가 없다. 이는 다름 아닌 기술의 발전 과정에서 어느 시점에는 과거 기술에 레퍼런스를 둔 선형 발전의 궤도에 변화가 생기는 disruption이 생기기 때문이다. 벨연구소의 모기업 AT&T도 이러한 변화에 대해 예외는 아니었고, 결국 벨연구소의 Belle Époque도 100년을 채우지 못하고 끝나게 된다.
사실 벨연구소에서 꽃 피웠던 문화는 기업 연구소보다는, 재단의 연구소 혹은 정부의 공적 연구소에 더 어울리는 문화에 가깝다. 재단이나 정부 같은 비영리 기관은 연구의 경제적 파급효과보다는 연구의 참신성과 파괴적 영향력, 전혀 새로운 시도와 실패가 용인되는 다양한 시도를 할 수 있는 문화를 정착시킬 수 있다. 그렇지만 주주의 이익에 복무해야 하고, 회사의 재무적 안정성과 현금 흐름에 시시각각 신경 써야 하는 기업들 입장은 다르다. 기업의 연구개발은 당연히 근미래의 먹거리를 확보하기 위한 연구와 더불어, 현업에서 일어나는 다양한 문제들을 해결할 수 있는 연구가 주력이 되어야 한다. 그렇다면 이런 질문을 할 수도 있다. 근미래의 먹거리와 현재의 트러블 슈팅에 대해 연구개발 자원을 어떻게 배분하는 것이 최적의 황금비인가?
물론 이러한 질문에 대한 일반적인 답은 없다. 그렇지만 이러한 기준은 생각해 볼 수 있다. 예를 들어 기업이 현재의 트러블 슈팅을 하지 않으면 다음 단계로 가기 어려운 상황일 때, 당연히 기업의 연구개발 역량은 현업에 집중되어야 한다. 반대로 기업이 현재의 성숙 기술에서는 더 이상 최적화할 대상이 없다고 판단될 정도로 안정되어 있다면, 이를 오히려 위기로 여기고 미래의 먹거리 발굴에 더 많은 집중을 해야 할 것이다. 이러한 판단은 연구자들이 할 수도 있지만, 사실 연구개발을 충분히 경험한 혹은 그 생리를 잘 알고 있는 경영자들이 조금 더 큰 시야에서 제대로 냉철하게 판단해야 하는 것이기도 하다. 왜냐하면 이러한 구분은 칼같이 잘리는 것이 아니라, 사실 사이클 방식으로 연계되기 때문이다. 예를 들어 메모리반도체 산업이 과거처럼 주로 범용(commodity) 반도체 위주로, 예전부터 충분히 축적되어 온 기술적 솔루션을 잘 연장하여 현재의 기술을 살살 달래 가며, 동시에 양산 규모를 키우고, 또 원가를 잘 관리하는 방향으로 성숙된 혹은 안정화된 상황을 생각해 보자. 정상적인 기업이라면 이러한 상황에 안도하기보다는, 불안감을 느끼고 현재의 기술 이후의 다른 기술, 특히 현재의 기술을 대체하거나 전혀 다른 방향으로 응용될 수 있는 기술에 대한 선행 연구개발에 더 많은 자원을 배분해야 한다.
여기서 말하는 선행 기술 개발은 과거의 솔루션을 많이 활용하기보다는 실패가 거듭되는 시도로 점철된다. FINFET 대신 GAAFET을 써야 하는데, 생각지도 못 한 leakage current나 interface instability가 발견되어 소모 전력은 늘어나고 SNR는 감소되는 문제가 생길 수 있다. 집적도 향상을 위해 커패시터 사이즈를 줄이면서 새로운 조성의 high K 물질을 도입했는데, 의도치 않게 thermal expansion properties 들에 비등방성이 발견되어 칩의 장시간 사용이 칩 수명의 극단적 감소를 불러일으키는 문제가 발견될 수도 있다. EUV lithography를 도입하여 랏을 돌렸는데 생각지도 못하게 아나몰픽 광학 효과가 통제가 안 되어 겹치는 부분의 광화학 반응이 이상한 방향으로 흘러 PR이 다 증발하거나 의도치 않은 side reaction이 발견될 수도 있다. 이러한 문제들은 사실 새로운 탐색을 하기 전에는 예상하기 힘들고 또 발견하기 어려운 것이기도 하다. 그렇지만 사실 선행 기술 탐색은 그렇게 하라고 하는 것이다. 그러한 실패와 데이터 축적이 충분히 이뤄지지 못하면, 막상 그 기술적 시도를 해야 하는 시점에서는 현재의 트러블 슈팅마저도 제대로 막기 어려워진다.
대만 신주에 위치한 TSMC에 방문하여 R&D 담당자들과 이야기를 나눠 보기도 했고, 전 TSMC R&D 총책임자인 콘래드 영 박사와 이야기를 나눠보며 깨달은 사항 중 하나는, TSMC가 막대한 비용으로 R&D를 집행하면서도 이들은 이 사이클의 특성을 누구보다도 잘 알고 잘 활용하고 있다는 것이었다. 콘래드 영 박사는 TSMC가 우리가 생각하는 그러한 류의 최첨단 R&D를 하지 않는다고 이야기했는데, 이는 TSMC의 엄살이 아니라, 정말 사실에 가까운 이야기다. TSMC는 극단적으로 현업 해결형 트러블 슈팅에 집중하는데, 이는 사실 그렇게 할 수밖에 없기 때문이다. 삼성과 비슷하게, TSMC 역시 반도체 제조 전문 기업으로서 과거의 솔루션을 잘 활용하고 싶어 한다. 그리고 최대한 보수적인 기술 판단을 한다. 예를 들어 TSMC는 EUV lithography를 먼저 도입했음에도 불구하고, 그것을 양산에 도입한 것은 후행 주자인 삼성전자보다도 늦었다. 또한 FINFET 이후의 트랜지스터 아키텍처인 GAAFET 역시 후행주자인 삼성이 3 나노 공정부터 도입한 것과는 달리, 이들은 2 나노부터 조심스럽게 도입하고 있다. 이러한 조심성은 TSMC가 유약하거나, 혁신성이 부족해서라기보다는, 이들이 최대한 uncertainty를 줄이고, 현재 참고할 수 있는 기술 솔루션을 최대한 많이 활용하기 위함이다. 그렇게 함에도 불구하고 TSMC의 팹에서 생기는 문제는 하루에도 수천 건이 넘는다. 대부분 공정 문제이지만, 상당수는 고객이 위탁한 칩의 생산 과정에서 생기는 unexpected problem이기도 하다. TSMC가 현업 문제에 집중하는 까닭은 그들이 만드는 칩이 TSMC의 브랜드를 달고 나가는 것이 아닌, 고객의 브랜드를 달고 나가기 때문이다. 즉, TSMC는 자신들의 비즈니스 바운더리 안에서 이 문제를 충분히 다룰만한 여유도 없고, 그럴 자유도 별로 없기 때문이다. TSMC가 세계 최대의 파운드리이긴 하나, 업종의 특성은 여전히 '을'이며, 이는 '갑'으로서의 고객이 원하는 방향에 따른 기술적 실현이 보장되어야만 TSMC가 갖는 독특한 지위도 장구하게 보장될 수 있음을 의미한다. 이는 TSMC로 하여금 선행 기술 개발보다는, 현업에서 부딪히는 수많은 불예측한 요소들에 대한 기술적 솔루션의 통합과 관리에 집중하게 만든다. 이러한 솔루션은 개발 즉시 TSMC만의 기술적 자산이 되기도 한다. 이는 다시 고객들에게는 TSMC에서 자신들의 칩을 제작해야 하는 근거를 만들어주기도 한다.
물론 TSMC가 현업 문제 해결에만 집중하는 것은 아니다. 이들도 TSRI 같은 조직을 대만의 여러 연구중심대학, 정부 연구소와 공동 운영하면서, 또 IMEC Taiwan branch와도 협력하면서 다양한 시도들을 한다. 대표적으로 high NA EUV lithography multi-patterning 기술의 솔루션은 TSMC가 가장 많이 가지고 있다. 심지어 EUV lithography의 독점 생산자인 네덜란드의 ASML 조차도 TSMC의 솔루션에 많이 기대고 있는 형편이라 대만 현지의 연구소에 가장 많은 인력을 파견하고 있기도 하다. 이러한 선행기술 개발은 사실 TSMC 자체를 위한 것이라기보다는 근미래에 예상되는 트러블을 최대한 많이 줄여두기 위한 포석에 가깝다. 즉, TSMC도 이러한 사이클의 특징을 잘 알고 있는 셈이라 볼 수 있다.
반도체 산업뿐만 아니라, 제조업, 특히 첨단 제조업에서의 현업 문제 해결에 집중하는 R&D는 이러한 사이클 특징을 제대로 파악하고 활용할 수 있어야 한다. 현업에서의 확실한 캐시 카우가 보장되고 기술 수준이 안정화되어 있다면 선행 기술 개발에 집중하며 미래의 먹거리와 트러블 슈팅을 확보하되, 그 미래의 시점이 현업 시점이 되면 현업의 트러블 슈팅에 집중하면서 다시 현재의 기술을 안정화시켜야 한다. 이를 마치 곡예사처럼 저글링 하며 동시에 잘 추진할 수 있다면 더할 나위 없겠으나, 만약 하나만 먼저 해야 한다면 당연히 현재 기술의 안정화다. 현재 기술이 안정화되어 있지 않다면, 그로부터 수익을 확보하기 어렵고, 수익이 줄어든다면 다음 period의 기술 개발로 들어가기 어렵다. 이는 비단 반도체에만 국한된 것은 아니지만, 특히 반도체 산업에서는 이러한 사이클을 제대로 운영하고 이끌어 가는 것이 매우 중요하다.
메모리반도체를 다시 예로 든다면, 현재 S모사가 겪고 있는 문제는 충분히 안정화되었다고 생각한 DRAM의 공정 전환이 사실 충분히 안정화되어있지 않기 때문이라는 사실부터 시작해야 한다. D1x-y-z-a-b-c로 순차적으로 진행되는 DRAM 공정 세대의 변화는 당연히 이전 세대에서 안정화된 기술과 솔루션의 확보를 전제로 한다. 공정뿐만 아니라, 사실 scaling-down 되는 트랜지스터의 집적도와 전성비, 그리고 성능 요구조건을 고려한 설계와의 합치가 보장되면서 이러한 기술 전이가 보장되어야 한다. 예를 들어 D1y-z로 넘어가는 과정에서 특정한 공정-설계 불합치 문제가 발견되었다면, 이를 간과하며 D1z-D1a로 넘어가기는 어렵다. 이 문제가 D1y에만 국한된 문제였다면 상관없겠으나, 이는 마치 부모 세대에서 자식 세대로 유전자의 전달 없이 세대를 이어가기 어려운 것처럼, 피해 가기 어렵다. 왜냐하면 대부분의 요소 기술들은 결국 거의 비슷한 맥락의 공정과, 그 공정을 담당하는 특정 회사의 장비와, 그 특정 장비의 파라미터 세트와, 그 파라미터 세트의 범위 조정이라는 오랜 노하우에 기반을 두기 때문이다. 아예 새로운 에칭이나 리소그래피를 도입하는 과정에서는 과거의 솔루션이나 트러블 슈팅이 많이 유전되지는 않겠지만, 그럼에도 불구하고 여전히 과거에 충분히 안정화된 기술이 보장되어야 다음 세대로 가는 것은 두말할 필요가 없다. 이러한 문제를 인지했음에도 불구하고 미리 설정한 기술 전이 타이밍에 얽매여 결국 무리해서 다음 단계로 가거나, 혹은 문제를 미처 인지하지 못 한 채로 다음 단계로 가게 되면, 결국 이 문제는 계속 증폭되어 어느 시점에 갑자기 블랙스완처럼 떡하니 나타나게 된다. 이를 내부에서 발견하지 못한다고 하더라도, 결국 공급받은 고객사에서 발견하는 것은 시간문제다. 전통적인 DRAM에서의 트러블 슈팅이 충분히 이루어지지 않은 상황에서, 이로부터 분기된 새로운 기술의 트러블 슈팅이 잘 이루어지기를 바라는 것은 어렵다.
HBM은 잘 알려져 있다시피, 어쨌든 DRAM에서 출발해야 한다. HBM3 이전까지는 D1z 세대의 DRAM을 이용할 수 있었지만, HBM3 이후부터는 D1a로의 전환이 필요하다. 이는 단순히 HBM의 요구 성능 확보를 위함이라기보다는, 애초에 form factor와 JEDEC 적층 표준 스펙을 맞춰야 하기 때문이다. 이러한 상황에서 현업 트러블 슈팅이 충분히 이뤄지지 않은 상황에서, 그리고 이전 세대의 트러블 슈팅이 충분히 안정화되지 않은 상황에서, 단순히 스펙만 맞춘다고 무리하게 중간 단계로 점프하여 솔루션을 확보하는 것은 매우 어렵다. 누적된 설계-공정 사이의 불일치와 그로 인한 수많은 문제들, 또 그 문제들로 인한 버리는 웨이퍼의 증가와 처참한 수율은 단순히 그냥 덮는다고 지나갈 수 있는 문제가 아닌 것이다. 차라리 그냥 계속 범용만 했다면 자체적으로 폐기하는 수준에서 다소 손해를 보면서도 어쨌든 시장 지배력을 유지할 수 있었겠지만, 하필 HBM은 그런 범용 메모리가 아니라, 엔비디아 같은 AI 주도의 세상에서 가장 많은 주목을 받는 업체가 요구하는 맞춤형 메모리였다는 것이 문제다. 이렇게 되면 과거의 방식으로 고객에게 납품 후 잊는 (send & forget) 하는 방식은 통하지 않는다. 엔비디아는 어쨌든 이를 통합하여 하나의 칩셋으로 서버도 만들고 GPU 카드도 만들어야 하기 때문이다. 즉, S사 입장에서는 과거의 범용 DRAM 위주의 트러블 슈팅이나 대응 방식을 외삽하여 대응하기 어려워지는 기술의 분기를 처음으로 마주치게 된 셈이고, 하필 이러한 분기에 대해 이전부터 충분히 연구개발 시행착오를 누적하지 못 한 상황을 마주치게 된 것.
현실을 인식했다면 당연히 솔루션은 현업 문제 해결로의 복귀다. 보여주기 식으로 무리하게 선행학습을 부실하게 한 학생들의 공통적인 문제는 지금 배우는 내용을 제대로 잘 설명하지 못한다는 것이다. 어떤 중학생이 삼각함수를 이용하여 수능 문제를 풀 수 있는 수준이 되었다고 해도, 당장 이 학생에게 중학생에게 요구되는 기하학 문제를 삼각함수 없이 풀라고 하면, 기하학적 상상력과 보조정리에 대한 이해 부족으로 인해 정작 그 문제를 잘 못 푸는 경우를 꽤 많이 볼 수 있는데, 이는 그 학생이 선행학습을 주로 보여주기 식으로 학원이 혹은 부모가 이끄는 대로 부실하게 했기 때문인 경우가 꽤 많다. 그런 보여주기 식의 선행학습은 학생에게는 자신의 실력에 대한 착각을 불러일으켜 정작 자신의 문제가 무엇인지 직시하지 못하게 가로막는 장애물이 된다. 반도체를 포함한 첨단 산업을 다루는 기업들이 먼저 집중해야 하는 것은 스스로의 실력과 문제 진단, 그리고 문제가 일어난 지점에 대한 차분한 복기와 기록의 검토다. 복기 과정은 매우 고통스럽고 수많은 사람들의 원성을 살 수 있고, 잡음이 많이 나올 것이며, 온갖 갈등과 투서와 음해와 시기와 질투와 정치질이 난무할 것이지만, 그 고통스러운 과정을 어쨌든 제대로 거치지 않는다면, 내가 이해를 못 하는 부분이 삼각함수인지 기하학인지, 아니면 애초에 덧셈뺄셈부터인지 제대로 확인할 방법이 없다. 내부 직원들을 기본적으로 믿어야겠지만, 그 판단은 오로지 크로스체크와 기록된 연구노트와 로그 데이터에 기반을 두어야 하며, 필요하다면 이러한 기록물과 데이터를 한 줄 한 줄 눈 빠지게 다시 검토해야 한다. 의사결정라인에서 누락되거나 증폭되거나 더해졌거나 과장되었거나 의도적으로 변형되었거나 개인적 판단이 더해진 부분이 있다면 그것을 다 필터링해야 한다. 그렇게 고통스러운 과정을 거쳐 문제의 지점이 발견되었다면 당연히 그 부분부터 다시 시작해야 한다. 재차 강조하지만 연속된 기술적 솔루션이 충분히 반영되지 않으면 다음 단계의 기술 속에는 더 불확실한 문제들이 증폭될 준비를 하고 있고, 그 문제들이 튀어나왔을 때 대처할 수 있는 타이밍을 놓치게 된다.
TSMC에서도 한 때는 선행기술 개발에 더 많은 가중치를 두어야 한다는 목소리가 컸던 때가 있다. 2000년대 초중반부터 2010년대 초반까지의 기간 정도로 볼 수 있다. 그때의 TSMC도 지금 같은 파운드리 산업 위주였지만, 지금처럼 대형 고객사들 위주의 제조보다는 다양한 고객사들의 위탁 제조에 치중했다. 비교적 공정이 안정되어 있던 때고, 고객사들의 요구 역시 아주 힘든 기술적 수준은 아니었기에, 현재 기술이 충분히 안정화되었다는 판단하게 새로운 시도를 하려 했을 것이다. 이랬던 TSMC가 2010년대 초반부터 현업에 더 많은 신경을 쓰게 된 것은 아이러니컬하게도 TSMC의 고객들이 대형화되면서, 또 AI와 애플 실리콘이 득세를 하면서, 고객사들의 현업 최선단 기술에 대한 요구조건이 대폭 강화되었기 때문이다. 이는 현업에서의 다양한 시도를 해야 할 수밖에 없음을 의미하고, 그 과정에서 TSMC는 무어의 법칙이 멈춰가는 것을 체감하며 온갖 시도를 안 할 수 없었다. 그러한 시도들은 할 때마다 고통스러운 현장의 비명을 야기했고, TSMC의 악명 (종업원들 사이에서의)은 더욱 높아졌다. 어쨌든 TSMC는 그렇게 현업에 더 많은 방점을 찍으며 고객사들의 요구에 대응했고, 그렇게 쌓인 솔루션은 그대로 TSMC의 자산이 되었다. 이러한 TSMC 모델이 꼭 바람직한 것만은 아니다. TSMC의 가장 큰 고민은 이렇게 어쨌든 규모와 퀄리티 모두 무리해서 극한까지 끌어올려놓았는데, 이 모델이 얼마나 지속가능하냐인 것에 있다. 애플실리콘이 5년, 10년 후에도 계속 잘 팔릴 것이라는 보장이 없고, 현재의 AI 파도가 언제까지 지속될지 예측 불가능하며, 클라우드 시스템에 대한 수요가 언제 다른 방식으로 바뀔지 쉽게 예측하기 어렵다. 그래서 TSMC 역시 현재의 기조가 바뀌는 것에 대해 대응할 수밖에 없을 것이고, 이는 TSMC 입장에서도 큰 모험이 되기 때문에 TSMC가 현재 취하는 방식의 현업 위주 R&D 전략의 유효기간은 언제 끝날지 아무도 모른다. 다만 S가 TSMC에 대해 참고할 부분이 있다면, TSMC가 매일 같이 관리하고 취합하는 기술적 문제들의 데이터베이스화, 그리고 최대한 보수적으로 안정적인 기술 개발을 위해 체크 또 체크하는 시스템과 문화일 것이다.
현재의 문제를 피해 미래로만 시선을 두는 것은 서서히 진흙의 늪에 빠지고 있으면서도 언제 내려올지 모를 동아줄만 바라보는 것과 비슷한 느낌이다. 당장 해야 할 것은 늪에 빠지는 속도를 늦추기 위해 허리띠든 옷이든 벗어서 주변의 나무에 걸어보려 시도하는 것, 그리고 주변의 뭐라도 붙들어서 최대한 버티면서 조금씩 손을 앞으로 내밀어 빠져나가는 것일 것이다. 선행 기술에 대한 투자는 반드시 이뤄져야 한다. 그렇지만 그것이 단지 보여주기 식이 되면 곤란하다. 선행의 트러블 발견은 트러블 발견만으로 가치가 있다. 그 트러블의 해결 과정이 현재의 문제 해결 과정으로 연결되는 경로를 찾고, 그래서 선행과 현재가 이어질 수 있는 채널을 충분히 만들어 두어야 한다. 언제나 답은 한결같다. 기본으로 돌아가는 것.