20250505
We are thus in a race between interpretability and model intelligence.
과연, 블랙박스를 해석하는 5~10년이 빠를까, 컨트롤 힘든 모델의 등장이 빠를까.
앤트로픽의 interpretability 연구는 느어무 재밌다.
내가 그 흐름을 본방사수하고 있다는게 행운인 느낌이랄까...
마침 얼마전 다리오 아모데이의 Mechanical Interpretability 어필 글
https://www.darioamodei.com/post/the-urgency-of-interpretability