brunch

드라이브 용량 및 권한은 미리 점검하자

부족해! 부족해! 부족해!!

by 미레티아

아래 대화는 평상시의 대화를 조합 및 각색한 것이다.


나: 교수님 □□□ 파일 △△쌤과 공유해야 하는데 드라이브 용량이 부족합니다.
교수님: 내가 대신 올려줄게~
나: 근데 그게 용량이 XXX라 며칠 올려야 할텐데요...?
교수님: ...외장하드를 택배로 쏠까...?
나: 교수님 ☆☆프로그램 저희 컴퓨터에서 안 돌아가서 구글 코랩으로 해야 할 것 같은데 그러면 코랩에 파일을 올려야 하거든요?
교수님: 안 올라가지 파일?
나: 네.
교수님: ...◎◎ 연구실에서 해 달라고 할까...?
Lucid_Realism_A_distressed_anthropomorphic_rabbit_wearing_a_cr_0.jpg Created using Leonardo.AI. 참고로 난 뭉크의 절규를 하고 있는 토끼를 요청했다. 뭉크풍의 그림이 아니라!

바야흐로 빅테이터의 시대. 모든 데이터의 용량이 커졌으며, 분석해야 할 데이터도 엄청나게 많다.


...그런데 연구 설계 단계에서 우리 연구소가 이렇게까지 무거운 파일들을 고사양의 컴퓨터로 돌려야 할지 몰랐던 게 틀림없다.


사실 현재 내가 월급을 받고 있는 우리 교수님의 5년짜리 펀드는 올해가 마지막이다. 그러니까 5년 전에 계획서를 쓰고 했겠지? 그런데 세상에, 5년동안 세상이 변했다. (ChatGPT에 따르면) 2020년에 Neuroimaging Open data 붐이 일어났다. 즉, UK biobank 같은 곳에서 엄청나게 많은 사람들의 MRI를 제공하면서 그것으로 머신러닝이나 AI 분석이 활발해진 것이다. 2022년 말, ChatGPT가 대중화하면서 코딩을 모르는 사람도 조금의 도움으로 코딩을 할 수 있게 되었다. 또한 예전에는 A라는 연구가 나오면 그걸 재현하는 데 시간이 오래 걸렸는데, 요즘은 그냥 코드를 보고 그대로 베껴서 B라는 연구를 할 수 있다. 즉, 연구가 데이터싸움시간싸움으로 변한 것이다.


그래서 나도 데이터싸움 및 시간싸움을 한다. 대부분의 코드를 자동화해서 돌려놓고, 밤새도록 컴퓨터를 돌리고, 우리 연구실의 데이터 뿐 아니라 공개 데이터를 받아서 분석한다.


문제는 이럴 줄 몰라서 대비를 못해놓았기 때문에 용량이 늘 부족하다는 것이다.


물론 내가 저번에 찡찡대서 컴퓨터에 몇 테라짜리 드라이브를 달아주셨는데, 이놈의 컴퓨터가 GPU가 없는 관계로 GPU가 필요하면 구글 코랩으로 넘어가야 한다. 그리고 구글 코랩은 용량 제한 때문에 만날 잘린다. 그렇다면 유료 버전을 써서 용량이 빵빵한 교수님의 구글 드라이브를 끌고와서 쓰는 방법이 있다. 그러면 아래와 같은 문제가 발생한다.

교수님: 어 그거 드라이브에 있어~
나: 어디요...?
교수님: 그 OOO폴더에 있어~
나: (잠시 뒤적이더니) 저에게 공유가 안 된 것 같아요!
교수님: (잠시 알아보더니) 어 그러네?
드라이브 용량 및 권한은 미리 점검하자

심지어 여러개의 파일로 되어있는 것을 올리다보면 용량 부족 시 올라가다가 중간에 멈춘다. 아니 처음부터 용량이 안 되어서 업로드가 안 됩니다! 라고 해야 할 것 아닌가....!!


다음 펀드로는! 슈퍼컴을 하나 사셨으면...(??)

keyword
이전 07화회의는 반드시 기록하고 다시 한 번 확인하자