Google Colaboratory Tip For Starter
안녕하세요.
Google Colaboratory 에 Google Drive를 연동해서 드라이브에 있는 csv 파일 등을 불러와 데이터 분석 작업을 할 수 있도록 해보겠습니다.
Google Colaboratory(이하, Colab) 는 기본적으로 Docker 이기 때문에, 처음 Colab를 사용하시는 분은 당연히 같은 구글 꺼니깐 드라이브에 파일을 올리면 Colab에서 바로 불러올 수 있겠지? 생각할 수 있지만 그렇지 않습니다. (저만 그렇게 생각했을까요..?)
1. 필요한 라이브러리를 설치하고 권한 부여를 위하여 아래 코드를 실행합니다.
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}
위의 코드를 실행하면, 아래와 같은 결과를 보실 수 있을 것입니다.
2. 결과창에 나타는 링크를 클릭해서 구글 계정 연동을 승인하고, verification code 를 텍스트 박스에 입력합니다.
3. 승인 절차가 완료되면 구글 드라이브를 연동시킬 디렉토리를 만들고, 해당 디렉토리에 드라이브를 연동시킵니다.
!mkdir -p drive #구글 드라이브 디렉토리 생성
!google-drive-ocamlfuse drive #생성한 디렉토리에 구글 드라이브 연동
연동이 잘 되었는 지 확인해볼까요?
우리가 사용할 수 있는 공간인 content 디렉토리 아래에 drive 라는 디렉토리가 생겼습니다.
드라이브에 있는 폴더와 파일들이 잘 연동되어서 나타나면 Mission complete!
(제 구글 드라이브는 참.. 지저분 하네요.)
이제 Python의 Pandas 라이브러리를 이용해 CSV 파일을 불러와 볼까요?
정상적으로 잘 읽어지는 걸 확인할 수 있습니다.
Google Colaboratory KR Facebook Group 바로가기
제이든입니다.
고객 관계 관리(CRM) 관련 업무를 해오고 있습니다. 현재는 카카오뱅크에서 데이터 분석을 기반으로 고객의 가치를 이해하고 증대시키는 방법을 찾기 위해 고민하고 있습니다.
최근에는 블록체인, 토큰 이코노미, 머신러닝, 마케팅 자동화, 구글 Colaboratory, 중국의 테크 비즈니스, 애그테크(AgTech) 등에 관심이 많습니다.
라이킷, 댓글, 공유하기 그리고 구독하기는 제가 글을 쓰는 데 큰 동기 부여가 됩니다.