brunch

데이터를 만들어보자!

데이터 분석을 위한 소스 - 주소록 샘플데이터

by 김영하

지난번 글에서 데이터 분석 및 R 학습할 때 유용한 R 패키지에 포함된 데이터셋들만 모아놓은 사이트를

소개하였습니다.


이번에는 http://generatedata.com 이라는 사이트를 소개하겠습니다. 마우스 클릭 몇 번만으로도

많은 샘플데이터를 만들 수 있습니다. 특히 주소록과 관련된 샘플데이터를 생성할 때 아주 유용합니다.

내부적으로 SQL교육이나 가상 고객 리스트를 만들 때 아주 유용할 것입니다.

사이트에 방문하면 아래와 같은 화면이 반겨주고 있습니다. 특별한 것은 없이 테이블을 생성하듯이

컬럼 이름 타임을 입력해주면 됩니다.

스크린샷 2016-03-11 오전 11.46.58.png


Data Type은 생성하고 싶은 데이터의 유형입니다. 아래와 같이 많은 유형들이 있습니다.

스크린샷 2016-03-11 오전 11.48.28.png


원하는 데이터 유형을 선택하면, 그 유형에 따라 생성하고자 하는 형태를 선택할 수도 있습니다.

스크린샷 2016-03-11 오전 11.54.52.png


각 컬럼들을 설정하여 DATA SET를 만들어 놓으면, 아래 화면처럼

CSV, Excel, HTML, JSON, LDIF, Programming Language, SQL, XML 총 8가지 형태로

데이터를 생성할 수 있습니다. Programming Language는 JavaScript, Perl, PHP, Ruby 4가지를

지원하고, SQL의 경우 MySQL, Postgres, SQLite, Oracle, SQL Server 5가지를 지원합니다.

스크린샷 2016-03-11 오전 11.56.21.png


최종적으로 위 화면의 초록색 부분에서 Generate를 선택하면 3가지 유형으로 샘플데이터를

받을 수 있습니다.

만약 Generate 되기전에 선택한 부분에서 부족한 부분이 있으면, 아래처럼 해당부분을 알려줍니다.

스크린샷 2016-03-11 오후 12.00.00.png


사실 100라인 보다 더 많이 그리고 전체 기능을 사용하려면 사용자 등록을 해야합니다.

스크린샷 2016-03-11 오전 11.56.31.png


기부를 하거나 개인적으로 가상머신이나 개인 PC에 이 프로그램을 설치해서 쓰시면 됩니다.

전체 기능을 사용하게 되면 설정된 샘플데이터 양식을 저장해서 다음에 불러와서 다시 사용할 수 있고,

정말 많은 샘플 데이터를 생성할 수 있습니다.


소스 파일은 https://github.com/benkeen/generatedata 에서 받을 수 있습니다. PHP로 만들어

졌고, MySQL를 데이터베이스로 사용하고 있습니다. 설치방법에 대해서는 다음 글에서 작성해보겠습니다.

스크린샷 2016-03-11 오후 12.04.34.png


keyword
작가의 이전글데이터를 분석하는 순서