brunch

You can make anything
by writing

C.S.Lewis

by 김영하 Mar 11. 2016

데이터를 만들어보자!

데이터 분석을 위한 소스 - 주소록 샘플데이터

지난번 글에서 데이터 분석 및 R 학습할 때 유용한 R 패키지에 포함된 데이터셋들만 모아놓은 사이트를

소개하였습니다.


이번에는 http://generatedata.com 이라는 사이트를 소개하겠습니다. 마우스 클릭 몇 번만으로도 

많은 샘플데이터를 만들 수 있습니다. 특히 주소록과 관련된 샘플데이터를 생성할 때 아주 유용합니다.

내부적으로 SQL교육이나 가상 고객 리스트를 만들 때 아주 유용할 것입니다.

사이트에 방문하면 아래와 같은 화면이 반겨주고 있습니다. 특별한 것은 없이 테이블을 생성하듯이

컬럼 이름 타임을 입력해주면 됩니다.


Data Type은 생성하고 싶은 데이터의 유형입니다. 아래와 같이 많은 유형들이 있습니다.


원하는 데이터 유형을 선택하면, 그 유형에 따라 생성하고자 하는 형태를 선택할 수도 있습니다.


각 컬럼들을 설정하여 DATA SET를 만들어 놓으면, 아래 화면처럼

CSV, Excel, HTML, JSON, LDIF, Programming Language, SQL, XML 총 8가지 형태로

데이터를 생성할 수 있습니다. Programming  Language는 JavaScript, Perl, PHP, Ruby 4가지를

지원하고, SQL의 경우 MySQL, Postgres, SQLite, Oracle, SQL Server 5가지를 지원합니다.


최종적으로 위 화면의 초록색 부분에서 Generate를 선택하면 3가지 유형으로 샘플데이터를 

받을 수 있습니다.

만약 Generate 되기전에 선택한 부분에서 부족한 부분이 있으면, 아래처럼 해당부분을 알려줍니다.


사실 100라인 보다 더 많이 그리고 전체 기능을 사용하려면 사용자 등록을 해야합니다.


기부를 하거나 개인적으로 가상머신이나 개인 PC에 이 프로그램을 설치해서 쓰시면 됩니다.

전체 기능을 사용하게 되면 설정된 샘플데이터 양식을 저장해서 다음에 불러와서 다시 사용할 수 있고,

정말 많은 샘플 데이터를 생성할 수 있습니다.


소스 파일은 https://github.com/benkeen/generatedata 에서 받을 수 있습니다. PHP로 만들어

졌고, MySQL를 데이터베이스로 사용하고 있습니다. 설치방법에 대해서는 다음 글에서 작성해보겠습니다.

 


작가의 이전글 데이터를 분석하는 순서
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari