Kaggle IBM HR Data를 활용하여
아래 프롬프트는 Chat GPT로부터 R코드를 받기 위해 분석하고자 하는 Data의 형식 정보를 제공한 프롬프트입니다.
Age Attrition BusinessTravel DailyRate Department DistanceFromHome Education EducationField EmployeeCount EmployeeNumber EnvironmentSatisfaction Gender HourlyRate JobInvolvement JobLevel JobRole JobSatisfaction MaritalStatus MonthlyIncome MonthlyRate NumCompaniesWorked Over18 OverTime PercentSalaryHike PerformanceRating RelationshipSatisfaction StandardHours StockOptionLevel TotalWorkingYears TrainingTimesLastYear WorkLifeBalance YearsAtCompany YearsInCurrentRole YearsSinceLastPromotion YearsWithCurrManager 41 Yes Travel_Rarely 1102 Sales 1 2 Life Sciences 1 1 2 Female 94 3 2 Sales Executive 4 Single 5993 19479 8 Y Yes 11 3 1 80 0 8 0 1 6 4 0 5
1행의 제목과 2행의 내용이 위와 같은 csv 파일이 있음.
해당 csv 파일은 총 1470행으로 구성되어 있음.
파일명은 C:\Rdata\WA_Fn-UseC_-HR-Employee-Attrition.csv임.
범주형 변수 (Categorical Variables) : 범주형 변수는 한정된 수의 카테고리나 분류로 나눌 수 있는 변수를 말합니다. 예를 들어, 성별(남성, 여성), 피부색(흰색, 검은색, 갈색 등), 결혼 여부(기혼, 미혼, 이혼 등) 등은 모두 범주형 변수에 속합니다. 범주형 변수는 '명목 변수'와 '순서 변수'로 더 세분화될 수 있습니다. 명목 변수는 순서나 순위가 없는 범주형 변수를 말하며, 순서 변수는 순서나 순위가 있는 범주형 변수를 말합니다.
연속형 변수 (Continuous Variables) : 연속형 변수는 무한한 수의 값을 가질 수 있는 변수를 말합니다. 예를 들어, 키, 무게, 온도, 거리 등은 모두 연속형 변수에 속합니다. 이러한 변수는 측정이 가능하며, 그 결과는 연속적인 수치형 값을 가지게 됩니다. 연속형 변수는 보통 실수형 값을 갖습니다.
https://www.yes24.com/Product/Goods/129378508