오렌지3 실습 계속, 이미지 분석 실습
오렌지3 실습 계속
discretize 위젯을 활용해 수치형 데이터를 범주형 데이터로 변환시켜서 회귀 문제를 분류 문제로 바꿀 수 있다.
오렌지3을 활용한 선형회귀 실습
오렌지에서 학습 알고리즘(Learner)과 모델(Model) 차이
데이터(Data)에 알고리즘(Learner)에 넣어 모델을 학습시킴
모델(Model)은 학습이 완료되어 모든 파라미터가 고정된 상태.
이 모델에 Target을 모르는 새로운 데이터를 넣으면 Target을 예측할 수 있음.
생산품질 데이터셋
시계열로 측정된 데이터를 기반으로 로스팅 머신에서 제품의 품질을 결정하는 모델을 구축해야 한다.
사출성형기 데이터셋
오버샘플링 / SMOTE(Synthetic Minority Over-sampling Technique)
57 N -> 학습 못함
6340 Y -> 지나치게 많이 함
불량과 합격 데이터 수의 불균형으로 인해 Y로 판별하는 비율이 지나치게 높아진다.
57개의 N 데이터를 변형해서 6340개로 만들어서 학습시킨다 -> 그러면 Y를 N으로 판별하는 비율이 높아짐.
이미지 데이터 분석
이미지 데이터 준비 - 이미지 데이터 전처리: 이미지 임베딩
오렌지 화면에서는 Import images 위젯을 활용해 이미지 데이터를 불러오고 Image Embeding 위젯을 활용해 이미지 임베딩을 수행한다.
이미지 임베딩을 한 이후에는 일반 정형 데이터 분류 과정과 같다.
컴퓨터 비전을 이용해 불량품을 예측할 수 있다!
성능지표 값을 보면 이미지를 통한 정상 불량 예측이 매우 잘 맞음을 알 수 있다.