[강의노트] KDT_day9_260116

오렌지3 실습 계속, 이미지 분석 실습

by 아르떼

오렌지3 실습 계속

image.png Wine quality 데이터의 분석 화면

discretize 위젯을 활용해 수치형 데이터를 범주형 데이터로 변환시켜서 회귀 문제를 분류 문제로 바꿀 수 있다.


오렌지3을 활용한 선형회귀 실습

오렌지에서 학습 알고리즘(Learner)과 모델(Model) 차이

데이터(Data)에 알고리즘(Learner)에 넣어 모델을 학습시킴

모델(Model)은 학습이 완료되어 모든 파라미터가 고정된 상태.

이 모델에 Target을 모르는 새로운 데이터를 넣으면 Target을 예측할 수 있음.




생산품질 데이터셋

시계열로 측정된 데이터를 기반으로 로스팅 머신에서 제품의 품질을 결정하는 모델을 구축해야 한다.

image.png Production Quality 데이터 분석 화면




사출성형기 데이터셋

오버샘플링 / SMOTE(Synthetic Minority Over-sampling Technique)

57 N -> 학습 못함

6340 Y -> 지나치게 많이 함

불량과 합격 데이터 수의 불균형으로 인해 Y로 판별하는 비율이 지나치게 높아진다.

57개의 N 데이터를 변형해서 6340개로 만들어서 학습시킨다 -> 그러면 Y를 N으로 판별하는 비율이 높아짐.


image.png 사출성형기 데이터 분석 화면




이미지 데이터 분석


이미지 데이터 준비 - 이미지 데이터 전처리: 이미지 임베딩

오렌지 화면에서는 Import images 위젯을 활용해 이미지 데이터를 불러오고 Image Embeding 위젯을 활용해 이미지 임베딩을 수행한다.

이미지 임베딩을 한 이후에는 일반 정형 데이터 분류 과정과 같다.


컴퓨터 비전을 이용해 불량품을 예측할 수 있다!

image.png 학습 이미지 폴더와 테스트 이미지 폴더가 나누어져 있을 떄 분석 화면
Train의 Test and Score 성능지표
Test의 Predictions 성능지표

성능지표 값을 보면 이미지를 통한 정상 불량 예측이 매우 잘 맞음을 알 수 있다.




image.png Casting 이미지 데이터 분석 화면


작가의 이전글[강의노트] KDT_day8_260115