상세 컨텐츠

본문 제목

IoT 정보를 머신러닝으로 데이터 분석_오랜지3지도학습1

AI-VR-AR

by 김일국 2021. 11. 23. 19:49

본문

Orange3 GUI 데이터 분석도구를 이용해서 데이터를 예측하는 실습을 하였습니다.

Orange3 기술영상 참조: https://www.youtube.com/c/%EC%97%98%EB%A6%AC%EC%8C%A4/videos

- 데이터분석에서 Orange3는 데이터전처리, 데이터분석 모델수립, 모델적용 및 결과 예측(추론)을 처리합니다.

수업 끝에 문제를 한번 풀어 보았습니다.(아래)

날씨 데이터 과거 자전거 대여횟수를 결합하여 워싱턴 DC의

휴일, 근무일, 날씨, 온도, 바람세기 를 독립변수로 사용하여

대여횟수 Count 를 종속변수로 예측할 수 있게 되었습니다.

Data Source: 캐글자료 https://www.kaggle.com/c/bike-sharing-demand/data

 

Bike Sharing Demand | Kaggle

 

www.kaggle.com

bike_test.csv
0.31MB
bike_train.csv
0.62MB

온도에 영향을 받는 Train 데이터를 시각화 해서 보여 줍니다.(아래)

Orange3 작업화면(아래)

결과파일 입니다. 오렌지 워크시트 파일 입니다.(아래)

01_06.ows
0.02MB

Random Forest와 Linear Regression 리니어리그레션(선형회귀) 모델로 확인해 보았는데, Accuracy정확도(CA) 또는 R2 값이 1로 둘다 좋은 분석모델이지만, MSE값이 0에 가까운면 더 좋으니 리니어 리그레션모델을 사용  합니다.

R2값이 1에 가까울 수록 좋은 모델 입니다.(아래)

그래서, 예측데이터가 잘 맞습니다.^^(아래 count컬럼이 실제값, Linear 리그레션 컬럼이 예측값 입니다.)

확실히 랜덤 포레스트 보다는 정확도가 좋은 것을 확인 할 수 있습니다.(아래)

참고: Orange3 를 설치하면서, 미니콘다(아나콘다 라이트버전)을 설치하는 과정이 중간에 포함됩니다.

주1, Orange3 설치시 Choose Users 선택창에서 anyone 으로 선택(그 외는 기본값으로)

주2. 미니콘다 설치시 Selected Installation Type 선택창에서 Just Me(recommended) 선택

주3. 미니콘다 설치시 Advanced Installation Options 선택창에서 Register Anaconda as my default Python 버전 on the system. 선택(현재는 3.8 파이썬 버전 아래)

- 오렌지3 에서 이미지 데이터를 분석하려면, 외부 콤포넌트가 필요합니다.(아래, 오렌지3 실행시 윈도우 관리자모드로 실행하셔야 합니다.)

- 아래에서 선택한 Add On 이 수업할때 필요한 콤포넌트 입니다.(아래)

관련글 더보기

댓글 영역