일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 데이터 엔지니어
- 파이썬
- JLPT
- streamlit
- 부트캠프
- 데이터 사이언티스트
- 자기계발
- ssafy 13기
- 티스토리챌린지
- 메타코드
- metacode
- 독학
- metacodem
- 데이터사이언티스트
- 데이터애널리스트
- 메타코드m
- DS
- LLM
- matacodem
- 머신러닝
- 데이터분석
- 일본어공부
- 싸피
- 개발자부트캠프
- 데이터엔지니어
- 데이터전문가
- ML
- 오블완
- SSAFY
- 자기개발
- Today
- Total
아카이브
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (6) 본문
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (6)
머루아빠승우 2024. 10. 27. 19:52kaggle 데이터를 활용한 실전 머신러닝 6차시입니다.
데이터분석과 더불어 개인의 포토폴리오가
요즘 취업시장 작성이 중요해졌지요.
남다른 경쟁력을 갖기 위해선
학위, 프로젝트 경험이 있어야 좋은 소식을
기대해 볼 수 있을 것으로 보입니다.

메타코드는 데이터에 관한 AI / ML/ 데이터 분석 역량을 키워볼 수 있어요.
다양한 커뮤니티 활동에서 유익한 정보와
데이터 사이언티스트에 관심이 있으시다면
제 게시글을 보시고 메타코드에서 함께 성장해보심 어떨까요?

캐글 데이터를 활용한 실전 머신러닝
이번 주차에는 하이브리드, 피처엔지니어링 고도화를 위해
앙상블 기법에 대해 학습중이죠
앞서, 사용한 XGboost모델과 같이 가중치의 중간값을
예측값과 실제값의 사이값에서 잘 계산하여
최적의 파라미터 값을 피벗합니다.


메타코드M
AI 강의 & 커뮤니티 플랫폼ㅣ300만 조회수 기록한 IT 현직자들의 교육과 함께 하세요
metacodes.co.kr
학습 과정

이번 주차는 Stacking model을 중점으로 다뤄볼 예정입니다!
1. 스태킹의 개념
스태킹은 모델들의 예측값을 최종 모델의 학습 데이터로 사용하는 예측하는 방법 입니다.
이진 분류 및 다차원 분류를 진행하는 알고리즘인 logistic regression, randomforest, xgboost 모델등을 이용해서 3종류의 예측값을 구했습니다.지금은 기본 모델로부터 예측된 값들이 최종모델의 학습데이터로 사용된다는 것만 이해하면 됩니다.
Stacking model은 간단히 말해 기본 모델들의 예측값을 통해 학습시킬 모델의 실제값을 예측할 수 있겠죠?

이 스태킹 분류는 RF, LGBM, XGBR 등 모델을 기반으로
최적의 평가 파라미터를 확인하도록 작성된 코드에요.
실제로 최종 모델이 하고자 하는 것은 y 실제값이 이정도 일 때,
LGBM에서 이정도 값, 랜덤 포레스트에서 이정도 값, XGBoost에서 이정도 값을 예측한다 는 것을
재학습시키는 것입니다.
.

앞서 소개한 MAPE를 기준으로
앙상블 모델에 따라 각 상품의 예측 수량 값을 시각화한 값입니다.
이전 시각화 모델과 함께 비교해볼까요?


실제로 확인해보면 큰차이가 없는 듯 해보이나 실제 값으로는 stack으로 예측했을 때
또 다른 수치가 나탐을 볼 수있네요. 여러 예측 모델 중
현재 도메인의 상황을 제일 핏하게 적용할 수 있는 결과를 찾는 것이 중요하다고 느껴지는 학습이었습니다.
다음 이 시간에는 Deep Learning with Pytorch에 대해 다뤄보겠습니다.
감사합니다!

*본 게시글은 메타코드 앰배서더 활동으로 작성된 게시글입니다.
'공모전 및 대외활동 > 앰배서더' 카테고리의 다른 글
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (8) (2) | 2024.10.31 |
---|---|
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (7) (1) | 2024.10.28 |
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (5) (3) | 2024.10.26 |
[데이터 분석 부트캠프] - 전액 환불/ 직장인 전용 파트타임 부트캠프 홍보 (5) | 2024.10.20 |
[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (4) (8) | 2024.10.13 |