아카이브

[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (2) 본문

공모전 및 대외활동/앰배서더

[데이터 사이언티스트] kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자 (2)

머루아빠승우 2024. 10. 6. 23:08

안녕하쎄요~

오늘도 찾아온 공부의 시간입니다.

 

데이터 사이언티스트로 성장하기 위해 또 다시 달려가보고자 합니다.

요즘 공부하면서 느낀 점은 데이터 분석에는 정답이 없다 입니다.

ㅎㅎ 실제로 내가 뽑은 인사이트의 근거가 사람마다

다르게 인식되거든요. 중요도라든지 정확도라든지

심지어 정말 느낌도 중요한 것 같습니다.

 

이런 모호한? 느낌이 든다면

더더욱 공부해야겠지요!

바로 가겠습니다.

 

 

kaggle 데이터를 활용한 실전 머신러닝 | IT기업 Data Scientist 현직자

 

metacodes.co.kr

지난 번 강의 후기와 이어서 

 kaggle 데이터를 활용한 실전 머신러닝 
입니다!

강의 목적

- 이커머스 도메인에서 실무에서 사용하는 유사한 데이터를 이용하여
- 머신러닝 및 시계열 예측 모델을 만드는 실제 과정을 제공합니다.
- 이를 통해 각자가 자신만의 포트폴리오를 만들수 있도록 기반 제공하고
- 포트폴리오를 통해 실력을 증명할수 있는 결과물을 제공하고 이직이나 취업에 활용하도록 합니다.


 

강사님을 따라 실제로 실습하면서 각 데이터를 추출해보는 방식으로 진행돼요.

점차 어려워지는 내용이더라도 차분히 알려주시고

특히! DS(데이터 사이언티스트)라면 민감하게 봐야할 정보도 요약해주십니다!


강사님 소개

실제로 데이서 사이언티스트로 활동하신 강사님으로부터

실무적인 인사이트도 획득할 수 있고

나만의 모델을 만들어보고 싶다는 생각도 할 수 있게 된답니다!

실제 데이터를 가지고 하는 실습이기에

ProPhet 모델 알고리즘을

이용해서 시계열 데이터를 분석해

실제 매출값을 시각해보고  고려해본다고 해요.

해당 표는 상관계수 표인데요! 각 상품별 구매 연관도를 확인한 것입니다

양파와 마늘은 꽤나 높은 계수를 보이죠? 그렇다면 

두 품목은 동시 구매가 이뤄진다는거예요~

 

실제로 코드를 실행해보면서 

이런 인사이트 정리 해보고 싶으신 분이라면

해당 강의를 추천드립니다.

ML(머신러닝)에서 너무 중요한 부분이지요

 

이후 모델 알고리즘을 피처 엔지니어링을 통해

하이퍼 파라미터 조정을 거쳐요!

실제로 내가 원하는 모델의 성능 수준 혹은 결과를 위해서

모델의 성능을 조절하는 과정을 학습합니다.



 

데이터 사이언티스트는 결과적으로 비즈니스적인

의사결정을 내야하지요!

그렇기에 자신이 추론한 인사이트를 시각화하고 ML을 통해

내 의견이 더 잘 설명되는 결론을 정리해야해요.

그러기 위한 과정까지~

학습할 수 있습니다.

 

이후 github에 배포할 수 있고, 실제로 포트폴리오로

활용할 수 있게 github 사용법도 알려주십니다.

포트폴리오 기록을 위해선 개발자들과 협업하는 공간도

익숙해져야기에 너무 좋은 부분인 것 같아요.


이렇게 1강 내용을 모두 학습했어요!

다음주엔 2강 내용으로 찾아뵙겠습니다~

모두들 한 주 파이팅!


해당 강의는 바로! 메타코드M으로부터 학습하실 수 있습니다.

 

메타코드M

AI 강의 & 커뮤니티 플랫폼ㅣ300만 조회수 기록한 IT 현직자들의 교육과 함께 하세요

metacodes.co.kr

*본 강의는 메타코드 앰배서더 활동으로 작성된 게시글입니다.