일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 싸피
- JLPT
- DS
- metacodem
- 자기계발
- 데이터사이언스
- ML
- 메타코드
- 데이터엔지니어
- 개발자부트캠프
- 데이터분석가
- matacodem
- 캐글
- 데이터전문가
- 머신러닝
- 데이터 사이언티스트
- 데이터 엔지니어
- 데이터분석
- ssafy 13기
- 티스토리챌린지
- metacode
- SSAFY
- 일본어공부
- 자기개발
- 오블완
- 메타코드m
- 부트캠프
- 독학
- 데이터사이언티스트
- 데이터애널리스트
- Today
- Total
목록Index (47)
아카이브

오늘의 고민지금단계에서 무엇을 더 쌓는데 집중할지정리하고 결과는 내는데 집중할지시기에 맞춰 효율적으로 해야한다.지금 내가 선택한 것은 쌓기 3 대 정리 7의 시기임 (내 포폴은 학부생 레벨에선 나쁘지 않음- 텐서플로, ai 플젝 sk하면서 하면 됨)(석사 이상가면 더 확실하게 할 수 있긴함)나의 성향은 하나를 무조건 하겠다하고 전력 투구하는 타입이 아님.대부분 여러 곳을 넣긴 하지만, 그 여러 곳을 넣는게 지금 시기만 가능하다고 생각.나의 계획 6~9월 (3개월)1. 네이버 인턴(6~9) or 부캠 (7~9) 인턴 지원2. 포폴 정리, 코테 준비, 어학, 자격증 공부, sk플젝9 ~ 12월1. 상반기 취준 코테, 면접, 인적성 준비2. 대학원 컨텍

import mataplotib.pyplot as pltimport seaborn as snsfrom sklearn.datasets import load_diabetesScatterplot & boxplot (산점도와 박스플롯)주요 변수와 목표값과의 관계 분석을 할 때 사용!!박스플롯과 산점도는 선형, 비선형 관계를 알 수 있으며 상관관계의 방향성을 확인할 수 있음하나의 목표 변수와 여러개의 주요 변수를 그리고자 할때 subplot기본적으로 하나만 출력할 때는 안써도 됨더보기 sns.subplots을 이용한 여러 레이블 그리기# 산점도와 boxplot을 하려면 sns.subplots로 도화지 만들기# fig : 액자 사이즈# axes 차원 3x2 사이즈 만들기fig, axes =plt.subplots(1..

데이터 분할테스트 및 검증 데이터를 분리해야 하는 이유검증 데이터 가 최종 모델을 선택하는 데 사용되기 때문에 검증 데이터에 대한 최종 모형의 오류율 추정치가 편향된다 (실제 오류율보다 작음).테스트 데이터로 최종 모델을 평가 한 후에는 모델을 더 이상 조정하지 않아야 한다.Resampling이 왜 필요했는가?모델의 성능을 제대로 평가하고, 불확실성이나 편향을 줄이며, 데이터가 부족하거나 한정된 상황에서도 신뢰할 수 있는 통계적 추정을 가능하게 하기 위해서테스트와 훈련 데이터의 차이모델을 평가할 때 train error는 쉽게 구할 수 있지만, test error는 구하기 어려움학습 데이터 모델을 기반으로 형성된 모델은 실제 평가 데이터에서 성능이 과적합됨그러면, 평가 데이터를 많이 확보하는 건 쉬운가?..

변수 선택 방법론변수 선택 방법론은. 모델링이 앞서, 우리가 독립 변수를 설명하기 위한 주요한 변수를 고르는 과정이다.흥미를 불러오는 비유로 시작해보자, 우리는 햄버거를 먹다보면 최적의 메뉴 조합을 떠올릴 수 있다.가장 맛있는 햄버거를 먹기 위해, 양상추, 치즈, 패티, 토마토 등 다양한 재료를 조합하여 먹게된다.그러나 너무 많은 속재료는 조화롭지 못하며, 네 맛도 내 맛도 아닌 굉장한 음식이 나온다.게다가 햄버거가 너무 커져 턱도 아프다. 이는 모델을 개발하는 과정과 유사하다.우리가 설명하고자 하는 변수를 기준으로 다른 변수들과의 관계를 고려하게 되는데 우리는 그 변수들을 선택해야만 한다. 당연히 모든 설명 변수를 기반으로 모델을 만들어 알고리즘으로 개발할 수 있다.그러나, 컴퓨팅 리소스 측면과 모델의..