로그인 바로가기
하위 메뉴 바로가기
본문 바로가기
검색
로그인 / 회원가입
난이도
기본
프로젝트로 배우는 데이터사이언스
박조은
공유하기
URL복사
밴드
페이스북
트위터
프로젝트로 배우는 데이터사이언스
프로젝트로 배우는 데이터사이언스
http://www.boostcourse.org/ds214/lecture/102085/
좋아요
1130
수강생
5838
전체 메뉴 열기
하위 메뉴
공지게시판
수강생 토론 게시판
오리엔테이션
강좌 전체목록보기
오리엔테이션
01. 프로젝트로 배우는 데이터 사이언스 코스란?
02. 이 코스를 개발한 전문가
03. 학습 가이드
04. 셀프리뷰 소개
05. 시작합니다!
1. 분류모델 기초
강좌 전체목록보기
1.1 사이킷런과 머신러닝
1.1.1 사이킷런 소개
1.1.2 사이킷런 활용 흐름
1.1.3 사이킷런의 의사결정나무 알고리즘 알아보기
1.2 의사결정나무로 간단한 분류 예측 모델 만들기
1.2.1 당뇨병 데이터셋 소개
1.2.2 학습과 예측을 위한 데이터셋 만들기
1.2.3 의사결정나무로 학습과 예측하기
1.2.4 예측한 모델의 성능 측정하기
2. EDA를 통해 데이터 탐색하기
강좌 전체목록보기
2.1 EDA를 통해 데이터 탐색하기
2.1.1 당뇨병 데이터셋 미리보기
2.1.2 결측치 보기
2.1.3 훈련과 예측에 사용할 정답값을 시각화로 보기
2.1.4 두 개의 변수를 정답값에 따라 시각화 해보기
2.1.5 수치형 변수의 분포를 정답값에 따라 시각화 해보기
2.1.6 서브플롯으로 모든 변수 한번에 시각화 하기
2.1.7 시각화를 통한 변수간의 차이 이해하기
2.1.8 피처엔지니어링을 위한 상관 계수 분석하기
3. 탐색한 데이터로 모델성능 개선
강좌 전체목록보기
3.1 탐색한 데이터를 바탕으로 모델의 성능 개선하기
3.1.1 연속 수치 데이터를 범주형 변수로 변경하기
3.1.2 범주형 변수를 수치형 변수로 변환하기 - 원핫인코딩
3.1.3 결측치 평균값으로 대체하기
3.1.4 결측치 중앙값으로 대체하기
3.1.5 수치형 변수를 정규분포 형태로 만들기
3.1.6 상관 분석을 통해 파생변수 만들기
3.1.7 이상치 다루기
3.1.8 피처 스케일링
3.1.9 전처리한 피처를 CSV 파일로 저장하기
4. 모델과 파라미터 찾기
강좌 전체목록보기
4.1 최적의 모델과 파라미터 찾기
4.1.1 사이킷런을 통해 학습과 예측에 사용할 데이터셋 나누기
4.1.2 랜덤값을 고정하여 디시전트리로 학습과 예측하기
4.1.3 최적의 max_depth 파라미터값 찾기
4.1.4 GridSearchCV 를 사용해서 최적의 하이퍼 파라미터 값 찾기
4.1.5 RamdomSearchCV 를 사용해서 최적의 하이퍼 파라미터 값 찾기
4.2 다양한 트리계열 머신러닝 모델 사용하기
4.2.1 랜덤포레스트 사용하기
4.2.2 그라디언트 부스팅 알고리즘 사용하기
4.2.3 RamdomSearchCV 로 여러 알고리즘의 최적의 하이퍼 파라미터를 찾기(1)
4.2.4 RamdomSearchCV 로 여러 알고리즘의 최적의 하이퍼 파라미터를 찾기(2)
프로젝트A. 분류모델
강좌 전체목록보기
건강검진 정보로 음주여부 분류하기
프로젝트 A. Classification
5. 회귀모델 만들기
강좌 전체목록보기
5.1 트리계열 모델로 회귀 예측하기
5.1.1 사이킷런의 분류와 회귀
5.1.2 인슐린 수치를 회귀로 예측하기 위해 데이터셋 나누기
5.1.3 크로스 밸리데이션으로 모델 검증하기
5.1.4 오차값 MAE, RMSE 구하기
5.1.5 회귀로 학습한 결과를 시각화 하기
5.1.6 예측의 결과값 분석하기
5.1.7 이상치 제거하기
5.1.8 RandomizedSearchCV 로 최적의 파라메터 값 찾기
5.1.9 RandomizedSearchCV 로 최적의 모델 찾기
5.1.10 csv 파일로 예측결과 저장하기
5.2 회귀로 예측한 값을 분류에 사용하기
5.2.1 회귀로 예측한 인슐린을 분류에 사용하기
5.3 사이킷런으로 머신러닝 모델 만들기 전체 과정 정리
5.3.1 사이킷런으로 머신러닝 모델 만들기 전체 과정 정리
프로젝트B. 회귀모델
강좌 전체목록보기
건강검진 정보로 허리둘레 예측하기
프로젝트 B. Regression
코스를 마치며
강좌 전체목록보기
코스를 마치며
코스를 마치며
1.1.3 사이킷런의 의사결정나무 알고리즘 알아보기
공유하기
URL복사
밴드
페이스북
트위터
1.1.3 사이킷런의 의사결정나무 알고리즘 알아보기 - 부스트코스
1.1.3 사이킷런의 의사결정나무 알고리즘 알아보기 - 부스트코스
좋아요 53
연관 토론
페이지 이동
First
이전
다음
Last
수강완료
수강이 완료되었습니다.
닫기
수강이 완료되었습니다.
이제
다음 강의
를 확인하세요.
닫기
닫기
1.1.2 사이킷런 활용 흐름
1.2.1 당뇨병 데이터셋 소개