가. Python 기초 문법 및 데이터 처리
- Python 개발 환경 소개
: Jupyter Notebook, Google Colab 사용법
- 기본 문법
: 변수, 자료형, 조건문, 반복문, 함수 정의 및 호출
- 자료구조
: List, Tuple, Dict, Set의 구조와 사용 예
- 패키지 설치 및 관리
: pip, venv 사용법
- Numpy를 활용한 벡터 연산
: 배열 생성, 브로드캐스팅, 배열 연산
- Pandas를 활용한 데이터프레임 처리
: Series, DataFrame 생성 및 인덱싱, 필터링
나. 데이터 시각화 및 탐색
- Matplotlib / Seaborn 기초 시각화
: plot, bar, scatter, line, pie 등 기본 그래프
- 범주형/연속형 변수 시각화
: countplot, histogram, kdeplot
- Boxplot, Heatmap, Countplot 실습
: 이상치 탐지, 상관관계 시각화
다. 머신러닝 기초
- 머신러닝 개념
: 지도 학습, 비지도 학습의 차이
- Scikit-Learn 소개 및 기본 구조
: fit(), predict(), transform() 함수 개념
- 주요 알고리즘 실습
: K-최근접 이웃 (KNN)
: 서포트 벡터 머신 (SVM)
: 결정 트리 (Decision Tree)
- 학습 및 테스트 데이터 분리
: train_test_split 사용법
- 평가 지표
: Accuracy, Precision, Recall, F1-score
- 데이터 전처리
: 스케일링(StandardScaler, MinMaxScaler)
: 인코딩(One-Hot, Label Encoding)
: 결측값 처리(SimpleImputer)
- 특성 선택 / 차원 축소
: PCA(주성분 분석) 소개 및 시각화