데이터 표현과 특성 공학

·Study/머신러닝
1. 범주형 변수 1.1 One-hot encoding(가변수) 범주형 변수를 0 또는 1 값을 가진 하나 이상의 새로운 특성으로 바꾼 것 one-hot-encoding one-out-of-N-encoding dummy variable 1.2 숫자로 표현된 범주형 특성 숫자 특성도 가변수로 만들고 싶다면 columns 매개변수에 인코딩하고 싶은 열을 명시해야 함 2. 구간 분할, 이산화, 그리고 선형 모델, 트리 모델 선형 모델: 선형 관계로만 모델링하므로 특성이 하나일 땐 직선으로 나타남 연속형 데이터에 강력한 선형 모델을 만드는 방법: 구간 분할(bining) 3. 상호작용과 다항식 특별히 특성을 풍부하게 나타내는 방법: 원본 데이터에 상호작용(interaction)과 다항식(polynomial)을 ..
potato_pizza
'데이터 표현과 특성 공학' 태그의 글 목록