수업내용:KNN(최근접 이웃 알고리즘)
jupyter notebook을 설치 한 후!
import matplotlib.pyplot as plt #후에 산점도를 그리기 위해 !
from sklearn.neighbors import KNeighborsClassifier #KNN 모델을 불러오기 위해!
fish_data =
fish_target =
#으로 데이터 설정이 되었고, 총 데이터는 49개이며 각 35,14개이다.
#데이터를 설정을 하였다면, 편중되지 않게 작업을 해줘야 한다.
### 랜덤한 값을 만들기 전에 seed(임의의 번호)를 정의하면
## 같은 랜덤값을 만들어 줌!
## 동일한 랜덤값을 생성할 때 사용
# 아무 의미가 없지만 그냥 자주 쓰는 숫자는 42임
np.random.seed(42)
index = np.arange(49)
np.random.shuffle(index)
##훈련데이터
train_input = fish_data[14:]
train_target = fish_target[14:]
#[14]가 기준인 것은 총 데이터가 49개인데 각 데이터가 35,14개로 들어가 있기 때문이다.
##테스트 데이터
test_input = fish_data[:14]
test_target = fish_target[:14]
############산점도를 통하여 자료가 잘 분산되었는지 확인
for i in range(35):
plt.scatter(train_input[i][0],train_input[i][1], c='red')
for i in range(14):
plt.scatter(test_input[i][0],test_input[i][1],c='blue')