카테고리 없음

수업내용:KNN(최근접 이웃 알고리즘)

뭉게구름사탕 2023. 7. 28. 16:03
728x90

jupyter notebook을 설치 한 후!

 

import matplotlib.pyplot as plt           #후에 산점도를 그리기 위해 !

from sklearn.neighbors import KNeighborsClassifier  #KNN  모델을 불러오기 위해!

 

fish_data =
fish_target  =

#으로 데이터 설정이 되었고, 총 데이터는 49개이며 각 35,14개이다.

 

#데이터를 설정을 하였다면, 편중되지 않게 작업을 해줘야 한다. 

### 랜덤한 값을 만들기 전에 seed(임의의 번호)를 정의하면
## 같은 랜덤값을 만들어 줌!
## 동일한 랜덤값을 생성할 때 사용 
# 아무 의미가 없지만 그냥 자주 쓰는 숫자는 42임
np.random.seed(42)

index = np.arange(49)

np.random.shuffle(index)

 

 

##훈련데이터
train_input = fish_data[14:]
train_target = fish_target[14:]

 


#[14]가 기준인 것은 총 데이터가 49개인데 각 데이터가 35,14개로 들어가 있기 때문이다.
##테스트 데이터
test_input = fish_data[:14]
test_target = fish_target[:14]

############산점도를 통하여 자료가 잘 분산되었는지 확인

for i in range(35):
    plt.scatter(train_input[i][0],train_input[i][1], c='red')
for i in range(14):
    plt.scatter(test_input[i][0],test_input[i][1],c='blue')