Hỏi về KNN trong R


#1

Chào các anh chị!!

Hiện tại nhóm em đang tìm hiểu về knn trong r với phần code như trên ạ. Nhưng tụi em chưa hiểu lắm mong các a chị giúp đỡ. Từng dòng code càng tốt ạ.Cảm ơn các anh chị đã đọc tin.


#2

Đầu tiên dữ liệu được normalized vì KNN dùng Euclidean distance.
data_norm <- function(x) {...} : tạo ra 1 function để normalize 1 vector (đầu vào x là 1 vector, đầu ra là vector được normalized.
wdbc_norm <- as.data.frame(lapply(...))) : bạn có thể hiểu đơn giản apply như for loop thôi, loop qua tất cả các cột của dataframe wdbc[,-1] dùng function data_norm, sau đó kết hợp lại thành 1 dataframe.
wdbc_pred <- knn(wdbc_train, ...) : dùng KNN trong library class, sử dụng train data wdbc_train, test data wdbc_test, true class của training data wdbc[1:450,1], và dùng số lân cận k là 21.
Bạn có thể đọc thêm về document của hàm knn bằng help(knn).


#3

Đoạn trên đa số toàn lệnh cơ bản của R chứ ko riêng KNN. Bạn nên đọc tài liệu basic về R (chắc mất 30ph để hiểu các câu lệnh cơ bản)

Sau đó đọc tiếp tài liệu về package cần sử dụng => từ đó hiểu các dùng hàm, gọi hàm cũng như ý nghĩa và các tham số đi kèm.


#4

Dạ anh ơi, anh có thể cho e xin file hay đường dẫn để tìm hiểu về các packages trong R được k ạ.