[12/02/2020 21:05] Mọi người cho e hỏi, làm thế nào để biết . . .


#1

Nguồn post: https://www.facebook.com/257768141347267_1115054915618581
Mọi người cho e hỏi, làm thế nào để biết trong 1 tập các vector thì có những vector nào giống nhau ạ? E dùng set để add thì set không add đc kiểu vector, ndarray ạ?


#2

Dùng một phép đo độ tương tự để đo em nhé. Em tìm hiểu từ khoá “similarity measures”


#3

Trong scipy nó có phần các metrics để tính distance của 2 vectors á bạn, bạn chọn 1 cái rồi tính distance rồi chọn là đc


#4

Bạn dùng thuật toán KMean phân cụm ra xem.


#5

Dùng thư viện facebook ai similarity search ấy bạn (faiss)


#6

Mình ko hiểu chỗ “vector giống nhau” như bạn nói. Nếu muốn classifieds pattern trong dataset bằng cách dùng khoảng cách giữa điểm vs center (độ dài của vector) thì dùng Kmean có sẵn, ko cần tính thủ công luôn


#7

bạn tham khảo hàm np.unique nó trả về các vector, số lần xuất hiện và vị trí xuất hiện