Tự tạo dataset ảnh trên Google Drive sử dụng Google Colab và Bing Image Search API

tutorial

#1

Sau đây mình xin chia sẻ cách tạo một dataset ảnh lưu trữ trên Google Drive. Công cụ mình sử dụng là Google ColabBing Image Search API.

Bước 1: Setup Google Colab và kết nối đến Google Drive

  • Phần này đã được bác trungthanhnguyen0502 nói rất chi tiết nên mình sẽ không nói thêm nữa. Các bạn hãy xem ở đây

Bước 2: Lấy key của Bing Image Search API

  • Hiện tại bạn có thể thử miễn phí 7 ngày sử dụng khi tạo một account Microsoft. Hoặc là bạn có thể đăng kí thêm thông tin thanh toán để được dùng miễn phí luôn.

Bước 3: Chạy code để download ảnh về Google Drive

  • Phần code mình lấy từ một tutorial trong blog PyImagesearch. Mình thấy đây là một tutorial cực kỳ hữu ích để xây dựng một dataset của riêng mình. Các bạn có thể vào repo trên github của mình để lấy code.

  • Trước hết, mình tạo một folder trong Google Drive và chạy code sau trong Google Colab để vào folder đó. Mình đặt tên folder của mình là AI_CODE_LAB.

    import os os.chdir(“drive/My Drive/AI_CODE_LAB”)

  • Sau đó, copy file code (make_dataset.py) vào trong folder đó. Để kiểm tra, bạn chạy trong Google colab câu lệnh sau:

    !ls

  • Tạo một folder dataset trong Google Drive và chạy câu lệnh sau trong Google Colab:

    !python make_dataset.py -q iphone -o dataset/iphone

Ảnh sẽ được download về folder dataset/iphone trong Google Drive và được đánh số theo thứ tự tăng dần luôn. Bạn có thể thay Iphone thành bất cứ thứ gì bạn muốn, nhớ thay đổi tên folder để dễ quản lý.

  • Kết quả

Vậy là hoàn thành việc xây dựng một dataset của riêng mình. Điều hay nhất của việc này là bạn hoàn toàn không cần sử dụng một chút nào tài nguyên của máy mình mà tất cả đều được thực hiện trên các tài nguyên miễn phí cung cấp bởi Google và Bing.