All-optical machine learning using diffraction

deep-learning
optic
machine-learning

#1

All-Optical Machine Learning Using Diffractive Deep Neural Networks

Xing Lin, Yair Rivenson, Nezih T. Yardimci, Muhammed Veli, Mona Jarrahi, Aydogan Ozcan

(Submitted on 14 Apr 2018 (v1), last revised 26 Jul 2018 (this version, v2))

We introduce an all-optical Diffractive Deep Neural Network (D2NN) architecture that can learn to implement various functions after deep learning-based design of passive diffractive layers that work collectively. We experimentally demonstrated the success of this framework by creating 3D-printed D2NNs that learned to implement handwritten digit classification and the function of an imaging lens at terahertz spectrum. With the existing plethora of 3D-printing and other lithographic fabrication methods as well as spatial-light-modulators, this all-optical deep learning framework can perform, at the speed of light, various complex functions that computer-based neural networks can implement, and will find applications in all-optical image analysis, feature detection and object classification, also enabling new camera designs and optical components that can learn to perform unique tasks using D2NNs.

Comments: 20 pages, 4 figures
Subjects: Neural and Evolutionary Computing (cs.NE); Machine Learning (cs.LG); Computational Physics (physics.comp-ph); Optics (physics.optics)
DOI: 10.1126/science.aat8084
Cite as: arXiv:1804.08711 [cs.NE]
(or arXiv:1804.08711v2 [cs.NE] for this version)

#2

image

Efficient Deep Learning

Deep learning đã cải thiện chất lượng của rất nhiều bài toán trong thị giác máy từ nhận diện chữ viết tay, tới nhận diện khuôn mặt, .v.v. Một số bài toán thậm chí DL còn cho kết quả tốt hơn cả con người với thời gian test khá thấp thậm chí là thời gian thực.

Tuy nghiên, đổi lại cho chất lượng cao đó, DL đòi hỏi rất nhiều dữ liệu và khối lượng tính toán rất lớn tới hàng triệu biến số và hàng triệu phép tính cộng và nhân. Cũng không quá khó hiểu khi nghiên cứu về “Efficient Network” với việc thiết kế, và thực hiện mạng network thân thiện với thiết bị mobile, cho phần cứng, FPGA, ARM hay giảm số lượng tính toán, yêu cầu về bộ nhớ .v.v. Đó là hàng loạt các nghiên cứu về Layer Prunning, Quantization Network, Efficient Convolutions (Separable convolution, Deep-wise convolution, shift operator, ) vân vân và mây mây.

Cho tới cuối ngày, mạng neuron hiệu quả, nhỏ gọn nhất vẫn yêu cầu mấy chục ngàn phép tính và lượng tính toán tương đối cao. Và hơn hết, việc tính toán các layer là theo tuần tự, layer trước, layer sau. Chưa kể dữ liệu đầu vào như ảnh,video đều phải trải qua quá trình chụp, rồi tiền xử lý, lượng tử hóa, sau đó mới đưa vào mạng neuron để dự đoán.

Deep Learning at the speed of light

Vậy mạng neuron network nhanh nhất có thể được là gì? Câu trả lời là mạng - neuron - quang học. Bởi lẽ chẳng có gì nhanh hơn tốc độ ánh sáng cả.

Nhóm nghiên cứu tới từ trường đại học UCLA đã công bố công trình nghiên cứu về “Diffration Deep Neural Network” - D2NN trên tạp chí Science. Trong công trình nghiên cứu trên, convolution layer được thay bằng các diffraction optic (in bằng máy in 3D). Ánh sáng đi qua từng điểm diffraction ở layer K sẽ trở thành nguồn sáng, và tán xạ cho layer K+1, dẫn đến các điểm diffraction ở layer K+1 sẽ là gộp ánh sáng từ nhiều nguồn sáng ở layer K. Điều này tương tự như việc bạn cộng gộp các neuron lại thông qua các kênh liên kết như hình dưới

Vậy hiệu ứng tán xạ sẽ tương ứng với ma trận Weight, còn hiệu ứng phản xạ ở từng điểm (optical mà, kiểu gì chả có phản xạ) sẽ mô hình tương ứng như Bias.

Vậy còn hàm phi tuyến như Rectifier? Không giống như hàm phi tuyên hay dùng trong DL như RELU, trong optic họ cũng có những đặc tính phi tuyến riêng như đặc tính phi tuyến của Phase, Polarization. Có vẻ như ở bài báo này chưa có thực hiện thành phần non-linear trong optic.

Training

Để training optical network, tác giả sẽ mô hình các hiệu ứng tán xạ, và phản xạ kể trên dưới dạng mạng neural network thông thường và train trên máy tính. Từ đặc tính học được sẽ in 3D để tạo ra các layer tương ứng. Lưu ý là khoảng cách đặt các miếng phản xạ ảnh hưởng tới độ tán xạ giữa các lớp, đây cũng là một thông số học trong quá trình training.

Chất lượng “test phase” chịu ảnh hưởng nhiều từ độ chính xác mô hình vật lý mô phỏng lúc huấn luyện, độ chính xác máy in 3D cũng như độ chính xác về khoảng cách giứa các lớp. Có vẻ rất khoai.

Kết quả

Với 5 lớp tán xạ đặt ở khoảng cách tương ứng, mạng D2NN đạt độ chính xác ở tốc độ gần ánh sáng ở

  • MNIST: D2NN đạt độ chính xác 88%
  • Fashion-MNIST đạt 81-86%

P/s: Deep Learning đã ảnh hưởng tới nhiều nhóm nghành nghiên cứu, và optical engineering cũng không phải ngoại lệ, tên chuyên ngành dùng deep learning cho optic được gọi là Computational Optic.