Vấn đề vanishing gradient và các phương pháp xử lý khi lan truyền ngược trong huấn luyện mô hình học sâu

Bài viết đưa ra các biện pháp khắc phục vấn đề suy giảm đạo hàm (vanishing gradient) trong mạng nơron Multi Layer Perceptrons (MLP) khi thực hiện huấn luyện mô hình quá sâu (có nhiều hidden layer). Có sáu phương pháp khác nhau tác động vào model, chiến thuật train,... để giúp giảm thiểu vanishing gradients được giới thiệu trong bài viết trên bộ dữ liệu FashionMNIST.

Từ khóa: Xây dựng hàm MyNormalization, Huấn luyện mô hình học sâu, Bộ dữ liệu FashionMNIST, Mạng nơron Multi Layer Perceptrons, Phương pháp Weight Increasing

9 p tvs_bci 25/03/2024 66 0

Xem toàn màn hình

Tài liệu liên quan

Bình luận

Trường Cao Đẳng Công Nghiệp Bắc Ninh

Địa chỉ: Số 499, Đường Hàn Thuyên - Khu 1, Phường Đại Phúc, TP Bắc Ninh
Điện thoại: 0222.3821.230 / 02223.827.974
Website: https://bci.edu.vn/ - Email: cdcn.bci@gmail.com/ tcdnktkt@bacninh.gov.vn

Phát triển bởi Thư viện số