Các nhà nghiên cứu ở Viện Khoa học Thông tin (ISI), Trường Kỹ thuật Viterbi (ĐH Nam California) đang phát triển một thuật toán có thể dạy máy học mà không cần đến sự giám sát của con người.
Rostami giải thích quy trình thực hiện học máy thông thường: “Chúng tôi thu thập dữ liệu đã được dán nhãn, sau đó dạy máy hành động giống con người khi tiếp xúc với dữ liệu đó. Vấn đề chúng tôi gặp phải là kiến thức máy thu được chỉ giới hạn ở tập dữ liệu sử dụng để đào tạo”.
Do vậy, nếu máy nhận được dữ liệu đầu vào khác với dữ liệu đào tạo, máy sẽ bị nhầm lẫn và không hành động giống con người.
Rostami đưa ra một ví dụ: “Có nhiều loại chó với hình dáng khác nhau. Nếu bạn huấn luyện một cỗ máy phân loại chó, kiến thức của nó chỉ giới hạn trong các mẫu bạn đã dùng để đào tạo. Nếu có một loại chó mới không nằm trong các mẫu huấn luyện, máy sẽ không biết được đó là một loại chó mới”.
Con người giỏi việc này hơn chương trình máy tính. Khi đưa một thứ gì đó cho con người để phân loại, nếu họ chỉ được cung cấp một vài mẫu trong một danh mục mới (chẳng hạn một loài chó mới), họ sẽ điều chỉnh và tìm hiểu danh mục mới đó là gì. “Một đứa trẻ sáu tuổi có thể học một danh mục mới bằng cách sử dụng hai, ba hoặc bốn mẫu, trái ngược với hầu hết các kỹ thuật học máy hiện đại yêu cầu ít nhất vài trăm mẫu”.
Vậy làm thế nào để máy tính có thể phân loại khi đối mặt với danh mục mới? Thông thường, đó không phải là việc học các danh mục hoàn toàn mới, mà là học cách điều chỉnh khi các danh mục hiện hành thay đổi.
Bản chất thay đổi của một danh mục được gọi là “sự thay đổi khái niệm”. Rosami lấy ví dụ về thư mục thư rác: “Dịch vụ email có một mô hình phân loại các email trong hộp thư đến thành email hợp lý và email spam. Người ta đã đào tạo nó để xác định thư rác thông qua một số đặc trưng nhất định. Chẳng hạn, nếu một email không được gửi đến cá nhân bạn, nhiều khả năng đó là thư rác”.
Thật không may, những kẻ gửi thư rác biết về các mô hình này, và liên tục bổ sung các tính năng mới để đánh lừa mô hình, nhằm ngăn chặn việc phân loại email của họ là thư rác. “Vẫn là khái niệm ‘thư rác’ nhưng theo thời gian, định nghĩa chi tiết về khái niệm này dần khác trước. Đó là sự thay đổi khái niệm”, Rostami cho biết.
Trong công bố mới, Rostami đã phát triển một phương pháp đào tạo mô hình máy học để giải quyết những vấn đề này.
Vì dữ liệu đào tạo ban đầu không phải lúc nào cũng có sẵn nên phương pháp của Rostami không dựa vào dữ liệu đó. Nhà khoa học Aram Galstyan ở ISI, đồng tác giả của nghiên cứu giải thích: “Mô hình của chúng tôi học cách phân loại dữ liệu cũ trong không gian ẩn, sau đó nó có thể tạo ra các biểu diễn ẩn (latent representation), gần giống tạo ra một tập dữ liệu tổng hợp bằng cách học cách biểu diễn của dữ liệu cũ”. Nhờ đó, mô hình có thể giữ lại những gì đã học được trong giai đoạn đào tạo ban đầu. Điều này giúp mô hình thích nghi, tìm hiểu các danh mục và danh mục phụ mới theo thời gian.
Quan trọng hơn, máy sẽ không quên dữ liệu đào tạo ban đầu hoặc những gì nó học được từ dữ liệu đó. Đây là một vấn đề lớn trong học máy. “Khi bạn đào tạo một mô hình mới, nó có thể quên một số mẫu hữu ích trước đây. Điều này gọi là vấn đề lãng quên (catastrophic forgetting)”, Galstyan nói.
Với cách tiếp cận mới, vấn đề lãng quên sẽ được giải quyết triệt để bởi vì nhóm nghiên cứu đã đưa ra một phương thức liên hệ tương ứng giữa phân loại dữ liệu cũ và dữ liệu mới. “Vì vậy, mô hình của chúng tôi sẽ không quên dữ liệu cũ”, Galstyan cho biết.
Rostami và Galstyan đang lên kế hoạch tiếp tục nghiên cứu về khái niệm này và áp dụng phương pháp mới cho các vấn đề trong thế giới thực. □
Thanh An lược dịch
Nguồn: https://techxplore.com/news/2023-03-machines-smarter-year-old.html