BTC cho mình hỏi là trên codalab có thông báo nội quy rằng không được dùng các kĩ thuật prompt-based, nhưng trong danh sách pretrained được sử dụng sao lại có mô hình LLama2 vậy ạ?
Posted by: lnmduc2 @ Oct. 9, 2023, 3:05 a.m.LLaMA 2 được Meta công bố dạng open-source, ngoài ra pre-trained model này cũng được huấn luyện trên tiếng Anh, chưa hỗ trợ tiếng Việt, do đó việc sử dụng model này vẫn hợp lý về mặt bản quyền và pháp lý. Ngoài ra BTC yêu cầu không sử dụng các kỹ thuật prompting, tức là các kỹ thuật zero-shot, one-shot và few-shot prompting, tuy nhiên các kỹ thuật fine-tuning dựa trên prompting (prompt-based fine-tuning) thì vẫn là các kỹ thuật fine-tuning yêu cầu việc huấn luyện phương pháp trên bộ dữ liệu cụ thể, do đó vẫn được xem là hợp lệ. (Giữa zero-shot prompting và zero-shot learning là khác nhau (tương ứng one-shot, few-shot), nhóm có thể tham khảo từ nguồn https://www.cs.princeton.edu/courses/archive/fall22/cos597G).
Posted by: nhn_nlp_uit @ Oct. 9, 2023, 3:30 a.m.