ChatGPT hiện là mô hình ngôn ngữ lớn (LLM) đang rất nóng hiện nay khi thu hút được sự quan tâm của người dùng trên khắp thế giới. Công cụ này tốt đến mức có thể tạo ra những bài luận văn cho bậc đại học, ví dụ sinh viên có thể sử dụng LLM để hoàn thành bài tập viết, khiến các giáo sư không thể đánh giá chính xác năng lực học tập...
Phương pháp của DetectGPT dựa trên ý tưởng văn bản do LLM tạo ra thường di chuyển xung quanh các vùng cụ thể của các hàm xác suất. Nó chỉ dùng các xác suất nhật ký được tính toán bởi mô hình quan tâm, các nhiễu loạn ngẫu nhiên của đoạn văn từ một mô hình ngôn ngữ được đào tạo.
Thông qua đó, các nhà nghiên cứu đã phát triển công cụ đánh giá văn bản có phải do máy tạo ra hay không, với đặc điểm của công cụ là không dựa vào việc đào tạo trí thông minh nhân tạo (AI) hoặc thu thập các bộ dữ liệu lớn để so sánh văn bản.
DetectGPT mở ra hướng mới giúp giải quyết những nội dung do ChatGPT tạo ra. Ảnh: Chụp màn hình |
Phương pháp này của nhóm được gọi là "zero-shot", cho phép DetectGPT phát hiện văn bản do AI viết, hoạt động hoàn toàn trái ngược với các phương pháp vốn thường yêu cầu dữ liệu để đào tạo "bộ phân loại" từ các nội dung thực và được ChatGPT tạo ra.
Nhóm nghiên cứu đã thử nghiệm DetectGPT trên các bài báo do CNET sử dụng AI viết trong năm 2022 và xác nhận nó vượt trội các phương pháp phát hiện văn bản do AI tạo ra. Đây là phương pháp không yêu cầu bất kỳ dữ liệu bổ sung hoặc đào tạo nào, làm nó trở thành một công cụ hiệu quả để xác định văn bản do máy tạo.
Khi việc sử dụng LLM tiếp tục phát triển, tầm quan trọng của các hệ thống tương ứng để phát hiện văn bản do máy tạo sẽ ngày càng trở nên đáng kể. DetectGPT ngoài phát hiện văn bản do ChatGPT tạo ra thì đây còn là phương pháp hứa hẹn có thể tác động đáng kể đến nhiều lĩnh vực.