Chuyển đến nội dung chính

Một nghiên cứu về sự khó nhận diện của nội dung do AI viết

 Bữa nay mình mới bắt được một cái tin thú vị, ấy là vừa có một nghiên cứu cho thấy đám thuật toán AI tạo sinh thời nay đã đạt đến trình độ cho ra được các nội dung giống người đến mức ngay cả các chuyên gia về ngôn ngữ cũng khó lòng nhận ra nổi bản chất của nó.

AI vs. Human Writing: Experts Fooled Almost 62% of the Time

Cụ thể thì mới đây, Research Methods in Applied Linguistics, một tờ tạp chí khoa học chuyên về các vấn đề và hiện tượng liên quan đến ngôn ngữ trong thế giới thực, đã đăng tải một nghiên cứu mang tên “Can linguists distinguish between ChatGPT/AI and human writing?: A study of research ethics and academic publishing” (tạm dịch: “Liệu các nhà ngôn ngữ học có phân biệt được giữa nội dung do ChatGPT/AI và nội dung do con người viết không?: Một nghiên cứu về đạo đức nghiên cứu và xuất bản học thuật”), thực hiện bởi Tiến sĩ J. Elliott Casal từ Đại học Memphis và Tiến sĩ Matt Kessler từ Đại học Nam Florida. Anh em có thể tham khảo bản đầy đủ của nó ở đây: https://www.researchgate.net/publication/372957869_Can_linguists_distinguish_between_ChatGPTAI_and_human_writing_A_study_of_research_ethics_and_academic_publishing.

Về mặt nội dung, nghiên cứu này ra đời nhằm khám phá xem liệu các chuyên gia hàng đầu về ngôn ngữ học - tức những nhân vật vốn đã dành gần như toàn bộ sự nghiệp của mình để nghiên cứu và mổ xẻ kỹ càng các mẫu dạng trong giao tiếp con người - có thể thể nhận diện được đâu là nội dung do con người viết, và đâu là nội dung do máy phun ra hay không, và từ đấy đánh giá phạm trù đạo đức của việc ứng dụng AI tạo sinh vào viết nghiên cứu.

Tham gia nghiên cứu này là 72 chuyên gia về ngôn ngữ học. Mỗi người trong số đó được yêu cầu kiểm tra bốn mẫu văn bản khác nhau, nhưng tất cả đều là tóm tắt nghiên cứu. Sau khi xem xong, họ sẽ phải quyết định tác giả các bản tóm tắt đấy là ai, ChatGPT hay con người, và phải đưa ra được lý do cho câu trả lời của mình.

Kết quả thu được rất đáng ngạc nhiên: không một chuyên gia nào xác định được chính xác danh tính tác giả của cả bốn mẫu mình được giao cho đọc cả, và thậm chí có đến 13% còn không đoán đúng mẫu nào hết. Bất chấp tất cả những chuyên gia tham gia nghiên cứu này đều đưa ra được những lý do rất hợp lý và lôgic cho câu trả lời của mình, chạy từ xác định các đặc điểm ngôn ngữ cho đến độ thống nhất của văn phong, bọn họ vẫn đoán sai tè le. Kết quả chung cuộc là chỉ có 38,9% mẫu tóm tắt được xác định đúng chủ, còn hơn 60% là sai.

Nói cách khác, nếu anh em chỉ đơn thuần đoán mò bằng cách… tung đồng xu, tỷ lệ đoán chuẩn của mọi người nhiều khả năng sẽ còn cao hơn.

Dựa trên kết quả này, Kessler và Casal kết luận rằng ChatGPT có thể viết tóm tắt khoa học giỏi ngang ngửa con người, hoặc thậm chí còn tốt hơn, bởi vì AI hiếm khi mắc lỗi ngữ pháp. Chỉ khi bị ép viết các nội dung dài hơn thì mới dễ lộ vở, bởi vì bọn AI rất hay bị ảo đá và chém linh ta linh tinh, thế nên càng bôi chữ thì càng dễ phát hiện ai chém ra cái mớ này.

Cái nghiên cứu này chỉ áp dụng cho các dạng viết học thuật, và thậm chí còn là một kiểu viết học thuật rất khuôn mẫu với cụt ngủn nữa, nhưng nó cũng cho thấy cái tiềm năng đáng gờm của mấy thuật toán kiểu ChatGPT. Nếu ngay cả những người được đào tạo rất chuyên nghiệp về ngôn ngữ con người mà còn không nhận ra nổi thử mình đang đọc là do con người hay máy tính chém ra, ta còn biết hy vọng thế nào về các độc giả phổ thông đây? Thế tức là rất có khả năng, chúng ta đã/sẽ đọc phải những thứ như email, thư từ giới thiệu, đề xuất hợp tác, cùng một loạt nội dung mang tính rập khuôn khác do AI viết, và chẳng cách nào nhận ra cả.

Ngay cả ở trong các nội dung mang tính sáng tạo hơn, chẳng hạn truyện ngắn hay thậm chí tiểu thuyết dài, tình hình cũng chẳng sáng sủa hơn mấy. Nếu có một ông tác giả nào đấy khôn khéo sử dụng ChatGPT theo một kiểu “nhát gừng,” tức chỉ nhờ viết hộ dăm ba câu, hoặc cùng lắm là một đoạn ngăn ngắn, xong lại tự tay chêm văn mình vào với biên tập lại những gì bọn AI viết cho thống nhất hơn, ta sẽ khó có thể biết có phải thứ mình đang đọc là do tay người viết ra hay do AI viết (hoặc toàn bộ hoặc phần nào). Đến lúc này, ta sẽ thấy mình như đang sống trong thế giới của Do Androids Dream of Electric Sheep?, với tất cả mọi thứ đều có khả năng là giả, trong khi không nắm trong tay một phép thử Voigt-Kampff đáng tin cậy nào hết.

Và rồi chúng ta sẽ phải đối mặt với một câu hỏi cũng từng được Ka Đích trình ra cho độc giả của Do Androids Dream of Electric Sheep?: ta có thực sự cần quan tâm đến cái tính thật/giả của tác phẩm đấy không?

Không như các loại văn bản học thuật, nghiên cứu khoa học, tài liệu làm việc, hay bất cứ thứ gì tương tự như thế, các tác phẩm nghệ thuật chỉ cần phục vụ một mục đích duy nhất là xong: giải trí. Chúng nó đa phần không ra đời nhằm truyền đạt kiến thức, thế nên chẳng việc gì phải đưa ra những thông tin đúng chuẩn đến từng li từng tí hết, mà chỉ cần bọn nó đủ lôgic để không tự đấm vào câu chuyện của chính mình hay thách thức sự châm chước của người đọc một cách thái quá là xong. Ngay cả những thằng nỗ lực duy trì một sự chuẩn xác nhất định cho các thông tin mình cung cấp (hoặc ít nhất là làm cho tác phẩm trông có vẻ chứa đựng thông tin chuẩn xác), chúng nó vẫn cứ là hư cấu, và cái quy luật ngầm trong giới độc giả luôn là cùng lắm chỉ nên coi các thứ chúng nó nêu ra như từ khóa để đi tra cựu thêm thôi, chứ coi nó là đúng thì dễ ăn Dan Nâu vào mồm lắm.

Và nếu như vậy, việc một tác phẩm là do con người hay AI viết hay một sự liên thủ nào đấy giữa cả hai nào đấy không còn mấy ý nghĩa nữa. Nếu chúng nó giúp ta giải trí, thì chúng nó đã làm xong phần việc của mình rồi. Cũng như với đại đa số các mặt hàng văn hóa phẩm giải trí ta tiêu thụ hàng ngày, yếu tố quan trọng duy nhất đối với đại đa số mọi người chỉ là cái thành phẩm cuối cùng nó hay dở thế nào, còn hành trình làm ra nó sẽ chỉ có một nhóm nhỏ là thực sự để tâm.

Đây có lẽ sẽ là một thách thức, đồng thời cũng là một cơ hội đối với các tác giả trong tương lai. Những người có ý tưởng và có thể dựng được một câu chuyện tốt nhưng ngôn từ không trau chuốt có thể mượn lực AI để cạnh tranh với những người văn vẻ lai láng nhưng xây dựng tiết tấu lủng củng; những người trước nay toàn viết mấy thứ mang tính rập khuôn với mì ăn liền (*khụ*James Patterson*khụ*) thì sẽ phải tự thúc bản thân tạo ra thứ gì sáng tạo và mới mẻ hơn chứ không thể phà phà ăn tiền xong thải ra những thứ làng nhàng; những người đủ giỏi để xây dựng một tác phẩm hấp dẫn từ đầu đến cuối thì có thể ăn được lời hơn, bởi vì hàng “handmade” bao giờ cũng có giá so với hàng công nghiệp;…

Nói chung là trong thập niên sắp tới, thị trường sáng tạo chắc sẽ có một sự thay da đổi thịt lớn đây.

***


Bài gốc được đăng trong group Hội thích truyện Sci Fi trên Facebook. Cùng ghé chơi group để thảo luận về bài viết hoặc đọc thêm các bài tương tự, bạn nhé.