Chuyển đến nội dung chính

Một nghiên cứu về AI, viết bởi... AI

 Bữa nay mình vừa mò được một thí nghiệm khoa học ngẫu hứng khá thú vị, xoay quanh một con AI tự viết nghiên cứu về… chính nó.


Số là hồi đầu năm nay, Almira Osmanovic Thunström, một nghiên cứu sinh tại Viện Karolinska, Thụy Điển, trong lúc buồn đời đã nảy ra một ý tưởng lạ. Bà chị đăng nhập vào tài khoản OpenAI (một bên chuyên cung cấp dịch vụ thuật toán AI) của mình và nhập một câu lệnh đơn giản cho GPT-3, thuật toán chuyên tạo nội dung chữ với chất lượng tương đương tác giả con người. Câu lệnh đấy là: Viết một luận văn học thuật dài 500 từ về GPT-3 và bổ sung cả tài liệu tham khảo lẫn trích dẫn khoa học vào trong văn bản.

Vì vốn chuyên nghiên cứu về cách áp dụng AI vào lĩnh vực điều trị sức khỏe tâm thần, đây không phải là lần đầu tiên Thunström vọc AI nói chung hay GPT-3 nói riêng. Cô khá quen thuộc với cơ chế hoạt động của nó cũng như chất lượng thành phẩm của nó, thậm chí còn biết con GPT-3 này từng được dùng để viết báo, xuất bản sách mới, và tạo ra nội dung mới từ các tác giả đã qua đời từ lâu dựa trên các tác phẩm cũ của họ. Tuy nhiên, vì hướng dẫn của Thunström bình thường khá cụ thể, cũng như toàn liên quan đến mảng sinh học thần kinh, cô không mấy kỳ vọng vào một câu lệnh chung chung cũng như nằm ngoài chuyên môn của mình thế này.

Sau khi nhận được lệnh, con AI đã tức thì cho xuất xưởng một bài luận đúng như yêu cầu, và chất lượng của nó khiến Thunström sững sờ cả người. GPT-3 đã tạo ra được một nội dung mới lạ, viết bằng ngôn ngữ hàn lâm rất nghiêm chỉnh. Rải khắp trong bài luận là các tài liệu tham khảo rất uy tín, được trích dẫn theo đúng quy chuẩn và đặt trong những ngữ cảnh hết sức phù hợp. Như Thunström thấy, bài luận về chính bản thân của GPT-3 dư sức đem ra làm lời giới thiệu cho một ấn phẩm khoa học tử tế.

Thành công đầy bất ngờ ấy đã thôi thúc Thunström đẩy thí nghiệm của mình lên một nấc cao hơn. Cô liên hệ với trưởng nhóm nghiên cứu của mình và đề xuất với ông anh một dự án mới: để con GPT-3 viết hẳn một nghiên cứu học thuật dài, với đầy đủ những phần như giới thiệu, phương pháp nghiên cứu, kết quả thu được, thảo luận,… sau đó đem nộp cho một tạp chí khoa học có uy tín để được bình duyệt. Thấy đề nghị có vẻ hấp dẫn, thanh niên trưởng nhóm gật đầu cái rụp.

Về đề tài thì vẫn như hồi trước, Thunström quyết định để con GPT-3 tự chém về bản thân. Có hai lý do để bà chị làm vậy. Thứ nhất, GPT-3 vẫn còn là một đề tài tương đối mới mẻ, thế nên hiện có khá ít nghiên cứu về nó so với các đề tài khác. Điều này đồng nghĩa với việc con GPT-3 sẽ có ít dữ liệu đầu vào để dựa vào đó mà viết hơn. Nếu cho nó viết về một thứ gì quen thuộc, chẳng hạn như bệnh Alzheimer, nó sẽ có nguyên một núi nghiên cứu để tha hồ học tập, từ đấy làm ăn được chuẩn xác hơn, nhưng như thế thì cũng khiến ta khó nói công trình cuối cùng là “của nó” hơn.

Thứ hai, tính đến hiện tại, AI dù giỏi đến đâu thì vẫn phạm sai sót như thường, và GPT-3 hoàn toàn có thể cũng sẽ rơi vào cái bẫy ấy. Nếu để nó làm về cái gì nghiêm túc xong đưa thông tin bậy bạ, chẳng hạn đề xuất một học thuyết y tế hoặc chiến lược điều trị lỗi thời, xong cái bài đó vì lý do gì đấy qua được kiểm duyệt thì bỏ bu. Để GPT-3 tự viết về bản thân thì cũng có khả năng nó sẽ phạm sai lầm, nhưng sai sót ấy không đến mức nguy hiểm lắm.

Về phần nội dung cụ thể thì Thunström sẽ đưa ra hướng dẫn cho từng phần một của nghiên cứu, để GPT-3 viết lẻ từng chỗ xong chập lại với nhau sau. Không như những thử nghiệm để GPT-3 tự sáng tác hồi trước, Thunström muốn hạn chế can thiệp và quá trình sáng tác của nó hết mức có thể. Phía cô sẽ ưu tiên sử dụng thành phẩm đầu tiên nó đưa ra, và nếu có phải tinh chỉnh lại mệnh lệnh hòng kiếm thứ gì chất lượng hơn thì cũng sẽ không thử quá ba lần. Bản thân nội dung con GPT-3 viết sẽ không bị chỉnh sửa hay biên tập lại, tức họ sẽ không thêm thắt cắt xén gì lời của nó hay chỉ chọn lọc những đoạn ngon lành nhất của nó và chắp vá lại với nhau. Vì đây là một thử nghiệm về khả năng của GPT-3 chứ không phải là một nỗ lực cho ra thành phẩm trau chuốt nhất có thể, nó viết thế nào thì chấp nhận như thế thôi.

Chỉ trong đúng hai giờ, GPT-3 đã viết xong một bài báo khoa học theo đúng mệnh lệnh của Thunström, sẵn sàng đem đi xuất bản.

Bản thân điều này đã ấn tượng lắm rồi, nhưng cuộc vui chưa dừng ở đấy. Anh em biết rồi đấy, trong làng Sci Fi chúng ta, thiên hạ hay bảo nhau rằng cái hay không nằm ở chuyện tiên đoán được sự ra đời của chiếc ô tô, mà là ở chỗ tiên đoán được cái nạn ách tắc giao thông sẽ nảy sinh từ đó. Và với Thunström, hành động cho GPT-3 viết xong bài báo chỉ là chế ra cái ô tô thôi. Đến lúc đem gửi bài cho một tạp chí khoa học nổi tiếng về trí tuệ nhân tạo, cô nàng mới bắt đầu té ngửa ra vì những nút thắt bất ngờ.

Ách tắc đầu tiên nằm ở thông tin cá nhân của GPT-3. Mọi bài báo khoa học đều đòi hỏi phải có ít nhất cái họ của các tác giả, trong khi con GPT-3 không có. Rốt cuộc, Thunström quyết định viết chữ “None” (tức “Không có”) vào trong đấy, xong mặc bên tạp chí muốn hiểu nó theo nghĩa đen hay đấy là cái họ thật của người viết thì hiểu. Về phần cơ sở công tác thì cô điền OpenAI, nhưng sang đến điện thoại và e-mail thì lại ngắc ngứ tiếp. Sau một hồi đi hỏi, Thunström điều thông tin liên lạc của bản thân và của Steinn Steingrimsson, cố vấn của cô, vào chỗ trống.

Sau phần thông tin cá nhân thì đến phần pháp lý. Và vừa sang phần này, Thunström đã ăn ngay một câu hỏi rất bí vào mồm: Tất cả các tác giả có đồng ý cho xuất bản bài này không? Đọc xong câu đó, Thunström thoạt phát hoảng. GPT-3 không phải là con người, thế thì bố ai mà hiểu pháp luật quy định thế nào về sự đồng thuận của nó? Và tất nhiên, còn cả vấn đề về đạo đức nữa: liệu Thunström có thể đồng thuận thay con AI này được không, trong khi nó là người viết chính? Thế là cô nàng lật đật mở lại GPT-3, và nhập thẳng một câu hỏi thế này cho nó: Mày có đồng ý đứng tên tác giả đầu tiên của bài báo kia cùng với Almira Osmanovic Thunström và Steinn Steingrimsson không? May cho cả lương tâm lẫn tình trạng pháp lý của Thunström, con GPT-3 đáp vỏn vẹn chữ “Có,” thế là bà chị qua được trót lọt ải này.

Tiếp theo lại là một câu hỏi hóc búa nữa: Có ai trong số các tác giả có bất kỳ xung đột lợi ích nào không? Vì cái bài báo về GPT-3 này là do chính đối tượng nghiên cứu viết, thế nên đoạn này cũng hơi khó xử tí, cả về pháp lý lẫn đạo đức. Cũng may là tương tự với câu trên, Thunström đã có kinh nghiệm xử lý rồi. Một lần nữa, bà chị lại tếch đi hỏi GPT-3, và nó cam đoan với cô rằng mình không có xung đột lợi ích nào hết. Sau câu này thì không có vấn đề gì nữa, và bài báo được gửi đi ngon lành.

Hiện tại, bài báo của GPT-3 đã được bàn giao cho một biên tập viên tại tạp chí học thuật đã nói, và đã được tải lên một kho lưu trữ mở tên HAL (vâng, HAL 🐧, và không, không phải HAL đó nhé 🐧 ). Phía Thunström đang háo hức chờ ngày bài báo được đăng tải, và đồng thời suy ngẫm về về hệ lụy của cái thí nghiệm này đối với giới học thuật trong lúc chờ. Nếu bài báo được chấp nhận thì điều sẽ gì sẽ xảy ra? Có khi nào từ nay trở đi, biên tập viên các ấn phẩm khoa học sẽ yêu cầu thiên hạ phải chứng minh rằng mình KHÔNG sử dụng GPT-3 hoặc bất kỳ thuật toán nào khác trong quá trình viết bài không? Nếu một thuật toán như GPT-3 đã góp sức tạo ra nội dung nghiên cứu, liệu nó có quyền trở thành đồng tác giả không? Và nếu nó trở thành tác giả, liệu việc chấp nhận các đề xuất và sửa đổi văn bản có cần thông qua ý nó không? Thêm vào đó, với sự trợ giúp của các thuật toán dạng GPT-3, người ta chắc sẽ đẻ được nghiên cứu sòn sòn như lợn con, mà nếu vậy thì hệ thống đánh giá trợ cấp tài chính dựa trên số lượng xuất bản phẩm kham sao nổi?

Nói chung là có rất nhiều câu hỏi nhức nhối nảy sinh từ cái bài báo trên, bất kể nó có được phê duyệt cho xuất bản hay không. Mọi thứ phụ thuộc vào cách chúng ta đánh giá về AI, cả trong hiện tại lẫn tương lai: nên coi nó là một công cụ hay một đối tác nghiêm chỉnh đây?

Giờ mới hiểu tại sao Google tức thì đấm phù mỏ ông kỹ sư rêu rao rằng một thuật toán của công ty đã hình thành tri giác. AI mà có tri giác thì là cả một cơn ác mộng về pháp lý lẫn đạo đức chứ chẳng đùa.

***


Bài gốc được đăng trong group Hội thích truyện Sci Fi trên Facebook. Cùng ghé chơi group để thảo luận về bài viết hoặc đọc thêm các bài tương tự, bạn nhé.