Chuyển đến nội dung chính

Sách nói bằng AI - một dự án mới của Apple

 Bữa nay mình vừa hay một tin khá thú vị, ấy là Apple đang rục rịch chuẩn bị tung ra một dịch vụ mới: tạo sách nói bằng AI.

Death of the narrator? Apple unveils suite of AI-voiced audiobooks

Cụ thể thì trong mấy tháng vừa qua, Apple đã lân la tiếp cận một số nhà xuất bản, chèo kéo bọn họ tham gia sản xuất sách nói, với giọng đọc được cung cấp bởi một thuật toán học máy do Apple phát triển. Apple tuyên bố sẽ cáng đáng toàn bộ chi phí sản xuất sách nói, trong khi các nhà văn sẽ vẫn nhận được tiền hoa hồng từ mọi đơn hàng mua sách thành công như thường. Không phải tất cả các bên Apple liên hệ đều gật đầu, nhưng vẫn có một số bên chấp thuận tham gia. Và bẵng đi một thời gian, đâu tầm tuần trước hay gì đó, Apple lẳng lặng tung ra lô sách nói đầu tiên do AI đọc. 

Bản thân việc sử dụng công nghệ để đọc văn bản cũng chẳng có gì mới lắm, và trên thực tế có khi mọi người còn từng dùng luôn chúng nó rồi chứ chẳng đùa. Kindle có chế độ text-to-speech (đọc chữ), cho phép người khiếm thị nghe máy đọc lại full các quyển sách ở định dạng azw3. Windows cũng có một phần mềm tương tự gọi là Narrator (hình như giấu trong mục accessibility), đọc cho ta nghe các file văn bản chữ. Hoặc chẳng nói gì phức tạp, anh em có thể quẳng một đoạn chữ bất kỳ lên Google Translate, và nó sẽ có lựa chọn cho mọi người nghe nó đọc các đoạn ấy bằng giọng bản địa. Trên Youtube thì nhan nhản các kênh sử dụng phần mềm text-to-speech, với một số kênh thậm chí còn là làm luôn sách nói nữa cơ (mặc dù mấy kênh đấy tất nhiên là làm lậu rồi).

Nhưng cái đáng chú ý của mấy quyển sách nói của Apple là cái chất lượng của nó.

Nếu đang sử dụng hàng táo, mọi người có thể cài cái app Apple Books, sau đó search “AI narration” trong mục cửa hàng của nó, và sẽ thấy một loạt sách do AI đọc được trưng ra, kèm một đoạn nghe thử. Trong trường hợp anh em không có hàng táo, mọi người có thể tham khảo một số đoạn preview lũ AI đọc ở đây: 


Khi nghe thử những đoạn preview ấy, anh em hẳn sẽ thấy chúng nó nghe mượt đến đáng ngạc nhiên. Vẫn có những chỗ chúng nó đọc rất vô hồn và lên xuống ngu si, đặc biệt trong các đoạn hội thoại, nhưng ở những phần lời dẫn bình thường thì khá ổn, và thậm chí còn có thể nói là diễn cảm nữa.

Ngay cả dân chuyên nghiệp cũng phải bất ngờ về nó. Tỉ như Anthony Pica, một diễn viên lồng tiếng kiêm huấn luyện viên giọng đọc, cũng đã nghe thử các đoạn lồng tiếng của con AI, và đã làm một clip phát biểu cảm nghĩ. Anh em tham khảo ở đây: 


Cũng như cái nhận định mình đã nói ở trên, ông anh bảo nghe mấy cái giọng AI này khá chất lượng, mặc dù vẫn có những dấu hiệu nhận biết rất rõ ràng rằng đây là một cái máy, đặc biệt khi nó đến các đoạn cần bộc lộ cảm xúc hoặc đổi giọng như hội thoại. Bên cạnh đó, ông anh cũng không mua hẳn quyển sách nào, mà chỉ nghe preview, thế nên không thể khẳng định được liệu chất lượng cả quyển sẽ ra sao, nhất là nếu quyển sách đòi hỏi cái giọng kể phải “trưởng thành” hoặc thay đổi theo thời gian. Dẫu thế, Anthony vẫn bảo với cái tình hình này, AI khả năng cao sẽ trở thành một đối thủ cạnh tranh đáng gờm trong tương lai, và những người lồng tiếng hoặc dẫn chuyện cần phải nỗ lực cải thiện cũng như xây dựng thương hiệu từ sớm, không là mai này sẽ căng lắm đấy.

Về cá nhân thì mình nhìn chung có cùng quan điểm với bro Anthony. Mặc dù căn cứ vào những gì đã nghe thử, mình không nghĩ là mấy cái quyển sách do AI đọc sẽ đú được với sách người đọc. Nhưng đấy chỉ là với những cuốn sách cần giọng giàu cảm xúc như truyện các kiểu thôi. Với những thứ không đến mức cần cảm xúc nhiều, chẳng hạn các loại sách kinh doanh hay sách kỹ năng, thì với cái giọng biết phân biệt ngắt dừng đúng chỗ, lên xuống theo nhịp câu tạm ổn như hiện tại của lũ AI nhà Apple cũng đã là đủ ok để khiến người ta cân nhắc xì tiền rồi, đặc biệt nếu giá thành có chênh lệch nhiều so với sách nói sản xuất kiểu truyền thống. Nếu Apple cải thiện chúng nó lên nữa, cung cấp khả năng tùy chỉnh tông giọng và nhịp điều và bắt đầu cung cấp đám AI giọng đọc của mình dưới dạng một dịch vụ độc lập (anh em cứ hình dung nó sẽ kiểu như Photoshop dành cho giọng nói đi), để các nhà sách hoặc tác giả tự đăng ký sử dụng và điều chỉnh tông giọng, cảm xúc theo từng câu, từ đấy có những tác phẩm với chất lượng có thể gọi là ngang ngửa với người trong khi chi phí tương đối rẻ, thì cánh diễn viên lồng tiếng sẽ mất đi một mảng thị phần đáng kể đấy.

Thêm vào đó, còn có khả năng là cái mớ AI của Apple sẽ tiếp tục tiến lên cái tầm gần như chẳng đòi hỏi chỉnh sửa gì cả, mà có thể tự nhìn vào văn bản đã cấp (có thể là kèm một số ghi chú bằng ngôn ngữ tự nhiên về cách đọc) và tự tạo ra một cuốn sách nói hoàn chỉnh với chất giọng ngang người. Cái này có lẽ chẳng đến nỗi xa xôi gì đâu, bởi vì ngay lúc này đây, ta cũng đã có những bằng chứng cho thấy công nghệ nhái giọng cao cấp nó đã tồn tại sẵn rồi, chí ít là dưới dạng nguyên mẫu. Chúng bao gồm Duplex, một trợ lý ảo do Google tạo ra với khả năng nhái giọng giống người đến mức bắt chước được cả ậm ừ và ngắt nghỉ (đọc full về nó ở đây: https://scifivietnam.blogspot.com/2019/05/duplex-mot-tro-ly-ao-voi-chat-giong-qua.html); MelNet, một con AI do Facebook chế tạo (https://scifivietnam.blogspot.com/2019/07/melnet-mot-ai-nhai-giong-nguoi-noi.html), có thể nhái giọng người nổi tiếng nếu được cho xem các bài thuyết trình của họ; Alexa, phụ tá ảo của Amazon, hiện đang trong quá trình được cấp tính năng nhái giọng bất cứ ai chỉ dựa trên một nguồn dữ liệu siêu giới hạn, và dùng nó để đọc truyện cho khách hàng (https://scifivietnam.blogspot.com/2023/01/du-inh-cung-cap-tinh-nang-nhai-giong.html). Nếu Apple phát triển được thứ gì tương đương, hoặc chốt kèo hợp tác sao đó với các bên kia (kiểu như Microsoft đang tìm cách chốt kèo tích hợp ChatGPT cho bộ Office) thì đúng là gg cho các anh em làm nghề lồng tiếng rồi.

Vậy là giờ ta đã có ảnh bìa do AI vẽ được, nội dung do AI soạn được, làm sách nói cũng do AI sản xuất được nốt. Nói không đùa chứ, biết đâu trong tầm 3, 4 năm gì đó nữa, ta sẽ thấy xuất hiện những cuốn tiểu thuyết do AI làm từ đầu đến đít, với sự tham gia của con người ở mức tối thiểu. Xét cho cùng, đằng nào thị trường hiện tại cũng tràn ngập những cuốn truyện về bám công thức theo một kiểu rất rập khuôn, chỉ thay đổi về tiểu tiết sẵn rồi (anh em đếm thử xem đã có bao quyển về các xã hội Dystopia nơi một toán thiếu niên bị phân cấp này nọ và vùng dậy lật đổ chính quyền trong khi vướng vào các cuộc tình tay ba, hay những quyển Lord of the Rings/A Song of Ice and Fire clone rồi xem). Để bọn AI viết mấy quyển như thế và cạnh tranh được với những quyển sử dụng mô típ cũ mèm do người viết cũng chẳng phải quá khó đâu.

***


Bài gốc được đăng trong group Hội thích truyện Sci Fi trên Facebook. Cùng ghé chơi group để thảo luận về bài viết hoặc đọc thêm các bài tương tự, bạn nhé.