OpenAI vừa công bố một công cụ sao chép giọng nói dựa trên AI mới có tên Voice Engine. Công ty vừa tự hào về tiềm năng to lớn của công nghệ này, như hỗ trợ đọc cho trẻ em hoặc trao lại tiếng nói cho những người đã mất giọng, nhưng cũng rất lo ngại về khả năng công cụ này bị lạm dụng.
“OpenAI cam kết phát triển AI an toàn và mang lại lợi ích rộng rãi,” công ty khẳng định trong một tuyên bố hôm thứ Sáu. Voice Engine về cơ bản sử dụng cùng công nghệ đằng sau API chuyển văn bản thành giọng nói và ChatGPT Voice, nhưng ứng dụng công nghệ lần này hướng đến việc sao chép giọng nói hơn là đọc to văn bản bằng chất giọng và ngữ điệu của người lạ.
OpenAI lưu ý rằng công nghệ của họ rất đặc biệt vì chỉ cần một đoạn âm thanh mẫu dài 15 giây để “tạo ra giọng nói chân thực và giàu cảm xúc, gần giống với người nói ban đầu.”
Hiện chưa rõ dữ liệu đào tạo được sử dụng để xây dựng Voice Engine như thế nào. Đây là điểm nhức nhối cho các công ty AI vốn bị cáo buộc vi phạm luật bản quyền do đào tạo mô hình của họ bằng các tác phẩm được bảo vệ. OpenAI khẳng định rằng phương pháp đào tạo của họ được xem là “hợp lý” theo luật bản quyền Hoa Kỳ, tuy nhiên mới đây họ cũng đang phải vướng phải một vụ kiện tương tự.
Trang web của OpenAI có các đoạn âm thanh mẫu đã được đưa qua Voice Engine và kết quả quả thực rất ấn tượng. Khả năng chuyển đổi cũng cực kỳ thuyết phục. Tuy nhiên, bạn vẫn chưa thể trải nghiệm công cụ này do vẫn chưa ra mắt công khai.
Tuy công nghệ đem đến nhiều kì vọng, rất nhiều mối lo ngại đã được nhắc tới. Đầu năm nay, Steve Kramer, người từng làm cố vấn cho ứng cử viên tổng thống đảng Dân chủ Dean Phillips năm 2020, đã sao chép giọng nói của Biden để tạo ra một thông điệp rằng mọi người không cần đi bỏ phiếu trong cuộc bầu cử sơ bộ ở New Hampshire.
Kramer sử dụng công cụ AI ElevenLabs và tạo ra thông điệp trong chưa đầy 30 phút, sau đó gửi các cuộc gọi tự động đến khoảng 5.000 người, theo tờ Washington Post.
Về OpenAI, công ty hy vọng sẽ bắt đầu một cuộc đối thoại về việc triển khai có trách nhiệm về công nghệ này. Họ sẽ suy nghĩ kĩ về việc có nên triển khai công nghệ này trên quy mô lớn hay không và bằng cách nào, dựa trên những cuộc thử nghiệm quy mô nhỏ.
Các bạn thấy công nghệ này có tiềm năng không?