Meta đã ra mắt Meta AI Voice và tiến xa hơn một bước so với OpenAI trong việc cung cấp tiếng nói của những người nổi tiếng. Tuy nhiên, mặc dù việc quen nghe Judi Dench có thể thú vị nhưng nó không hấp dẫn hay hấp dẫn bằng giọng nói tự nhiên và thực tế gần đây được thêm vào ChatGPT.
Hiện có chín tùy chọn Giọng nói trong ứng dụng ChatGPT, hoạt động trên giọng nói cơ bản và nâng cao. Mỗi người có một giọng điệu, phong cách khác nhau và – không nhân cách hóa quá mức – tính cách.
OpenAI đã bẻ khóa để tạo ra giọng nói nghe có vẻ siêu thực. Chúng thậm chí còn có các chuyển âm và âm thanh thở giống như con người được tích hợp trong các khoảng dừng và điều này loại bỏ một số rào cản nhân tạo được tìm thấy khi thử các dịch vụ giọng nói khác như Gemini Live hoặc giọng nói AI mới của Meta. Tuy nhiên, điều này tạo thêm một chút gợi ý về Thung lũng kỳ lạ, nơi đôi khi có cảm giác “quá chân thực”.
Những gì nó có, điều mà Meta AI và Gemini Live không có là khả năng chuyển lời nói thành giọng nói. Điều này có nghĩa là nó có thể nhận biết những thay đổi về giọng điệu, ngữ điệu và thậm chí cả giọng nói cũng như tốc độ nói của bạn, cho phép cuộc trò chuyện giống con người hơn, tự nhiên hơn và ngắt quãng nhanh hơn.
Giọng nói ChatGPT mới như thế nào?
Breeze, Cove, Ember và Juniper là những giọng nói hiện có khi Voice ra mắt lần đầu và vẫn còn hiện diện. Chúng ta chưa thấy sự trở lại của Sky sau những so sánh của Scarlett Johansen hồi đầu năm nay nhưng có năm giọng nói khác, trong đó có hai giọng nói giọng Anh.
Arbor có giọng Anh và được thiết kế để trở nên dễ tính và linh hoạt, Maple vui vẻ và thẳng thắn, Sol hiểu biết và thoải mái, Spruce điềm tĩnh và quả quyết còn Vale, cũng là người Anh, thông minh và ham học hỏi.
Cá nhân tôi thích Arbor vì nó giống tôi nhất. Nó giống như nói chuyện với một người bạn cùng lớn lên với tôi hơn là với một người nói giọng Mỹ. Giọng điệu của nó cũng tự nhiên hơn so với thế hệ giọng nói trước đó. Công ty duy nhất gần gũi với công nghệ giọng nói của OpenAI là ElevenLabs.
Một trong những tính năng thú vị nhất của Advanced Voice là khả năng thích ứng. Nếu bạn muốn nó nghe giống mình hơn thì bạn có thể yêu cầu nó sử dụng một giọng cụ thể. Nó sẽ không thể bắt chước trực tiếp giọng nói của bạn do có các thanh chắn, nhưng nó có thể phát ra âm thanh giống như từ “round your way”.
Nếu bạn muốn nó luôn phát âm giống bạn, chỉ cần yêu cầu nó chọn giọng, đặt tốc độ nói và lưu điều đó vào bộ nhớ. Mỗi lần bạn mở lại ChatGPT nó sẽ tiếp tục với giọng nói đó.
Bạn có thể làm gì với Advanced Voice?
Việc chuyển giọng nói thành giọng nói một cách tự nhiên mang lại cho Advanced Voice một lợi thế so với các công cụ khác thuộc loại này. Vì nó đang nghe âm thanh trực tiếp nên nó có thể nghe thấy các âm thanh khác bao gồm tiếng ồn xung quanh, âm nhạc và ừm, ars và các âm thanh khác mà bạn có thể tạo ra không phải là một phần của lời nói trực tiếp.
Thật không may, OpenAI đã chọn tắt nhiều khả năng này nhưng thực tế chúng tồn tại vẫn ảnh hưởng đến tính hiệu quả của ứng dụng. “Cho dù bạn nói nhanh, chậm hay nhiều cảm xúc, tôi sẽ cố gắng hết sức để phản hồi một cách thích hợp,” Arbor giải thích khi chúng tôi nói chuyện về khả năng của nó.
Bạn có thể thuyết phục nó làm những việc mà nó không được phép làm về mặt kỹ thuật, chẳng hạn như hát hoặc rap nếu bạn thuyết phục được nó. Ví dụ: yêu cầu nó viết một số lời bài hát cho một đoạn rap và yêu cầu nó đọc chúng. Khi hoàn thành, hãy yêu cầu nó thực hiện nhanh hơn nhiều và nó sẽ chuyển sang biểu diễn nó như một bản rap hơn là một bài thơ.
Tôi hy vọng, theo thời gian, OpenAI sẽ nới lỏng các rào cản (trong phạm vi lý do) và cho phép nó làm được nhiều việc hơn. Ví dụ, về mặt lý thuyết, nó có thể được sử dụng để cải thiện khả năng ca hát của bạn, dạy bạn đánh beatbox và thậm chí chỉnh dây đàn guitar.
Thông tin khác từ Hướng dẫn của Tom