Tạo bản sao giọng nói AI của riêng bạn với Audible: Đột phá mới trong ngành sách nói

Giọng nói tổng hợp có đã phát triển mạnh trong nhiều năm và sự bùng nổ AI tạo ra của những năm 20 mới đã đẩy nhanh quá trình đó. Giọng nói AI ở khắp mọi nơi—trong podcast, trong các chiến dịch chính trị và trong các chatbot nơi chúng có thể sao chép giọng nói của người nổi tiếng một cách không tinh tế. Sớm thôi, chúng cũng sẽ xuất hiện trong sách nói của bạn.

Audible, công ty sách nói thuộc sở hữu của Amazon, đã công bố một chương trình thử nghiệm để tạo bản sao giọng nói AI để đọc tác phẩm trên thị trường sách nói của mình. Thông báo này được đưa ra thông qua bài đăng trên ACX—Audiobook Creation Exchange—dịch vụ của Audible cho phép tác giả và nhà xuất bản chuyển sách viết thành sách nói.

Bài đăng cho biết: “Chúng tôi đang thực hiện các bước thận trọng để thử nghiệm các công nghệ mới nhằm giúp mở rộng danh mục của mình và tuần này, chúng tôi đang mời một nhóm nhỏ người kể chuyện tham gia phiên bản beta chỉ dành cho Hoa Kỳ, cho phép họ tạo và kiếm tiền từ các bản sao giọng nói của chính họ bằng công nghệ giọng nói do AI tạo ra”.

Audible cho biết cả người kể chuyện và tác giả đều có quyền kiểm soát các dự án sử dụng giọng nói AI của họ và lời kể chuyện cuối cùng sẽ được xem xét như một phần trong quy trình sản xuất của ACX để kiểm tra lỗi phát âm hoặc các lỗi khác.

Tuy nhiên, điều này có vẻ hơi không phù hợp với cách tiếp cận hiện tại của Audible đối với sách nói có lời bình, vì ngay cả sau thông báo này, ACX yêu cầu nộp bài vẫn nói rằng lời tường thuật sách nói, “phải được tường thuật bởi con người.” Nhưng Amazon đã lạc quan về AI và đã triển khai chương trình âm thanh AI tương tự cho hoạt động xuất bản trực tiếp trên Kindle vào năm ngoái.

Hiện tại, chương trình Audible còn hạn chế, với một nhóm người kể chuyện được chọn tham gia. Nhưng dễ dàng thấy được điều này có thể đi đến đâu từ đây, và Audible có thể sớm được mở ra để bất kỳ tác giả nào có khả năng tạo ra giọng nói AI có thể đọc sách của riêng họ. Các công ty khác cũng đang tham gia vào không gian này; công ty khởi nghiệp Rebind đang tuyển dụng các tác giả để cho phép giọng nói của họ được sao chép để phiên bản AI của họ có thể “hướng dẫn” người đọc qua các văn bản của họ. Những người hâm mộ sách nói là trên hàng rào về tất cả mọi thứ.

Cá nhân tôi không thể chờ đợi cho đến khi những giọng hát ngọt ngào nhưng kỳ lạ này rơi vào tay khủng long khiêu dâm.

Sau đây là một số tin tức công nghệ tiêu dùng khác trong tuần này.

Xin hãy nộp giấy tờ

Google đang cho phép người dùng số hóa nhiều thông tin cá nhân hơn nữa. Tiếp theo: hộ chiếu.

Google đã thêm giấy phép lái xe kỹ thuật số vào nền tảng Wallet của mình vào năm ngoái, cho phép người dùng Android lưu trữ thông tin nhận dạng trên điện thoại của họ. Sớm thôi (Google không nói chính xác khi nào) người dùng sẽ có thể làm tương tự với hộ chiếu Hoa Kỳ của họ.

Tất nhiên là có một số lưu ý. Phiên bản Google Wallet của hộ chiếu của bạn sẽ chỉ được chấp nhận tại các trạm kiểm soát TSA cụ thể nơi cho phép sử dụng ID kỹ thuật số. (Đây là bản đồ.) Ngoài ra, Google đảm bảo khuyến nghị bạn nên giữ hộ chiếu của mình trong tay. ID kỹ thuật số thường không được chấp nhận ở bất kỳ nơi nào ngoài sân bay, vì vậy nếu bạn gặp khó khăn khi ở nước ngoài, bạn sẽ muốn có giấy tờ vật lý của mình. Nhưng đối với một nhóm du khách may mắn, điều này sẽ giải quyết được vấn đề cần phải lấy thêm một thứ nữa ra khỏi túi khi đi qua an ninh sân bay.

Giữ Tab

Này nói về Google, công ty cũng đã công bố một số tin tốt cho tất cả những người tích trữ tab trình duyệt bẩn thỉu. Nhóm tab là một tính năng trong Google Chrome cho phép bạn lưu trữ tất cả các tab trình duyệt của mình dưới dạng thư mục nhóm để dễ sắp xếp hơn. (Tôi sẽ đọc chúng sau, tôi thề!) Google cho biết tính năng nhóm của mình sẽ sớm được đồng bộ hóa trên nền tảng. Điều đó có nghĩa là bạn có thể tiếp tục hành trình duyệt máy tính để bàn trên thiết bị di động của mình một cách liền mạch, nơi bạn chắc chắn sẽ không tiếp tục bỏ qua chúng.

Nhóm tab cũng sẽ sớm có trên Chrome trong iOS và cũng có thể đồng bộ hóa trên máy tính để bàn. Bao lâu nữa thì tất cả những điều này sẽ đến? Vâng, một lần nữa Google không nói rõ về điều đó. Bất kể thế nào, tốt hơn hết là hãy bắt đầu thu thập tất cả các tab trình duyệt đó ngay bây giờ. Không bao giờ biết khi nào bạn có thể cần chúng một lần nữa.

Menlo-Upon-Tyne

Meta—công ty Facebook, Instagram và WhatsApp cũng thực hiện AI—đã thông báo rằng các dịch vụ AI của họ sẽ xâm chiếm một thế giới văn hóa mới: người Anh. Meta thông báo rằng họ sẽ đào tạo các mô hình AI của mình từ dữ liệu từ người dùng nền tảng của nó ở Vương quốc Anh.

Cụ thể, dữ liệu sẽ được thu thập từ bất kỳ ai sử dụng Facebook hoặc Instagram tại Vương quốc Anh, sau đó được sử dụng để đào tạo AI của Meta theo đó. Trong thông báo của mình, Meta cho biết họ hy vọng động thái này sẽ giúp các công cụ AI của mình phản ánh chính xác hơn văn hóa và ngôn ngữ của Anh.