Tôi thực sự đã không mong đợi nhiều lần đầu tiên tôi gõ biểu tượng bước sóng nhỏ để thử chế độ giọng nói của Chatgpt. Tôi hình dung nó chỉ là một mánh lới quảng cáo AI khác. Rốt cuộc, tôi đã thất vọng bởi các trợ lý giọng nói trước đây – nhưng đây không phải là Siri.
Đừng bỏ lỡ: Chatgpt là gì? Mọi thứ bạn cần biết về Chatbot AI
Chế độ giọng nói trượt một cách dễ dàng vào cuộc trò chuyện thực sự của con người, bắt gặp những tạm dừng của tôi, những suy nghĩ đã hoàn thành một nửa và “UMS”. Tôi có thể tìm ra những gì tôi đang làm cho bữa tối trong khi nhích qua phương tiện giao thông LA hoặc đánh bóng của tôi trong khi xóa sạch quầy trong căn hộ của tôi. Tất cả mà không phá vỡ luồng trò chuyện hoặc bao giờ với bàn phím của tôi.
Chatgpt, từ Openai, không phải là chatbot duy nhất rảnh tay. Gemini Live của Google cung cấp cùng một “cuộc nói chuyện về tôi và tôi sẽ tiếp tục”. Claude của Anthropic có phiên bản beta của chế độ thoại trên các ứng dụng di động của nó, hoàn chỉnh với các điểm đạn trên màn hình khi nó nói, và trợ lý iOS và Android của Perplexity cũng trả lời các câu hỏi nói và khởi chạy các ứng dụng như OpenTable hoặc Uber trên lệnh.
Nhưng ngay cả với tất cả mọi người chạy đua để làm chủ cuộc trò chuyện AI thời gian thực, Chatgpt vẫn là tôi. Dù bạn chọn chatbot nào, hãy nghỉ ngơi và thử tùy chọn giọng nói. Nó hữu ích hơn nhiều so với bạn nghĩ.
.
Xem cái này: Tính năng lan truyền của Chatgpt: Biến mọi người thành nhân vật hành động
Chính xác thì chế độ giọng nói là gì?
Trò chuyện bằng giọng nói (hoặc “Cuộc trò chuyện bằng giọng nói”) là chế độ rảnh tay của TATGPT cho phép bạn nói chuyện với mô hình AI và nghe nó nói chuyện lại với bạn, không cần gõ. Có một biểu tượng giọng nói mà bạn sẽ tìm thấy trong thiết bị di động, máy tính để bàn và ứng dụng web ở dưới bên phải của bất kỳ cuộc trò chuyện nào bạn đang tham gia. Nếu bạn nhấn nút, bạn có thể nói to câu hỏi của bạn và Chatgpt sẽ phiên âm, lý do và trả lời. Ngay khi nói xong, nó bắt đầu nghe lại, tạo ra một cuộc đối thoại tự nhiên qua lại.
Chỉ cần nhớ: Chế độ giọng nói chạy trên cùng một mô hình ngôn ngữ lớn với Chatgpt thông thường, vì vậy nó vẫn có thể ảo giác hoặc hiểu sai sự thật. Bạn nên luôn luôn kiểm tra kỹ bất cứ điều gì quan trọng.
Openai cung cấp hai phiên bản của các cuộc hội thoại thoại này: Tiếng nói tiêu chuẩn (tùy chọn mặc định, nhẹ miễn phí) và Giọng nói nâng cao (chỉ có sẵn cho người dùng trả phí).
Tiêu chuẩn giọng nói trước tiên chuyển đổi bài phát biểu của bạn thành văn bản và xử lý nó bằng GPT-4O (và GPT-4O Mini), mất nhiều thời gian hơn để nói chuyện lại với bạn. Mặt khác, giọng nói nâng cao sử dụng các mô hình đa phương thức tự nhiên, có nghĩa là nó “nghe” bạn và tạo âm thanh, vì vậy cuộc trò chuyện là tự nhiên hơn và được thực hiện trong thời gian thực. Nó có thể nhận được các tín hiệu khác với các từ, như tốc độ bạn đang nói hoặc cảm xúc trong giọng nói của bạn và điều chỉnh theo điều này.
Ghi chú: Người dùng miễn phí có thể truy cập một bản xem trước hàng ngày của giọng nói nâng cao.
kinh ngạc
7 lý do bạn nên bắt đầu sử dụng tính năng Chế độ giọng nói của Chatgpt
1. Nó thực sự là cuộc trò chuyện
Không giống như gõ, khi tôi nói chuyện với Chatgpt, tôi không săn lùng đúng cách hoặc khoảng cách sau mỗi lỗi đánh máy. Tôi chỉ nói, giống như tôi làm với bất kỳ người bạn hoặc thành viên gia đình nào, chứa đầy “ummmmms” và “thích” và những giờ nghỉ khó xử khác. Tuy nhiên, chế độ giọng nói cuộn với tất cả những suy nghĩ đã hoàn thành một nửa của tôi, và trả lời bằng một câu trả lời hoàn toàn bằng thịt hoặc một câu hỏi để giúp tôi trau dồi về những gì tôi cần. Việc cho và nhận dễ dàng này cảm thấy tự nhiên hơn nhiều so với gõ.
2. Bạn có thể sử dụng chế độ rảnh tay Chatgpt
Rõ ràng, tôi vẫn cần mở ứng dụng Chatgpt và nhấn vào nút Chế độ Voice để bắt đầu, nhưng một khi tôi bắt đầu, tôi không còn phải sử dụng tay để tiếp tục cuộc trò chuyện với AI Chatbot. Tôi có thể bị mắc kẹt trong giao thông và động não một kỳ nghỉ mà tôi muốn thực hiện vào cuối năm nay. Tôi có thể hỏi về các chuyến bay, khách sạn, địa danh, nhà hàng và bất cứ thứ gì khác, mà không cần chạm vào điện thoại của tôi, và cuộc trò chuyện đó được lưu trong ứng dụng, để tôi không phải nhớ mọi thứ mà Chatgpt nói với tôi.
3. Thật tốt khi học một ngôn ngữ mới với bản dịch thời gian thực
Tôi đã đề cập trước đó rằng tôi sử dụng chế độ giọng nói để thực hành các ngôn ngữ, chế độ giọng nói vượt trội. Tôi có thể nói bằng tiếng Anh và đã trả lời Chats trong tiếng Ba Lan hoàn hảo, hoàn chỉnh với các mẹo phát âm. Chỉ cần hỏi chế độ giọng nói, “Bạn có thể giúp tôi thực hành (ngôn ngữ) của tôi” và nó sẽ trả lời bằng một vài cách nó có thể giúp bạn, như người bắt đầu hội thoại, từ vựng cơ bản hoặc số. Và nó nhớ nơi bạn rời đi, vì vậy bạn có thể, theo một cách nào đó, tham gia các bài học; Không cần Duolingo.
4. Nhận câu trả lời về những điều bạn nhìn thấy trong thế giới thực
Tính năng này là độc quyền cho giọng nói nâng cao, nhưng đây có lẽ là tính năng yêu thích của tôi với chế độ thoại. Nhờ các siêu năng lực đa phương thức của nó, tôi có thể bật máy ảnh của điện thoại hoặc quay video/ảnh và yêu cầu TATGPT giúp tôi. Ví dụ, tôi gặp khó khăn trong việc nhận ra một bức tranh mà tôi tìm thấy ở một cửa hàng tiết kiệm, và chủ sở hữu không biết nó đến từ đâu. Tôi kéo lên trò chuyện bằng giọng nói, bật máy ảnh của mình và hỏi chế độ giọng nói của bức tranh từ đâu. Trong vài giây, nó có thể cho tôi biết tiêu đề của bức tranh, tên của nghệ sĩ và khi nó được vẽ.
5. Đó là một lựa chọn tốt hơn cho những người khuyết tật nhất định
Đối với bất cứ ai có thị lực thấp hoặc chứng khó đọc, nói chuyện chắc chắn đánh đập. Chế độ giọng nói có thể phiên âm bài phát biểu của bạn và sau đó đọc to câu trả lời của bạn với bất kỳ tốc độ nào bạn chọn (bạn có thể điều chỉnh điều này trong cài đặt của mình hoặc yêu cầu Chatgpt chậm lại). Tùy chọn rảnh tay cũng giúp bất cứ ai có thách thức về kỹ năng vận động, bởi vì tất cả những gì bạn cần làm là bắt đầu một lần để bắt đầu và khác để dừng, mà không cần gõ rộng rãi trên bàn phím.
6. Động não nhanh hơn
Đôi khi tôi có được một ý tưởng, và tôi nghĩ nhanh hơn tôi có thể gõ, vì vậy chế độ giọng nói của Chatgpt là hoàn hảo cho các ý tưởng câu chuyện Spitball, tìm ra một bố cục mới cho phòng khách của tôi hoặc quyết định các bữa ăn thú vị để nấu ăn trong tuần. Bởi vì tôi đang suy nghĩ to thay vì nhìn chằm chằm vào điện thoại của mình, ý tưởng của tôi chảy dễ dàng và nhanh hơn nhiều, đặc biệt là với các lần theo dõi tức thì của Chatgpt. Nó giúp giữ cho động lực cuộn cho đến khi tôi có một ý tưởng bóng bẩy cho bất cứ điều gì tôi đang động não.
7. Tóm tắt tức thì bạn có thể nghe
Thả một tệp PDF 90 trang trong cuộc trò chuyện, như cho một kịch bản phim hoặc sách giáo khoa, yêu cầu tóm tắt và yêu cầu AI đọc to cho bạn trong khi bạn gấp đồ giặt. Nó giống như biến bất kỳ tài liệu nào (tôi thậm chí còn làm các trang Wikipedia) thành một podcast – theo yêu cầu.
Chế độ giọng nói không chỉ là một mẹo gọn gàng; Đó là một cách nhanh chóng và tự nhiên hơn để sử dụng chatgpt. Cho dù bạn đang dịch các dấu hiệu đường phố, động não một ý tưởng hoặc bắt kịp tin tức, nói chuyện với Chatgpt cảm thấy ít giống như sử dụng chatbot và giống như có một cuộc trò chuyện với một chuyên gia có kích thước cắn. Một khi bạn đã quen với việc suy nghĩ to, bạn có thể không bao giờ quay lại bàn phím của mình.
Xem chi tiết và đăng kýKhám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.