Trong thử nghiệm sớm, Grok-3 đã thể hiện hiệu suất vượt trội so với các mô hình như GPT-4O của Openai, Song Tử của Google và V3 của Deepseek. Nó cung cấp hai chế độ lý luận riêng biệt: “Hãy suy nghĩ”, hiển thị quá trình suy nghĩ của Grok trong quá trình giải quyết vấn đề và “Big Brain”, dành cho các nhiệm vụ chuyên sâu hơn về mặt tính toán. Ngoài ra, XAI đã giới thiệu Deep Search, một công cụ tìm kiếm AI thế hệ tiếp theo, tương tự như các tác nhân tìm kiếm sâu sắc của Perplexity, Gemini và Chatgpt. Một tính năng giọng nói tổng hợp cho Grok được đồn đại sẽ đến trong tương lai gần.
Truy cập vào các chức năng của GROK-3 có sẵn thông qua đăng ký X Premium Plus, gần đây đã tăng giá ($ 40 mỗi tháng), với tùy chọn cho gói Supergrok nâng cao. Mặc dù nhằm mục đích tối đa hóa các khả năng tìm kiếm sự thật, các phiên bản trước phải đối mặt với những lời chỉ trích về thông tin sai lệch và đầu ra tấn công. XAI có kế hoạch để nguồn mở Grok-2 trong tương lai gần.
Tôi đã yêu cầu Perplexity giúp tôi đưa ra 5 lời nhắc sẽ kiểm tra GROK-3. Một trong những lý do tôi kiểm tra chatbot là để xác định mức độ đáng tin cậy của chúng, đủ thú vị, sau khi nhận thấy Grok-3 không phải lúc nào Chatbot.
1. Lý luận nâng cao
https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/NBKF4TYoyQaWNdk8ZTzjQc.jpg"/>
Nhắc nhở: “Giải thích khái niệm về sự vướng víu lượng tử và ý nghĩa của nó đối với việc chuyển thông tin.”
Phản ứng của GROK-3 giới thiệu một cách hiệu quả sự vướng víu lượng tử, mô tả cách các hạt được kết nối với nhau sao cho trạng thái của một người ảnh hưởng trực tiếp đến trạng thái của người khác, bất kể khoảng cách. AI sử dụng các chất tương tự có thể liên quan, chẳng hạn như so sánh các hạt vướng mắc với các đối tượng được liên kết, giúp làm sáng tỏ các hiện tượng lượng tử phức tạp cho bất kỳ ai có thể không hiểu sâu về chủ đề này.
GROK-3 không tham chiếu các nguồn có thẩm quyền để hỗ trợ các yêu cầu của nó. Bằng cách kết hợp các trích dẫn từ các tài liệu khoa học có uy tín, người dùng có thể cảm thấy tự tin hơn về độ tin cậy và độ tin cậy của thông tin được trình bày.
2. Nghiên cứu sâu
https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/t6wP6UryicfRiw9tN2SkVf.jpg"/>
Nhắc nhở: “Cung cấp một bản tóm tắt về nghiên cứu mới nhất về các nguồn năng lượng tái tạo được công bố trong tháng qua.”
GROK-3 nhanh chóng rút ra từ nhiều nguồn khác nhau và Phản ứng giải quyết nhiều khía cạnh của nghiên cứu năng lượng tái tạo, bao gồm tiến bộ năng lượng mặt trời và năng lượng gió, giải pháp lưu trữ năng lượng, sản xuất hydro xanh, phát triển năng lượng sinh học và chiến lược tích hợp lưới. Bề rộng này cho thấy sự hiểu biết về các lĩnh vực đa dạng trong lĩnh vực năng lượng tái tạo.
Ngoài ra, việc đề cập đến việc tích hợp AI và học máy để quản lý lưới tốt hơn chỉ ra rằng chatbot có sự hiểu biết về các phương pháp liên ngành có thể tăng cường các hệ thống năng lượng tái tạo. Tuy nhiên, trong khi phản hồi cung cấp một cái nhìn tổng quan chung, nó thiếu các tài liệu tham khảo về các nghiên cứu, ấn phẩm hoặc dữ liệu cụ thể từ tháng trước (giữa tháng 1 đến giữa tháng 2 năm 2025). Kết hợp các ví dụ hoặc phát hiện cụ thể sẽ tăng cường độ tin cậy và mức độ liên quan của bản tóm tắt.
Mặc dù tôi có thể thấy các nguồn, nhưng sẽ rất tuyệt nếu Grok-3 chỉ ra chúng, chỉ ra nơi có thể tìm thấy thông tin. Thêm vào đó, việc sử dụng các cụm từ của AI như “nghiên cứu có thể tiếp tục” và “các nghiên cứu có thể đã xây dựng dựa trên các nỗ lực” cho thấy các giả định thay vì thông tin dứt khoát, điều này làm giảm thẩm quyền của phản ứng.
3. Chế độ não lớn
https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/Z2p3JqGHi34UaREbWFE4Ri.jpg"/>
Nhắc nhở: “Phân tích các tác động kinh tế của việc thực hiện thu nhập cơ bản phổ quát ở các nước phát triển.”
Phản hồi của GROK-3 trình bày cả hình ảnh tích cực và tiêu cực về thu nhập cơ bản phổ quát (UBI), cung cấp một quan điểm sắc thái thừa nhận sự phức tạp của vấn đề. Lần này, AI đã tham khảo các nghiên cứu cụ thể và các chương trình thí điểm, giúp đưa ra phản ứng trong các ví dụ trong thế giới thực nâng cao độ tin cậy của chatbot.
Tuy nhiên, câu trả lời sử dụng các từ như có thể là người có thể và các từ có thể, những từ có thể làm suy yếu sức mạnh của thẩm quyền của chatbot đối với chủ đề này. Phản hồi cũng không giải quyết đầy đủ các phản biện có thể và phân tích chủ yếu tập trung vào các tác động ngay lập tức thay vì kiểm tra các hậu quả kinh tế lâu dài.
Tạo hình ảnh với Aurora
https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/2YhTACCisejkF3X7ZruhAm.jpg"/>
Nhắc nhở: “Tạo một hình ảnh quang học của một cảnh quan thành phố tương lai vào lúc hoàng hôn.”
Chất lượng photorealistic của hình ảnh là cực kỳ cao với ánh sáng thực tế, phản xạ và hiệu ứng khí quyển, khiến chúng trở nên hấp dẫn và hấp dẫn. Kiến trúc tương lai và bảng màu kết hợp cho một cảnh hấp dẫn trực quan trong khi các hình ảnh khác nhau cung cấp các quan điểm đa dạng. Từ những bức ảnh cấp đường cho đến tầm nhìn ra bờ sông, tôi đánh giá cao sự đa dạng từ các góc độ và quan điểm khác nhau.
Tuy nhiên, trong khi các hình ảnh duy trì thẩm mỹ tương lai, các phong cách khác nhau, một số người với vẻ ngoài siêu hiện đại và những người khác xuất hiện gần như ngày nay với những cải tiến tối thiểu. Mặc dù các tòa nhà trông tương lai, nhưng việc thiếu các yếu tố sáng tạo như xe bay, sẽ giúp làm cho cảnh quan thành phố này tương lai hơn nhiều.
Xử lý đầu vào đa phương thức
https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC-480-80.jpg 480w, https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC-650-80.jpg 650w, https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC-970-80.jpg 970w, https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC-1024-80.jpg 1024w, https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC-1200-80.jpg 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC.jpg" data-pin-media="https://cdn.mos.cms.futurecdn.net/TRsWFdqfBsJskkWWBcYuC.jpg"/>
Nhắc nhở: “Phân tích sự thay đổi nhiệt độ toàn cầu trong thế kỷ qua và tóm tắt các xu hướng chính.”
Phản ứng của Grok-3 phác thảo chính xác sự gia tăng nhiệt độ toàn cầu (~ 1.1, 1,2 ° C) kể từ đầu thế kỷ 20, phù hợp với các phát hiện từ NOAA, NASA và IPCC (tôi phải thực hiện công việc thủ công để kiểm tra điều này). Nó cũng xác định hai giai đoạn nóng lên quan trọng (1910 Từ1940 và sau năm 1970), nắm bắt các biến thể lịch sử trong các xu hướng nóng lên. Việc đề cập đến khuếch đại Bắc cực và sự khác biệt về tỷ lệ nóng lên giữa đất và đại dương được hỗ trợ tốt về mặt khoa học.
AI thừa nhận rằng các vùng đất đã ấm lên nhanh hơn mức trung bình đại dương toàn cầu. Tuy nhiên, nó không trích dẫn các bộ dữ liệu hoặc báo cáo cụ thể, điều này sẽ cải thiện độ tin cậy (tôi phải nghiên cứu bản thân để xác định độ chính xác). Bao gồm một tham chiếu đến bộ dữ liệu nhiệt độ được chấp nhận rộng rãi (ví dụ, HadCrut, Gistemp) sẽ tăng cường đối số. Cũng như các câu trả lời khác, các cụm từ như “thường được quan sát” và “thường được trích dẫn” giới thiệu một mức độ không chắc chắn.
Suy nghĩ cuối cùng
GROK-3 thể hiện sức mạnh trong việc xử lý các gợi ý phân tích và giải thích trên một loạt các chủ đề phức tạp, bao gồm khoa học khí hậu, kinh tế, AI và vật lý. Mặc dù các câu trả lời thường có cấu trúc tốt và nhiều thông tin, nhưng có những khu vực mà chatbot có thể sử dụng cải tiến. Ví dụ: nếu người dùng chọn sử dụng GROK-3 cho mục đích nghiên cứu học thuật hoặc chuyên nghiệp, chatbot vẫn cần được kiểm tra thực tế. Tôi đã phải làm điều đó trong thí nghiệm này vì Grok không phải lúc nào cũng là nguồn trang web.
Mặc dù nó thường tham khảo các tổ chức lớn như NASA, nhưng nó không liên kết trực tiếp với một báo cáo hoặc cơ sở dữ liệu cụ thể. Ngoài ra, trong khi một số sự không chắc chắn khoa học là hợp lệ, chatbot thường sử dụng các cụm từ dự kiến làm suy yếu niềm tin của tôi trong các tuyên bố của nó. Vì sự không chắc chắn khoa học đó và thiếu dữ liệu cụ thể, tôi đã bị nghi ngờ về phản ứng. +
Cuối cùng, trong khi Grok-3 chủ yếu giải thích lời nhắc hình ảnh của tôi, nó không kết hợp đầy đủ các yếu tố được yêu cầu, điều này khiến tôi tự hỏi mức độ thường xuyên làm điều này với các lời nhắc khác.
Nhìn chung, GROK-3 là một AI có khả năng cao, vượt trội trong việc cấu trúc thông tin rõ ràng và thực hiện một công việc tốt trong việc thu hút người dùng với cuộc đối thoại thích hợp. Có tốt không, vâng. “Thật đáng sợ?” Không quá nhanh, Elon.
Thêm từ hướng dẫn của Tom
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.