Openai, công ty đằng sau chatbot nổi tiếng, Chatgptđang xây dựng một mô hình AI mới. Mô hình này sẽ là một mô hình ngôn ngữ “trọng lượng mở” với lý luận, theo CEO Sam Altman, người đã tweet về sự phát triển vào thứ Hai.
Một mô hình AI “trọng lượng mở” là một loại trung gian giữa các phương pháp tiếp cận nguồn mở và đóng. Trọng lượng là cách các mô hình AI học và tạo kết nối – một số đặc điểm hoặc kết nối được cung cấp nhiều trọng lượng hơn trong nỗ lực củng cố thông tin cụ thể. Một mô hình trọng lượng mở có nghĩa là các trọng số của nó được công khai, như Ủy ban Thương mại Liên bang đặt nó. Điều đó có nghĩa là người dùng sẽ có thể nhìn thấy các trọng số này và thay đổi chúng mà không cần đào tạo lại mô hình trên dữ liệu mới.
Các mô hình trọng lượng mở thường rẻ hơn cho các công ty sử dụng và cho phép họ tùy chỉnh các mô hình. Ví dụ, một doanh nghiệp có thể tải các tài liệu nội bộ của mình lên một mô hình trọng lượng mở hiện có để kết hợp thông tin đó trong kết quả của nó mà không phải xây dựng toàn bộ mọi thứ từ đầu.
Nhưng các mô hình trọng lượng mở không giống với các mô hình nguồn mở. Giống như cái tên ngụ ý, một mô hình nguồn mở cho phép bạn xem nó được tạo ra, mã nguồn, đôi khi ngoài cách được đào tạo và có trọng số. Trong một mô hình trọng lượng mở, bạn có thể thấy làm thế nào mô hình tạo kết nối nhưng không nhất thiết là mã cơ bản hoặc nội dung đào tạo. Đó là tất cả về mức độ cởi mở. Với hồ sơ theo dõi của Openai về việc không tiết lộ những gì nó sử dụng để đào tạo Chatgpt, mô hình trọng lượng mở mới có khả năng mang lại cho mọi người một cái nhìn thoáng qua đằng sau bức màn, nhưng không nhiều.
Các công ty AI đang trong một cuộc đua nóng bỏng vì mỗi người phát triển nhiều mô hình cho các mục đích sử dụng khác nhau. Mô hình mới của Openai được coi là đối thủ cạnh tranh với các mô hình Llama của Meta, là nguồn mở. Mark Zuckerberg đã nhiều lần nói rằng nguồn mở là con đường chính xác cho sự phát triển của AI. Mô hình mới cũng xuất hiện dưới dạng AI của Trung Quốc như Deepseek Fight cho vị trí hàng đầu. Mô hình V3 mới nhất của Deepseek được báo cáo là dẫn đầu gói và nó cũng là một mô hình trọng lượng mở. Trọng lượng mở và các mô hình nguồn mở có thể đe dọa các mô hình đăng ký của Openai bằng cách cung cấp cho các doanh nghiệp các công cụ AI rẻ hơn, tùy chỉnh hơn, vì vậy công ty dường như đang thực hiện các động thái để bắt kịp đối thủ cạnh tranh.
Không rõ chính xác khi nào mô hình mới sẽ được phát hành. Hiện tại, Openai đang mời các nhà phát triển gửi phản hồi về những gì sẽ làm cho mô hình trở nên hữu ích nhất cho họ. Bạn có thể đóng góp phản hồi đó trong biểu mẫu này trên trang web của Openai.
Để biết thêm, hãy xem các hình ảnh AI GHIBLI-ESQUE được tạo bằng trình tạo hình ảnh mới của Chatgpt và đánh giá đầy đủ của chúng tôi về Chatbot.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.