Openai đã ra mắt một trang web mới có tên là Trung tâm đánh giá an toàn để chia sẻ công khai thông tin liên quan đến những thứ như tỷ lệ ảo giác của các mô hình. Trung tâm cũng sẽ làm nổi bật nếu một mô hình tạo ra nội dung có hại, nó hoạt động tốt như thế nào theo hướng dẫn và cố gắng bẻ khóa.
Công ty công nghệ tuyên bố trang mới này sẽ cung cấp sự minh bạch bổ sung trên OpenAI, một công ty, đối với bối cảnh, đã phải đối mặt với nhiều vụ kiện cho rằng họ sử dụng bất hợp pháp tài liệu có bản quyền để đào tạo các mô hình AI của mình. Ồ, vâng, và điều đáng nói là Thời báo New York tuyên bố công ty công nghệ đã vô tình xóa bằng chứng trong vụ án đạo văn của tờ báo chống lại nó.
Các trung tâm đánh giá an toàn có nghĩa là mở rộng trên các thẻ hệ thống của Openai. Họ chỉ phác thảo các biện pháp an toàn của phát triển khi ra mắt, trong khi trung tâm sẽ cung cấp các bản cập nhật liên tục.
“Khi khoa học đánh giá AI phát triển, chúng tôi nhằm chia sẻ tiến trình của chúng tôi về việc phát triển các cách có thể mở rộng hơn để đo lường khả năng và sự an toàn của mô hình”, Openai tuyên bố trong thông báo của mình. “Bằng cách chia sẻ một tập hợp các kết quả đánh giá an toàn của chúng tôi ở đây, chúng tôi hy vọng điều này sẽ không chỉ giúp dễ hiểu về hiệu suất an toàn của các hệ thống OpenAI theo thời gian, mà còn hỗ trợ các nỗ lực của cộng đồng để tăng tính minh bạch trên toàn lĩnh vực.” Openai cho biết thêm rằng hoạt động của nó để có giao tiếp chủ động hơn trong lĩnh vực này trong toàn công ty.
Giới thiệu các đánh giá an toàn Hub Một nguồn tài nguyên để khám phá kết quả an toàn cho các mô hình của chúng tôi.
Mặc dù thẻ hệ thống chia sẻ các số liệu an toàn khi ra mắt, trung tâm sẽ được cập nhật định kỳ như một phần trong nỗ lực của chúng tôi để truyền đạt chủ động về an toàn.https: //t.co/c8ngmxlc2y
– Openai (@openai) Ngày 14 tháng 5 năm 2025
Các bên quan tâm có thể xem xét từng phần của Hub và xem thông tin về các mô hình có liên quan, chẳng hạn như GPT-4.1 đến 4.5. Openai lưu ý rằng thông tin được cung cấp trong trung tâm này chỉ là một “ảnh chụp nhanh” và các bên quan tâm nên xem xét thẻ hệ thống của nó. Đánh giá và các bản phát hành khác để biết thêm chi tiết.
Một trong những người lớn nhưngs Đối với toàn bộ trung tâm đánh giá an toàn là Openai là thực thể thực hiện các bài kiểm tra này và chọn thông tin nào để chia sẻ công khai. Do đó, không có cách nào để đảm bảo rằng công ty sẽ chia sẻ tất cả các vấn đề hoặc mối quan tâm của mình với công chúng.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.