StabilityAI hôm nay sẽ phát hành dòng mô hình hình ảnh AI Stable Diffusion 3.5 mới. Nó đi kèm với tính hiện thực được cải thiện, khả năng tuân thủ nhanh chóng và hiển thị văn bản so với SD3.
Giống như phiên bản đầu tiên của SD3, Khuếch tán ổn định 3.5 có ba kích cỡ – Lớn (8B), Turbo lớn (8B) và Trung bình (2.6B). Tất cả đều có thể tùy chỉnh và điều chỉnh để chạy trên phần cứng của người tiêu dùng, đồng thời có sẵn để sử dụng theo Giấy phép Cộng đồng AI ổn định.
Nói tóm lại, đây là một bước tiến lớn hướng tới việc bất kỳ người dùng nào cũng có thể tạo ra những hình ảnh AI chân thực hơn. Trong một thông cáo báo chí, StabilityAI thừa nhận mô hình Stable Diffusion 3 Medium ra mắt vào tháng 6 “không đáp ứng đầy đủ các tiêu chuẩn của chúng tôi hoặc mong đợi của cộng đồng chúng tôi”.
Công ty nói thêm rằng “Sau khi lắng nghe những phản hồi có giá trị của cộng đồng, thay vì khắc phục nhanh chóng, chúng tôi đã dành thời gian để phát triển thêm một phiên bản nhằm nâng cao sứ mệnh chuyển đổi phương tiện truyền thông trực quan của chúng tôi.”
Biên tập viên AI của chúng tôi Ryan Morrison đã thử nghiệm SD3.5 và cho biết đây là một bản nâng cấp đáng kể, phù hợp và có khả năng vượt quá khả năng của Flux 1.1 Pro được phát hành gần đây.
Có gì mới với Khuếch tán ổn định 3.5?
AI ổn định cho biết các mô hình được đưa vào tập trung vào khả năng tùy chỉnh, hiệu suất hiệu quả và đầu ra đa dạng. Người phát ngôn giải thích: “Stable Diffusion 3.5, mô hình mạnh mẽ nhất của chúng tôi, phản ánh cam kết của chúng tôi trong việc trao quyền cho người sáng tạo bằng các công cụ vừa tiên tiến vừa có thể truy cập rộng rãi”.
Điều đó có nghĩa là hình ảnh có thể được tinh chỉnh, các mô hình chạy trên phần cứng tiêu dùng “ngay lập tức” và các hình ảnh được tạo ra sẽ có cảm giác độc đáo hơn với nhau.
Ngoài ra còn có sự tập trung vào các lựa chọn phong cách mới, bao gồm nhiếp ảnh, hội họa, v.v. Cần có lời nhắc về hashtag để chỉ định một phong cách, chẳng hạn như boho hoặc thời trang. Nó cũng có thể sử dụng tính năng đánh dấu trong lời nhắc để điều khiển mô hình theo một hướng cụ thể.
Thông cáo báo chí giải thích: “Ngoài ra, phân tích của chúng tôi cho thấy rằng Stable Diffusion 3.5 Large dẫn đầu thị trường về khả năng tuân thủ nhanh chóng và cạnh tranh với các mẫu lớn hơn nhiều về chất lượng hình ảnh”.
“Stable Diffusion 3.5 Turbo cung cấp thời gian suy luận nhanh nhất so với kích thước của nó, trong khi vẫn có tính cạnh tranh cao cả về chất lượng hình ảnh và khả năng tuân thủ nhanh chóng, ngay cả khi so sánh với các mẫu không được chưng cất có kích thước tương tự.”
“Stable Diffusion 3.5 Medium vượt trội so với các mẫu cỡ trung bình khác, mang lại sự cân bằng giữa khả năng tuân thủ nhanh chóng và chất lượng hình ảnh, khiến nó trở thành lựa chọn hàng đầu cho hiệu suất hiệu quả, chất lượng cao.”
Mô hình này miễn phí cho mục đích sử dụng phi thương mại, bao gồm nghiên cứu khoa học và miễn phí cho các doanh nghiệp vừa và nhỏ có doanh thu lên tới 1 triệu USD. Bất cứ điều gì vượt quá điều đó sẽ yêu cầu Giấy phép Doanh nghiệp.
Thông tin khác từ Hướng dẫn của Tom
[ad_2]