Pika Labs, một trong những nền tảng video trí tuệ nhân tạo thương mại đầu tiên, cuối cùng đã ra mắt phiên bản 1.5 và đã có một bước chuyển thú vị so với các nền tảng như Runway Gen-3 và Luma Labs, tập trung vào niềm vui và meme. để thu hút sự chú ý đến khả năng của nó.
Cùng với các bản cập nhật cho mô hình cơ bản bao gồm chuyển hình ảnh thành video, chuyển văn bản thành video và mức độ hiện thực chuyển động ngày càng được cải thiện, còn có các hiệu ứng được tạo tùy chỉnh gọi là PikaEffects cho phép bạn chụp ảnh và thao tác các phần của nó để biến nó thành bánh, ép nó thành chất nhờn hoặc nghiền nát nó.
Ngay sau khi ra mắt, máy chủ của Pika Labs đã phải tải nặng, có nghĩa là một số người phải mất tới 12 giờ để tạo video, nhưng điều đó dường như đang tự khắc phục, đặc biệt nếu bạn tạo một trong các meme- video theo phong cách hiệu ứng. Yêu thích cá nhân của tôi là vụ nổ.
Tôi quyết định thử nghiệm nó, tạo ra một số hình ảnh và sau đó thử các Pikaffects mặc định khác nhau, bao gồm làm nổ tung hộp điện thoại ở London, nghiền nát bàn cờ và thổi phồng hộp sọ.
Pika Labs 1.5 hoạt động như thế nào?
Rất tiếc, chúng tôi đã quên mật khẩu. PIKA 1.5 LÀ ĐÂY. Với chuyển động chân thực hơn, ảnh chụp trên màn hình lớn và các hiệu ứng Pikaffect ấn tượng phá vỡ các định luật vật lý, bạn sẽ có nhiều điều để yêu thích Pika hơn bao giờ hết. Hãy dùng thử. pic.twitter.com/lOEVZIRygxNgày 1 tháng 10 năm 2024
Phương trình cho trí tuệ nhân tạo dường như là dữ liệu cộng với sức mạnh tính toán cộng với thời gian bằng một mô hình tốt hơn và đó chính xác là những gì Pika Labs đã đạt được. Công ty đã dành thời gian trong vài tháng qua để tạo ra thứ gì đó đặc biệt với các tính năng không có trên bất kỳ nền tảng nào khác.
Mặc dù có một số hiệu ứng meme mặc định nhưng rõ ràng vẫn có những hiệu ứng ẩn mà bạn có thể thêm vào. Tôi nghi ngờ rằng tại một thời điểm nào đó trong tương lai mọi người sẽ có thể tạo ra những hiệu ứng của riêng mình và chia sẻ chúng với những người khác. Tôi rất muốn xem các hiệu ứng văn bản trong đó một đối tượng được chuyển thành văn bản 3D trên màn hình.
Tại một thời điểm nào đó, khi tải máy chủ dịu hơn một chút, tôi dự định sẽ tìm hiểu sâu hơn về các khả năng khác của mô hình. Hiện tại, để thử nghiệm, tôi đã tạo năm hình ảnh trong Ideogram trong đó một đối tượng hoặc thực thể ở phía trước và giữa, sau đó chạy tất cả chúng thông qua Pika Labs.
Thổi phồng nó: Một chiếc máy đánh chữ cổ điển
Hình ảnh gợi ý: “Một chiếc máy đánh chữ cổ điển có chi tiết đẹp mắt đặt trên bàn gỗ, trong một phòng làm việc ấm cúng với ánh sáng tự nhiên dịu nhẹ chiếu qua cửa sổ, xung quanh là sách và giấy tờ, bầu không khí ấm áp và hoài cổ.”
Làm tan chảy nó: Mũ bảo hiểm không gian
Dấu nhắc hình ảnh: “Mũ bảo hiểm không gian của một phi hành gia nằm trên bàn trong trạm vũ trụ tương lai, với sự phản chiếu của các ngôi sao và hành tinh ở xa trong tấm che mặt, ánh sáng xung quanh màu xanh dịu, kết cấu đẹp mắt và có độ chi tiết cao.”
Nổ tung nó: Một bốt điện thoại
Dấu nhắc hình ảnh: “Một bốt điện thoại màu đỏ cổ điển của Anh sừng sững trên một con phố yên tĩnh ở London, với nền đá cuội ướt phản chiếu ánh đèn đường, nền kiến trúc mang tính biểu tượng, cảnh hoàng hôn buổi tối, chi tiết và chân thực.”
Squish it: Một cây đàn piano lớn
Hình ảnh gợi ý: “Một cây đàn piano lớn trong phòng hòa nhạc lớn, lớp sơn đen bóng phản chiếu ánh đèn sân khấu dịu nhẹ, nội thất trang nhã của hội trường với rèm và hàng ghế nhung đỏ, bầu không khí ấn tượng và thanh bình.”
Cake-ify it: Xe buýt hai tầng
Hình ảnh gợi ý: “Một chiếc xe buýt hai tầng màu đỏ tươi đậu trên một con phố đông đúc ở London, với những người đi bộ ngang qua và các tòa nhà mang tính biểu tượng ở hậu cảnh, ánh nắng giữa buổi chiều, cảnh quan thành phố rất chi tiết và chân thực.”
Suy nghĩ cuối cùng
Tất cả những điều này không hoàn hảo, nhưng chúng là dấu hiệu ban đầu cho thấy một cách mới mà video AI có thể được sử dụng trong tương lai – để tạo ảnh gif và meme. Tôi có thể tạo ảnh gif dài 5 giây từ mỗi video và trong mỗi trường hợp, chúng có dung lượng dưới 10 MB, hoàn hảo để chia sẻ trên mạng xã hội hoặc trong tin nhắn.
Apple đã hướng một số AI sáng tạo của mình theo hướng meme với việc tạo biểu tượng cảm xúc và tùy chỉnh hình ảnh dựa trên ảnh của ai đó, vì vậy có thể đây là bước phát triển rõ ràng tiếp theo.
Thông tin khác từ Hướng dẫn của Tom