ByteDance sẽ ra mắt Seedance 2.1, đối đầu trực tiếp với Veo 4?

Trong cuộc đua tạo video AI năm 2026, Seedance 2.0 đã trở thành tiêu chuẩn để so sánh cho hầu như mọi mô hình mới được phát hành. Dù là dòng Veo của Google hay Sora của OpenAI, mỗi bản phát hành mới đều được so sánh với Seedance 2.0. Việc “trở thành chuẩn” này là một hình thức công nhận tự thân.

Nhưng cuộc cạnh tranh không bao giờ dừng lại. Google, vốn tương đối im lặng gần đây, có vẻ đang chuẩn bị một điều gì đó lớn. Gemini Omni, một mô hình tạo video hoàn toàn mới, đã tình cờ xuất hiện trong giao diện chat của Gemini.

Gemini Omni Xuất Hiện

Sáng sớm nay, một người dùng đã vô tình kích hoạt tính năng tạo video mới này trong Gemini. Giao diện hiển thị trực tiếp:

“Tạo với Gemini Omni – gặp gỡ mô hình tạo video mới của chúng tôi. Remix video của bạn, chỉnh sửa trực tiếp trong cuộc trò chuyện, thử các mẫu phong phú, và còn nhiều hơn nữa.”

Mặc dù tính năng đã biến mất khi người dùng mở lại ứng dụng, nhưng các video thử nghiệm bị rò rỉ đã đủ gây ra sự náo động trong cộng đồng.

Thử Thách Bảng Toán: Đột Phá Trong Kết Xuất Văn Bản

Trường hợp thử nghiệm đầu tiên bị rò rỉ là một video 10 giây: một giáo sư viết các chứng minh toán học cho các đẳng thức lượng giác trên bảng truyền thống đồng thời giải thích các bước.

Chỉ một câu prompt: “Một giáo sư viết chứng minh toán học cho các đẳng thức lượng giác trên bảng truyền thống, giải thích bước mà anh đang thực hiện trong phương trình.”

Mặc dù vẫn có thể tìm thấy một số tạo tác do AI tạo ra trong cảnh quay, nhưng việc xử lý nội dung văn bản trên bảng khá chính xác – đây là một lỗi lớn đã ám ảnh nhiều mô hình video trước đây. Tính chân thực tổng thể của video cũng ấn tượng.

Một Tribute Cổ Điển: Will Smith Ăn Mì Spaghetti

Trường hợp thử nghiệm thứ hai tiếp tục theo truyền thống cổ điển này – “Will Smith ăn mì spaghetti” đã trở thành một trong những prompt bắt buộc thử nghiệm cho hầu như tất cả các mô hình tạo video.

Do hạn chế về nội dung, người thử nghiệm đã mô tả hai người đàn ông trông giống Will Smith đang ăn tại một nhà hàng sang trọng. Trong video được tạo bởi Gemini Omni, toàn bộ quá trình – từ hai người đàn ông tiến đến bàn, trao đổi lịch sự và bắt đầu ăn mì spaghetti – diễn ra mượt mà và tự nhiên.

So Sánh Trực Tiếp: Gemini Omni vs Seedance 2.0

Điều gì xảy ra khi cùng một prompt được gửi đến cả hai mô hình?

Khả Năng Kết Xuất Văn Bản

Trong bài kiểm tra bảng toán, Gemini Omni xử lý văn bản trên bảng tốt hơn đáng kể. Nội dung do Seedance 2.0 tạo ra có ít liên quan đến các đẳng thức lượng giác, và vẫn còn vấn đề với việc kết xuất văn bản trên bảng.

Xử Lý Logic Vật Lý

Trong cảnh ăn mì spaghetti, Seedance 2.0 thể hiện tự nhiên hơn. Gemini Omni cho thấy một số vấn đề vật lý nhỏ: khi các nhân vật đứng, không có mì spaghetti trên đĩa, nhưng xuất hiện đột ngột sau khi ngồi xuống, và trong khi ăn, mì spaghetti biến mất mà không thực sự được ăn.

Đánh Giá Tổng Quan

Gemini Omni thực sự ấn tượng trong tính nhất quán của văn bản, nhưng Seedance 2.0 vẫn giữ được lợi thế trong logic vật lý của việc tạo video. Cả hai sản phẩm đều có thế mạnh riêng, và hiệu suất thực tế phụ thuộc vào trường hợp sử dụng cụ thể.

Không Chỉ Tạo Video: Khả Năng Chỉnh Sửa Video Của Gemini Omni

Vụ rò rỉ này cũng nêu bật một điểm nổi bật khác – Gemini Omni đã thể hiện khả năng chỉnh sửa video mạnh mẽ.

Người dùng có thể trực tiếp thay thế các đối tượng trong video trong cuộc trò chuyện. Ví dụ, mì spaghetti trong video gốc có thể được thay bằng một tô canh tom yum. Thực tế hơn, nó còn có thể loại bỏ hình mờ do các công cụ AI khác tạo ra – bài kiểm tra đã loại bỏ thành công hình mờ Sora di chuyển liên tục trong khi vẫn duy trì sự nhất quán cơ bản của video gốc.

Video AI: Đang Trở Thành Phương Tiện Truyền Thông Chính

Cuộc cạnh tranh giữa hai sản phẩm này chỉ là phần nổi của tảng băng. Gần đây, một làn sóng video chất lượng cao do AI tạo ra đã bùng nổ trên internet.

Marko Slavnic, nghệ sĩ kỹ thuật tại Runway, đã tạo một video chim bồ câu do AI tạo ra đạt được một triệu lượt xem. Clip 47 giây không hề có dấu vết AI nào – có lẽ đội ngũ hoạt hình Disney nên lo lắng.

Tại Trung Quốc, nội dung dưới chủ đề Weibo “Phim Ngắn AI: Sản Xuất Hàng Loạt Love, Death, and Robots” đã trở nên viral quốc tế, đạt 12 triệu lượt xem sau khi được chia sẻ ra nước ngoài. Nhà sáng tạo tiết lộ rằng bộ phim ngắn được thực hiện bằng Seedance 2.0 trong 10 ngày và đã hợp tác với công ty điện ảnh để phát hành chiếu rạp.

Những trường hợp này cho thấy video AI đang tiến hóa từ “đồ chơi phòng thí nghiệm” thành phương tiện truyền thông sáng tạo chính.

Seedance 2.1 Sắp Ra Mắt?

Vụ rò rỉ Gemini Omni của Google có thể đang tạo sự mong đợi cho hội nghị Google I/O diễn ra vào tuần tới. Nếu Gemini Omni được phát hành chính thức tại hội nghị, nửa sau của cuộc thi tạo video AI sẽ chính thức bắt đầu.

Trong khi đó, ByteDance cũng đang tích cực chuẩn bị. Theo các nguồn tin, Seedance 2.1 đang được phát triển và có thể ra mắt cùng lúc với Veo 4.

Bất kể kết quả cuối cùng ra sao, đối với những người tạo nội dung, đây là thời đại tốt nhất – công cụ đang phát triển, rào cản đang giảm dần, khả năng đang mở rộng vô hạn.

Bắt Đầu Sử Dụng Seedance 2.0

Bạn muốn tự mình trải nghiệm sức mạnh của Seedance 2.0? Nhấp vào nút bên dưới để bắt đầu tạo ngay bây giờ.

Bắt Đầu Sử Dụng Seedance 2.0