Sora mới ra mắt và chưa cho số đông sử dụng nhưng một ngày không xa, bạn có thể tạo một đoạn video ngắn chỉ với vài câu lệnh đơn giản. Cách đây vài năm thôi bạn không thể tin ngày nào đó đạo diễn, diễn viên sẽ được thay thế hoàn toàn.

Chỉ một năm trước, không ai tin rằng với vài câu lệnh đơn giản thì AI sẽ tạo ra được một video. Dĩ nhiên đằng sau đó còn cả một quá trình phân tích và xử lý phức tạp, khác xa với sự đơn giản mà video được tạo ra dưới góc nhìn của người dùng bình thường. OpenAI nói họ phải phân tích câu lệnh, tạo ra một chuỗi giải thích chi tiết hơn rất nhiều rồi mới đưa cho mô hình để tạo ra video. Sora có khả năng hiểu ngôn ngữ văn bản rất tốt, AI sẽ phân tích, bóc tách ra chi tiết để tạo ra một video tự nhiên đúng với ý của người dùng. Dưới đây là video đang gây sốt tạo bằng văn bản mà các phương tiện truyền thông đang rầm rộ đưa tin.

Hầu hết những video ngắn do Sora tạo ra đều từ 2-3 câu lệnh ngắn gọn nhưng nó lại rất hợp logic và hoàn cảnh thực tế. Không chỉ là chỉ đơn giản dựa trên câu lệnh mà Sora còn phân tích để xem hoàn cảnh đó diễn ra vào khoảng thời gian nào, có sự kiện gì xảy ra để tạo ra cảnh vật, nhân vật tự nhiên nhất. Ví dụ nổi tiếng là video một cô gái bước đi ở khu downtown Tokyo, chúng ta nhìn cái là biết ngay ở Nhật, khu trung tâm, sự hào nhoáng của cảnh vật và biển quảng cáo. Bộ đồ của cô gái, phong thái bước đi hay màu son môi đều là yêu cầu của người dùng và Sora đã thành công khi tạo ra một video như vậy. Hay như khung cảnh California thời kỳ đào vàng (gold rush), nếu quan tâm về lịch sử và đọc sách thì đó là thời kỳ người ta đổ xô đi đào vàng cho nên chúng ta thấy được cảnh vật rất hợp lý với thời kỳ đó như khu thị trấn, con suối, ngựa là phương tiện di chuyển chính…

Sora có khả năng tạo ra đoạn video Full-HD theo chiều ngang hoặc dọc, nên chúng ta thấy hình ảnh rất sắc nét, màu sắc tự nhiên. Không chỉ vậy, nó còn đủ thông minh để có thể tự căn góc quay, ví dụ một người nào đó tự quay mình thì hình nhân vật sẽ xuất hiện ở trung tâm khung cảnh chứ không bị lệch. Với những video dạng 3D cũng vậy, nó chẳng khác gì những video do những studio hoạt hình chuyên nghiệp tạo ra cả. OpenAI nói Sora có khả năng hiểu ngôn ngữ rất tốt, ví dụ với video về một chiếc SUV kiểu cổ (câu lệnh là vintage SUV) thì Sora chọn một chiếc xe đại diện hoàn hảo cho yếu tố vintage và SUV đó là Land Rover Defender. Nói cách khác Sora đã rất thông minh để hiểu người dùng muốn gì và muốn xem gì để đưa ra video như vậy.

Dĩ nhiên là Sora vẫn có điểm yếu khi khung cảnh có quá nhiều nhân vật thì những cử chỉ đôi khi sẽ không tự nhiên và dễ nhận ra là nhân tạo. Các cử chỉ phức tạp như bước chân đi bộ, môi mấp máy hoặc liên quan đến con người thì chưa hoàn hảo và sẽ cần thêm thời gian để công nghệ AI tự học. Sora chưa cho dùng đại trà và những yếu tố liên quan đến an toàn, đạo đức cũng đang được OpenAI phát triển và hoàn thiện.

HTECOM là nhà sáng tạo nội dung tương tác hàng đầu với lợi thế tận dụng công nghệ cao đi kèm sự sáng tạo của các chuyên gia, kỹ sư thiết kế, biên tập nội dung, video. Tìm hiểu thêm về dịch vụ nội dung của chúng tôi tại https://htecom.net/content-creator

(Nguồn: tinhte.vn)

Print Friendly, PDF & Email

Post Tags :

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết được thực hiện bởi HTECOM AI. Hãy chat với tôi nếu cần hỗ trợ nhé.

Tin mới nhất