OpenAI, phòng lab nghiên cứu trí tuệ nhân tạo hàng đầu, vừa công bố sản phẩm mới nhất của mình – Sora, một hệ thống AI có khả năng tạo ra các cảnh phim phức tạp từ các mô tả văn bản đơn giản. Đây được xem là một bước nhảy vọt lớn trong lĩnh vực AI đa phương tiện có thể kết nối ngôn ngữ và hình ảnh.
Gần đây, một nhân viên của OpenAI đã chia sẻ một đoạn video để khoe thêm một khả năng khác của Sora: tạo ra các collage video. Cụ thể, với prompt về những hoạt cảnh khác nhau trong cùng một khung hình, Sora đã sản xuất ra một clip với 4 cảnh diễn ra đồng thời trong các ô hình chữ nhật, rất ấn tượng.
Đây chắc chắn là một tác phẩm tuyệt vời của trí tuệ nhân tạo. Tuy nhiên, nhiều người không khỏi tò mò và thắc mắc rằng Sora đã tạo ra đúng những cảnh gì trong khung hình phía trên bên phải của video collage đó.
Video mới đây này cho thấy các khả năng ấn tượng của Sora trong việc kết hợp nhiều kịch bản, chủ đề và các góc nhìn hình ảnh lại với nhau. Như vậy, các đạo diễn và nghệ sĩ thị giác trong tương lai có thể dễ dàng xây dựng và thể hiện các ý tưởng phức tạp của họ thông qua lời nói và văn bản.
Bên cạnh Sora, OpenAI cho biết họ đang phát triển nhiều công nghệ AI đột phá khác để mở ra một kỷ nguyên sáng tạo hoàn toàn mới cho nội dung kỹ thuật số.