Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải cao hơn 16 lần Stable Diffusion

Một trong những vấn đề lớn nhất với tác phẩm nghệ thuật do trí tuệ nhân tạo tạo ra là độ phân giải của đầu ra. Ngay cả những ứng dụng tốt nhất thường cũng chỉ tạo ra hình ảnh 1MP. Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải lên tới 256MP, cao hơn 16 lần Stable Diffusion.

Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải cao hơn 16 lần Stable Diffusion

Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải 256MP

Đáp lại, một nhóm các nhà nghiên cứu từ Đại học Surrey ở Anh tuyên bố đã phát triển một kỹ thuật có thể tạo ra hình ảnh với độ phân giải gấp 16 lần so với những ông lớn như Midjourney, DALL-E 3 và Stable Diffusion’s SDXL 1.0.

Kết quả là một trình tạo hình ảnh AI có tên DemoFusion và nó sử dụng một quy trình tương đối đơn giản để đạt được những kết quả đó — cụ thể là nó tiếp tục chạy đi chạy lại quá trình tạo hình ảnh cho đến khi chất lượng được cải thiện. DemoFusion sau đó sẽ ghép các dữ liệu cơ bản lại với nhau. Nó cũng hoàn toàn là mã nguồn mở và có thể chạy miễn phí trên máy tính chơi game tầm trung.

So sánh DemoFusion với các trình tạo ảnh AI khác

DemoFusion, dựa trên SDXL 1.0 mã nguồn mở từ StabilityAI, một mô hình tạo hình ảnh AI hiệu suất cao được xây dựng dựa trên Stable Diffusion. SDXL 1.0 tạo ra hình ảnh có độ phân giải lên tới 1024 x 1024 hoặc 1MP.

Midjourney đã thực hiện một số công việc liên quan đến việc nâng cấp, đạt 2048 x 2048 trong thử nghiệm beta, nhưng mô hình cơ sở vẫn giống với cả DALL-E 3 từ OpenAI và SDXL 1.0.

Không ai trong số này có thể đạt được độ phân giải của ảnh chụp bằng điện thoại thông minh. Các thiết bị iPhone và Android cao cấp mới nhất chụp ảnh có độ phân giải 48MP trở lên, mang lại những bức ảnh có chiều rộng tối thiểu 8.000 pixel — đủ lớn để in.

DemoFusion có miễn phí không?

Các nhà phát triển DemoFusion không chỉ biến nó thành nguồn mở mà còn nhấn mạnh vào việc “dân chủ hóa quyền truy cập vào AI”. Điều đó bao gồm việc cung cấp miễn phí mô hình và tất cả các chi tiết liên quan để tải xuống và chạy cục bộ.

Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải cao hơn 16 lần Stable Diffusion

Bạn có thể truy cập trang chủ của DemoFusion trên Github để tải về và tự cài đặt trên máy tính cá nhân. Hoặc bạn có thể trải nghiệm thử tại https://replicate.com/lucataco/demofusion.

Nhược điểm của DemoFusion là gì?

Vấn đề lớn nhất mà DemoFusion phải đối mặt là thời gian. Ngay cả khi chạy trên các chip AI mạnh mẽ và đắt tiền nhất của Nvidia, có thể mất khoảng 10 phút để tạo ra hình ảnh có độ phân giải cao, trong khi chỉ mất vài giây đối với SDXL 1.0 hoặc Midjourney. Điều này sẽ càng là vấn đề lớn khi chạy trên các máy tính cá nhân với phần cứng hạn chế, chẳng hạn các chip Nvidia dành cho chơi game.

Trình tạo ảnh DemoFusion có thể tạo ra ảnh độ phân giải cao hơn 16 lần Stable Diffusion

Vấn đề khác là mô hình DemoFusion có xu hướng đi thay đổi kết quả khi bạn thực hiện nhiều lần cùng một lời nhắc. Điều này đặc biệt rõ ràng nếu bạn sử dụng hình ảnh làm lời nhắc thay vì lời nhắc bằng văn bản. 

Leave a Reply

Your email address will not be published. Required fields are marked *