Khuếch tán ổn định cho phép bạn tạo thực tế bất kỳ hình ảnh nào dựa trên văn bản. Chẳng hạn, dự án của bạn có thể yêu cầu bạn cải thiện khuôn mặt AI, nhưng bạn đang gặp sự cố khi cải thiện bản gốc. Nếu vậy, bạn có thể sử dụng một số mẹo của chúng tôi để cải thiện quy trình tạo khuôn mặt Khuếch tán Ổn định của mình. Đọc để tìm hiểu thêm.
Làm thế nào để bạn tạo ra những khuôn mặt đẹp hơn với sự khuếch tán ổn định?
Để tạo ra những khuôn mặt đẹp hơn với Stable Diffusion, bạn cần thiết lập Google Colab có tên là Deforum Stable Diffusion v0.5. Đây là cách bạn có thể làm điều đó:
- Mở trình duyệt của bạn và đi đến trang web này.
- Nhấn nút “Kết nối” và nhấp vào “GPU NVIDIA”. Vì đây là GPU của máy chủ Google nên đừng lo — bạn không cần card đồ họa NVIDIA.
- Cấp quyền hệ thống cho trang web sử dụng máy tính của bạn.
- Nhấn vào phần bên dưới thẻ GPU (“Mô hình và Đường dẫn đầu ra”).
- Kết nối Google Colab với Google Drive của bạn và đợi dấu kiểm xuất hiện bên cạnh “Mô hình và Đường dẫn đầu ra”.
- Chọn “Môi trường thiết lập” và để hệ thống kết nối tài khoản của bạn. Làm tương tự cho “Định nghĩa Python”.
- Chuyển đến phần “Chọn và tải mô hình”. Phần này yêu cầu bạn phải có mô hình mà bạn muốn tải lên Google Drive của mình. Để làm như vậy, hãy tải xuống tệp .ckpt từ trang web này bằng cách nhấn “sd-v1.4.ckpt” trong phần “Tải xuống quả cân”. Tải tệp này lên thư mục Google Drive AI chứa các mô hình bạn muốn cải thiện.
- Nhấn nút “Phát” bên cạnh phần “Chọn và tải mô hình”. Đợi dấu kiểm màu xanh lá cây và Google Colab của bạn sẽ được thiết lập và chạy.
Giờ đây, Google Colab của bạn đã được thiết lập, bạn có thể cải thiện khuôn mặt AI của mình bằng Tính năng khuếch tán ổn định. Quá trình này còn được gọi là cải thiện kết xuất cũ và dẫn đến thay đổi độ phân giải hình ảnh của bạn:
- Cắt khuôn mặt bạn muốn cải thiện và lưu nó thành một hình ảnh riêng biệt.
- Tải khuôn mặt lên bằng cách kéo khuôn mặt đó vào ổ đĩa tạm thời Google Colab của bạn (bảng điều khiển bên trái).
- Nhấp chuột phải vào hình ảnh và nhấp vào nút “Sao chép đường dẫn”.
- Dán hình ảnh vào trường “init_image” trong menu bên phải.
- Điều hướng đến cửa sổ “Lời nhắc” và nhập lời nhắc bạn muốn cho khuôn mặt của mình. Đảm bảo gõ
trong lời nhắc bên trong dấu ngoặc kép để có được kết quả tốt nhất. - Đi tới phần “Chạy” và tìm menu “Cài đặt hình ảnh”.
- Thay đổi độ phân giải pixel để tăng độ rõ nét của khuôn mặt. Chẳng hạn, 800×800 hoạt động tốt trong hầu hết các trường hợp.
- Nhấn nút “Phát” màu đỏ bên dưới cửa sổ “Chạy” để hiển thị hình ảnh.
- Hình ảnh của bạn bây giờ sẽ được hiển thị với độ phân giải khác. Chơi xung quanh với quy trình cho đến khi bạn nhận được hiệu quả mong muốn.
- Tải xuống hình ảnh từ ổ đĩa của bạn và phủ nó lên bản gốc.
Làm thế nào để bạn sử dụng các biến thể với khuếch tán ổn định để tạo ra các khuôn mặt đẹp hơn?
Bên cạnh việc trực tiếp cải thiện khuôn mặt bằng cách thay đổi độ phân giải, bạn cũng có thể giới thiệu các biến thể để tạo ra hình ảnh sắc nét hơn. Bước đầu tiên là đặt tùy chọn “Hoạt hình” của bạn thành “không”. Đây là những gì bạn cần làm:
- Kết nối Google Drive của bạn với Google Deforum Stable Diffusion 0.5 Colab theo các bước trên.
- Tải hình ảnh khuôn mặt lên bảng điều khiển bên trái của Colab.
- Chuyển đến menu “Hoạt hình” và thay đổi cài đặt “animation_mode” thành “none”.
- Nhấp vào nút “Phát” bên cạnh phần “Hoạt hình” để lưu các thay đổi của bạn.
Khi bạn đã thay đổi cài đặt “Hoạt ảnh”, bạn có thể bỏ qua hầu hết các cài đặt khác vì bạn không muốn tạo hoạt ảnh. Tuy nhiên, bạn sẽ cần thực hiện một số chỉnh sửa đối với phần “Lời nhắc”. Thực hiện theo các bước sau:
- Sử dụng lời nhắc ban đầu làm điểm bắt đầu.
- Thực hiện các biến thể cần thiết bằng cách thay đổi đường kẻ, tùy thuộc vào việc bạn muốn thêm hay xóa các đặc điểm khỏi khuôn mặt AI của mình. Làm việc trong phần “Prompts” thay vì cửa sổ “Animation Prompts”.
- Đặt dấu ngoặc kép ở đầu và cuối lời nhắc của bạn.
- Đặt dấu phẩy ở cuối lời nhắc (sau dấu ngoặc kép).
- Nhấp vào nút “Phát” ở góc trên bên trái của cửa sổ “Lời nhắc” để hiển thị hình ảnh của bạn và lưu tiến trình của bạn.
Menu tiếp theo bạn muốn điều chỉnh là menu “Run”. Cụ thể hơn, bạn cần vào cửa sổ “Cài đặt hình ảnh” và thực hiện các thay đổi sau:
- Điều hướng đến “Cài đặt lấy mẫu” và đặt cài đặt “Seed” thành “-1.”
- Chơi xung quanh với cài đặt “Bộ lấy mẫu” cho đến khi bạn nhận được hiệu ứng mong muốn.
- Đặt bao nhiêu “Bước” tùy thích. Giá trị “Quy mô” cũng tùy thuộc vào bạn.
- Nếu bạn đã sử dụng kết xuất “ddim” trong cửa sổ “Sampler”, hãy đặt “ddim_eta” thành “1”.
- Cuộn xuống cho đến khi bạn tìm thấy “Cài đặt hàng loạt” và đi đến dòng “n_batch”. Nhập số biến thể bạn muốn có vào hộp văn bản.
- Chuyển đến “Cài đặt ban đầu” và nhấn vào hộp bên cạnh tùy chọn “use_init”. Bây giờ sẽ có một dấu kiểm bên cạnh cài đặt.
- Nhập “0,5” vào trường “sức mạnh” nếu bạn muốn sử dụng lại 50% hình ảnh gốc. Bạn có thể nhập các giá trị cao hơn hoặc thấp hơn, tùy thuộc vào mức độ bạn muốn sử dụng lại tài liệu nguồn.
- Nhấp vào biểu tượng “Tệp” trong bảng điều khiển bên trái. Chuyển đến thư mục chứa hình ảnh khuôn mặt bạn muốn tối ưu hóa và kéo nó vào phần bên trái. Đợi hệ thống tải ảnh của bạn, nhấp chuột phải vào ảnh và nhấn nút “sao chép đường dẫn”.
- Dán đường dẫn vào trường “init_image” và nhấp vào nút “Phát” màu đỏ ở góc trên cùng bên trái của menu “Cài đặt hình ảnh”.
- Hãy để chương trình hiển thị hình ảnh của bạn và thêm các biến thể. Bây giờ bạn sẽ thấy giao diện mới ở phần dưới của màn hình với các biến thể của bạn.
Cách cải thiện khả năng tạo ảnh với khuếch tán ổn định
Khi cải thiện khuôn mặt với Khuếch tán ổn định, phần lớn công việc thuộc về viết lời nhắc thích hợp. Hệ thống dựa vào tính năng này để tạo hình ảnh bằng công nghệ “txt2img”. Nó sử dụng dấu nhắc văn bản và các thông số khác để tạo ra một hình ảnh dựa trên đầu vào của bạn.
Như đã thảo luận trước đó, bạn cần nhập giá trị “hạt giống” tại một thời điểm để tạo ra kết quả mong muốn. Bạn cũng có thể thay đổi số “bước” khi kết hợp các biến thể.
Tuy nhiên, những tính năng này có thể không giúp ích gì nhiều trong việc cải thiện khuôn mặt kết quả của bạn. Thay vào đó, bạn sẽ cần đẩy mạnh trò chơi “lời nhắc” của mình để đảm bảo tạo ra hình ảnh chất lượng cao. Dưới đây là một vài lời khuyên sẽ giúp bạn làm như vậy.
- Hãy cụ thể – Lời nhắc văn bản của bạn phải rất chi tiết, đặc biệt là phần đầu, vì phần đầu của cụm từ có nhiều ý nghĩa hơn phần cuối. Nếu bạn bỏ qua thông tin chính, bạn có thể không có được giao diện mong muốn.
- Gắn bó với tiếng Anh – Các nhà phát triển của Khuếch tán ổn định đã sử dụng hơn hai tỷ cặp văn bản-hình ảnh tiếng Anh. Hơn 100 ngôn ngữ khác chiếm ít cặp hơn, nghĩa là tỷ lệ của các ngôn ngữ riêng lẻ nhỏ hơn nhiều so với tiếng Anh. Do đó, viết lời nhắc bằng tiếng Anh không phải là tiếng Anh có thể không mang lại cho bạn kết quả đúng.
- Bao gồm thể loại và loại hình nghệ thuật – Khuếch tán ổn định có thể tạo ra tất cả các loại hình ảnh, bao gồm tranh sơn dầu và acrylic, ảnh thời trang, phim hoạt hình và bản in. Do đó, việc chỉ định dạng hình ảnh bạn muốn làm cho thuật toán chính xác hơn.
- Hợp thời trang – Nếu bạn đang tìm kiếm những hình ảnh nghệ thuật, bạn có thể thêm “trending on ArtStation” hoặc các tên khác để giúp Stable Diffusion gần với hình ảnh mong muốn nhất có thể.
- Chơi với các từ khác nhau – Khi viết lời nhắc, bạn không bao giờ được lạm dụng các mô tả của mình. Do đó, hãy sử dụng các thuộc tính kỹ thuật khác nhau, chẳng hạn như “tiêu cự sắc nét” và “ánh sáng ấn tượng” hoặc các tính từ, chẳng hạn như “tuyệt vời”, “tuyệt đẹp” và “tuyệt đẹp”.
- Thêm tên nghệ sĩ – Khuếch tán ổn định cho phép bạn tạo ra hình ảnh theo phong cách của các nghệ sĩ nổi tiếng. Để đạt được hiệu ứng này, hãy thêm tên nghệ sĩ của bạn vào lời nhắc, chẳng hạn như Andry Warhol, Caspar David Friedrich hoặc Auguste Renoir.
- Sử dụng phủ định – Một số phiên bản giao diện của bạn phản ứng với lời nhắc tiêu cực. Những điều này cho phép bạn chỉ ra những gì hệ thống của bạn nên tránh khi tạo hình ảnh.
Hãy để trí tưởng tượng và khả năng sáng tạo của bạn được phát huy trong sự khuếch tán ổn định
Làm chủ Khuếch tán ổn định có thể mất một khoảng thời gian, đặc biệt là khi bạn muốn nâng cao khuôn mặt AI và các hình ảnh khác của mình. Một hoặc hai dòng sai có thể dễ dàng làm giảm chất lượng dự án của bạn, vì vậy bạn cần cực kỳ cẩn thận khi viết lời nhắc và nhập tham số tạo. Với một vài điều chỉnh, bạn sẽ có thể làm đẹp khuôn mặt và bất kỳ phần nào khác trong ảnh một cách dễ dàng.
Bạn có thường xuyên sử dụng Khuếch tán Ổn định không? Bạn đã bao giờ thêm các biến thể trong hình ảnh của mình chưa? Nếu có, chúng đã tạo ra những tác động gì? Chia sẻ kinh nghiệm của bạn trong phần bình luận bên dưới.