유튜브나 구글에서 ai 실사 이미지를 본 적 있나요? 요즘ai 이미지는 실물과 비슷해서 소름이 돋을 정도인데요. 이런 ai 이미지는 어떻게 만드는 걸까요?
대표적인 방법 중 하나는 ai 이미지 생성 프로그램을 쓰는 것입니다. 그 중 특히 많이 쓰는 프로그램이 스테이블 디퓨전입니다. 그냥 편하게 말하듯이 써도 원하는 이미지를 뽑아줘서 무척 사용하기가 쉽거든요. 마치 챗 GPT(chat gpt)의 이미지 버전인 셈이죠.
하지만 처음 사용하는 분들은 설치나 사용이 어려울 수 있긴 합니다. 그래서 오늘은 스테이블 디퓨전 사용법과 설치 방법에 대해 알아보겠습니다. 본 글은 윈도우11 OS를 기준으로 설명하였습니다.

목차
1. 스테이블 디퓨전 설치 방법
스테이블 디퓨전을 설치하는 방법은 크게 세 가지입니다.
참고로 원래는 구글 코랩(Google Colab)을 이용하여 따로 프로그램을 설치하지 않아도 되는 간단한 방법도 있었는데요. 이 방식에 여러가지 문제가 나타나면서 구글 코랩 측에서 스테이블 디퓨전 사용을 막았습니다.
다만 유료로 구글 코랩을 사용하는 사람들에게는 여전히 스테이블 디퓨전 사용을 허가한다고 하니 참고해주시기 바랍니다.
1.1 엔비디아 그래픽카드를 쓰고 있다면?
이 방법은 스테이블 디퓨전을 설치하는 가장 빠르고 쉬운 방법입니다. 단, 이 방법을 이용하기 위해서는 두 가지 조건이 필요합니다.
- 윈도우 10 또는 윈도우11 사용 중일 것
- 엔비디아(nvidia) gpu를 사용 중일 것
참고로 gpu 확인 방법은 CPU 확인 방법과 같습니다. 만약 자신의 컴퓨터가 엔비디아 gpu를 사용 중이라면 아래 과정을 따라해주세요. (만약 엔비디아 gpu를 사용하지 않으면 다음으로 넘어가주세요.)
먼저 automatic1111로 들어가셔서 Installation on Windows 10/11 with NVidia-GPUs using release package 부분까지 스크롤을 내려줍니다.

여기서 v1.0.0-pre라고 된 텍스트 링크를 타고 들어가서, sd.webui.zip 파일을 다운받습니다.

다운로드 후에는 해당 zip 폴더를 마우스 우클릭하여 압축을 풀어줍니다.
그리고 폴더 안에 있는 update.bat를 파일을 클릭해서 실행합니다.
update.bat 파일실행이 완료되면 run.bat 파일을 실행해주세요.
run 파일이 진행되다보면 프롬프트 안에서 https://127.0.0.1:7860 라고 되어있는 local url이 나올 겁니다. 이 url을 자신의 브라우저(크롬 등) 복사/붙여넣기 하시면 스테이블 디퓨전의 web ui로 진입할 수 있습니다.

1.2 엔비디아 그래픽 카드가 아니라면?
위 1번 방법은 가장 바르고 간단하지만 엔비디아 그래픽 카드를 사용하지 않으면 적용할 수 없는 방법입니다. 저도 엔비디아 그래픽카드를 쓰지 않아서 위 방법을 적용할 수 없었는데요.
그렇다면 아래 단계를 따라오면 됩니다. 총 4단계로 이루어진 방법입니다.
1.2.1 파이썬 3.10.6 다운로드
먼저 python 3.10.6 버전을 다운받아 줍니다. (스크롤을 맨 밑으로 내리면 다운받을 수 있는 파일이 있습니다.) Window-installer (64bit)라고 되어있는 파일을 다운 받으시길 바랍니다.
이때 반드시 Add Python 3.10 to Path 란에 체크를 눌러주셔야 합니다. 그 외에는 계속 Next 버튼 눌러주시면서 다운받아 주시면 됩니다. 다운만 받아주시고 따로 조치할 건 없습니다.

1.2.2 git 다운로드
그 다음에는 git을 다운받습니다. 윈도우라면 윈도우 버전을, 맥이라면 맥 버전을 받으시면 됩니다. 설치 방법도 간단히 나와있으니 보고 따라하시면 됩니다.
참고로 git을 다운 받을 때는 기본값이 다 맞으니 계속 Next눌러주면서 넘어가면 됩니다. 역시 다운로드만 해주시면 되고 따로 조작할 부분은 없습니다.
1.2.3 스테이블 디퓨전 폴더 설치
윈도우 + r 키를 눌러 실행 탭을 열어주시고, cmd 입력하여 cmd를 띄워줍니다. 여기에 다음과 같은 코드를 복사/붙여넣기 하여 삽입하고 엔터를 누릅니다. 본격적으로 스테이블 디퓨전 webui 폴더를 설치하는 과정입니다.
cmd에서 아래 명령어를 입력합니다. <>는 빼고 씁니다. 명령어를 입력하면 3~5 분 정도 로딩 후 다운로드가 완료됩니다.
cd <설치하고자 하는 경로>
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
참고로 설치하고자 하는 명령어를 입력하는 방법은 다음과 같습니다.
파일 탐색기 열기-해당 경로로 들어가기-화면 상단 경로 우클릭-주소 복사-cmd에 붙여넣기
바탕화면의 경로를 복사한다면 아래 사진과 같이 실행하면 됩니다.

1.2.4 webui-user.bat 실행
다운로드 받은 ‘stable-diffusion-webui’ 폴더로 들어갑니다.
여기서 webui-user.bat이라는 파일을 더블 클릭하여 실행해줍니다. 간혹 bat이라는 글자가 보이지 않을 수도 있는데, 그러면 그냥 webui-user라고 되어있는 파일을 모두 더블 클릭해보시면 됩니다.
더블 클릭 후, 잠시 기다리면 프롬프트 화면에 https://127.0.0.1:7860라는 url이 나타날 것입니다. 이 url을 인터넷 주소창에 복사붙여넣기해서 들어가주시면 스테이블 디퓨전에 접속할 수 있습니다.

다시 접속하고 싶은 분들은 3단계(파이썬 설치~스테이블 디퓨전 폴더 다운로드)를 제외하고 4단계(webui-user.bat 실행)만 다시 해주시면 됩니다.
1.3 AMD 그래픽 카드를 쓴다면?
만약 AMD 그래픽 카드를 쓴다면 스테이블 디퓨전 Web UI가 실행되지 않을 수 있습니다. 그러면 파이썬과 깃 설치까지는 위와 똑같이 진행해 주시고, 아래 명령어를 cmd에 입력하여 스테이블 디퓨전 directml qjwjsdmf설치하시길 바랍니다.
git clone https://github.com/lshqqytiger/stable-diffusion-webui-directml && cd stable-diffusion-webui-directml && git submodule init && git submodule update
스테이블 디퓨전 directml을 다운받은 후에는 위와 똑같이 webui-user.bat을 실행하시면 됩니다.
2. 스테이블 디퓨전 설치 없이 이용하기
스테이블 디퓨전을 설치없이 이용하는 방법도 있습니다. (구글 Colab을 이용하는 방법과는 다릅니다.)
바로 Dream Studio 웹사이트를 이용하는 방법인데요. Dream Studio 웹사이트에서 계정을 만들고 ‘Get started’ 버튼을 누르면 스테이블 디퓨전을 따로 설치하지 않고도 프롬프트를 실행할 수 있습니다.
단, Dream Studio 웹사이트는 기본적으로 유료 웹사이트입니다. ai 이미지 1회 제작 당 크레딧을 구매해야 하는 방식인데요. 가입 시에 약 200회의 무료 크레딧이 주어진다고 합니다. 또한 무료 크레딧을 모두 소진하면 100회 크레딧 당 1.2달러로 크레딧을 구매할 수 있다고 합니다.
유료이긴 해도 가격이 그렇게 부담되는 수준은 아니니, 여유가 있는 분들은 참고하셔도 좋겠습니다.
3. 스테이블 디퓨전 설치가 안된다면?
간혹 스테이블 디퓨전 설치가 안 돼서 애를 먹는 경우가 있습니다. 저도 스테이블 디퓨전 설치가 한 번에 안 됐었는데요. 가장 흔한 문제는 그래픽 카드의 용량이 부족해서 생기는 문제였습니다.
이런 경우는 다음과 같은 해결책을 적용해 볼 수 있습니다.
- 스테이블 디퓨전 폴더 내의 ‘venv’ 폴더 삭제 (접속할 때마다 계속 삭제해야 합니다.)
- webui-user.bat 파일 우클릭-추가 옵션 표시-편집-set COMMANDLINE_ARGS= 뒤에 아래 명령 입력
--theme dark --xformers --no-half-vae --lowvram --skip-torch-cuda-test
만약 이 방법으로도 안 된다면 그래픽 카드를 더 좋은 것으로 업그레이드 하는 방법 밖에 없습니다. AI로 이미지를 만드는 작업 자체가 그래픽 카드 메모리를 상당히 많이 먹는 작업이기 때문에, 그래픽 카드 사양이 낮으면 어렵습니다. 보통은 4GB 이상의 VRAM을 요구합니다.
4. 스테이블 디퓨전 사용법
4.1 txt2img 사용법

아래는 스테이블디퓨전 txt2img의 기본 기능입니다. 아래 기능을 참고하셔서 필요한 부분을 세팅한 뒤, prompt에 원하는 이미지를 묘사하면 ai 이미지가 출력됩니다.
- prompt : 생성하고자 하는 그림을 묘사하는 글을 쓰는 곳입니다. 스테이블 디퓨전에서 가장 핵심이 되는 부분입니다.
- Negative prompt: 생성하지 않고자 하는 그림을 묘사하는 글을 쓰는 곳입니다. (ugly, bad hands 등)
- Sampling steps: 글에서 몇 단계의 샘플링을 거쳐 이미지를 뽑아낼 것인지에 대한 설정입니다. Sampling Steps가 높아질 수록 이미지가 디테일하게 묘사됩니다. (원치 않는 이미지도 디테일하게 묘사될 수 있으니 주의해주세요.) 보통 20~60 사이의 값으로 많이 설정합니다.
- Sampling method: 어떤 방법으로 Sampling 작업을 할 지 설정합니다. 사실 어떤 방법을 쓰더라도 큰 차이는 없습니다.
- Width/Height: 사진의 넓이와 높이를 설정합니다.
- Restore Face: 얼굴 모양을 보정해줍니다.
- Tiling: 타일 형태로 여러 개의 사진을 겹쳐서 배열할 때 자연스럽게 만들어줍니다.
- Highres.fix: 512*512 보다 큰 사진을 만들 때 사진에 이상한 부분이 생기지 않도록 합니다.
- Batch count: 이미지를 몇 번 만들 것인지 결정합니다.
- Batch Size: 한 번 생성할 때 이미지를 몇 개 만들 것인지 결정합니다. (최종 생성되는 결과물의 개수는 Batch Count와 Batch Size의 곱만큼 생성됩니다.)
- CFG Scale: 프롬프트 값을 얼마나 정확하게 반영할 것인지 결정합니다.
- lexica 홈페이지를 참조하시면 다른 사람들이 어떤 프롬프트를 사용해서 어떤 이미지를 출력했는지 확인할 수 있습니다.
4.2 img2img 기초 사용법
- 원하는 이미지를 스테이블 디퓨전에 삽입하고, 어떤 방식으로 변형하고 싶은지 Prompt 란에 적어주시면 됩니다.
- Denoising Strength: Denoising Strength가 높아질수록 이미지가 많이 변형됩니다.
- Inpaint: 사진 내의 특정 부분을 선택해서 수정하는 기능입니다.
아래 영상을 통해 스테이블 디퓨전 img2img 기능을 익혀볼 수 있습니다.