ComfyUI의 기본 노드 설명

티스토리 뷰

AI/AI 이미지

ComfyUI의 기본 노드 설명

silbaram 2025. 4. 24. 00:57

728x90

1. Load Checkpoint (모델 로더)

목적: 이미지 생성의 기반이 되는 주 모델 파일(.ckpt 또는 .safetensors 확장자)을 불러옵니다. 이 모델에는 이미지 생성 방식과 스타일 정보가 포함되어 있습니다.
주요 속성:
- ckpt_name: 드롭다운 목록에서 사용할 체크포인트 모델 파일을 선택합니다. ComfyUI 설치 폴더 내의 models/checkpoints 디렉토리에 있는 파일들이 표시됩니다.
출력:
- MODEL: 주 확산 모델(U-Net 등) 자체입니다. KSampler 노드에 연결됩니다.
- CLIP: 텍스트 프롬프트를 이해하는 데 사용되는 언어 모델입니다. CLIP Text Encode 노드에 연결됩니다.
- VAE: 잠재 공간(Latent Space)의 이미지를 실제 픽셀 이미지로 변환하거나 그 반대로 변환하는 모델입니다. VAE Decode 또는 VAE Encode 노드에 연결됩니다.

2. CLIP Text Encode (프롬프트 인코더)

목적: 사용자가 입력한 텍스트 프롬프트(긍정 또는 부정)를 모델이 이해할 수 있는 형태(임베딩 또는 컨디셔닝)로 변환합니다. 일반적으로 긍정 프롬프트용과 부정 프롬프트용으로 두 개의 노드를 사용합니다.
주요 속성:
- text: 텍스트 프롬프트를 입력하는 필드입니다. 긍정 프롬프트 노드에는 생성하려는 이미지의 특징(예: "beautiful landscape, sunset, highly detailed")을, 부정 프롬프트 노드에는 피하고 싶은 특징(예: "ugly, deformed, blurry, low quality")을 입력합니다.
입력:
- clip: Load Checkpoint 노드에서 출력된 CLIP 모델을 연결합니다.
출력:
- CONDITIONING: 인코딩된 프롬프트 정보입니다. KSampler 노드의 positive 또는 negative 입력에 연결됩니다.

3. Empty Latent Image (빈 잠재 공간 이미지)

목적: 이미지 생성을 시작할 빈 '캔버스'를 잠재 공간(Latent Space)에 생성합니다. 실제 이미지가 아니라 모델이 작업하는 추상적인 데이터 공간입니다.
주요 속성:
- width, height: 생성될 잠재 공간 이미지의 너비와 높이를 설정합니다. 이 값은 최종 이미지 크기와 직접적인 관련이 있습니다 (일반적으로 VAE에 따라 1/8 크기). 모델이 학습된 해상도(예: 512x512, 768x768, 1024x1024)에 맞춰 설정하는 것이 좋습니다.
- batch_size: 한 번에 생성할 이미지의 개수를 설정합니다. 높이면 여러 이미지를 동시에 생성하지만 VRAM 사용량이 늘어납니다.
출력:
- LATENT: 생성된 빈 잠재 공간 이미지 데이터입니다. KSampler 노드의 latent_image 입력에 연결됩니다.

4. KSampler (또는 KSampler Advanced)

목적: 핵심적인 이미지 생성(확산) 프로세스를 수행합니다. 입력된 모델, 프롬프트, 잠재 공간 이미지를 사용하여 노이즈를 점진적으로 제거하고 프롬프트에 맞는 이미지로 변환합니다.

주요 속성:

seed: 노이즈 생성 및 샘플링 과정의 무작위성을 제어하는 숫자입니다. 같은 시드값을 사용하면 동일한 조건에서 같은 이미지를 다시 생성할 수 있습니다. 'randomize' 버튼으로 무작위 시드를 생성할 수 있습니다.
steps: 샘플링 과정의 반복 횟수입니다. 높을수록 이미지 품질이 향상될 수 있지만 생성 시간이 길어집니다. 일반적으로 20~40 사이 값을 많이 사용합니다.
cfg (Classifier Free Guidance Scale): 생성된 이미지가 프롬프트를 얼마나 강하게 따를지 결정하는 값입니다. 너무 낮으면(예: 1~4) 프롬프트와 관련 없는 이미지가 나올 수 있고, 너무 높으면(예: 15 이상) 색상이 과도하게 강해지거나 왜곡될 수 있습니다.. 보통 5~10 사이 값을 사용합니다.

sampler_name: 사용할 샘플링 알고리즘을 선택합니다. (예: euler, dpmpp_2m_karras, lms) 샘플러 종류에 따라 이미지 결과물의 스타일이나 품질, 생성 속도가 달라질 수 있습니다.

샘플러 이름	종류/기반	특징	장점	단점	추천 사용 경우
euler	ODE (확정적)	가장 기본적이고 빠름. 단순함.	속도 빠름, 예측 가능, 기본 베이스라인.	고품질 위해 스텝 수 더 필요할 수 있음, 다소 밋밋한 결과 가능성.	빠른 테스트, 프롬프트 실험, 안정적인 기본 결과 필요시.
euler_ancestral	Ancestral (무작위)	Euler 기반 + 스텝별 노이즈 추가.	창의적/다양한 결과 가능성, 낮은 스텝에서 흥미로운 결과 가능.	스텝 수 변경 시 결과 달라짐 (비결정성), 일관성 낮을 수 있음, 예측 어려움.	다양한 변형 탐색, 창의적인 결과 원할 때, 정확한 재현 불필요시.
dpmpp_2m	ODE (확정적)	DPM-Solver++ (2차). 속도와 품질 균형 우수.	속도 대비 품질 매우 좋음, 선명하고 안정적인 결과.	일부 사용자는 SDE 계열보다 덜 유기적이라 느낄 수 있음.	범용적인 고품질 생성, 신뢰성 있는 결과 필요시 (좋은 기본 선택지).
dpmpp_sde	SDE (무작위)	DPM-Solver++ (SDE 기반). 디테일/질감 표현 우수.	디테일/질감 표현 좋음, 사진적이거나 회화적인 느낌 줄 수 있음.	무작위성 (결과 약간씩 변함), dpmpp_2m보다 약간 느릴 수 있음.	높은 디테일/질감 표현 목표, 사진/회화 스타일, 약간의 변형 허용 가능 시.
dpmpp_2m_karras	ODE (확정적)	dpmpp_2m + Karras 노이즈 스케줄. 매우 인기 있음.	낮은 스텝(20~30)에서도 고품질, 속도/품질 효율 극대화, 안정적.	dpmpp_2m과 유사.	대부분의 작업에 추천되는 강력한 기본 선택지, 효율적인 고품질 생성.
dpmpp_sde_karras	SDE (무작위)	dpmpp_sde + Karras 노이즈 스케줄.	Karras 스케줄의 효율성 + SDE의 디테일/질감, 낮은 스텝에서 효율적.	무작위성.	SDE 스타일 선호 + 낮은 스텝 효율성 원할 때.
uni_pc	Predictor-Corrector	비교적 최신, 빠른 수렴 목표.	매우 낮은 스텝(10~15)에서도 괜찮은 품질 가능성, 속도 중시.	최신이라 상대적으로 검증/피드백 적을 수 있음, 모델/프롬프트 따라 결과 편차 가능성.	속도 최우선, 매우 낮은 스텝 실험.
lms / lms_karras	ODE (확정적)	고전적인 샘플러. Karras 버전은 효율 개선 시도.	비교적 안정적.	최신 샘플러 대비 특별한 장점 적을 수 있음.	다른 샘플러와 비교 실험용, 특정 모델에서 잘 맞을 경우.
heun	ODE (확정적)	Euler보다 정확도 높지만 느림 (스텝당 2배 계산).	품질 우수.	느림.	최고 품질 추구 시 (시간 여유 있을 때), Euler와 비교용.

scheduler: 샘플링 스텝에 따라 노이즈 수준을 어떻게 조절할지 결정합니다. (예: normal, karras, exponential) 선택한 샘플러와 함께 작동하며 결과에 영향을 줍니다.
denoise: (주로 KSampler Advanced나 이미지 수정 시 사용) 샘플링 시작 전 원본 잠재 공간 이미지에 얼마나 많은 노이즈를 추가할지 결정합니다. 1.0이면 완전히 새로운 이미지를 생성(Text-to-Image)하고, 값이 낮을수록(예: 0.5) 입력 이미지의 형태를 더 많이 유지합니다(Image-to-Image).

입력:
- model: Load Checkpoint에서 온 MODEL.
- positive: 긍정 프롬프트 CLIP Text Encode에서 온 CONDITIONING.
- negative: 부정 프롬프트 CLIP Text Encode에서 온 CONDITIONING.
- latent_image: Empty Latent Image 또는 다른 Latent 입력 노드에서 온 LATENT.
출력:
- LATENT: 샘플링 과정이 완료된 후의 잠재 공간 이미지입니다. VAE Decode 노드에 연결됩니다.

5. VAE Decode (VAE 디코더)

목적: KSampler에서 생성된 잠재 공간 이미지를 사람이 볼 수 있는 실제 픽셀 이미지로 변환합니다.
입력:
- samples: KSampler에서 출력된 최종 LATENT 이미지.
- vae: Load Checkpoint 노드에서 출력된 VAE 모델 (또는 별도의 Load VAE 노드).
출력:
- IMAGE: 최종적으로 생성된 픽셀 이미지 데이터입니다. Save Image 또는 Preview Image 노드에 연결됩니다.

6. Save Image (이미지 저장)

목적: 생성된 이미지를 파일로 저장합니다.
주요 속성:
- filename_prefix: 저장될 파일 이름의 접두사를 지정합니다. 기본값은 'ComfyUI'이며, 날짜, 시간, 시드 등의 정보를 포함하도록 설정할 수도 있습니다. (예: ComfyUI_%date%_%time%_)
입력:
- images: VAE Decode 노드에서 출력된 IMAGE 데이터.

7. Preview Image (이미지 미리보기)

목적: 생성된 이미지를 ComfyUI 인터페이스 내에서 직접 보여줍니다. 파일을 저장하지 않고 결과를 확인할 때 유용합니다.
입력:
- images: VAE Decode 노드에서 출력된 IMAGE 데이터.

728x90

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

글 보관함

알쏭달쏭

티스토리 뷰

ComfyUI의 기본 노드 설명

티스토리툴바