티스토리 뷰

AI/AI 이미지

ComfyUI의 기본 노드 설명

silbaram 2025. 4. 24. 00:57
728x90

 

 

 

 

1. Load Checkpoint (모델 로더)

  • 목적: 이미지 생성의 기반이 되는 주 모델 파일(.ckpt 또는 .safetensors 확장자)을 불러옵니다. 이 모델에는 이미지 생성 방식과 스타일 정보가 포함되어 있습니다.
  • 주요 속성:
    • ckpt_name: 드롭다운 목록에서 사용할 체크포인트 모델 파일을 선택합니다. ComfyUI 설치 폴더 내의 models/checkpoints 디렉토리에 있는 파일들이 표시됩니다.
  • 출력:
    • MODEL: 주 확산 모델(U-Net 등) 자체입니다. KSampler 노드에 연결됩니다.
    • CLIP: 텍스트 프롬프트를 이해하는 데 사용되는 언어 모델입니다. CLIP Text Encode 노드에 연결됩니다.
    • VAE: 잠재 공간(Latent Space)의 이미지를 실제 픽셀 이미지로 변환하거나 그 반대로 변환하는 모델입니다. VAE Decode 또는 VAE Encode 노드에 연결됩니다.

2. CLIP Text Encode (프롬프트 인코더)

  • 목적: 사용자가 입력한 텍스트 프롬프트(긍정 또는 부정)를 모델이 이해할 수 있는 형태(임베딩 또는 컨디셔닝)로 변환합니다. 일반적으로 긍정 프롬프트용과 부정 프롬프트용으로 두 개의 노드를 사용합니다.
  • 주요 속성:
    • text: 텍스트 프롬프트를 입력하는 필드입니다. 긍정 프롬프트 노드에는 생성하려는 이미지의 특징(예: "beautiful landscape, sunset, highly detailed")을, 부정 프롬프트 노드에는 피하고 싶은 특징(예: "ugly, deformed, blurry, low quality")을 입력합니다.
  • 입력:
    • clip: Load Checkpoint 노드에서 출력된 CLIP 모델을 연결합니다.
  • 출력:
    • CONDITIONING: 인코딩된 프롬프트 정보입니다. KSampler 노드의 positive 또는 negative 입력에 연결됩니다.

3. Empty Latent Image (빈 잠재 공간 이미지)

  • 목적: 이미지 생성을 시작할 빈 '캔버스'를 잠재 공간(Latent Space)에 생성합니다. 실제 이미지가 아니라 모델이 작업하는 추상적인 데이터 공간입니다.
  • 주요 속성:
    • width, height: 생성될 잠재 공간 이미지의 너비와 높이를 설정합니다. 이 값은 최종 이미지 크기와 직접적인 관련이 있습니다 (일반적으로 VAE에 따라 1/8 크기). 모델이 학습된 해상도(예: 512x512, 768x768, 1024x1024)에 맞춰 설정하는 것이 좋습니다.
    • batch_size: 한 번에 생성할 이미지의 개수를 설정합니다. 높이면 여러 이미지를 동시에 생성하지만 VRAM 사용량이 늘어납니다.
  • 출력:
    • LATENT: 생성된 빈 잠재 공간 이미지 데이터입니다. KSampler 노드의 latent_image 입력에 연결됩니다.

4. KSampler (또는 KSampler Advanced)

  • 목적: 핵심적인 이미지 생성(확산) 프로세스를 수행합니다. 입력된 모델, 프롬프트, 잠재 공간 이미지를 사용하여 노이즈를 점진적으로 제거하고 프롬프트에 맞는 이미지로 변환합니다.
  • 주요 속성:
    • seed: 노이즈 생성 및 샘플링 과정의 무작위성을 제어하는 숫자입니다. 같은 시드값을 사용하면 동일한 조건에서 같은 이미지를 다시 생성할 수 있습니다. 'randomize' 버튼으로 무작위 시드를 생성할 수 있습니다.
    • steps: 샘플링 과정의 반복 횟수입니다. 높을수록 이미지 품질이 향상될 수 있지만 생성 시간이 길어집니다. 일반적으로 20~40 사이 값을 많이 사용합니다.
    • cfg (Classifier Free Guidance Scale): 생성된 이미지가 프롬프트를 얼마나 강하게 따를지 결정하는 값입니다. 너무 낮으면(예: 1~4) 프롬프트와 관련 없는 이미지가 나올 수 있고, 너무 높으면(예: 15 이상) 색상이 과도하게 강해지거나 왜곡될 수 있습니다.. 보통 5~10 사이 값을 사용합니다.
    • sampler_name: 사용할 샘플링 알고리즘을 선택합니다. (예: euler, dpmpp_2m_karras, lms) 샘플러 종류에 따라 이미지 결과물의 스타일이나 품질, 생성 속도가 달라질 수 있습니다.
      샘플러 이름 종류/기반 특징 장점 단점 추천 사용 경우
      euler ODE (확정적) 가장 기본적이고 빠름. 단순함. 속도 빠름, 예측 가능, 기본 베이스라인. 고품질 위해 스텝 수 더 필요할 수 있음, 다소 밋밋한 결과 가능성. 빠른 테스트, 프롬프트 실험, 안정적인 기본 결과 필요시.
      euler_ancestral Ancestral (무작위) Euler 기반 + 스텝별 노이즈 추가. 창의적/다양한 결과 가능성, 낮은 스텝에서 흥미로운 결과 가능. 스텝 수 변경 시 결과 달라짐 (비결정성), 일관성 낮을 수 있음, 예측 어려움. 다양한 변형 탐색, 창의적인 결과 원할 때, 정확한 재현 불필요시.
      dpmpp_2m ODE (확정적) DPM-Solver++ (2차). 속도와 품질 균형 우수. 속도 대비 품질 매우 좋음, 선명하고 안정적인 결과. 일부 사용자는 SDE 계열보다 덜 유기적이라 느낄 수 있음. 범용적인 고품질 생성, 신뢰성 있는 결과 필요시 (좋은 기본 선택지).
      dpmpp_sde SDE (무작위) DPM-Solver++ (SDE 기반). 디테일/질감 표현 우수. 디테일/질감 표현 좋음, 사진적이거나 회화적인 느낌 줄 수 있음. 무작위성 (결과 약간씩 변함), dpmpp_2m보다 약간 느릴 수 있음. 높은 디테일/질감 표현 목표, 사진/회화 스타일, 약간의 변형 허용 가능 시.
      dpmpp_2m_karras ODE (확정적) dpmpp_2m + Karras 노이즈 스케줄. 매우 인기 있음. 낮은 스텝(20~30)에서도 고품질, 속도/품질 효율 극대화, 안정적. dpmpp_2m과 유사. 대부분의 작업에 추천되는 강력한 기본 선택지, 효율적인 고품질 생성.
      dpmpp_sde_karras SDE (무작위) dpmpp_sde + Karras 노이즈 스케줄. Karras 스케줄의 효율성 + SDE의 디테일/질감, 낮은 스텝에서 효율적. 무작위성. SDE 스타일 선호 + 낮은 스텝 효율성 원할 때.
      uni_pc Predictor-Corrector 비교적 최신, 빠른 수렴 목표. 매우 낮은 스텝(10~15)에서도 괜찮은 품질 가능성, 속도 중시. 최신이라 상대적으로 검증/피드백 적을 수 있음, 모델/프롬프트 따라 결과 편차 가능성. 속도 최우선, 매우 낮은 스텝 실험.
      lms / lms_karras ODE (확정적) 고전적인 샘플러. Karras 버전은 효율 개선 시도. 비교적 안정적. 최신 샘플러 대비 특별한 장점 적을 수 있음. 다른 샘플러와 비교 실험용, 특정 모델에서 잘 맞을 경우.
      heun ODE (확정적) Euler보다 정확도 높지만 느림 (스텝당 2배 계산). 품질 우수. 느림. 최고 품질 추구 시 (시간 여유 있을 때), Euler와 비교용.
    • scheduler: 샘플링 스텝에 따라 노이즈 수준을 어떻게 조절할지 결정합니다. (예: normal, karras, exponential) 선택한 샘플러와 함께 작동하며 결과에 영향을 줍니다.
    • denoise: (주로 KSampler Advanced나 이미지 수정 시 사용) 샘플링 시작 전 원본 잠재 공간 이미지에 얼마나 많은 노이즈를 추가할지 결정합니다. 1.0이면 완전히 새로운 이미지를 생성(Text-to-Image)하고, 값이 낮을수록(예: 0.5) 입력 이미지의 형태를 더 많이 유지합니다(Image-to-Image).
  • 입력:
    • model: Load Checkpoint에서 온 MODEL.
    • positive: 긍정 프롬프트 CLIP Text Encode에서 온 CONDITIONING.
    • negative: 부정 프롬프트 CLIP Text Encode에서 온 CONDITIONING.
    • latent_image: Empty Latent Image 또는 다른 Latent 입력 노드에서 온 LATENT.
  • 출력:
    • LATENT: 샘플링 과정이 완료된 후의 잠재 공간 이미지입니다. VAE Decode 노드에 연결됩니다.

 

5. VAE Decode (VAE 디코더)

  • 목적: KSampler에서 생성된 잠재 공간 이미지를 사람이 볼 수 있는 실제 픽셀 이미지로 변환합니다.
  • 입력:
    • samples: KSampler에서 출력된 최종 LATENT 이미지.
    • vae: Load Checkpoint 노드에서 출력된 VAE 모델 (또는 별도의 Load VAE 노드).
  • 출력:
    • IMAGE: 최종적으로 생성된 픽셀 이미지 데이터입니다. Save Image 또는 Preview Image 노드에 연결됩니다.

6. Save Image (이미지 저장)

  • 목적: 생성된 이미지를 파일로 저장합니다.
  • 주요 속성:
    • filename_prefix: 저장될 파일 이름의 접두사를 지정합니다. 기본값은 'ComfyUI'이며, 날짜, 시간, 시드 등의 정보를 포함하도록 설정할 수도 있습니다. (예: ComfyUI_%date%_%time%_)
  • 입력:
    • images: VAE Decode 노드에서 출력된 IMAGE 데이터.

7. Preview Image (이미지 미리보기)

  • 목적: 생성된 이미지를 ComfyUI 인터페이스 내에서 직접 보여줍니다. 파일을 저장하지 않고 결과를 확인할 때 유용합니다.
  • 입력:
    • images: VAE Decode 노드에서 출력된 IMAGE 데이터.

 

 

 

728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함