Stable Diffusion के लिए LoRA मॉडल कैसे ट्रेन करें

LoRA (Low-Rank Adaptation) एक efficient तकनीक है जो आपको कम computational resources के साथ Stable Diffusion model को fine-tune करने की अनुमति देती है। यह technique आपको specific styles, characters, या objects के लिए custom model बनाने में मदद करती है।

  1. Training environment setup करें. Python 3.10+ install करें और virtual environment बनाएं। `pip install torch torchvision xformers diffusers transformers accelerate` command चलाकर required libraries install करें। CUDA-compatible GPU (minimum 8GB VRAM) की जरूरत होगी efficient training के लिए।
  2. Dataset तैयार करें. 15-50 high-quality images collect करें जो आपके desired style या subject को represent करते हों। Images को 512x512 pixels में resize करें। हर image के लिए descriptive caption file (.txt) बनाएं same filename के साथ।
  3. Kohya_ss GUI tool download करें. GitHub से kohya_ss repository clone करें: `git clone https://github.com/bmaltais/kohya_ss.git`। Directory में navigate करके `setup.bat` (Windows) या `setup.sh` (Linux/Mac) run करें। यह सभी dependencies install करेगा।
  4. Training configuration set करें. Kohya GUI launch करें `gui.py` script के साथ। LoRA tab में जाकर base model path (stable-diffusion-v1-5), output directory, और dataset folder specify करें। Learning rate 1e-4, batch size 1, और epochs 10-20 set करें starting values के रूप में।
  5. Network settings configure करें. Network Rank 32-128 के बीच set करें (higher values = more detailed learning)। Network Alpha को Rank के आधे के बराबर रखें। Optimizer को AdamW8bit select करें memory efficiency के लिए। Resolution 512x512 रखें।
  6. Training process शुरू करें. सभी settings verify करने के बाद 'Start Training' button click करें। Training progress terminal में दिखेगी। Process में 30 minutes से 2 hours तक लग सकते हैं dataset size के अनुसार। Loss values gradually decrease होनी चाहिए।
  7. Trained LoRA model test करें. Output folder से .safetensors file को अपने Stable Diffusion interface (Automatic1111 WebUI या ComfyUI) के models/Lora folder में copy करें। Interface restart करके LoRA को activate करें prompt में `<lora:filename:0.7>` के साथ।
  8. Results को fine-tune करें. अगर results satisfactory नहीं हैं तो learning rate कम करें या training epochs बढ़ाएं। Overfitting के लिए check करें - अगर model केवल training images जैसे output generate कर रहा है तो dataset diversity बढ़ाएं या epochs कम करें।

Related

  • AI का उपयोग करके मीटिंग्स का ट्रांसक्रिप्शन कैसे करें
  • रियल टाइम में आवाज़ का AI अनुवाद कैसे करें
  • ऑडियोबुक के लिए AI नैरेशन कैसे बनाएं
  • YouTube वीडियो के लिए AI नैरेशन कैसे बनाएं
  • Adobe Podcast AI से ऑडियो साफ कैसे करें
  • Descript में AI का उपयोग करके ऑडियो एडिटिंग कैसे करें