Stable Diffusion বাংলা ইনস্টল গাইড — নিজের কম্পিউটারে Local AI Image
ভূমিকা — Mirpur-এর এক game artist-এর local SD setup
মিরপুর ১০-এর এক freelance 3D/game artist শাহরিয়ার রহমান — ২৬ বছর, IUT CSE ২০২২ batch, ৩ বছর Unity game development experience। ২০২৪-এ একটা US-based indie game studio-র contract পেলেন: ৭০০+ concept art deliverable, ৬ মাস deadline, $৪,২০০ total। Midjourney monthly $৩০ পরিকল্পনা ছিল, কিন্তু complex variants + style consistency-এ Midjourney limited (paid tier-এ commercial use OK, কিন্তু per-image control low)। বন্ধু Tausif suggest করল local Stable Diffusion + ComfyUI। শাহরিয়ারের desktop: RTX 3060 12GB + 32GB RAM + i5-12400। ৩ দিন setup, learning curve ২ সপ্তাহ। পরে: per image generation cost effectively ০ taka (electricity ৳১২/দিন), unlimited iterations, ControlNet + LoRA দিয়ে precise style control। ৬ মাসে contract delivered + extra clients onboard। এই গাইড সেই workflow।
এই গাইডে যা থাকবে: কেন local Stable Diffusion, hardware minimum requirements, Automatic1111 (Windows install), ComfyUI (advanced workflow), Civitai থেকে model download, BD users-এর জন্য practical tips, সাধারণ সমস্যা + সমাধান।
কেন Local Stable Diffusion?
- Free forever: Once setup, per-image cost ০। Electricity-ই ব্যয়।
- Unlimited iterations: Cloud tools-এ daily/monthly limit। Local-এ infinite।
- Privacy: Client data/concept art cloud-এ যায় না। NDA-protected work-এ critical।
- Custom models: Civitai-তে ৩০,০০০+ community models। Niche style (anime, photorealism, architecture) — pretrained available।
- ControlNet + LoRA: Precise control — pose, depth, edge, style — cloud tools-এ limited।
- Offline: Internet ছাড়া কাজ চলে। Power outage backup-এ valuable।
- Commercial: Most SD models commercial use allowed (license check)।
হার্ডওয়্যার minimum
Minimum (entry)
NVIDIA GTX 1660 6GB
16GB RAM
SD 1.5 only
Comfortable (recommended)
NVIDIA RTX 3060 12GB
32GB RAM
SDXL + LoRA
Best (pro)
NVIDIA RTX 4090 24GB
64GB RAM
SDXL + multi-LoRA + Flux
Storage
SSD 500GB+ (models heavy)
Models 5-15GB each
- AMD GPU: Possible via ROCm/DirectML, performance ~৭০% of NVIDIA। NVIDIA recommended।
- Apple Silicon (M1/M2/M3): Works via DiffusionBee app। Slower than NVIDIA but functional।
- BD pricing reality (২০২৬): RTX 3060 12GB ~৳৪২,০০০ (used)। RTX 4060 16GB ~৳৬০,০০০। RTX 4070 ৳৮৫,০০০+।
Automatic1111 (সবচেয়ে popular) — Windows-এ install
Step 1: Prerequisites
- Python 3.10.6 download (specific version, latest doesn't work) — python.org
- Git download — git-scm.com
- "Add Python to PATH" check করুন install-এ
Step 2: Download Automatic1111
- github.com/AUTOMATIC1111/stable-diffusion-webui
- Open folder you want (e.g., C:\AI\SD)
- Right-click → "Git Bash Here" → command:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Step 3: First run
- Folder-এ
webui-user.bat double-click
- First run: ১০-৩০ minutes (dependencies + base model download)
- Browser auto-opens: localhost:7860
- "txt2img" tab → prompt → "Generate"
ComfyUI (advanced workflow)
Automatic1111-এর alternative — node-based visual workflow। Power users-এর জন্য better।
- github.com/comfyanonymous/ComfyUI
- Node-based: each step (model load, sampler, decoder) আলাদা node
- Complex workflows save + share possible
- SDXL + Flux + advanced LoRA stacking
- Shahriar's choice: ComfyUI (precision-এর জন্য)
Model download — Civitai
civitai.com — Stable Diffusion community-র model hub।
- Base models: SD 1.5, SDXL, FLUX dev
- Style models (LoRA): Photorealistic, anime, architectural, vintage
- Subject models: Specific character, brand style
- ControlNet: Pose, depth, edge guidance models
Shahriar-এর favorite models:
- Juggernaut XL (photorealistic)
- RealVis XL (humans + portraits)
- Animagine XL (anime/2D style)
- Architectural Designs LoRA (buildings, interiors)
বাংলাদেশি ব্যবহারকারীদের জন্য টিপস
- Internet bandwidth: Model download 5-15GB each। Robi/GP unlimited night plan ব্যবহার করুন।
- Electricity: ১ generation ~৫-১৫ seconds @ 200-300W। Daily ৫০ generations = ০.৫-১ kWh = ৳৬-১২।
- Cooling: Summer-এ GPU temp 80°C+ হতে পারে। Case fan + thermal paste check।
- Storage: Models + outputs দ্রুত accumulate। 2TB SSD recommended।
- Backup: Important LoRA/workflows external drive-এ backup।
সাধারণ সমস্যা
- "CUDA out of memory": --medvram or --lowvram flag webui-user.bat-এ add।
- Slow generation: xformers install (
pip install xformers) — 30% speed up।
- Bangla prompt doesn't work: SD-এ Bangla prompt support নেই — English-এ describe।
- Output blurry/low-quality: Steps 20+, Sampler "DPM++ 2M Karras", CFG 7-9 try।
- Hands deformed: Negative prompt-এ "bad hands, extra fingers" + use "ADetailer" extension।
উপসংহার
Shahriar বলেন: "Local SD-এর learning curve steep — ২ সপ্তাহ struggle। কিন্তু একবার set up + master হলে, cloud tools-এর চেয়ে ১০০x flexibility। Per image cost ০, NDA-protected client work safe, unlimited experimentation।"
BD-র creative professional-দের জন্য local Stable Diffusion একটা long-term investment। GPU ৳৪০-৬০K initial cost, কিন্তু ROI ৬-১২ মাসে। আপনি যদি serious creator/designer/game artist — local SD শুরু করুন। প্রথমে Automatic1111, পরে ComfyUI।
প্রাসঙ্গিক টুলস ও গাইড
AI আপডেট পেতে চান?
প্রতি সপ্তাহে নতুন AI টুলস ও টিউটোরিয়াল বাংলায় পান।
ফ্রি নিউজলেটার। যেকোনো সময় আনসাবস্ক্রাইব করতে পারবেন।