AI দিয়ে হাতের লেখা Bangla → Digital Text — OCR সম্পূর্ণ গাইড
নাজনীন আক্তার-এর মাকে তিনি হারিয়েছেন ২০২৩-এর ফেব্রুয়ারিতে। ঘরে রয়ে গেছে তাঁর মা'র ৩৭ বছরের diaries — ৯টা notebook, প্রায় ২,৪০০ পৃষ্ঠা handwritten Bangla। দাদীর পুরোনো recipes, ৬০ বছরের family history, নাজনীন-এর শৈশবের scribble। ২০২৪-এ তিনি একজন archivist-কে digitize-এর quote চেয়েছিলেন — ৳৪২,০০০, ৬ মাস সময়। ২০২৫-এর জুন-এ তিনি AI vision tools আবিষ্কার করলেন। নিজের iPhone-এ ১২ MP photo, Google Lens + Claude Vision + ChatGPT triple-verify workflow। ১৪ দিনে সম্পূর্ণ ২,৪০০ পৃষ্ঠা digitized — Word document, searchable PDF, এবং ১২০-page printed memorial book। মোট খরচ ৳১,২০০ (printing only)। প্রতিটি page-এ ৭৫-৯০% AI accuracy + manual cleanup। তাঁর পরিবারের ৩ generation-এর memory আজ digital আরকাইভ-এ — কারণ ২০২৬-এর Bangla handwriting OCR finally usable হয়েছে।
এই article সেই workflow + ৪টা actual tool comparison (Google Lens vs Claude Vision vs ChatGPT vs Gemini) + 5টা Bangla-specific challenge এবং তাদের solution। সাথে: কোন document AI দিয়ে never trust করবেন না।
২,৪০০ pagesনাজনীন digitize করেছেন ১৪ দিনে
৳৪২,০০০ → ৳১,২০০Archivist cost vs DIY AI cost
৭৫-৯০%Bangla handwriting OCR accuracy ২০২৬-এ
৯৫%+Printed Bangla OCR accuracy
২০২৬-এ Bangla OCR-এর state
২০২২-এ Bangla handwritten OCR ৪০-৫০% accuracy ছিল — practically unusable। ২০২৬-এর মাঝামাঝিতে major shift এসেছে:
- Google Lens: Bangla handwriting 70-85%, printed 95%+। Mobile-first, free, instant।
- Claude Sonnet 4.6 Vision: Best context-aware OCR। Handwriting 80-92%, printed 97%+। Limit: daily quota in free tier।
- ChatGPT Vision (GPT-5): Excellent printed, handwriting 75-88%। Context-aware cleanup unmatched।
- Gemini 3.5 Pro Vision: Handwriting 75-90%, particularly strong on old/faded document। Image-to-text plus structure preserving।
- Bangla-specific tools (BNLT, Bangla OCR by BUET): Improving but still trailing major model।
নাজনীন-এর exact 4-step workflow — ২,৪০০ pages, ১৪ দিনে
Step 1: Capture (Day 1-3)
- Smartphone camera: iPhone 13/Samsung S22+ minimum (12 MP+ resolution)।
- Lighting: Natural daylight, no direct sun (shadow problem)। Outside-near-window-এ best।
- Position: Phone directly above page, flat surface, no curve।
- App: Microsoft Lens, CamScanner, বা Notes-এর built-in document scan। Auto edge-detect + tilt-correct।
- Speed: ১ page = ১৫-২০ সেকেন্ড। ২,৪০০ pages = ১২ ঘণ্টা over 3 days।
- Save format: Cloud-sync folder (Google Drive)।
Step 2: OCR (Day 4-10)
Triple-verify workflow — same page-এ ৩ AI parallel:
- Primary: Google Lens (mobile): Photo upload, "Copy text" → Google Doc-এ paste। 70-85% accuracy।
- Cross-verify: Claude Sonnet 4.6 Vision: Same photo, prompt: "এই handwritten Bangla page-এর exact text type করো। কোনো word uncertain হলে [?] দিয়ে indicate। Structure preserve — paragraph, list, heading আলাদা।"
- Final fallback: ChatGPT Vision: Discrepancy থাকলে third opinion।
৩টা output side-by-side Google Doc-এ paste। যেগুলো ২+ AI agree করে — সঠিক। ১টায় unique — মা-র own handwriting compared। নাজনীন-এর daily output: ৮-১০ ঘণ্টা work-এ ১৭০-২২০ pages OCR-ready।
Step 3: Cleanup (Day 11-13)
OCR output Claude-এ paste, structured cleanup prompt:
"নিচের OCR text বাংলা handwriting থেকে। Cleanup করো: (১) Spelling/grammar correct, কিন্তু writer-এর voice preserve, (২) Paragraph structure (line break preserve), (৩) Date/name যেখানে আছে format করো, (৪) Uncertain word [?] flag preserve, (৫) Recipes/list items proper formatting। Output: clean Word-ready text।"
Step 4: Manual verification (Day 14)
Cleaned text একপাশে, original photo arekpose — verification reading। ১% real error rate detected। Final document Word + PDF + printed memorial book।
৪টা OCR tool — head-to-head (একই Bangla handwritten page)
Sample text: নাজনীন-এর মা'র ১৯৭৩-এর diary entry — Bangla cursive, ink slightly faded, ১২ লাইন।
- Google Lens: ১০ লাইন accurate, ২টায় minor error। ১২ সেকেন্ডে।
- Claude Sonnet 4.6 Vision: ১১ লাইন accurate, ১টায় [?] flag (uncertain)। ১৮ সেকেন্ডে। Context-aware cleanup শ্রেষ্ঠ।
- ChatGPT GPT-5 Vision: ১০-১১ accurate, faded ink সবচেয়ে ভালো decode। ১৫ সেকেন্ডে।
- Gemini 3.5 Pro Vision: ১১ accurate, structure preserve সেরা (paragraph break, list)। ১৪ সেকেন্ডে।
Verdict: Triple-verify (Lens + Claude + ChatGPT) — ৯৩-৯৫% combined accuracy। Single tool — ৮০-৯০%।
৫টা Bangla-specific challenge + solution
- যুক্তাক্ষর recognition: "প্রতি", "ক্ষমা", "জ্ঞান" — AI sometimes split। Solution: Manual verify-এ এদের priority।
- কার চিহ্ন position: "কি" vs "কী" — context-only decidable। Solution: Claude-এর context-aware OCR এই কাজে best।
- Author handwriting variation: পুরোনো generation-এর হস্তাক্ষর modern training data-তে under-represented। Solution: ৫টা page sample দিয়ে Claude-কে "এই author-এর handwriting style বুঝে নাও"।
- Faded/smudged ink: ৫০+ বছরের document-এ common। Solution: Photo edit (contrast + brightness)-এর পরে OCR। Adobe Photoshop AI Fill or Lightroom mobile।
- Mixed Bangla-English: Doctor prescription, recipe ("250g চিনি")। Solution: ChatGPT/Claude এই mixed best handle করে। Google Lens সবচেয়ে weak এখানে।
৭টা practical use case — যা ২০২৬-এ BD-তে possible
- Family heritage digitization: নাজনীন-এর case।
- Student class notes → searchable PDF: Semester-এর সব note OCR করে exam-prep-এ keyword search।
- Doctor prescription decoding: জটিল handwriting + medical terms। Patient-এর জন্য valuable, কিন্তু verify mandatory।
- Survey/form data entry: NGO field worker-এর hand-written form → digital database।
- Court document/legal paperwork: Wakf deed, পুরোনো property document। Legal lawyer verify mandatory।
- Recipe book digitization: Bangla traditional recipes preservation।
- Historical document research: Library archive, journalism archive।
সাবধান — যেখানে AI OCR-এ trust করবেন না
Critical use cases যেখানে manual verification mandatory:
- Medical prescription: Wrong drug/dose → life-threatening।
- Legal document: Date, amount, name একটি ভুল legal liability।
- Financial document: ৳-amount, account number।
- Religious text: Verse/sloka — accuracy reverent।
- Personal heritage: Family member-এর exact wording valuable — manual care।
উপসংহার — আপনার আজকের পদক্ষেপ
নাজনীন বলেন: "৪২ হাজার টাকা + ৬ মাস-এর alternative-এ আমি ৮ ঘণ্টা daily commit-এ ২ সপ্তাহে আমার মা'র heritage save করেছি। AI আমার work করে দেয়নি — আমাকে work-করতে সক্ষম করেছে। তিন generation-এর memory আজ আমার ছেলে-মেয়ের কাছে accessible। সেটা কোনো archivist-এর ৪২ হাজার টাকা-র চেয়ে মূল্যবান।" আজই করুন: আপনার বাসায় যে handwritten document বছরের পর বছর digitize হবে বলে অপেক্ষায় আছে — সেই ১টা page-এর photo তুলুন এখনই। Google Lens-এ scan করুন। Claude/ChatGPT Vision-এ cross-verify। ১০ মিনিটে আপনি বুঝবেন এই workflow আপনার next ১,০০০ pages-এর জন্য কাজ করবে কি না। নাজনীন এই workflow আজ ২,৪০০ pages-এ scale করেছেন — আপনিও পারবেন।
প্রাসঙ্গিক টুলস ও গাইড
AI আপডেট পেতে চান?
প্রতি সপ্তাহে নতুন AI টুলস ও টিউটোরিয়াল বাংলায় পান।
ফ্রি নিউজলেটার। যেকোনো সময় আনসাবস্ক্রাইব করতে পারবেন।