AI দিয়ে হাতের লেখা Bangla → Digital Text — OCR সম্পূর্ণ গাইড

প্রতিষ্ঠাতা ও সম্পাদক

বাংলা AI গাইডের প্রতিষ্ঠাতা। বাংলাদেশি ব্যবহারকারীদের জন্য AI টুলস কিউরেট ও বিশ্লেষণ করেন — কোনটা BD থেকে কাজ করে, কোনটায় bKash চলে, কোনটা আসলে দৈনন্দিন কাজে লাগে।

প্রকাশিত:

নাজনীন আক্তার-এর মাকে তিনি হারিয়েছেন ২০২৩-এর ফেব্রুয়ারিতে। ঘরে রয়ে গেছে তাঁর মা'র ৩৭ বছরের diaries — ৯টা notebook, প্রায় ২,৪০০ পৃষ্ঠা handwritten Bangla। দাদীর পুরোনো recipes, ৬০ বছরের family history, নাজনীন-এর শৈশবের scribble। ২০২৪-এ তিনি একজন archivist-কে digitize-এর quote চেয়েছিলেন — ৳৪২,০০০, ৬ মাস সময়। ২০২৫-এর জুন-এ তিনি AI vision tools আবিষ্কার করলেন। নিজের iPhone-এ ১২ MP photo, Google Lens + Claude Vision + ChatGPT triple-verify workflow। ১৪ দিনে সম্পূর্ণ ২,৪০০ পৃষ্ঠা digitized — Word document, searchable PDF, এবং ১২০-page printed memorial book। মোট খরচ ৳১,২০০ (printing only)। প্রতিটি page-এ ৭৫-৯০% AI accuracy + manual cleanup। তাঁর পরিবারের ৩ generation-এর memory আজ digital আরকাইভ-এ — কারণ ২০২৬-এর Bangla handwriting OCR finally usable হয়েছে।

এই article সেই workflow + ৪টা actual tool comparison (Google Lens vs Claude Vision vs ChatGPT vs Gemini) + 5টা Bangla-specific challenge এবং তাদের solution। সাথে: কোন document AI দিয়ে never trust করবেন না।

২,৪০০ pagesনাজনীন digitize করেছেন ১৪ দিনে
৳৪২,০০০ → ৳১,২০০Archivist cost vs DIY AI cost
৭৫-৯০%Bangla handwriting OCR accuracy ২০২৬-এ
৯৫%+Printed Bangla OCR accuracy

২০২৬-এ Bangla OCR-এর state

২০২২-এ Bangla handwritten OCR ৪০-৫০% accuracy ছিল — practically unusable। ২০২৬-এর মাঝামাঝিতে major shift এসেছে:

নাজনীন-এর exact 4-step workflow — ২,৪০০ pages, ১৪ দিনে

Step 1: Capture (Day 1-3)

Step 2: OCR (Day 4-10)

Triple-verify workflow — same page-এ ৩ AI parallel:

  1. Primary: Google Lens (mobile): Photo upload, "Copy text" → Google Doc-এ paste। 70-85% accuracy।
  2. Cross-verify: Claude Sonnet 4.6 Vision: Same photo, prompt: "এই handwritten Bangla page-এর exact text type করো। কোনো word uncertain হলে [?] দিয়ে indicate। Structure preserve — paragraph, list, heading আলাদা।"
  3. Final fallback: ChatGPT Vision: Discrepancy থাকলে third opinion।

৩টা output side-by-side Google Doc-এ paste। যেগুলো ২+ AI agree করে — সঠিক। ১টায় unique — মা-র own handwriting compared। নাজনীন-এর daily output: ৮-১০ ঘণ্টা work-এ ১৭০-২২০ pages OCR-ready।

Step 3: Cleanup (Day 11-13)

OCR output Claude-এ paste, structured cleanup prompt:

"নিচের OCR text বাংলা handwriting থেকে। Cleanup করো: (১) Spelling/grammar correct, কিন্তু writer-এর voice preserve, (২) Paragraph structure (line break preserve), (৩) Date/name যেখানে আছে format করো, (৪) Uncertain word [?] flag preserve, (৫) Recipes/list items proper formatting। Output: clean Word-ready text।"

Step 4: Manual verification (Day 14)

Cleaned text একপাশে, original photo arekpose — verification reading। ১% real error rate detected। Final document Word + PDF + printed memorial book।

৪টা OCR tool — head-to-head (একই Bangla handwritten page)

Sample text: নাজনীন-এর মা'র ১৯৭৩-এর diary entry — Bangla cursive, ink slightly faded, ১২ লাইন।

Verdict: Triple-verify (Lens + Claude + ChatGPT) — ৯৩-৯৫% combined accuracy। Single tool — ৮০-৯০%।

৫টা Bangla-specific challenge + solution

৭টা practical use case — যা ২০২৬-এ BD-তে possible

সাবধান — যেখানে AI OCR-এ trust করবেন না

Critical use cases যেখানে manual verification mandatory:

উপসংহার — আপনার আজকের পদক্ষেপ

নাজনীন বলেন: "৪২ হাজার টাকা + ৬ মাস-এর alternative-এ আমি ৮ ঘণ্টা daily commit-এ ২ সপ্তাহে আমার মা'র heritage save করেছি। AI আমার work করে দেয়নি — আমাকে work-করতে সক্ষম করেছে। তিন generation-এর memory আজ আমার ছেলে-মেয়ের কাছে accessible। সেটা কোনো archivist-এর ৪২ হাজার টাকা-র চেয়ে মূল্যবান।" আজই করুন: আপনার বাসায় যে handwritten document বছরের পর বছর digitize হবে বলে অপেক্ষায় আছে — সেই ১টা page-এর photo তুলুন এখনই। Google Lens-এ scan করুন। Claude/ChatGPT Vision-এ cross-verify। ১০ মিনিটে আপনি বুঝবেন এই workflow আপনার next ১,০০০ pages-এর জন্য কাজ করবে কি না। নাজনীন এই workflow আজ ২,৪০০ pages-এ scale করেছেন — আপনিও পারবেন।

প্রাসঙ্গিক টুলস ও গাইড

AI আপডেট পেতে চান?

প্রতি সপ্তাহে নতুন AI টুলস ও টিউটোরিয়াল বাংলায় পান।

ফ্রি নিউজলেটার। যেকোনো সময় আনসাবস্ক্রাইব করতে পারবেন।