শুদ্ধশব্দ

শুদ্ধশব্দ একটি বাংলা স্পেলচেকার। এটি ডেভালপ করা হয়েছে মাইক্রোসফট ওয়ার্ড অ্যাড-ইন হিসেবে। এর শব্দভাণ্ডারে রয়েছে ১, ০৬, ০০০ এরও বেশি শব্দ যা সম্পূর্ণ আধুনিক বাংলা বানানের নিয়ম অনুসারে প্রণীত । স্পেলচেকারটি এই স্বল্প পরিমান শব্দ দিয়েই বাংলায় সম্ভব এমন কয়েকশো কোটি শব্দ নিখুঁতভাবে পরীক্ষা করতে পারে। ভুল হিসেবে চিহ্নিত শব্দর সম্ভাব্য সঠিক শব্দের পরামর্শ তালিকা তৈরি করতে স্পেলচেকারটি ধ্বনিতাত্ত্বিক, রূপতাত্ত্বিক, শব্দের সম্পাদনার দূরত্ব, ব্যবহারকৃত কিবোর্ড এবং ব্যাকরণসহ আরও অনেক বিষয়াদি বিবেচনা করে। পরামর্শের তালিকা প্রণয়নের পর সেগুলিকে আবার নৈকট্যের মাত্রা অনুসারে সাজায়। পরামর্শ তালিকা সাধারণত যথা সম্ভব সংক্ষিপ্ত রাখা হয়।

বৃহস্পতিবার, ৮ জুলাই, ২০১০

শুদ্ধশব্দ বাংলা স্পেলচেকার বৃত্তান্ত

প্রারম্ভ কথা
বাংলা প্রকাশনা শিল্প সম্পূর্ণ কম্পিউটার নির্ভর হয়ে গেছে। শুধু প্রকাশনা শিল্পই নয় প্রায় সকল ধরনের বাংলা ব্যবহারকারীই ওয়ার্ড প্রসেসিংয়ের জন্য কম্পিউটারের উপর নির্ভরশীল হয়ে পড়েছেন। কারণ কম্পিউটার হলো সেই প্রযুক্তি যা আমাদের বাংলা প্রক্রিয়াকরণের কাজে বহু জটিলতার অবসান ঘটিয়েছে।
কম্পিউটার দিয়ে সহজে লেখা যায়। বিভিন্ন রকম ফন্ট ব্যবহার করা যায়। ফরম্যাটিং করা যায় ইচ্ছা মতো। এজন্য ওয়ার্ড প্রসেসরের সাথে ব্যবহার উপযোগী বেশ কিছু বাংলা কিবোর্ড ইন্টারফেস এবং ফন্টও পাওয়া যায়। কিন্তু এখনও একটা সমস্যা রয়েই গেছে যা আমাদের প্রকাশনা শিল্পের কাজের গতিকে করছে মারাত্মক রকম সময় ও শ্রম সাধ্য।প্রতিটি টাইপ করা ডকুমেন্টকেই ছাপার পূর্বে প্রুফ দেখে নিতে হয়। এমনিতেই বাংলা ভাষার বানান ধ্বনিমূলক নয় সাথে মানুষের হরেক রকম সীমাবদ্ধতা-সব মিলে বহু সময় ও শ্রম ব্যয়ের পরও নানা রকম ভুল। এই অবস্থার বিপ্লবাত্মক পরিবর্তন ঘটতে পারে যদি গাণিতিকভাবে পরিশুদ্ধ কম্পিউটারকে আমরা এই কাজে ব্যবহার করতে পারি।
কম্পিউটার ভিত্তিক বানান পরীক্ষণ সময়ের সাশ্রয় ঘটাবে নাটকীয়ভাবে। একটি ৩০০ পৃষ্ঠার বই যার প্রুফ দেখতে কমপক্ষে দুই মাস প্রয়োজন হতো তা তিন থেকে পাঁচ দিনের ভেতর সম্ভব হবে। (সময়ের এই সাশ্রয়ের পরিমাণ কার্যক্ষেত্রে দেখা গেছে আরও অনেক বেশি।) তাছাড়া কম্পিউটারের পরীক্ষণ পরিশুদ্ধতা ত্র“টি-প্রবণ মানুষের দ্বারা কখনই সম্ভব নয়। কম্পিউটার দ্বারা সম্ভব হবে সকল আধুনিক বানানের পুঙ্খানুপুঙ্খ প্রয়োগ এবং একমাত্র কম্পিউটার দ্বারাই সম্ভব একটি ডকুমেন্টের বানানের ধারাবাহিকতা রক্ষা করা।
বাংলা প্রকাশনার এই শূন্যতা পূরণের নিমিত্তেই শুদ্ধশব্দ ১.০ বাংলা স্পেলচেকার। বাংলা ভাষার লিখন পদ্ধতির সকল জটিলতা কাটিয়ে শুদ্ধশব্দ অত্যন্ত উন্নত প্রযুক্তি সংবলিত বাংলা স্পেলচেকার। এটি ব্যবহার করা যাবে বিশ্বব্যাপী ব্যবহৃত মাইক্রোসফ্ট ওয়ার্ডের সাথে। ফলে এখন থেকে প্রয়োজন হলেই কম্পিউটারের সাহায্য নিয়ে বানান সংশোধন করা যাবে যা বাঁচিয়ে দেবে ব্যবহারকারীর বহু মূল্যবান সময় এবং শ্রম।

শুদ্ধশব্দ বাংলা স্পেলচেকার:
স্পেলচেকার হলো এক ধরনের কম্পিউটার প্রোগ্রাম যা কম্পিউটারের স্মৃতিতে রক্ষিত শব্দের অভিধান ব্যবহার করে শব্দের বানান পরীক্ষা করে। এখানে শব্দ বলতে বোঝায় একটি স্পেস বা যতিচিহ্ন থেকে আরেকটি যতিচিহ্নের মধ্যবর্তী অক্ষরের সমষ্টি। বাংলায় স্পেলচেকারকে শব্দবীক্ষণ যন্ত্রও বলা যেতে পারে। বানান পরীক্ষার ক্ষেত্রে স্পেলচেকার যদি শব্দটি রক্ষিত বানান অভিধানে না পায় তবে শব্দটিকে ভুল হিসেবে চিহ্নিত করে। স্পেলচেকারের আরেকটি কাজ হলো ভুল হিসেবে চিহ্নিত শব্দটির সম্ভাব্য সঠিক শব্দের পরামর্শ তালিকা তৈরি করা। এই পরামর্শ তালিকা তৈরি করতে স্পেলচেকার ধ্বনিতাত্ত্বিক, রূপতাত্ত্বিক, শব্দের সম্পাদনার দূরত্ব, ব্যবহারকৃত কিবোর্ড এবং ব্যাকরণসহ আরও অনেক বিষয়াদি বিবেচনা করে। পরামর্শের তালিকা প্রণয়নের পর সেগুলিকে আবার নৈকট্যের মাত্রা অনুসারে সাজায়। পরামর্শ তালিকা সাধারণত যথা সম্ভব সংক্ষিপ্ত রাখা হয়।

সংক্ষিপ্ত কার্যপ্রণালী
শুদ্ধশব্দ একটি বাংলা স্পেলচেকার। এটি মাইক্রোসফ্ট ওয়ার্ডের অ্যাড-ইন হিসেবে ডেভালপ করা হয়েছে। এটি ইনস্টল করার পর মাইক্রোসফ্ট ওয়ার্ডে দুটি বাটন তৈরি করে, যথা: ক) Bangla spelling খ) Mark Error Words। যে কোনো একটি বাটন ক্লিক করলেই স্পেলচেকারটি লোড হবে এবং কারসরের অবস্থান থেকে ডকুমেন্টের শেষ পর্যন্ত বানান পরীক্ষা করবে। প্রথম বাটনটি ক্লিক করলে স্পেলচেকার ডায়ালগ বক্স আসবে যা ভুল শব্দ পেলেই বানান পরীক্ষা বন্ধ করে দেবে এবং ভুল শব্দের জন্য সম্ভাব্য সঠিক শব্দের একটি পরামর্শ তালিকা তৈরি করবে। এরপর ব্যবহারকারীর নির্দেশ অনুযায়ী ভুলশব্দটি সংশোধন করবে অথবা পরবর্তী ভুল শব্দটি অনুসন্ধান করবে। দ্বিতীয় বাটনটি ক্লিক করলে, স্পেলচেকারটি কারসর অবস্থান থেকে ডকুমেন্টের শেষ পর্যন্ত টাইপের ভুল হওয়া শব্দগুলিকে নীল এবং বানানের ভুল হওয়া শব্দগুলিকে লাল রং দিয়ে চিহ্নিত করবে।

বৈশিষ্ট্যসমূহ:
১. শব্দভাণ্ডার
শব্দভাণ্ডারটি প্রণীত হয়েছে সম্পূর্ণ আধুনিক বাংলা বানানের নিয়ম অনুসারে। এখানে রয়েছে ১, ০৬, ০০০ এরও বেশি শব্দ। যার ভেতর ৬৫, ০০০ ক্রিয়াপদ নয় এমন শব্দ, ৩৬, ০০০ ক্রিয়াপদ এবং ৫০০০ এরও বেশি অন্যান্য শব্দ রয়েছে।
২. মরফলজিকাল অ্যানালাইসিস
এঞ্জিন এই এঞ্জিনের সাহায্যে মাত্র ১, ০৬, ০০০ শব্দ দিয়েই বাংলা সম্ভব এমন কয়েকশো কোটি শব্দ নিখুঁতভাবে পরীক্ষা করতে পারে।
৩. টাইপ এরর ডিটেকশন এঞ্জিন
এই এঞ্জিনের মাধ্যমে সকল অবোধগম্য, রীতিবিরুদ্ধ এবং ভুল টাইপ ফেস যুক্ত বানান শনাক্ত এবং নিখুঁত পরামর্শ প্রদান করতে পারে।
৪. সমাস ডিটেকশন এঞ্জিন
বাংলা শব্দে সমাসের ব্যবহার ব্যাপক এবং সৃষ্টিশীল হওয়ায় সকল সমাস শব্দ অভিধানে অন্তর্ভুক্ত হওয়া সম্ভব নয়। এই এঞ্জিনের মাধ্যমে স্পেলচেকার স্পেসবিহীন শব্দসমূহ শনাক্ত করতে পারে এবং শব্দগুলিকে হাইফেন ও স্পেস দিয়ে পরামর্শ প্রদান করতে পারে।
৫. সাজেশন এঞ্জিন
বাংলা ভাষার গঠন ও লেখনরীতি এমন যে কোনো একটি একটি বিষয় বিবেচনা করে সঠিক ভাবে পরামর্শ তৈরি করা সম্ভব নয়। যে এঞ্জিনগুলি পরামর্শ তালিকা তৈরি করার জন্য কাজ করে সেগুলি হলো:
  • এডিট ডিসটেন্স অ্যানালাইসিস এঞ্জিন যা ভুল শব্দের ভেতর ভুক্তি, বিচ্যুতি, প্রতিস্থাপন, স্থানান্তরসহ বিভিন্ন প্রকার ভুল শনাক্ত করতে পারে।
  • ফোনেটিক অ্যানালাইসিস এঞ্জিন ধ্বনিতাত্ত্বিক ভুল শনাক্ত করতে পারে এবং ধ্বনি বা উচ্চারণ অনুযায়ী সঠিক বানান খুঁজে বের করতে পারে।
  • কনজাংকট্ সিমুলেশন এঞ্জিনের সাহায্যে যুক্তাক্ষর প্রয়োগের ভুল শনাক্ত ও পরামর্শ প্রদান করতে পারে।
  • গ্রামাটিকাল অ্যানালাইসিস এঞ্জিনের মাধ্যমে শব্দের বানানের ব্যাকরণগত ভুল শনাক্ত ও পরামর্শ প্রদান করতে পারে।
  • সাজেশন কপ্লিমেন্ট এঞ্জিন যা উল্লিখিত এঞ্জিনের অন্তর্ভুক্ত নয় এমন ভুলগুলি শনাক্ত ও পরামর্শ প্রদান করে।
  • মরফলজিকাল সিমুলেশন এঞ্জিন যা দিয়ে শব্দভাণ্ডারের সীমার বাইরের শব্দও পরামর্শ প্রদান করতে পারে।
  • সাজেশন প্রবাবিলিটি এঞ্জিন যা দিয়ে পরামর্শ তালিকাকে ভুলশব্দের নৈকট্য অনুসারে সাজাতে পারে।
৬. স্বয়ংক্রিয়শুদ্ধি
সকল টাইপ সংক্রান্ত ভুল স্বয়ংক্রিয়ভাবে শুদ্ধকরতে পারে। স্বয়ংক্রিয়শুদ্ধি অভিধানের ২৫০০ এরও বেশি শব্দ স্বয়ংক্রিয়ভাবে শুদ্ধ করতে পারে। ব্যবহারকারী তার প্রয়োজন অনুযায়ী আরও অনেক শব্দ স্বয়ংক্রিয়শুদ্ধি অভিধানে অন্তর্ভুক্ত করতে পারবেন।
৭. কাসটম ডিকশনারি
ব্যবহারকারী প্রয়োজন অনুযায়ী নিজস্ব শব্দের অভিধান তৈরি করতে পারবেন এবং তা মূল অভিধানের পাশাপাশি ব্যবহার করতে পারবেন।
৮. ফন্ট ম্যানেজমেন্ট এঞ্জিন
এই এঞ্জিনের সাহায্যে শুদ্ধশব্দ বাংলাদেশে ব্যবহৃত প্রায় যে কোনো ফন্টে ব্যবহার করা যাবে।

সাধারণ ব্যবহারকারীর সুবিধা:
  • সহজে ও দক্ষতার সাথে প্রুফরিডিং
  • মানবীয় ভুল থেকে মুক্তি
  • প্রচুর সময়ের সাশ্রয়
  • ভুল শব্দের জন্য অভিধান থেকে পরামর্শ
  • কয়েক হাজার শব্দের স্বয়ংক্রিয়শুদ্ধি
  • ব্যক্তিগত অভিধান ব্যবহারের সুবিধা
  • যে কোনো ফন্ট ব্যবহারের সুবিধা
  • ডকুমেন্টে বানান সংহতি নিশ্চিতকরণ
  • ডকুমেন্টে আধুনিক বানানের নিয়ম প্রয়োগ
  • সহজ ব্যবহার

প্রাতিষ্ঠানিক ব্যবহারের সুবিধা:
  • স্পেলচেকার পাবলিকেশন্সের কাজে মানব নির্ভরশীলতা কমাবে
  • কর্মীদের প্রকাশনার কাজে আরও দক্ষ করে তুলবে
  • বাংলা টেক্সট প্রসেসিংয়ের কাজে কর্মীদের শ্রমঘণ্টা এবং সেই মূল্যবান অর্থ সাশ্রয় ঘটাবে
  • নির্ভুল প্রকাশনা প্রতিষ্ঠানের সুনাম বৃদ্ধি করবে
  • অত্যন্ত সহজ ইন্টারফেস এবং বহুল ব্যবহৃত ওয়ার্ড প্রসেসরে ব্যবহার করা যাবে বিধায় প্রশিক্ষণের জন্য বাড়তি কোনো খরচ হবে না।

৩টি মন্তব্য: