ইউনিকোডেড মুক্তমনা

অভিজি রায়


মুক্তমনা বাংলা সেকশনটি আজ থেকে ইউনিকোডে রূপান্তরিত করা হল। গত জুলাই ফোর্থের ছুটিকে কাজে লাগিয়ে এই কনভারশনের কাজটা করে ফেললাম। কিন্তু ইউনিকোড জিনিসটা কি? এইটা কি খায় না পিন্দে? আসলে ইউনিকোড হল ১৬ বিটের একটি ইন্ডাস্ট্রি স্ট্যান্ডার্ড কোড যা বিশ্বের প্রতিটি ভাষার প্রতিটি অক্ষরের জন্য একটি করে নম্বর প্রদান করে। সহজ ভাষায়, ইউনিকোড পৃথিবীর বিভিন্ন ভাষার বর্ণগুলিকে প্রকাশ করার জন্য একটি সার্বজনীন ও স্ট্যান্ডার্ড চার্ট তৈরী করেছে এবং তাতে বাংলা ভাষাও স্থান পেয়েছে। বেশ কিছু কারনে মুক্তমনাকে ইউনিকোডে রূপান্তরিত করার পদক্ষেপটি নেওয়া হয়েছে:

১। প্রথম কারণটি হল, সার্চ করার সুবিধা। ইউনিকোডে থাকলে সার্চ করতে খুবই সুবিধা হয়। কেননা তখন পৃথিবীর যেকোন সার্চ ইঞ্জিন -তা সে ইয়াহুই হোক কিংবা গোগুলই হোক,যে কোন ভাবে সেটা খুঁজে বের করতে পারে।

২। আমাদের সাইটের বাংলা হরফগুলো যে কোন দেশের যে কোন ইউনিকোড কম্প্যাটিবল কম্পিউটারে বসে দেখা যাবে শুধু দেখা নয়,  যে কোন জায়গায় গিয়ে যেখানে বিজয় বা বর্ণসফট ব্যবহারের কোন আপশন নেই, সেখানেও বাংলা ব্যবহার করা সুবিধা হবে। 

৩। -মেইলে, যে কোন ডকুমেন্টে সহজে বাংলা ব্যাবহার করা যাবে।  ইউনিকোডের সুবিধা ব্যবহার করে আপনি এখানে এটাকে সহজেই ব্যবহার করতে পারবেন। আমাদের সাইটের বাংলা কনটেন্ট আপনি কপি পেস্ট করে ইমেইলে পাঠালে গ্রাহক সেটা পড়ে নিতে পারবেন ফন্ট ইন্সটলের ঝামেলা ছাড়াই।  

৪। যেহেতু ইউনিকোডে বাংলা ইংরেজী আরবী, উর্দু, সংস্কৃত এবং অন্যান্য ভাষা মিশিয়ে ব্যবহার করা যায় তাই সহজে একে বিভিন্ন প্রোগ্রামে অর্ন্তভুক্ত করা সহজ।

 এতদিন ওয়েবসাইটে বাংলা ফন্ট ব্যবহার করতে হলে ছবি তৈরি করে নিয়ে তা ওয়েবে ব্যবহার করতে হত। এটি তৈরি করা শুধু সময় সাপেক্ষ নয়, সার্ভারে স্থানসংকুলানের বিবেচনায়ও খুবই অনুপো্যোগী। এমবেডেড ইউনিকোড এ সমস্যা থেকে আমাদের মুক্তি দিয়েছে।


আমরা যেহেতু আমাদের সাইটটি ইউনিকোডে রূপান্তরিত করে ফেলেছি, আমরা মুক্তমনায় এখন থেকে লেখকদের পিডিএফ ফাইল প্রেরণ নিরুত্সাহিত করছি। এমনিতে পিডিএফ ফাইলের মহা হ্যাপো। লোড হতে সময় লাগে, আনেক সময় কিছু কিছু ফন্টের পিডিএফ করলেও জগাখিচুরি হয়ে যায়।  এছারা সার্ভারে স্থানসংকুলান জাতীয় সমস্যা আছেই।  

কাজেই যারা বিজয় কিবোর্ড ব্যবহার করে লিখেন তাদেরকে সরাসরি ওয়ার্ড ডকুমেন্ট প্রেরণ করার আনুরোধ করছি। আমরা আপনাদের ডকুমেন্ট ইউনিকোডে রুপান্তরিত করে নেব। আর যারা  বর্ণসফট (ফ্রি ভার্শন) ব্যবহার করে টাইপ করেন, তাদেরকে  বর্ণসফটের মতই (কিন্তু আরো অগ্রগামী) একটি সফটওয়্যঅভ্র ব্যবহার করতে অনুরোধ করছি।   এটা অনেকটা বর্ণসফটের মতই। কিন্ত বাড়তি সুবিধা হল আপনি মাইক্রোসফট ওয়ার্ড ডকুমেন্টেই আপনার লেখা লিখতে পারবেন, বাড়তি কোন সফটওয়্যর ব্যবহার করা ছাড়াই। আর, আপনি আপনার ডকুমেন্টটি ইউনিকোডে পাচ্ছেন, যা আপনাকে সার্বজনীনতার পথে আরেক ধাপ অগ্রসর করবে।

তবে ইউনিকোডের সবচাইতে বড় দিক হলো এর সহজলভ্যতা। কোন ব্যাক্তি বা প্রতিষ্ঠানের সফটওয়্যারের উপর নির্ভর করতে হয় না। ব্যাক্তিগত সফটওয়্যার দিয়ে যা সম্ভব হয়নি, ইউনিকোড দিয়ে তা সম্ভব। ইউনিকোডের পেছনের প্রযুক্তিটি কিন্তু খুবই সহজ। আমরা জানি, কম্পিউটারে শুধু সংখ্যার ব্যবহার হয়। কম্পিউটার আমাদের মত বিভিন্ন ভাষা বুঝেনা, সে বুঝে শুধু বাইনারি ডিজিট- “এক” ও “শূন্য”। তাই কম্পিউটারে প্রতিটি ভাষার বর্ণগুলিকে প্রকাশ করবার জন্য সুনির্দিষ্ট কিছু স্ট্যান্ডার্ড বা মানদন্ড আছে। নির্ধারিত আছে কোন বর্ণটির কি কোড। অর্থা, কম্পিউটারে যে লিপি বা অন্যান্য অক্ষর সংরক্ষিত হয় সেই অক্ষরগুলির প্রতিটির পিছনে একটি করে একক সংখ্যা নির্ধারিত আছে। ইউনিকোড বিশ্বের প্রতিটি ভাষার প্রতিটি অক্ষরের জন্য একটি করে নম্বর প্রদান করে, সেটা যে প্লাটফর্মেই হোক, সেটা যে প্রোগ্রামেই হোক, সেটা যে ভাষারই হোক। পৃথিবীর প্রতিটা কোনায় বাংলাকে পৌঁছে দেবার ক্ষেত্রে ইউনিকোড ভবিষ্যতে গুরুত্বপূর্ণ ভূমিকা পালন করবে এটি নিশ্চিতভাবে বলা যায়।

জুলাই ৫, ২০০৭



Unicoded Mukto-Mona  

Avijit Roy

Published on July 05, 2007

Bangla section of MM site has been upgraded lately with Unicode system.  For readers not familiar with the term, Unicode is an industry standard that allows computers to consistently represent and manipulate text expressed in any of the world's writing systems. There are several reasons why we've converted MM Bangla site into Unicode:

1. One of the most important reasons is we'll have greater advantages in Bangla content searching. Any search engine around the world, be it Google or Yahoo, can detect your Bangla content if you write it using Unicode platform.

2. Secondly, you can read Unicoded Bangla in any place in the world, if the computer is Unicode compatible. That makes it free from hassle of downloading & installing PDF, special fonts.

3. Third, You can directly copy and paste Unicoded Bangla and send it to the recipient through email who will be able to read directly without taking the trouble of installing PDF, fonts etc.

4. Fourthly, as Bangla, English, Arabic, Sangskrit – all characters are supported by Unicode system, its easy to use in any programs and websites. Wikipedia has some good information on Bangla Unicode script: http://en.wikipedia.org/wiki/Bengali_script

5. To implement special Bangla fonts on a web page, our choices so far were limited to using high bandwidth-consuming images or embed the fonts each and every time you use it. Unicode embedded fonts give a relief from such anxiety.

That said, we are not encouraging our members/authors to send pdf files to MM from now on. Pdf files have lot of problems. Normally It takes a huge time to load, sometimes several fonts do not  appear correctly.

Please send your document in doc or rtf format. We will convert your document into Unicode, if it has not been done already.

In addition to the points listed above, another most useful and bright side of Unicode is its availability. It is not depended on any customized software of any company; rather, it has some kind of universal appeal to the user. Unicode has overcome the barrier where other individual efforts remained unsuccessful. The technology behind Unicode is pretty simple. We all know that computer works using numbers, to be precise uses binary digit 0 and 1. Any alphabet in a computer is displayed by a number that is assigned to it. Unicode assigns a number for each alphabet of every language all over the world, no matter what the type of platform, program or language is being used. To reach Bangla in each and every corner of the world, we are positive Unicode will play a major role in future.

Avijit Roy
Founding Moderator