Sunday, July 05, 2009

বহুভাষী ওয়েব এবং উন্মুক্ত অনুবাদ


এমন এক সময় ছিল যখন তথ্য শুধু লাইব্রেরী, বা সরকারী তথ্যাগারে থাকত। মানুষের কাছে তা সহজলভ্য হতো বই বা সংবাদপত্রের মাধ্যমে। কিন্তু ইন্টারনেটের প্রথম বিপ্লব এই বাধাকে ঘুঁচিয়ে দিল। বিভিন্ন স্ট্যাটিক ওয়েব পেইজের মাধ্যমে এবং অনলাইন সংবাদপত্রের মাধ্যমে তথ্যের অবাধ প্রবাহ চলতে লাগল।

এরপর আসল ইন্টারনেটের দ্বিতীয় জাগরণ। এটি ভেঙ্গে দিল কারা তথ্য সৃষ্টি করবে তার মনোপলি। লক্ষ কোটি মানুষ ডিসকাশন ফোরাম, ব্লগ, ছবি, ভিডিও ইত্যাদির মাধ্যমে তথ্যের সৃষ্টি ও আদান প্রদান করতে লাগল বিশ্বব্যাপী পাঠক-শ্রোতাদের জন্যে।

কিন্তু তথ্যের মনোপলি কি ভেঙ্গেছে? তথ্য আগেও উৎকৃষ্ট পণ্য ছিল, এখনও আছে। যেই তথ্যের চাহিদা বেশী, যোগান কম, তার মূল্য তত বেশী। বর্তমানে তথ্যের চাহিদা একই আছে (মানুষের তথ্য গ্রহণ করার ক্ষমতা অপরিবর্তিত আছে)। কিন্তু এখন তথ্যের যোগান অনেক। কিবোর্ড টিপলেই ডজনখানেক বাংলা পত্রিকা পড়া যায় আর ইংরেজীতো অগুণতি। তথ্যের এই বিস্ফোরণকে কেভিন কেলী বলেছেন দ্যা এক্সপানশন অফ ইগনোরেন্স। তিনি যুক্তি দেখাচ্ছেন যে যত বেশি তথ্য সহজলভ্য হচ্ছে তত আমাদের প্রশ্ন বেড়ে যাচ্ছে এবং উত্তরের চাহিদা বেড়ে যাচ্ছে। আমাদের উত্তরের যোগানের বিপরীতে প্রশ্নের হার বেড়ে যাওয়ায় আমাদের অজ্ঞানতা বাড়ছে। এটাকেই তিনি বলছেন দ্যা এক্সপানশন অফ ইগনোরেন্স।

তথ্যের প্রবাহ বাড়ার সাথে সাথে অপ্রক্রিয়াজাত তথ্যের মূল্য কমে যায় এবং মূল্য থাকে সেই সব তথ্যের যা আমাদের কাছে সংকলিত, অনুবাদিত, সহজবোধ্য; আমাদের বোধগম্য অবস্থায় যা পাওয়া যায়।

আপনি চিন্তা করুন দশ বছর আগের ইন্টারনেটের কথা। তখন বাংলা ইউনিকোড ছিল না। বাংলা ভাষায় কটি ডকুমেন্ট পাওয়া যেত? আজকে বাংলা উইকিপিডিয়ায় ২০০০০ এরও বেশী এন্ট্রি আছে। বাংলা ব্লগগুলোতে হাজার হাজার পোস্ট (যদিও যথার্থতা, মান নিয়ে প্রশ্ন আছে অনেকগুলোর)। কয়েক বছর আগের এক পরিসংখ্যান অনুযায়ী পাঁচ কোটি ব্লগের ৩৯% ইংরেজী ভাষায় ছিল। এর পরে ছিল জাপানী (৩৩%), চৈনিক (১৪%), স্প্যানিশ (৩%), ইটালিয়ান (৩%), রাশিয়ান (২%), ফ্রেন্চ (২%), পর্তুগীজ (১%), জার্মান (১%) ইত্যাদি। বর্তমানে এই পরিসংখ্যান নিশ্চয়ই অনেক বদলেছে, ইংরেজী ভাষার আধিপত্য কমে অন্যান্য ভাষার জাগরণ লক্ষ্য করা যাচ্ছে। কারন সবাই তার নিজের ভাষায় কথা বলতেই স্বাচ্ছন্দ বোধ করে।

তবে ইথান জুকারম্যান বলছেন যে আজকের ইন্টারনেট পরিমন্ডলে ভাষাগত বিচ্ছিন্নতার ভয় রয়েছে। আগের ইংরেজী ভাষার আধিপত্যের সময় পাঠকরা ভাষার বাধা ডিঙ্গিয়ে এক ভাষায় কথোপকথনের চেষ্টা চালাতো। বর্তমানে নিজের ভাষায় কথোপকথনের সুবিধার কারনে ইন্টারনেটে দেখা যাচ্ছে যে বিভিন্ন ভাষা ভাষাভাষীদের কমিউনিটিরা নিজেদের মধ্যে তথ্য আদানপ্রদানেই ব্যস্ত বেশী এবং অন্যান্য ভাষার কমিউনিটির সাথে যোগাযোগে আগ্রহী নয়। বা আগ্রহী নয় অন্যান্য ভাষায় পাওয়া যাওয়া বিষয়গুলো সম্পর্কে জানতে।

বিশ্বের অনেক কিছুই আমরা ভাষা জানি না বলে অন্যের দৃষ্টিতে দেখি। গাব্রিয়েল গার্সিয়া মার্কেজ এর বই বাংলায় অনুদিত হচ্ছে কি না বলে হা পিত্যেশ করে বসে থাকি, যাও হয়ত অনুবাদ করা হবে ইংরেজী অনুবাদ থেকে।
ভাষার বাধা তথ্য প্রবাহে মস্ত বড় বাধা। আমরা বিশ্বের বিভিন্ন ভাষায় পাওয়া যাওয়া ইন্টারনেট কন্টেন্টের কত অংশ বুঝতে পারি? এমন তথ্য নিশ্চয়ই আছে যা আমি জানতে চাই কিন্তু ফার্সী ভাষায় আছে বলে জানতে পাচ্ছি না। কিন্তু এই বাধা দুর করার উপায় কি?

বর্তমানে বেশ কিছু ভাষার জন্যে মেশিন ট্রান্সলেশন সুবিধা পাওয়া যাচ্ছে। গুগল ৪২টি ভাষা সাপোর্ট করে, কিন্তু তার মধ্যে বাংলা নেই। আর মেশিন অনুবাদের মানও আশানুরুপ নয়। মেশিন ট্রান্সলেশন নিয়ে কাজ করছে এমন এক প্রযুক্তিবিদের সাথে আলাপ করে জানলাম যে আগামী দশ বছরেও পার্ফেক্ট অনুবাদ প্রযুক্তি আবিষ্কারের সম্ভাবনা কম। কারন অনুবাদের সাথে স্টাইল, প্রাসঙ্গিকতা, সাংস্কৃতিক পটভূমি ইত্যাদি জড়িত এবং এটি শিল্প বলেই একে লজিকের দ্বারা সম্পূর্ণ বাধা যায় না। মেশিন অনুবাদের দ্বারা খুঁটিনাটি ও খাপছাড়া কাজ চলবে কিন্তু রিসার্চ বা প্রচলিত অনুবাদের জন্যে মানুষ কর্তৃক অনুবাদের বিকল্প নেই।

সারা বিশ্বের লক্ষ কোটি মানুষ একের অধিক ভাষা জানে। যে বাংলা এবং হিন্দি জানে, সে সহজেই হিন্দি থেকে বাংলা ভাষায় অনুবাদ করতে পারে (যা মেশিন অনুবাদের মাধ্যমে সম্ভব নয়, এখনো)। অনেকেরই সময় আছে তা করার জন্যে। ওপেন সোর্সের মত ওপেন ট্রান্সলেশন ও একটি আন্দোলন যার মাধ্যমে ইতিমধ্যে বেশ অনেকগুলো সফল কাজ হয়েছে বিশ্বের অনেক ভাষায়ই। বাংলার ক্ষেত্রে কলাবরেটিভ ট্রান্সলেশন এবং লোকালাইজেশন এর উদাহরণস্বরুপ বাংলা উইকিপিডিয়া, গ্লোবাল ভয়েসেস বাংলা সংস্করণ, ওয়ার্ডপ্রেস বাংলা লোকাইলেজেশন প্রকল্প মেঘদুত ইত্যাদি উল্লেখযোগ্য।

একটি বাংলা মেশিন ট্রান্সলেশন প্রকল্প - অনুবাদক কাজ করছে সেটিও ক্রাউডসোর্সিং (স্বেচ্ছাসেবীদের ইনপুট) এর মাধ্যমে এগিয়ে চলছে।

ইন্টারনেটকে আমাদের নিজস্ব ভাষায় সহজবোধ্য করার জন্যে দরকার বিভিন্ন টুল এবং আগ্রহী স্বেচ্ছাসেবী। যে যেই দ্বিতীয় ভাষা জানেন সেই ভাষার কন্টেন্ট যদি বাংলায় অনুবাদ করেন ও ইন্টারনেটে প্রকাশ করেন তাহলে বাংলা ভাষা ইন্টারনেটে প্রাণ পাবে। বেশী পরিমান লোক অনায়াসে তথ্য পাবে যা এখনও সহজলভ্য নয়।

ইথান জুকারম্যানের কথা দিয়েই শেষ করি:
"For the internet to reach its potential in bridging human differences, we need to make the problems of language and translation center to our conversations about the future of the internet."
অনুবাদের ভারটুকু আপনাদের উপরই ছেড়ে দিলাম।

বি: দ্র: গত মাসে আমস্টারডামে ওপেন ট্রান্সলেশন টুলস কনফারেন্সে অংশ নেয়ার পর তা নিয়ে লিখব লিখব করছিলাম। কিন্তু সুযোগ হয়ে উঠছিল না। এটি তার পটভূমি মাত্র। পরবর্তীতে বিস্তারিত আলোচনা করব।

(ছবির সূত্র)

 প্রথম প্রকাশ: সচলায়তন

No comments: