—প্রতীকী ছবি।
বছর দশেক আগেও কম্পিউটারকে দিয়ে কাজ করাতে হলে শিখতে হত সি, সি-প্লাস-প্লাস, জাভার মতো সব প্রোগ্রামিং ল্যাঙ্গুয়েজ। কম্পিউটারের সঙ্গে নিতান্ত সাধারণ ইংরেজিতে কথাবার্তা চালিয়ে যাওয়ার রাস্তা খুলে দিয়ে গত বছর নভেম্বরে আলোচনার কেন্দ্রে উঠে এল আমেরিকার ওপেনএআই নামের এক সংস্থা— তারা বাজারে আনল চ্যাটজিপিটি নামের একটি প্রায় সর্বজ্ঞ চ্যাটবট। পক্ষে-বিপক্ষে নানা সমালোচনার মধ্যে দিয়েই প্রায় সমস্ত পেশার সঙ্গে যুক্ত মানুষ এবং বিনিয়োগকারীদের মধ্যে প্রবল জনপ্রিয় হয়ে উঠেছে চ্যাটজিপিটি-র নেপথ্যে থাকা জিপিটি ৩.৫, ৪ এবং সমগোত্রীয়রা। এগুলি হল লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) বা বৃহৎ ভাষা-প্রক্রিয়াকরণ মডেল। গোটা ২০২৩ জুড়েই শোনা গেল জেনারেটিভ এআই বা সৃষ্টিশীল কৃত্রিম মেধার এই তুঙ্গ পর্যায়টির আলোচনা। ‘এলএলএম’, ‘জেন-এআই’, ‘জ়িরো-শট লার্নিং’-এর মতো শব্দ ঢুকে পড়ল আমাদের ঘরে।
২০২০-২১ যদি অতিমারির বছর হয়ে থাকে, ২০২৩ নিঃসন্দেহে কৃত্রিম মেধার। এক দিকে আমেরিকার বৃহৎ পুঁজিবাদী ব্যবস্থায় বেসরকারি সংস্থাগুলোর কৃত্রিম মেধা গবেষণায় অকল্পনীয় মাপের লগ্নি ও সারা পৃথিবীকেই বাজারে পরিণত করার চেষ্টা; অন্য দিকে চিনের মতো দেশে সম্পূর্ণ সরকারের নিয়ন্ত্রণে নাগরিকদের জীবনের আনাচেকানাচে কৃত্রিম মেধার অনুপ্রবেশ— এই দুই বিপ্রতীপ সীমার মধ্যে দাঁড়িয়ে দুনিয়া।
সৃষ্টিশীল কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দুতে দাঁড়িয়ে এই মুহূর্তে সবচেয়ে আলোচিত গাণিতিক তন্ত্রটির পোশাকি নাম ‘ফাউন্ডেশন মডেল’। চ্যাটজিপিটি, বার্ড, লামা, পাম ইত্যাদি সংলাপধর্মী চ্যাটবটের নেপথ্যে রয়েছে অতিকায় এবং বহুমুখী কার্যশক্তিসম্পন্ন এই ধরনের ভাষা প্রক্রিয়াকরণ মডেল। এই মডেলগুলোকে আমাদের মানুষী ভাষার অনেক সাধারণ কার্যকলাপে (যেমন পাঠ সংক্ষেপণ, একটি অনুচ্ছেদ পড়ে তা থেকে প্রশ্নের উত্তর খোঁজা, শূন্যস্থান পূরণ ইত্যাদি) প্রশিক্ষিত করে তোলার জন্য ব্যবহার করতে হয় ইন্টারনেটের ভাঁড়ার থেকে বিপুল পরিমাণ ডিজিটাল টেক্সট-এর সম্ভার— উদাহরণ হিসাবে পেশ করা যায় গোটা উইকিপিডিয়াকেই। এর জন্য প্রয়োজন কার্যত ধারণাতীত মাপের গণনাশক্তি। তার জোগান আবার দিতে পারে গুগল, মাইক্রোসফট, মেটা বা ওপেনএআই-এর মতো সংস্থা, যাদের হাতে রয়েছে গোটা দুনিয়ার পুঁজির একটা বিরাট অংশ।
২০২৩-এ গড়ে ওঠা অনেক স্টার্ট আপ সংস্থাই নিজেদের ফাউন্ডেশন মডেল বানাতে পারেনি এই বিপুল পুঁজির অভাবে। তারা বরং এই বড় সংস্থাগুলির তৈরি মডেলগুলোকেই নিজেদের ব্যবহারিক ক্ষেত্রের সঙ্গে খাপ খাইয়ে নিতে চেষ্টা করে, তুলনায় অল্প পরিমাণ তথ্যের সাহায্যে বিশেষ প্রশিক্ষণ দিয়ে। এ ভাবে একটি সাধারণ ফাউন্ডেশন মডেলকে বিশেষ উদ্দেশ্যে ব্যবহার করার প্রক্রিয়াগুলোকে যন্ত্রমেধার পরিভাষায় বলে প্রি-ট্রেনিং, ফাইন-টিউনিং, এবং প্রম্পট এঞ্জিনিয়ারিং। এই প্রক্রিয়াগুলো ব্যবহার করে বানিয়ে ফেলা চলে নির্দিষ্ট ধরনের কাজের জন্য বিশেষ চ্যাটবট— যেমন মেড-পাম২, যা বিশেষ ভাবে প্রশিক্ষিত শুধুমাত্র চিকিৎসাবিদ্যা বিষয়ক প্রশ্নোত্তরের জন্য। এই চ্যাটবট শেক্সপিয়রের নাটক বিষয়ক প্রশ্নের সদুত্তর দিতে পারবে না, কিন্তু বুকের একটি এক্স-রে ছবি দেখে বলে দেবে ফুসফুসের অবস্থা ঠিক কী রকম, তৈরি করে দেবে একটি মেডিক্যাল রিপোর্ট।
বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই। ক্রমে আমাদের শিক্ষা আরও সঙ্কীর্ণ এবং সুনির্দিষ্ট পরিসরে ন্যস্ত হয়। তার পর জীবিকা অর্জনের জন্য আমরা হয়তো কোনও একটি বিষয়ে বিশেষ ভাবে প্রশিক্ষিত হয়ে উঠি। এই বিশেষ প্রশিক্ষণ অনেকটা ভাষা প্রক্রিয়াকরণ মডেলগুলোর প্রি-ট্রেনিং এবং ফাইন-টিউনিংয়ের মতো। পরিণত বয়েসে সাফল্যের মূল চাবিকাঠি যেমন লুকিয়ে থাকে বিদ্যালয় স্তরের বহুমুখী শিক্ষার শক্ত বনিয়াদের উপরে, তেমনই বিশেষ ব্যবসায়িক প্রয়োজনে তৈরি চ্যাটবটগুলোর সাফল্য এবং সঠিক উত্তর দেওয়ার ক্ষমতাও এদের নেপথ্যে থাকা ফাউন্ডেশন মডেলগুলোর প্রশিক্ষণের উপরে নির্ভরশীল।
এই মুহূর্তে ভারতে দেড় হাজারেরও বেশি কৃত্রিম বুদ্ধিমত্তাভিত্তিক স্টার্ট আপ আছে, যেগুলোতে মোট বিনিয়োগের পরিমাণ প্রায় চারশো কোটি ডলার। কিন্তু, দুনিয়া জুড়ে সৃষ্টিশীল যন্ত্রমেধার ঝড়ের সঙ্গে পাল্লা দেওয়ার ক্ষমতা এখনও আমাদের আয়ত্তের অনেকটা বাইরে। সম্পূর্ণ দেশীয় উদ্যোগে তৈরি কোনও প্রতিষ্ঠান আজও জিপিটি-৪, বার্ড, লামা, কিংবা আন্থ্রপিকের মতো প্রতিষ্ঠিত জেনারেটিভ এআই প্ল্যাটফর্মের দিকে চ্যালেঞ্জ ছুড়ে দেওয়ার মতো প্রযুক্তি বাজারে আনতে পারেনি। ভাষা প্রক্রিয়াকরণ মডেলের উপরে নির্ভরশীল ভারতীয় স্টার্ট আপগুলোর কোনওটারই এখনও নিজস্ব ফাউন্ডেশন মডেল নেই। এই ধরনের সংস্থাগুলোর বৃদ্ধির পথে সবচেয়ে বড় বাধা হচ্ছে বিরাট মাপের গণনা-পরিকাঠামোর অভাব, যেটা পূরণ করতে গেলে প্রথমেই দরকার হবে বিশাল পুঁজির।
ওপেনএআই বা গুগলের মতো সংস্থার তৈরি ফাউন্ডেশন মডেলগুলোর মূল নকশা বা সোর্স-কোড প্রায় পুরোটাই গোপনীয় এবং সাধারণের ধরাছোঁয়ার বাইরে। সুতরাং, এই মডেলগুলোর অন্দরমহলে পক্ষপাতদুষ্টতা, তথ্য চুরি কিংবা তথ্যের অপলাপ ঘটিয়ে গ্রহীতাদের প্ররোচিত করার কোন খেলা চলছে, তা বোঝার এবং বন্ধ করার কোনও উপায় প্রায় নেই। বিভিন্ন আঞ্চলিক ভাষায় নিজেদের ফাউন্ডেশন মডেলকে প্রশিক্ষিত করার পথে ভারত-জিপিটি’র মতো প্রকল্প নিয়ে সরকারের সহায়তায় নেমে পড়েছে করোভার-এআই সংস্থা, যাদের গ্রহীতাদের লম্বা তালিকায় ভারতের বহু ব্যাঙ্কিং প্রতিষ্ঠান আছে। শোনা যাচ্ছে, গুগল এই কাজে ভারত সরকারের সঙ্গে হাত মিলিয়ে বড় অঙ্কের বিনিয়োগ করবে। আশার কথা বটে, শুধু অস্বস্তি বাড়িয়ে দিচ্ছে ২০২৩-এর শেষে ইন্টারনেটের জগতে যন্ত্রমেধার সাহায্যে মানবাধিকার লঙ্ঘনের ভয়ঙ্কর পরিসংখ্যান।
আজকের দুনিয়ায় কৃত্রিম বুদ্ধিমত্তার ব্যবহার নেটনাগরিকদের স্বাধীনতা এবং মানবাধিকারকে খর্ব করার কাজ অনেক সোজা করে দিয়েছে বিভিন্ন রাষ্ট্রযন্ত্রের কাছে। গত এক বছরে পৃথিবীর ৫৫টি দেশে নাগরিকরা জেলে নিক্ষিপ্ত হয়েছেন শুধু ইন্টারনেটে নিজেদের মতামত প্রকাশ করার অপরাধে, ৪১টি দেশের সরকার যন্ত্রমেধা-নির্ভর নজরদারি ব্যবস্থায় বিরুদ্ধমতের সামান্যতম প্রকাশেও বন্ধ করে দিয়েছে নানা ওয়েবসাইট। গত অক্টোবরে প্রকাশিত আমেরিকার সংস্থা ফ্রিডম হাউসের একটি রিপোর্ট বলছে, পৃথিবীর অন্তত ৪৭টি দেশে সৃষ্টিশীল কৃত্রিম মেধার অপব্যবহার করে নেটনাগরিকদের গেলানো হয়েছে রাষ্ট্রের পক্ষে লাভজনক বিভিন্ন মিথ্যা, যার সমর্থনে ব্যবহার করা হয়েছে নকল ছবি, ভিডিয়ো, বা টেক্সট। মায়ানমার, ইরান, চিনের মতো আরও অনেক দেশেই বেশ খোলাখুলি ভাবে সরকার বিভিন্ন মুনাফাসন্ধানী সংস্থার সঙ্গে হাত মিলিয়ে কৃত্রিম মেধার আধুনিকতম আবিষ্কারগুলোকে ব্যবহার করছে জনমত নিয়ন্ত্রণে রাখার পাশাপাশি বিরুদ্ধস্বরকে চিহ্নিত ও নির্মূল করতে।
শেষে একটা কথা মনে করিয়ে দেওয়া জরুরি। সমাজ থেকেই আসে তথ্য, সেই তথ্যের ভিত্তিতেই প্রশিক্ষণ লাভ করে কৃত্রিম মেধার সংস্থাগুলো। আবার সমাজের বিশেষ সুবিধাভোগী ও ক্ষমতাবানরাই ইন্টারনেটের মাধ্যমে বিভিন্ন ডিজিটাল প্ল্যাটফর্মে তথ্য জোগান। উইকিপিডিয়ার অধিকাংশ লেখা যেমন আসে ইউরোপ বা আমেরিকা থেকে, আফ্রিকার এমন কোনও দেশ থেকে নয়, যেখানে দিনে কয়েক ঘণ্টার বিদ্যুৎই রাজকীয় বিলাসিতা। সুতরাং, সেই সুবিধাভোগী অংশটির রাজনৈতিক, সাম্প্রদায়িক বা লিঙ্গভিত্তিক পক্ষপাত অনায়াসেই ছাপ ফেলে তথ্যভান্ডারে। এই তথ্যভান্ডার বিপুল হওয়া সত্ত্বেও নিরপেক্ষ নয়, আর তাই তার ভিত্তিতে প্রশিক্ষিত যন্ত্রমেধা নিয়ে ফেলে পক্ষপাতদুষ্ট সিদ্ধান্ত।
সুতরাং, শুধু নিজস্ব ফাউন্ডেশন মডেল বানালেই কাজ শেষ হচ্ছে না। সরকারপক্ষের যাঁরা চাইছেন যে, আগামী বছরগুলোতে ভারতের সমস্ত আঞ্চলিক ভাষায় তৈরি হোক ‘মেক ইন ইন্ডিয়া’ চ্যাটবট, তাঁদের এখনও কৃত্রিম মেধা নামের ইঞ্জিনটির আসল জ্বালানি, অর্থাৎ আমজনতার থেকে আহরিত তথ্যভান্ডারকে পরিচ্ছন্ন, সুষম, এবং সুরক্ষিত করার পথে অনেকটা হাঁটতে হবে।