—প্রতীকী ছবি।
বছর দশেক আগেও কম্পিউটারকে দিয়ে কাজ করাতে হলে শিখতে হত সি, সি-প্লাস-প্লাস, জাভার মতো সব প্রোগ্রামিং ল্যাঙ্গুয়েজ। কম্পিউটারের সঙ্গে নিতান্ত সাধারণ ইংরেজিতে কথাবার্তা চালিয়ে যাওয়ার রাস্তা খুলে দিয়ে গত বছর নভেম্বরে আলোচনার কেন্দ্রে উঠে এল আমেরিকার ওপেনএআই নামের এক সংস্থা— তারা বাজারে আনল চ্যাটজিপিটি নামের একটি প্রায় সর্বজ্ঞ চ্যাটবট। পক্ষে-বিপক্ষে নানা সমালোচনার মধ্যে দিয়েই প্রায় সমস্ত পেশার সঙ্গে যুক্ত মানুষ এবং বিনিয়োগকারীদের মধ্যে প্রবল জনপ্রিয় হয়ে উঠেছে চ্যাটজিপিটি-র নেপথ্যে থাকা জিপিটি ৩.৫, ৪ এবং সমগোত্রীয়রা। এগুলি হল লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) বা বৃহৎ ভাষা-প্রক্রিয়াকরণ মডেল। গোটা ২০২৩ জুড়েই শোনা গেল জেনারেটিভ এআই বা সৃষ্টিশীল কৃত্রিম মেধার এই তুঙ্গ পর্যায়টির আলোচনা। ‘এলএলএম’, ‘জেন-এআই’, ‘জ়িরো-শট লার্নিং’-এর মতো শব্দ ঢুকে পড়ল আমাদের ঘরে।
২০২০-২১ যদি অতিমারির বছর হয়ে থাকে, ২০২৩ নিঃসন্দেহে কৃত্রিম মেধার। এক দিকে আমেরিকার বৃহৎ পুঁজিবাদী ব্যবস্থায় বেসরকারি সংস্থাগুলোর কৃত্রিম মেধা গবেষণায় অকল্পনীয় মাপের লগ্নি ও সারা পৃথিবীকেই বাজারে পরিণত করার চেষ্টা; অন্য দিকে চিনের মতো দেশে সম্পূর্ণ সরকারের নিয়ন্ত্রণে নাগরিকদের জীবনের আনাচেকানাচে কৃত্রিম মেধার অনুপ্রবেশ— এই দুই বিপ্রতীপ সীমার মধ্যে দাঁড়িয়ে দুনিয়া।
সৃষ্টিশীল কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দুতে দাঁড়িয়ে এই মুহূর্তে সবচেয়ে আলোচিত গাণিতিক তন্ত্রটির পোশাকি নাম ‘ফাউন্ডেশন মডেল’। চ্যাটজিপিটি, বার্ড, লামা, পাম ইত্যাদি সংলাপধর্মী চ্যাটবটের নেপথ্যে রয়েছে অতিকায় এবং বহুমুখী কার্যশক্তিসম্পন্ন এই ধরনের ভাষা প্রক্রিয়াকরণ মডেল। এই মডেলগুলোকে আমাদের মানুষী ভাষার অনেক সাধারণ কার্যকলাপে (যেমন পাঠ সংক্ষেপণ, একটি অনুচ্ছেদ পড়ে তা থেকে প্রশ্নের উত্তর খোঁজা, শূন্যস্থান পূরণ ইত্যাদি) প্রশিক্ষিত করে তোলার জন্য ব্যবহার করতে হয় ইন্টারনেটের ভাঁড়ার থেকে বিপুল পরিমাণ ডিজিটাল টেক্সট-এর সম্ভার— উদাহরণ হিসাবে পেশ করা যায় গোটা উইকিপিডিয়াকেই। এর জন্য প্রয়োজন কার্যত ধারণাতীত মাপের গণনাশক্তি। তার জোগান আবার দিতে পারে গুগল, মাইক্রোসফট, মেটা বা ওপেনএআই-এর মতো সংস্থা, যাদের হাতে রয়েছে গোটা দুনিয়ার পুঁজির একটা বিরাট অংশ।
২০২৩-এ গড়ে ওঠা অনেক স্টার্ট আপ সংস্থাই নিজেদের ফাউন্ডেশন মডেল বানাতে পারেনি এই বিপুল পুঁজির অভাবে। তারা বরং এই বড় সংস্থাগুলির তৈরি মডেলগুলোকেই নিজেদের ব্যবহারিক ক্ষেত্রের সঙ্গে খাপ খাইয়ে নিতে চেষ্টা করে, তুলনায় অল্প পরিমাণ তথ্যের সাহায্যে বিশেষ প্রশিক্ষণ দিয়ে। এ ভাবে একটি সাধারণ ফাউন্ডেশন মডেলকে বিশেষ উদ্দেশ্যে ব্যবহার করার প্রক্রিয়াগুলোকে যন্ত্রমেধার পরিভাষায় বলে প্রি-ট্রেনিং, ফাইন-টিউনিং, এবং প্রম্পট এঞ্জিনিয়ারিং। এই প্রক্রিয়াগুলো ব্যবহার করে বানিয়ে ফেলা চলে নির্দিষ্ট ধরনের কাজের জন্য বিশেষ চ্যাটবট— যেমন মেড-পাম২, যা বিশেষ ভাবে প্রশিক্ষিত শুধুমাত্র চিকিৎসাবিদ্যা বিষয়ক প্রশ্নোত্তরের জন্য। এই চ্যাটবট শেক্সপিয়রের নাটক বিষয়ক প্রশ্নের সদুত্তর দিতে পারবে না, কিন্তু বুকের একটি এক্স-রে ছবি দেখে বলে দেবে ফুসফুসের অবস্থা ঠিক কী রকম, তৈরি করে দেবে একটি মেডিক্যাল রিপোর্ট।
বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই। ক্রমে আমাদের শিক্ষা আরও সঙ্কীর্ণ এবং সুনির্দিষ্ট পরিসরে ন্যস্ত হয়। তার পর জীবিকা অর্জনের জন্য আমরা হয়তো কোনও একটি বিষয়ে বিশেষ ভাবে প্রশিক্ষিত হয়ে উঠি। এই বিশেষ প্রশিক্ষণ অনেকটা ভাষা প্রক্রিয়াকরণ মডেলগুলোর প্রি-ট্রেনিং এবং ফাইন-টিউনিংয়ের মতো। পরিণত বয়েসে সাফল্যের মূল চাবিকাঠি যেমন লুকিয়ে থাকে বিদ্যালয় স্তরের বহুমুখী শিক্ষার শক্ত বনিয়াদের উপরে, তেমনই বিশেষ ব্যবসায়িক প্রয়োজনে তৈরি চ্যাটবটগুলোর সাফল্য এবং সঠিক উত্তর দেওয়ার ক্ষমতাও এদের নেপথ্যে থাকা ফাউন্ডেশন মডেলগুলোর প্রশিক্ষণের উপরে নির্ভরশীল।
এই মুহূর্তে ভারতে দেড় হাজারেরও বেশি কৃত্রিম বুদ্ধিমত্তাভিত্তিক স্টার্ট আপ আছে, যেগুলোতে মোট বিনিয়োগের পরিমাণ প্রায় চারশো কোটি ডলার। কিন্তু, দুনিয়া জুড়ে সৃষ্টিশীল যন্ত্রমেধার ঝড়ের সঙ্গে পাল্লা দেওয়ার ক্ষমতা এখনও আমাদের আয়ত্তের অনেকটা বাইরে। সম্পূর্ণ দেশীয় উদ্যোগে তৈরি কোনও প্রতিষ্ঠান আজও জিপিটি-৪, বার্ড, লামা, কিংবা আন্থ্রপিকের মতো প্রতিষ্ঠিত জেনারেটিভ এআই প্ল্যাটফর্মের দিকে চ্যালেঞ্জ ছুড়ে দেওয়ার মতো প্রযুক্তি বাজারে আনতে পারেনি। ভাষা প্রক্রিয়াকরণ মডেলের উপরে নির্ভরশীল ভারতীয় স্টার্ট আপগুলোর কোনওটারই এখনও নিজস্ব ফাউন্ডেশন মডেল নেই। এই ধরনের সংস্থাগুলোর বৃদ্ধির পথে সবচেয়ে বড় বাধা হচ্ছে বিরাট মাপের গণনা-পরিকাঠামোর অভাব, যেটা পূরণ করতে গেলে প্রথমেই দরকার হবে বিশাল পুঁজির।
ওপেনএআই বা গুগলের মতো সংস্থার তৈরি ফাউন্ডেশন মডেলগুলোর মূল নকশা বা সোর্স-কোড প্রায় পুরোটাই গোপনীয় এবং সাধারণের ধরাছোঁয়ার বাইরে। সুতরাং, এই মডেলগুলোর অন্দরমহলে পক্ষপাতদুষ্টতা, তথ্য চুরি কিংবা তথ্যের অপলাপ ঘটিয়ে গ্রহীতাদের প্ররোচিত করার কোন খেলা চলছে, তা বোঝার এবং বন্ধ করার কোনও উপায় প্রায় নেই। বিভিন্ন আঞ্চলিক ভাষায় নিজেদের ফাউন্ডেশন মডেলকে প্রশিক্ষিত করার পথে ভারত-জিপিটি’র মতো প্রকল্প নিয়ে সরকারের সহায়তায় নেমে পড়েছে করোভার-এআই সংস্থা, যাদের গ্রহীতাদের লম্বা তালিকায় ভারতের বহু ব্যাঙ্কিং প্রতিষ্ঠান আছে। শোনা যাচ্ছে, গুগল এই কাজে ভারত সরকারের সঙ্গে হাত মিলিয়ে বড় অঙ্কের বিনিয়োগ করবে। আশার কথা বটে, শুধু অস্বস্তি বাড়িয়ে দিচ্ছে ২০২৩-এর শেষে ইন্টারনেটের জগতে যন্ত্রমেধার সাহায্যে মানবাধিকার লঙ্ঘনের ভয়ঙ্কর পরিসংখ্যান।
আজকের দুনিয়ায় কৃত্রিম বুদ্ধিমত্তার ব্যবহার নেটনাগরিকদের স্বাধীনতা এবং মানবাধিকারকে খর্ব করার কাজ অনেক সোজা করে দিয়েছে বিভিন্ন রাষ্ট্রযন্ত্রের কাছে। গত এক বছরে পৃথিবীর ৫৫টি দেশে নাগরিকরা জেলে নিক্ষিপ্ত হয়েছেন শুধু ইন্টারনেটে নিজেদের মতামত প্রকাশ করার অপরাধে, ৪১টি দেশের সরকার যন্ত্রমেধা-নির্ভর নজরদারি ব্যবস্থায় বিরুদ্ধমতের সামান্যতম প্রকাশেও বন্ধ করে দিয়েছে নানা ওয়েবসাইট। গত অক্টোবরে প্রকাশিত আমেরিকার সংস্থা ফ্রিডম হাউসের একটি রিপোর্ট বলছে, পৃথিবীর অন্তত ৪৭টি দেশে সৃষ্টিশীল কৃত্রিম মেধার অপব্যবহার করে নেটনাগরিকদের গেলানো হয়েছে রাষ্ট্রের পক্ষে লাভজনক বিভিন্ন মিথ্যা, যার সমর্থনে ব্যবহার করা হয়েছে নকল ছবি, ভিডিয়ো, বা টেক্সট। মায়ানমার, ইরান, চিনের মতো আরও অনেক দেশেই বেশ খোলাখুলি ভাবে সরকার বিভিন্ন মুনাফাসন্ধানী সংস্থার সঙ্গে হাত মিলিয়ে কৃত্রিম মেধার আধুনিকতম আবিষ্কারগুলোকে ব্যবহার করছে জনমত নিয়ন্ত্রণে রাখার পাশাপাশি বিরুদ্ধস্বরকে চিহ্নিত ও নির্মূল করতে।
শেষে একটা কথা মনে করিয়ে দেওয়া জরুরি। সমাজ থেকেই আসে তথ্য, সেই তথ্যের ভিত্তিতেই প্রশিক্ষণ লাভ করে কৃত্রিম মেধার সংস্থাগুলো। আবার সমাজের বিশেষ সুবিধাভোগী ও ক্ষমতাবানরাই ইন্টারনেটের মাধ্যমে বিভিন্ন ডিজিটাল প্ল্যাটফর্মে তথ্য জোগান। উইকিপিডিয়ার অধিকাংশ লেখা যেমন আসে ইউরোপ বা আমেরিকা থেকে, আফ্রিকার এমন কোনও দেশ থেকে নয়, যেখানে দিনে কয়েক ঘণ্টার বিদ্যুৎই রাজকীয় বিলাসিতা। সুতরাং, সেই সুবিধাভোগী অংশটির রাজনৈতিক, সাম্প্রদায়িক বা লিঙ্গভিত্তিক পক্ষপাত অনায়াসেই ছাপ ফেলে তথ্যভান্ডারে। এই তথ্যভান্ডার বিপুল হওয়া সত্ত্বেও নিরপেক্ষ নয়, আর তাই তার ভিত্তিতে প্রশিক্ষিত যন্ত্রমেধা নিয়ে ফেলে পক্ষপাতদুষ্ট সিদ্ধান্ত।
সুতরাং, শুধু নিজস্ব ফাউন্ডেশন মডেল বানালেই কাজ শেষ হচ্ছে না। সরকারপক্ষের যাঁরা চাইছেন যে, আগামী বছরগুলোতে ভারতের সমস্ত আঞ্চলিক ভাষায় তৈরি হোক ‘মেক ইন ইন্ডিয়া’ চ্যাটবট, তাঁদের এখনও কৃত্রিম মেধা নামের ইঞ্জিনটির আসল জ্বালানি, অর্থাৎ আমজনতার থেকে আহরিত তথ্যভান্ডারকে পরিচ্ছন্ন, সুষম, এবং সুরক্ষিত করার পথে অনেকটা হাঁটতে হবে।
Or
By continuing, you agree to our terms of use
and acknowledge our privacy policy
We will send you a One Time Password on this mobile number or email id
Or Continue with
By proceeding you agree with our Terms of service & Privacy Policy