কৃত্রিম বুদ্ধিমত্তার বছর

বছর দশেক আগেও কম্পিউটারকে দিয়ে কাজ করাতে হলে শিখতে হত সি, সি-প্লাস-প্লাস, জাভার মতো সব প্রোগ্রামিং ল্যাঙ্গুয়েজ। কম্পিউটারের সঙ্গে নিতান্ত সাধারণ ইংরেজিতে কথাবার্তা চালিয়ে যাওয়ার রাস্তা খুলে দিয়ে গত বছর নভেম্বরে আলোচনার কেন্দ্রে উঠে এল আমেরিকার ওপেনএআই নামের এক সংস্থা— তারা বাজারে আনল চ্যাটজিপিটি নামের একটি প্রায় সর্বজ্ঞ চ্যাটবট। পক্ষে-বিপক্ষে নানা সমালোচনার মধ্যে দিয়েই প্রায় সমস্ত পেশার সঙ্গে যুক্ত মানুষ এবং বিনিয়োগকারীদের মধ্যে প্রবল জনপ্রিয় হয়ে উঠেছে চ্যাটজিপিটি-র নেপথ্যে থাকা জিপিটি ৩.৫, ৪ এবং সমগোত্রীয়রা। এগুলি হল লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) বা বৃহৎ ভাষা-প্রক্রিয়াকরণ মডেল। গোটা ২০২৩ জুড়েই শোনা গেল জেনারেটিভ এআই বা সৃষ্টিশীল কৃত্রিম মেধার এই তুঙ্গ পর্যায়টির আলোচনা। ‘এলএলএম’, ‘জেন-এআই’, ‘জ়িরো-শট লার্নিং’-এর মতো শব্দ ঢুকে পড়ল আমাদের ঘরে।

২০২০-২১ যদি অতিমারির বছর হয়ে থাকে, ২০২৩ নিঃসন্দেহে কৃত্রিম মেধার। এক দিকে আমেরিকার বৃহৎ পুঁজিবাদী ব্যবস্থায় বেসরকারি সংস্থাগুলোর কৃত্রিম মেধা গবেষণায় অকল্পনীয় মাপের লগ্নি ও সারা পৃথিবীকেই বাজারে পরিণত করার চেষ্টা; অন্য দিকে চিনের মতো দেশে সম্পূর্ণ সরকারের নিয়ন্ত্রণে নাগরিকদের জীবনের আনাচেকানাচে কৃত্রিম মেধার অনুপ্রবেশ— এই দুই বিপ্রতীপ সীমার মধ্যে দাঁড়িয়ে দুনিয়া।

সৃষ্টিশীল কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দুতে দাঁড়িয়ে এই মুহূর্তে সবচেয়ে আলোচিত গাণিতিক তন্ত্রটির পোশাকি নাম ‘ফাউন্ডেশন মডেল’। চ্যাটজিপিটি, বার্ড, লামা, পাম ইত্যাদি সংলাপধর্মী চ্যাটবটের নেপথ্যে রয়েছে অতিকায় এবং বহুমুখী কার্যশক্তিসম্পন্ন এই ধরনের ভাষা প্রক্রিয়াকরণ মডেল। এই মডেলগুলোকে আমাদের মানুষী ভাষার অনেক সাধারণ কার্যকলাপে (যেমন পাঠ সংক্ষেপণ, একটি অনুচ্ছেদ পড়ে তা থেকে প্রশ্নের উত্তর খোঁজা, শূন্যস্থান পূরণ ইত্যাদি) প্রশিক্ষিত করে তোলার জন্য ব্যবহার করতে হয় ইন্টারনেটের ভাঁড়ার থেকে বিপুল পরিমাণ ডিজিটাল টেক্সট-এর সম্ভার— উদাহরণ হিসাবে পেশ করা যায় গোটা উইকিপিডিয়াকেই। এর জন্য প্রয়োজন কার্যত ধারণাতীত মাপের গণনাশক্তি। তার জোগান আবার দিতে পারে গুগল, মাইক্রোসফট, মেটা বা ওপেনএআই-এর মতো সংস্থা, যাদের হাতে রয়েছে গোটা দুনিয়ার পুঁজির একটা বিরাট অংশ।

২০২৩-এ গড়ে ওঠা অনেক স্টার্ট আপ সংস্থাই নিজেদের ফাউন্ডেশন মডেল বানাতে পারেনি এই বিপুল পুঁজির অভাবে। তারা বরং এই বড় সংস্থাগুলির তৈরি মডেলগুলোকেই নিজেদের ব্যবহারিক ক্ষেত্রের সঙ্গে খাপ খাইয়ে নিতে চেষ্টা করে, তুলনায় অল্প পরিমাণ তথ্যের সাহায্যে বিশেষ প্রশিক্ষণ দিয়ে। এ ভাবে একটি সাধারণ ফাউন্ডেশন মডেলকে বিশেষ উদ্দেশ্যে ব্যবহার করার প্রক্রিয়াগুলোকে যন্ত্রমেধার পরিভাষায় বলে প্রি-ট্রেনিং, ফাইন-টিউনিং, এবং প্রম্পট এঞ্জিনিয়ারিং। এই প্রক্রিয়াগুলো ব্যবহার করে বানিয়ে ফেলা চলে নির্দিষ্ট ধরনের কাজের জন্য বিশেষ চ্যাটবট— যেমন মেড-পাম২, যা বিশেষ ভাবে প্রশিক্ষিত শুধুমাত্র চিকিৎসাবিদ্যা বিষয়ক প্রশ্নোত্তরের জন্য। এই চ্যাটবট শেক্সপিয়রের নাটক বিষয়ক প্রশ্নের সদুত্তর দিতে পারবে না, কিন্তু বুকের একটি এক্স-রে ছবি দেখে বলে দেবে ফুসফুসের অবস্থা ঠিক কী রকম, তৈরি করে দেবে একটি মেডিক্যাল রিপোর্ট।

বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই। ক্রমে আমাদের শিক্ষা আরও সঙ্কীর্ণ এবং সুনির্দিষ্ট পরিসরে ন্যস্ত হয়। তার পর জীবিকা অর্জনের জন্য আমরা হয়তো কোনও একটি বিষয়ে বিশেষ ভাবে প্রশিক্ষিত হয়ে উঠি। এই বিশেষ প্রশিক্ষণ অনেকটা ভাষা প্রক্রিয়াকরণ মডেলগুলোর প্রি-ট্রেনিং এবং ফাইন-টিউনিংয়ের মতো। পরিণত বয়েসে সাফল্যের মূল চাবিকাঠি যেমন লুকিয়ে থাকে বিদ্যালয় স্তরের বহুমুখী শিক্ষার শক্ত বনিয়াদের উপরে, তেমনই বিশেষ ব্যবসায়িক প্রয়োজনে তৈরি চ্যাটবটগুলোর সাফল্য এবং সঠিক উত্তর দেওয়ার ক্ষমতাও এদের নেপথ্যে থাকা ফাউন্ডেশন মডেলগুলোর প্রশিক্ষণের উপরে নির্ভরশীল।

এই মুহূর্তে ভারতে দেড় হাজারেরও বেশি কৃত্রিম বুদ্ধিমত্তাভিত্তিক স্টার্ট আপ আছে, যেগুলোতে মোট বিনিয়োগের পরিমাণ প্রায় চারশো কোটি ডলার। কিন্তু, দুনিয়া জুড়ে সৃষ্টিশীল যন্ত্রমেধার ঝড়ের সঙ্গে পাল্লা দেওয়ার ক্ষমতা এখনও আমাদের আয়ত্তের অনেকটা বাইরে। সম্পূর্ণ দেশীয় উদ্যোগে তৈরি কোনও প্রতিষ্ঠান আজও জিপিটি-৪, বার্ড, লামা, কিংবা আন্থ্রপিকের মতো প্রতিষ্ঠিত জেনারেটিভ এআই প্ল্যাটফর্মের দিকে চ্যালেঞ্জ ছুড়ে দেওয়ার মতো প্রযুক্তি বাজারে আনতে পারেনি। ভাষা প্রক্রিয়াকরণ মডেলের উপরে নির্ভরশীল ভারতীয় স্টার্ট আপগুলোর কোনওটারই এখনও নিজস্ব ফাউন্ডেশন মডেল নেই। এই ধরনের সংস্থাগুলোর বৃদ্ধির পথে সবচেয়ে বড় বাধা হচ্ছে বিরাট মাপের গণনা-পরিকাঠামোর অভাব, যেটা পূরণ করতে গেলে প্রথমেই দরকার হবে বিশাল পুঁজির।

ওপেনএআই বা গুগলের মতো সংস্থার তৈরি ফাউন্ডেশন মডেলগুলোর মূল নকশা বা সোর্স-কোড প্রায় পুরোটাই গোপনীয় এবং সাধারণের ধরাছোঁয়ার বাইরে। সুতরাং, এই মডেলগুলোর অন্দরমহলে পক্ষপাতদুষ্টতা, তথ্য চুরি কিংবা তথ্যের অপলাপ ঘটিয়ে গ্রহীতাদের প্ররোচিত করার কোন খেলা চলছে, তা বোঝার এবং বন্ধ করার কোনও উপায় প্রায় নেই। বিভিন্ন আঞ্চলিক ভাষায় নিজেদের ফাউন্ডেশন মডেলকে প্রশিক্ষিত করার পথে ভারত-জিপিটি’র মতো প্রকল্প নিয়ে সরকারের সহায়তায় নেমে পড়েছে করোভার-এআই সংস্থা, যাদের গ্রহীতাদের লম্বা তালিকায় ভারতের বহু ব্যাঙ্কিং প্রতিষ্ঠান আছে। শোনা যাচ্ছে, গুগল এই কাজে ভারত সরকারের সঙ্গে হাত মিলিয়ে বড় অঙ্কের বিনিয়োগ করবে। আশার কথা বটে, শুধু অস্বস্তি বাড়িয়ে দিচ্ছে ২০২৩-এর শেষে ইন্টারনেটের জগতে যন্ত্রমেধার সাহায্যে মানবাধিকার লঙ্ঘনের ভয়ঙ্কর পরিসংখ্যান।

আজকের দুনিয়ায় কৃত্রিম বুদ্ধিমত্তার ব্যবহার নেটনাগরিকদের স্বাধীনতা এবং মানবাধিকারকে খর্ব করার কাজ অনেক সোজা করে দিয়েছে বিভিন্ন রাষ্ট্রযন্ত্রের কাছে। গত এক বছরে পৃথিবীর ৫৫টি দেশে নাগরিকরা জেলে নিক্ষিপ্ত হয়েছেন শুধু ইন্টারনেটে নিজেদের মতামত প্রকাশ করার অপরাধে, ৪১টি দেশের সরকার যন্ত্রমেধা-নির্ভর নজরদারি ব্যবস্থায় বিরুদ্ধমতের সামান্যতম প্রকাশেও বন্ধ করে দিয়েছে নানা ওয়েবসাইট। গত অক্টোবরে প্রকাশিত আমেরিকার সংস্থা ফ্রিডম হাউসের একটি রিপোর্ট বলছে, পৃথিবীর অন্তত ৪৭টি দেশে সৃষ্টিশীল কৃত্রিম মেধার অপব্যবহার করে নেটনাগরিকদের গেলানো হয়েছে রাষ্ট্রের পক্ষে লাভজনক বিভিন্ন মিথ্যা, যার সমর্থনে ব্যবহার করা হয়েছে নকল ছবি, ভিডিয়ো, বা টেক্সট। মায়ানমার, ইরান, চিনের মতো আরও অনেক দেশেই বেশ খোলাখুলি ভাবে সরকার বিভিন্ন মুনাফাসন্ধানী সংস্থার সঙ্গে হাত মিলিয়ে কৃত্রিম মেধার আধুনিকতম আবিষ্কারগুলোকে ব্যবহার করছে জনমত নিয়ন্ত্রণে রাখার পাশাপাশি বিরুদ্ধস্বরকে চিহ্নিত ও নির্মূল করতে।

শেষে একটা কথা মনে করিয়ে দেওয়া জরুরি। সমাজ থেকেই আসে তথ্য, সেই তথ্যের ভিত্তিতেই প্রশিক্ষণ লাভ করে কৃত্রিম মেধার সংস্থাগুলো। আবার সমাজের বিশেষ সুবিধাভোগী ও ক্ষমতাবানরাই ইন্টারনেটের মাধ্যমে বিভিন্ন ডিজিটাল প্ল্যাটফর্মে তথ্য জোগান। উইকিপিডিয়ার অধিকাংশ লেখা যেমন আসে ইউরোপ বা আমেরিকা থেকে, আফ্রিকার এমন কোনও দেশ থেকে নয়, যেখানে দিনে কয়েক ঘণ্টার বিদ্যুৎই রাজকীয় বিলাসিতা। সুতরাং, সেই সুবিধাভোগী অংশটির রাজনৈতিক, সাম্প্রদায়িক বা লিঙ্গভিত্তিক পক্ষপাত অনায়াসেই ছাপ ফেলে তথ্যভান্ডারে। এই তথ্যভান্ডার বিপুল হওয়া সত্ত্বেও নিরপেক্ষ নয়, আর তাই তার ভিত্তিতে প্রশিক্ষিত যন্ত্রমেধা নিয়ে ফেলে পক্ষপাতদুষ্ট সিদ্ধান্ত।

সুতরাং, শুধু নিজস্ব ফাউন্ডেশন মডেল বানালেই কাজ শেষ হচ্ছে না। সরকারপক্ষের যাঁরা চাইছেন যে, আগামী বছরগুলোতে ভারতের সমস্ত আঞ্চলিক ভাষায় তৈরি হোক ‘মেক ইন ইন্ডিয়া’ চ্যাটবট, তাঁদের এখনও কৃত্রিম মেধা নামের ইঞ্জিনটির আসল জ্বালানি, অর্থাৎ আমজনতার থেকে আহরিত তথ্যভান্ডারকে পরিচ্ছন্ন, সুষম, এবং সুরক্ষিত করার পথে অনেকটা হাঁটতে হবে।

(এই প্রতিবেদনটি আনন্দবাজার পত্রিকার মুদ্রিত সংস্করণ থেকে নেওয়া হয়েছে)

Artificial Intelligence Science Society