কোন তথ্য ব্যবহৃত হচ্ছে, সে দিকে নজর রাখা জরুরি
Artificial Intelligence

কৃত্রিম বুদ্ধিমত্তার বছর

বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই।

Advertisement

স্বাগতম দাস

শেষ আপডেট: ২২ ডিসেম্বর ২০২৩ ০৮:১৪
Share:

—প্রতীকী ছবি।

বছর দশেক আগেও কম্পিউটারকে দিয়ে কাজ করাতে হলে শিখতে হত সি, সি-প্লাস-প্লাস, জাভার মতো সব প্রোগ্রামিং ল্যাঙ্গুয়েজ। কম্পিউটারের সঙ্গে নিতান্ত সাধারণ ইংরেজিতে কথাবার্তা চালিয়ে যাওয়ার রাস্তা খুলে দিয়ে গত বছর নভেম্বরে আলোচনার কেন্দ্রে উঠে এল আমেরিকার ওপেনএআই নামের এক সংস্থা— তারা বাজারে আনল চ্যাটজিপিটি নামের একটি প্রায় সর্বজ্ঞ চ্যাটবট। পক্ষে-বিপক্ষে নানা সমালোচনার মধ্যে দিয়েই প্রায় সমস্ত পেশার সঙ্গে যুক্ত মানুষ এবং বিনিয়োগকারীদের মধ্যে প্রবল জনপ্রিয় হয়ে উঠেছে চ্যাটজিপিটি-র নেপথ্যে থাকা জিপিটি ৩.৫, ৪ এবং সমগোত্রীয়রা। এগুলি হল লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) বা বৃহৎ ভাষা-প্রক্রিয়াকরণ মডেল। গোটা ২০২৩ জুড়েই শোনা গেল জেনারেটিভ এআই বা সৃষ্টিশীল কৃত্রিম মেধার এই তুঙ্গ পর্যায়টির আলোচনা। ‘এলএলএম’, ‘জেন-এআই’, ‘জ়িরো-শট লার্নিং’-এর মতো শব্দ ঢুকে পড়ল আমাদের ঘরে।

Advertisement

২০২০-২১ যদি অতিমারির বছর হয়ে থাকে, ২০২৩ নিঃসন্দেহে কৃত্রিম মেধার। এক দিকে আমেরিকার বৃহৎ পুঁজিবাদী ব্যবস্থায় বেসরকারি সংস্থাগুলোর কৃত্রিম মেধা গবেষণায় অকল্পনীয় মাপের লগ্নি ও সারা পৃথিবীকেই বাজারে পরিণত করার চেষ্টা; অন্য দিকে চিনের মতো দেশে সম্পূর্ণ সরকারের নিয়ন্ত্রণে নাগরিকদের জীবনের আনাচেকানাচে কৃত্রিম মেধার অনুপ্রবেশ— এই দুই বিপ্রতীপ সীমার মধ্যে দাঁড়িয়ে দুনিয়া।

সৃষ্টিশীল কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দুতে দাঁড়িয়ে এই মুহূর্তে সবচেয়ে আলোচিত গাণিতিক তন্ত্রটির পোশাকি নাম ‘ফাউন্ডেশন মডেল’। চ্যাটজিপিটি, বার্ড, লামা, পাম ইত্যাদি সংলাপধর্মী চ্যাটবটের নেপথ্যে রয়েছে অতিকায় এবং বহুমুখী কার্যশক্তিসম্পন্ন এই ধরনের ভাষা প্রক্রিয়াকরণ মডেল। এই মডেলগুলোকে আমাদের মানুষী ভাষার অনেক সাধারণ কার্যকলাপে (যেমন পাঠ সংক্ষেপণ, একটি অনুচ্ছেদ পড়ে তা থেকে প্রশ্নের উত্তর খোঁজা, শূন্যস্থান পূরণ ইত্যাদি) প্রশিক্ষিত করে তোলার জন্য ব্যবহার করতে হয় ইন্টারনেটের ভাঁড়ার থেকে বিপুল পরিমাণ ডিজিটাল টেক্সট-এর সম্ভার— উদাহরণ হিসাবে পেশ করা যায় গোটা উইকিপিডিয়াকেই। এর জন্য প্রয়োজন কার্যত ধারণাতীত মাপের গণনাশক্তি। তার জোগান আবার দিতে পারে গুগল, মাইক্রোসফট, মেটা বা ওপেনএআই-এর মতো সংস্থা, যাদের হাতে রয়েছে গোটা দুনিয়ার পুঁজির একটা বিরাট অংশ।

Advertisement

২০২৩-এ গড়ে ওঠা অনেক স্টার্ট আপ সংস্থাই নিজেদের ফাউন্ডেশন মডেল বানাতে পারেনি এই বিপুল পুঁজির অভাবে। তারা বরং এই বড় সংস্থাগুলির তৈরি মডেলগুলোকেই নিজেদের ব্যবহারিক ক্ষেত্রের সঙ্গে খাপ খাইয়ে নিতে চেষ্টা করে, তুলনায় অল্প পরিমাণ তথ্যের সাহায্যে বিশেষ প্রশিক্ষণ দিয়ে। এ ভাবে একটি সাধারণ ফাউন্ডেশন মডেলকে বিশেষ উদ্দেশ্যে ব্যবহার করার প্রক্রিয়াগুলোকে যন্ত্রমেধার পরিভাষায় বলে প্রি-ট্রেনিং, ফাইন-টিউনিং, এবং প্রম্পট এঞ্জিনিয়ারিং। এই প্রক্রিয়াগুলো ব্যবহার করে বানিয়ে ফেলা চলে নির্দিষ্ট ধরনের কাজের জন্য বিশেষ চ্যাটবট— যেমন মেড-পাম২, যা বিশেষ ভাবে প্রশিক্ষিত শুধুমাত্র চিকিৎসাবিদ্যা বিষয়ক প্রশ্নোত্তরের জন্য। এই চ্যাটবট শেক্সপিয়রের নাটক বিষয়ক প্রশ্নের সদুত্তর দিতে পারবে না, কিন্তু বুকের একটি এক্স-রে ছবি দেখে বলে দেবে ফুসফুসের অবস্থা ঠিক কী রকম, তৈরি করে দেবে একটি মেডিক্যাল রিপোর্ট।

বিদ্যালয় স্তরে আমরা আসলে অনেকটা ফাউন্ডেশন মডেলগুলোর মতোই এক বহুমাত্রিক শিক্ষণপ্রণালীর মধ্যে দিয়ে যাই। একই সঙ্গে শিখতে হয় ভাষা, অঙ্ক, ইতিহাস, ভূগোল, বিজ্ঞান; ভাল ছাত্র হতে গেলে পারদর্শিতা অর্জন করতে হয় সব ক’টাতেই। ক্রমে আমাদের শিক্ষা আরও সঙ্কীর্ণ এবং সুনির্দিষ্ট পরিসরে ন্যস্ত হয়। তার পর জীবিকা অর্জনের জন্য আমরা হয়তো কোনও একটি বিষয়ে বিশেষ ভাবে প্রশিক্ষিত হয়ে উঠি। এই বিশেষ প্রশিক্ষণ অনেকটা ভাষা প্রক্রিয়াকরণ মডেলগুলোর প্রি-ট্রেনিং এবং ফাইন-টিউনিংয়ের মতো। পরিণত বয়েসে সাফল্যের মূল চাবিকাঠি যেমন লুকিয়ে থাকে বিদ্যালয় স্তরের বহুমুখী শিক্ষার শক্ত বনিয়াদের উপরে, তেমনই বিশেষ ব্যবসায়িক প্রয়োজনে তৈরি চ্যাটবটগুলোর সাফল্য এবং সঠিক উত্তর দেওয়ার ক্ষমতাও এদের নেপথ্যে থাকা ফাউন্ডেশন মডেলগুলোর প্রশিক্ষণের উপরে নির্ভরশীল।

এই মুহূর্তে ভারতে দেড় হাজারেরও বেশি কৃত্রিম বুদ্ধিমত্তাভিত্তিক স্টার্ট আপ আছে, যেগুলোতে মোট বিনিয়োগের পরিমাণ প্রায় চারশো কোটি ডলার। কিন্তু, দুনিয়া জুড়ে সৃষ্টিশীল যন্ত্রমেধার ঝড়ের সঙ্গে পাল্লা দেওয়ার ক্ষমতা এখনও আমাদের আয়ত্তের অনেকটা বাইরে। সম্পূর্ণ দেশীয় উদ্যোগে তৈরি কোনও প্রতিষ্ঠান আজও জিপিটি-৪, বার্ড, লামা, কিংবা আন্থ্রপিকের মতো প্রতিষ্ঠিত জেনারেটিভ এআই প্ল্যাটফর্মের দিকে চ্যালেঞ্জ ছুড়ে দেওয়ার মতো প্রযুক্তি বাজারে আনতে পারেনি। ভাষা প্রক্রিয়াকরণ মডেলের উপরে নির্ভরশীল ভারতীয় স্টার্ট আপগুলোর কোনওটারই এখনও নিজস্ব ফাউন্ডেশন মডেল নেই। এই ধরনের সংস্থাগুলোর বৃদ্ধির পথে সবচেয়ে বড় বাধা হচ্ছে বিরাট মাপের গণনা-পরিকাঠামোর অভাব, যেটা পূরণ করতে গেলে প্রথমেই দরকার হবে বিশাল পুঁজির।

ওপেনএআই বা গুগলের মতো সংস্থার তৈরি ফাউন্ডেশন মডেলগুলোর মূল নকশা বা সোর্স-কোড প্রায় পুরোটাই গোপনীয় এবং সাধারণের ধরাছোঁয়ার বাইরে। সুতরাং, এই মডেলগুলোর অন্দরমহলে পক্ষপাতদুষ্টতা, তথ্য চুরি কিংবা তথ্যের অপলাপ ঘটিয়ে গ্রহীতাদের প্ররোচিত করার কোন খেলা চলছে, তা বোঝার এবং বন্ধ করার কোনও উপায় প্রায় নেই। বিভিন্ন আঞ্চলিক ভাষায় নিজেদের ফাউন্ডেশন মডেলকে প্রশিক্ষিত করার পথে ভারত-জিপিটি’র মতো প্রকল্প নিয়ে সরকারের সহায়তায় নেমে পড়েছে করোভার-এআই সংস্থা, যাদের গ্রহীতাদের লম্বা তালিকায় ভারতের বহু ব্যাঙ্কিং প্রতিষ্ঠান আছে। শোনা যাচ্ছে, গুগল এই কাজে ভারত সরকারের সঙ্গে হাত মিলিয়ে বড় অঙ্কের বিনিয়োগ করবে। আশার কথা বটে, শুধু অস্বস্তি বাড়িয়ে দিচ্ছে ২০২৩-এর শেষে ইন্টারনেটের জগতে যন্ত্রমেধার সাহায্যে মানবাধিকার লঙ্ঘনের ভয়ঙ্কর পরিসংখ্যান।

আজকের দুনিয়ায় কৃত্রিম বুদ্ধিমত্তার ব্যবহার নেটনাগরিকদের স্বাধীনতা এবং মানবাধিকারকে খর্ব করার কাজ অনেক সোজা করে দিয়েছে বিভিন্ন রাষ্ট্রযন্ত্রের কাছে। গত এক বছরে পৃথিবীর ৫৫টি দেশে নাগরিকরা জেলে নিক্ষিপ্ত হয়েছেন শুধু ইন্টারনেটে নিজেদের মতামত প্রকাশ করার অপরাধে, ৪১টি দেশের সরকার যন্ত্রমেধা-নির্ভর নজরদারি ব্যবস্থায় বিরুদ্ধমতের সামান্যতম প্রকাশেও বন্ধ করে দিয়েছে নানা ওয়েবসাইট। গত অক্টোবরে প্রকাশিত আমেরিকার সংস্থা ফ্রিডম হাউসের একটি রিপোর্ট বলছে, পৃথিবীর অন্তত ৪৭টি দেশে সৃষ্টিশীল কৃত্রিম মেধার অপব্যবহার করে নেটনাগরিকদের গেলানো হয়েছে রাষ্ট্রের পক্ষে লাভজনক বিভিন্ন মিথ্যা, যার সমর্থনে ব্যবহার করা হয়েছে নকল ছবি, ভিডিয়ো, বা টেক্সট। মায়ানমার, ইরান, চিনের মতো আরও অনেক দেশেই বেশ খোলাখুলি ভাবে সরকার বিভিন্ন মুনাফাসন্ধানী সংস্থার সঙ্গে হাত মিলিয়ে কৃত্রিম মেধার আধুনিকতম আবিষ্কারগুলোকে ব্যবহার করছে জনমত নিয়ন্ত্রণে রাখার পাশাপাশি বিরুদ্ধস্বরকে চিহ্নিত ও নির্মূল করতে।

শেষে একটা কথা মনে করিয়ে দেওয়া জরুরি। সমাজ থেকেই আসে তথ্য, সেই তথ্যের ভিত্তিতেই প্রশিক্ষণ লাভ করে কৃত্রিম মেধার সংস্থাগুলো। আবার সমাজের বিশেষ সুবিধাভোগী ও ক্ষমতাবানরাই ইন্টারনেটের মাধ্যমে বিভিন্ন ডিজিটাল প্ল্যাটফর্মে তথ্য জোগান। উইকিপিডিয়ার অধিকাংশ লেখা যেমন আসে ইউরোপ বা আমেরিকা থেকে, আফ্রিকার এমন কোনও দেশ থেকে নয়, যেখানে দিনে কয়েক ঘণ্টার বিদ্যুৎই রাজকীয় বিলাসিতা। সুতরাং, সেই সুবিধাভোগী অংশটির রাজনৈতিক, সাম্প্রদায়িক বা লিঙ্গভিত্তিক পক্ষপাত অনায়াসেই ছাপ ফেলে তথ্যভান্ডারে। এই তথ্যভান্ডার বিপুল হওয়া সত্ত্বেও নিরপেক্ষ নয়, আর তাই তার ভিত্তিতে প্রশিক্ষিত যন্ত্রমেধা নিয়ে ফেলে পক্ষপাতদুষ্ট সিদ্ধান্ত।

সুতরাং, শুধু নিজস্ব ফাউন্ডেশন মডেল বানালেই কাজ শেষ হচ্ছে না। সরকারপক্ষের যাঁরা চাইছেন যে, আগামী বছরগুলোতে ভারতের সমস্ত আঞ্চলিক ভাষায় তৈরি হোক ‘মেক ইন ইন্ডিয়া’ চ্যাটবট, তাঁদের এখনও কৃত্রিম মেধা নামের ইঞ্জিনটির আসল জ্বালানি, অর্থাৎ আমজনতার থেকে আহরিত তথ্যভান্ডারকে পরিচ্ছন্ন, সুষম, এবং সুরক্ষিত করার পথে অনেকটা হাঁটতে হবে।

আনন্দবাজার অনলাইন এখন

হোয়াট্‌সঅ্যাপেও

ফলো করুন
অন্য মাধ্যমগুলি:
আরও পড়ুন
Advertisement