গত ২৭ জানুয়ারি দুনিয়া জুড়ে ছড়ানো কৃত্রিম বুদ্ধিমত্তার বাণিজ্য-বাজারে ভূমিকম্প হল। চিনের একটি ছোট গবেষক দলের তৈরি ‘ডিপসিক’ নামের এআই মডেলটি আমেরিকার শেয়ার বাজার থেকে খুব অল্প সময়ের মধ্যে উধাও করে দিয়েছে প্রায় এক লক্ষ কোটি ডলার। শেয়ার বাজারের ইতিহাসে এক দিনে এই পরিমাণ পতন আগে কখনও দেখা যায়নি। এইটুকু বললে আসলে কিছুই বলা হয় না। যন্ত্রমেধার বাজারটিকে নিয়ন্ত্রণ করে আসছে আমেরিকার যে মস্তান কোম্পানিগুলো— যেমন, ওপেনএআই, মেটা, গুগল, এবং এআই হার্ডওয়্যার-এর দিক থেকে অবশ্যই এনভিডিয়া— এদের তুলনায় মূলধন কিংবা আয়তনে ২০২৩-এর মে মাসে আত্মপ্রকাশ করা ডিপসিক নামক সংস্থাটি নেহাতই নগণ্য।
এত দিন ভেবেছি, চ্যাটজিপিটি-র মতো ভাষা প্রক্রিয়াকরণ মডেলগুলোকে শূন্য থেকে নিজেদের মতো করে তৈরি করতে লাগবে চিহ্নিত তথ্যের মহাসাগর এবং সেই সমুদ্রকে মন্থন করতে এক অবিশ্বাস্য গণনাশক্তি। এআই-এর জন্য জিপিইউ, ডেটা সেন্টার ও বিশাল পরিমাণ বিদ্যুতের প্রয়োজন অনিবার্য মনে হলেও উদ্ভাবনের জন্য এই মূল্য চোকানোর ক্ষমতা আমেরিকা ছাড়া খুব বেশি দেশের নাগালে ছিল না। বিশ্লেষকরা ধরে নিয়েছিলেন যে, পারমাণবিক শক্তি— যা পরিচ্ছন্ন ও অবাধে প্রসারণযোগ্য বিদ্যুৎ দিতে পারে— ক্রমে হয়ে উঠবে এআই বিপ্লবের চালিকাশক্তি। ঠিক এখানেই পুরো খেলাটা ঘুরিয়ে দিল ডিপসিক— মাত্র ছ’মিলিয়ন ডলারের একটি স্টার্টআপ, যারা মূলধনের অভাবকে পুষিয়ে দিতে হাতিয়ার করল অসাধারণ উদ্ভাবনী ক্ষমতাকে, যে ক্ষমতার ভিত্তি আসলে কোনও কৃত্রিম মেধা নয়, নিতান্তই মানবীয় বুদ্ধিমত্তা।
খেলা কতটা ঘুরে গেল, তার একটু আভাস দেওয়ার চেষ্টা করি। এআই-এর দুনিয়াতে একটি টোকেন হল আমাদের ভাষার ক্ষুদ্রতম একক, যা চ্যাটজিপিটি-র মতো একটি বড় ভাষা মডেল ব্যবহার করে ব্যবহারকারীদের প্রশ্নের উত্তর দিতে। এটি সাধারণত একটি শব্দ, আংশিক শব্দ বা চিহ্ন (যেমন বিরামচিহ্ন) হতে পারে। ওপেনএআই-এর চ্যাটজিপিটি-৪’এর মতো মডেল চালাতে প্রতি দশ লক্ষ টোকেনে ১০০ ডলার খরচ হয়। ডিপসিকের খরচ সেখানে দশ লক্ষ টোকেনে মাত্র ৪ ডলার!
ডিপসিকের উদ্ভাবনের প্রভাব শুধু প্রযুক্তি খাতেই সীমাবদ্ধ নয়। যাদের জিপিইউ ছাড়া যন্ত্রমেধা কল্পনাই করা যেত না, সেই এনভিডিয়া শেয়ার বাজারে বড় ধাক্কা খেয়েছে; শেয়ারে রেকর্ড পতন হয়েছে ভিস্ট্রা ও কনস্টেলেশন-এর মতো সংস্থার, যারা নিউক্লিয়ার শক্তির ভবিষ্যৎ নিয়ে বাজি ধরেছিল। ভার্টিভ হোল্ডিংস, যারা এআই-এর জন্য ডেটা সেন্টার পরিকাঠামো সরবরাহ করে, তাদের শেয়ারের মূল্য কমেছে ৩০%। কিন্তু ব্যাপারটা শুধুই দাম কমানোর নয়, ব্যাপারটা হল সর্বাধুনিক প্রাইভেট এআই মডেলগুলোকে কয়েকটা মাত্র অতিবৃহৎ প্রযুক্তি সংস্থার সিন্দুক থেকে বার করে, পৃথিবীর গরিব দেশগুলোর সাধারণ গবেষকদের নাগালে নিয়ে আসার— সাফল্যে চ্যাটজিপিটি-র কাছাকাছি, কিন্তু প্রায় ওপেন সোর্স অর্থাৎ নিখরচায় ব্যবহারযোগ্য মডেল তৈরি করে এআই-এর এক প্রকার গণতন্ত্রীকরণ। অনেকের মতে, সেটাই ডিপসিকের এই বাজিমাতের আসল তাৎপর্য।
ডিপসিকের দক্ষতার পিছনে রহস্যটা বুঝতে হলে আমাদের তাকাতে হবে মেশিন লার্নিং-এর একটি বিশেষ শাখার দিকে, পোশাকি নাম ‘রিইনফোর্সমেন্ট লার্নিং’। এ হল শেখার এমন একটি পদ্ধতি, যেখানে এক জন এজেন্ট (যেমন, একটি শিশু) সরাসরি তার নিজস্ব পরিবেশে কিছু কাজ করে; সেই কাজের ফলাফল ভাল হল না খারাপ, সেটা অনুধাবন করে; এবং, ভবিষ্যতে একই পরিবেশে কী করা উচিত, সেটা শিখতে থাকে। যখন ভাল কিছু করে, তখন পুরস্কার পায়; আর ভুল করলে জোটে শাস্তি বা নেতিবাচক প্রতিক্রিয়া, যা তাকে পরের বার নির্ভুল ভাবে কাজটি করতে উদ্বুদ্ধ করে।
ধরুন, একটি শিশু নতুন ভাষা শিখছে। কিন্তু সে তো আগে থেকে কিনে রাখা একটা বিরাট অভিধান নিয়ে বসে না, বরং বেছে নেয় তার চার পাশের পরিবেশ থেকে শোনা পছন্দসই কিছু শব্দ। সে প্রথম বার ‘বিস্কুট’ বলতে গিয়ে বার বার ভুল উচ্চারণ করে, বাবা-মা তাকে ঠিক উচ্চারণটি শেখান— এটি এক ধরনের সংশোধন, বা ‘শাস্তি’। যখন সে ঠিক ভাবে ‘বিস্কুট’ বলতে পারে, তখন সবাই খুশি হয়ে তার প্রশংসা করেন— এটি পুরস্কার। শিশুটি দেখে, ঠিক উচ্চারণ করলে সবাই খুশি হয়, তাই সে পরের বার আরও ভাল ভাবে বলার চেষ্টা করে। এই প্রক্রিয়ায়, শিশুটি আস্তে আস্তে ভাষা শেখে, কারণ সে বুঝতে পারে কোন উচ্চারণ বা বাক্য বললে ইতিবাচক প্রতিক্রিয়া পাবে, এবং কোনটা ভুল করলে সংশোধন করা হবে। এরই নাম ‘রিইনফোর্সমেন্ট লার্নিং’।
ডিপসিক আর-ওয়ান এমন একটি মডেল, যা কোনও জটিল সমস্যার সমাধান করার সময় নিজেরই ব্যবহৃত যুক্তিজালকে পুনর্মূল্যায়ন করতে থাকে, সেই যুক্তির ফাঁকফোঁকরগুলো থেকে শেখে, এবং সময়ের সঙ্গে আরও শক্তিশালী ও নির্ভরযোগ্য হয়ে ওঠে। যন্ত্রমেধা সংক্রান্ত পরিভাষায় বললে, ডিপসিক বাজারচলতি ‘সুপারভাইজ়ড ফাইন-টিউনিং’এর বদলে সরাসরি ‘রিইনফোর্সমেন্ট লার্নিং’-এ জোর দিয়েছে অনেক বেশি।
প্রচলিত রিইনফোর্সমেন্ট লার্নিংয়ে, একটি এআই মডেল সঠিক উত্তর দিলে কতটা পুরস্কার পাবে, আর ভুল উত্তর দিলেই বা তার কতটা শাস্তি অথবা তিরস্কার জুটবে, সেগুলো আগে থেকে ঠিক করে রাখতে হয়। কিন্তু ডিপসিক একটি বিশেষ রিইনফোর্সমেন্ট লার্নিং পদ্ধতি ব্যবহার করে, যা কতকটা মানুষের নতুন কোনও দক্ষতা অর্জনের মতো। সেখানে চেষ্টা, ভুল এবং ধীরে ধীরে নিজের আগের চেষ্টাগুলোকেও ছাপিয়ে যাওয়ার মাধ্যমে উন্নতির দিকে এগোই আমরা। এই শিক্ষণপ্রণালীতে একটা জটিল প্রশ্নকে ঘুরিয়ে-ফিরিয়ে নানা ভাবে করা হলে, বা একই প্রশ্নের অনেকগুলো সম্ভাব্য উত্তর থাকলে, এআই মডেলটি আলাদা আলাদা সময়ে তার দেওয়া বিভিন্ন উত্তরগুলোর মধ্যে তুলনা করতে থাকে, যাতে ভবিষ্যতের উত্তরগুলো আরও যুক্তিনিষ্ঠ হয়, মডেলটির স্থিতিশীলতা বজায় রেখেও।
ডিপসিক প্রতিষ্ঠার সময়টা ছিল এক কঠিন চ্যালেঞ্জের মুহূর্ত। তখন আমেরিকান সরকার এনভিডিয়া চিপের রফতানির উপরে কঠোর নিয়ন্ত্রণ আরোপ করেছিল, ফলে চিনের পক্ষে উন্নত প্রক্রিয়াকরণ সামগ্রী পাওয়া হয়ে উঠছিল এক প্রকার অসম্ভব। জিপিইউ-এর অপ্রতুলতাকে মোকাবিলা করতে গিয়ে ডিপসিকের গবেষকরা জোর দিচ্ছিলেন ‘মিক্সচার অব এক্সপার্টস’ প্রযুক্তির উপরে, যেখানে বড় মডেলের সব অংশের জন্য সব সময় গণনা না চালিয়েও, শুধুমাত্র পূর্বনির্ধারিত ‘এক্সপার্ট’ বা বিশেষ অংশগুলোকেই সক্রিয় রাখা হয়, ফলে অনেকটাই কমে যায় মডেলটির প্রশিক্ষণের খরচ।
কিন্তু গল্পটা এখানেই শেষ হচ্ছে না। কৃত্রিম মেধার গবেষণা করতে কোটি কোটি টাকার জিপিইউ কেনার মতো সামর্থ্য নেই যে গবেষকদের, তাঁদের কথা মাথায় রেখে ডিপসিক বাজারে এনেছে কিছু ছোট ছোট ‘ডিস্টিলড সংস্করণ’, যেখানে একটি বড় মডেল (শিক্ষক) একটি ছোট মডেলকে (শিক্ষার্থী) প্রশিক্ষিত করে। মাত্র ৪৮ গিগাবাইট র্যান্ডম অ্যাক্সেস মেমোরি (র্যাম) দিয়ে এই ডিস্টিলড মডেলগুলি আমাদের বাড়ির ল্যাপটপেও চলতে পারে। এর ফলে আরও বেশি মানুষের কাছে সহজলভ্য হয়ে উঠতে পারে উন্নত এআই। ডিপসিকের আজকের সাফল্যকে বিশ্লেষকরা তুলনা করছেন সোভিয়েট কৃত্রিম উপগ্রহ স্পুটনিকের উৎক্ষেপণের মুহূর্তটির সঙ্গে। একটা জিনিস খুব স্পষ্ট— কৃত্রিম মেধার জগতে মস্তানি শুধু টাকা কিংবা গণনাশক্তি দিয়ে আর হবে না, থাকতে হবে স্বকীয় উদ্ভাবনী ক্ষমতা ও প্রচলিত ছক ভেঙে বেরিয়ে আসার সাহস।
এমন গবেষণা ভারতে হয় না কেন? এর একটা কারণ: একেবারে স্কুল স্তর থেকে শিক্ষাব্যবস্থার সমূহ সর্বনাশ হয়ে গিয়েছে। উচ্চশিক্ষার ক্ষেত্রে ব্যতিক্রমী চিন্তাসম্পন্ন আধুনিক উদ্ভাবনী গবেষণায় বিনিয়োগ প্রায় নেই বললেই চলে। আমলাদের নির্দেশ শিরোধার্য করে, গবেষণার টাকা দেওয়ার মালিক সরকারকে যতটা সম্ভব তুষ্ট রেখে এবং মাঝে মাঝে পুষ্পক বিমান বা গোমূত্রের গুণ বর্ণনা করে উচ্চশিক্ষা প্রতিষ্ঠানগুলোকে চালিয়ে নিয়ে যাচ্ছেন সেগুলোর মহামান্য কর্ণধারেরা। আমরাও মজে আছি কুম্ভ মেলায় আইআইটি বাবার কেরামতি নিয়ে। ডিপসিক, সে অন্য কোনও সাধনার ফল।
ইন্ডিয়ান স্ট্যাটিস্টিক্যাল ইনস্টিটিউট, কলকাতা
(এই প্রতিবেদনটি আনন্দবাজার পত্রিকার মুদ্রিত সংস্করণ থেকে নেওয়া হয়েছে)