Data Science

বিগ ডেটা ও ষষ্ঠীচরণ

অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’। 

Advertisement

অতনু বিশ্বাস

শেষ আপডেট: ২৩ ডিসেম্বর ২০২০ ০১:৫২
Share:

— ফাইল চিত্র

ডিজিটাল তথ্যের সাগরে প্লাবন এসেছে। এমনিতেই জীবনযাপনের প্রতিটি ক্ষণ আজ বাঁধা আন্তর্জালের দুনিয়াতে। সোশ্যাল মিডিয়ায় ‘ইন্টারনেট অব থিংস’-এর (ইন্দ্র)জালে জড়ানো অগণিত বস্তুও প্রতি মুহূর্তে জোগান দিয়ে চলেছে গাদা গাদা তথ্যের। এরই মাঝে অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’।

Advertisement

এই তথ্যসমুদ্র মন্থন করে অমৃত আহরণের প্রচেষ্টাও চলেছে পুরোদস্তুর, কয়েক দশক ধরেই। নতুন একদল পেশাদারই তৈরি হয়ে গেলেন— ‘ডেটা সায়েন্টিস্ট’। প্রধানত কিছু গড়পড়তা সফটওয়্যার চালিয়ে বিপুল পরিমাণে ডেটা-র বিশ্লেষণ করে পরিকল্পনার পথ-নির্দেশ করে চলেছেন এঁরা। ব্যবসা-বাণিজ্যে, খেলায়, ভোটের রাজনীতিতে, স্বাস্থ্যে, মানব-সম্পদে, কোথায় নয়!

এই শতকের গোড়ার দিকে আমেরিকার বেসবল টিম ‘ওকল্যান্ড অ্যাথলেটিক্স’-এর সাফল্যের গল্প এখন প্রায় রূপকথার পর্যায়ভুক্ত। এদের ম্যানেজার বিলি বিন খুব অল্প বাজেটেও সাফল্য এনে দিয়েছেন তাঁর দলকে, ‘মেজর লিগ বেসবল’ প্রতিযোগিতায়— শুধুমাত্র রাশিবিজ্ঞান, প্রজ্ঞা আর বাস্তব বুদ্ধিকে ব্যবহার করে। অন্য দলগুলি যেখানে ব্যাটিং গড়, স্বাস্থ্য, গতি ইত্যাদিতে গুরুত্ব দিয়ে খেলোয়াড় নিয়োগ করে, বিলি বিন পুরনো তথ্য বিশ্লেষণ করে দেখলেন, ‘অন-বেস পারসেন্টেজ’ নামে এক সূচক খেলোয়াড়দের অর্থমূল্যের ভাল নির্ণায়ক হতে পারে। তার ভিত্তিতেই দল গঠন করেন বিন। পর পর ২০টা খেলায় জিতে তৈরি হয় এক নতুন রেকর্ড। এ নিয়ে ২০০৩ সালে জমিয়ে বই লিখেছেন মাইকেল ল্যুইস। মানিবল। হলিউডে তা নিয়ে ছবি হয়েছে ২০১১ সালে। বিলি বিনের ভূমিকায় ব্র্যাড পিট। ক্রমে জীবনের প্রায় সর্ব ক্ষেত্রের দখল নিয়ে ফেলল এই ‘মানিবল’-সংস্কৃতি। আর সিলিকন ভ্যালি এক জাদুর ঝাঁপি নিয়ে এর মধ্যে ঢুকে পড়ল।

Advertisement

কোভিড-১৯ অতিমারি মোকাবিলায় ‘বিগ ডেটা’ ম্যাজিক দেখাবে, এমনটাই প্রত্যাশা ছিল অনেকের। ডেটা সায়েন্টিস্টদের সামনেও এ ছিল অগ্নিপরীক্ষা। এপ্রিলে ‘হার্ভার্ড বিজ়নেস রিভিউ’-এর এক প্রবন্ধে বলা হল, শতাব্দী-প্রাচীন স্প্যানিশ ফ্লু-র সঙ্গে আজকের অতিমারির প্রধান পার্থক্য হল প্রযুক্তির বিবর্তন। বলা হল, এটাই ‘বিগ ডেটা’-র সবচেয়ে অর্থবহ চ্যালেঞ্জ। ইচ্ছাশক্তি এবং উদ্ভাবনী ক্ষমতার প্রয়োগে নাকি ক্ষুদ্রাতিক্ষুদ্র স্তরে, এমনকি পাড়ায় পাড়ায়ও, ভাইরাস সংক্রমণের দ্রুত পূর্বাভাস দেওয়া সম্ভব। দক্ষিণ কোরিয়া বা তাইওয়ানের কোভিড নিয়ন্ত্রণে সাফল্যকে ‘বিগ ডেটা’ বিশ্লেষণের সাফল্যের সঙ্গে জুড়বার চেষ্টাও হল।

কিন্তু অতিমারির দাপট বাড়তেই স্পষ্ট হল ‘বিগ ডেটা’-র অসহায় ব্যর্থতাও। কোভিড অতিমারি সামলাতে ‘বিগ ডেটা’ জাদুকাঠি হয়ে উঠতে পারলে তা বড় বিজ্ঞাপন হত ডেটা সায়েন্টিস্টদের পক্ষে। এই কঠিনতম এবং অতি-প্রয়োজনীয় পরীক্ষায় বিগ ডেটা-র ব্যর্থতাকেও তাই তুলে ধরা প্রয়োজন।
আমেরিকা থেকে ভারত, বিভিন্ন দেশের নির্বাচনের ফলাফল নির্ধারণে বিগ ডেটার ভূমিকাই হোক, বা ২০১৪-র ব্রাজিল বিশ্বকাপে জার্মানির চ্যাম্পিয়ন হওয়ার পিছনে ‘বিগ ডেটা’-র বিশ্লেষণ-ভিত্তিক পরিকল্পনার অবদানই হোক, এই নতুন প্রযুক্তি নিয়ে গত কয়েক বছরে আলোচনা হয়েছে প্রচুর। কোভিড-১৯’পর্ব কিন্তু দেখাল, এখনও ‘বিগ ডেটা’ নামের মস্ত হাতিটাকে নিয়ে লোফালুফি করবার মতো ষষ্ঠীচরণ হয়ে উঠতে পারেনি আমাদের প্রযুক্তি। ২০০৮-এ খুব ঢাক-ঢোল পিটিয়ে গুগল শুরু করেছিল ফ্লু-র পূর্বাভাস দেওয়া। ফ্লু হওয়ার উপক্রম হলে সে সংক্রান্ত যে সব সার্চ করা হয় গুগলের সার্চ ইঞ্জিনে, তার বিশ্লেষণ করে সরকারি স্বাস্থ্য সংস্থার আগে ফ্লু-র পূর্বাভাস দেওয়াই ছিল এই প্রকল্পের উদ্দেশ্য। প্রকল্পটা মুখ থুবড়ে পড়ে। আসলে মানুষ যখন ফ্লু হয়েছে ভাবে, তার প্রায় নব্বই শতাংশ ক্ষেত্রেই সেটা বাস্তবে ফ্লু নয়। তাই তথ্যটা বিপুল হলেও, কতটা নির্ভরযোগ্য, সন্দেহ থেকেই যায়।

তবু, প্রযুক্তির উন্নতির সঙ্গে সঙ্গে উপচে পড়া ‘বিগ ডেটা’-কে ঠিকঠাক বিশ্লেষণ করার ক্ষমতা কি সত্যিই আছে আজকের রাশিবিজ্ঞানের? ডেটা সায়েন্টিস্ট-দের? সমস্যা দ্বিবিধ। এই বিপুল তথ্যভান্ডারে থাকে হাজার হাজার বিষয়ের উপর কোটি কোটি তথ্যবিন্দু। রাশিবিজ্ঞানের বেশির ভাগ তত্ত্বই বিশাল সংখ্যক ভেরিয়েব্‌ল বা চলকের ক্ষেত্রে নড়বড়ে হয়ে যায়। তথ্য যে হারে বেড়েছে, আমাদের বিশ্লেষণ-ক্ষমতা তার সঙ্গে পাল্লা দিতে পারেনি। তথ্য বাড়লে যেমন খানিক প্রয়োজনীয় তথ্য বাড়ে, তেমনই তার সঙ্গে পাল্লা দিয়ে বাড়তে থাকে অপ্রয়োজনীয় অনেক কিছু। আর খড়ের গাদাটা বাড়তে থাকলে, কঠিন থেকে কঠিনতর হতে পড়ে তার ভিতর থেকে সুচ খোঁজার কাজটাও। ও দিকে আজকের শক্তিশালী কম্পিউটারও সাধারণ ভাবে এই বিপুল তথ্যকে বিশ্লেষণ করার উপযুক্ত নয়। কম্পিউটারের স্মৃতির ভাঁড়ার উপচে পড়ে এক বিশ্রী ব্যাপার হয়ে দাঁড়ায়। ভবিষ্যতে কোয়ান্টাম কম্পিউটারের বিপ্লব এলে তথ্যের মহাসমুদ্র থেকে অমৃত খোঁজার কাজটা সহজ হবে নিশ্চয়ই। তাই দক্ষ রাশিবিজ্ঞানী, প্রযুক্তিবিদ এবং কম্পিউটার বিশেষজ্ঞকে একসঙ্গে বসেই গড়ে তুলতে হবে এই তথ্য-সমুদ্র মন্থনের কৌশল।

তবে এটাও ঠিক যে, বিপুল তথ্যের মহাসমুদ্রের মধ্যে কোথাও লুকিয়ে রয়েছে অমৃত-কুম্ভ। বাস্তবিকই ‘বিগ ডেটা’ থেকে অমৃত উদ্ধারের সাধনাটা মহাসমুদ্রের অতল থেকে পীযূষভাণ্ড তোলার চাইতে কম কিছু নয়। ভুললে চলবে না, কালকূট বিষও কিন্তু এই সমুদ্র মন্থনের এক ফসল। তাই ‘বিগ ডেটা’-র মহাসমুদ্র সেচে ঠিক কী পাওয়া যাবে— অমৃত না হলাহল— তা নির্ভর করবে মন্থনকারীদের দক্ষতা, প্রযুক্তি, সদিচ্ছা এবং অনমনীয়তার উপরে।

ইন্ডিয়ান স্ট্যাটিস্টিক্যাল ইনস্টিটিউট, কলকাতা

আনন্দবাজার অনলাইন এখন

হোয়াট্‌সঅ্যাপেও

ফলো করুন
অন্য মাধ্যমগুলি:
আরও পড়ুন
Advertisement