Advertisement
২২ নভেম্বর ২০২৪
Data Science

বিগ ডেটা ও ষষ্ঠীচরণ

অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’। 

— ফাইল চিত্র

— ফাইল চিত্র

অতনু বিশ্বাস
শেষ আপডেট: ২৩ ডিসেম্বর ২০২০ ০১:৫২
Share: Save:

ডিজিটাল তথ্যের সাগরে প্লাবন এসেছে। এমনিতেই জীবনযাপনের প্রতিটি ক্ষণ আজ বাঁধা আন্তর্জালের দুনিয়াতে। সোশ্যাল মিডিয়ায় ‘ইন্টারনেট অব থিংস’-এর (ইন্দ্র)জালে জড়ানো অগণিত বস্তুও প্রতি মুহূর্তে জোগান দিয়ে চলেছে গাদা গাদা তথ্যের। এরই মাঝে অতিমারির ফলে জোয়ার এসেছে আন্তর্জালের ব্যবহারে। মহাসমুদ্রের জমাট-বাঁধা তরঙ্গের মতো ‘ডেটা’ তাই হয়ে উঠেছে ‘বিগ ডেটা’।

এই তথ্যসমুদ্র মন্থন করে অমৃত আহরণের প্রচেষ্টাও চলেছে পুরোদস্তুর, কয়েক দশক ধরেই। নতুন একদল পেশাদারই তৈরি হয়ে গেলেন— ‘ডেটা সায়েন্টিস্ট’। প্রধানত কিছু গড়পড়তা সফটওয়্যার চালিয়ে বিপুল পরিমাণে ডেটা-র বিশ্লেষণ করে পরিকল্পনার পথ-নির্দেশ করে চলেছেন এঁরা। ব্যবসা-বাণিজ্যে, খেলায়, ভোটের রাজনীতিতে, স্বাস্থ্যে, মানব-সম্পদে, কোথায় নয়!

এই শতকের গোড়ার দিকে আমেরিকার বেসবল টিম ‘ওকল্যান্ড অ্যাথলেটিক্স’-এর সাফল্যের গল্প এখন প্রায় রূপকথার পর্যায়ভুক্ত। এদের ম্যানেজার বিলি বিন খুব অল্প বাজেটেও সাফল্য এনে দিয়েছেন তাঁর দলকে, ‘মেজর লিগ বেসবল’ প্রতিযোগিতায়— শুধুমাত্র রাশিবিজ্ঞান, প্রজ্ঞা আর বাস্তব বুদ্ধিকে ব্যবহার করে। অন্য দলগুলি যেখানে ব্যাটিং গড়, স্বাস্থ্য, গতি ইত্যাদিতে গুরুত্ব দিয়ে খেলোয়াড় নিয়োগ করে, বিলি বিন পুরনো তথ্য বিশ্লেষণ করে দেখলেন, ‘অন-বেস পারসেন্টেজ’ নামে এক সূচক খেলোয়াড়দের অর্থমূল্যের ভাল নির্ণায়ক হতে পারে। তার ভিত্তিতেই দল গঠন করেন বিন। পর পর ২০টা খেলায় জিতে তৈরি হয় এক নতুন রেকর্ড। এ নিয়ে ২০০৩ সালে জমিয়ে বই লিখেছেন মাইকেল ল্যুইস। মানিবল। হলিউডে তা নিয়ে ছবি হয়েছে ২০১১ সালে। বিলি বিনের ভূমিকায় ব্র্যাড পিট। ক্রমে জীবনের প্রায় সর্ব ক্ষেত্রের দখল নিয়ে ফেলল এই ‘মানিবল’-সংস্কৃতি। আর সিলিকন ভ্যালি এক জাদুর ঝাঁপি নিয়ে এর মধ্যে ঢুকে পড়ল।

কোভিড-১৯ অতিমারি মোকাবিলায় ‘বিগ ডেটা’ ম্যাজিক দেখাবে, এমনটাই প্রত্যাশা ছিল অনেকের। ডেটা সায়েন্টিস্টদের সামনেও এ ছিল অগ্নিপরীক্ষা। এপ্রিলে ‘হার্ভার্ড বিজ়নেস রিভিউ’-এর এক প্রবন্ধে বলা হল, শতাব্দী-প্রাচীন স্প্যানিশ ফ্লু-র সঙ্গে আজকের অতিমারির প্রধান পার্থক্য হল প্রযুক্তির বিবর্তন। বলা হল, এটাই ‘বিগ ডেটা’-র সবচেয়ে অর্থবহ চ্যালেঞ্জ। ইচ্ছাশক্তি এবং উদ্ভাবনী ক্ষমতার প্রয়োগে নাকি ক্ষুদ্রাতিক্ষুদ্র স্তরে, এমনকি পাড়ায় পাড়ায়ও, ভাইরাস সংক্রমণের দ্রুত পূর্বাভাস দেওয়া সম্ভব। দক্ষিণ কোরিয়া বা তাইওয়ানের কোভিড নিয়ন্ত্রণে সাফল্যকে ‘বিগ ডেটা’ বিশ্লেষণের সাফল্যের সঙ্গে জুড়বার চেষ্টাও হল।

কিন্তু অতিমারির দাপট বাড়তেই স্পষ্ট হল ‘বিগ ডেটা’-র অসহায় ব্যর্থতাও। কোভিড অতিমারি সামলাতে ‘বিগ ডেটা’ জাদুকাঠি হয়ে উঠতে পারলে তা বড় বিজ্ঞাপন হত ডেটা সায়েন্টিস্টদের পক্ষে। এই কঠিনতম এবং অতি-প্রয়োজনীয় পরীক্ষায় বিগ ডেটা-র ব্যর্থতাকেও তাই তুলে ধরা প্রয়োজন।
আমেরিকা থেকে ভারত, বিভিন্ন দেশের নির্বাচনের ফলাফল নির্ধারণে বিগ ডেটার ভূমিকাই হোক, বা ২০১৪-র ব্রাজিল বিশ্বকাপে জার্মানির চ্যাম্পিয়ন হওয়ার পিছনে ‘বিগ ডেটা’-র বিশ্লেষণ-ভিত্তিক পরিকল্পনার অবদানই হোক, এই নতুন প্রযুক্তি নিয়ে গত কয়েক বছরে আলোচনা হয়েছে প্রচুর। কোভিড-১৯’পর্ব কিন্তু দেখাল, এখনও ‘বিগ ডেটা’ নামের মস্ত হাতিটাকে নিয়ে লোফালুফি করবার মতো ষষ্ঠীচরণ হয়ে উঠতে পারেনি আমাদের প্রযুক্তি। ২০০৮-এ খুব ঢাক-ঢোল পিটিয়ে গুগল শুরু করেছিল ফ্লু-র পূর্বাভাস দেওয়া। ফ্লু হওয়ার উপক্রম হলে সে সংক্রান্ত যে সব সার্চ করা হয় গুগলের সার্চ ইঞ্জিনে, তার বিশ্লেষণ করে সরকারি স্বাস্থ্য সংস্থার আগে ফ্লু-র পূর্বাভাস দেওয়াই ছিল এই প্রকল্পের উদ্দেশ্য। প্রকল্পটা মুখ থুবড়ে পড়ে। আসলে মানুষ যখন ফ্লু হয়েছে ভাবে, তার প্রায় নব্বই শতাংশ ক্ষেত্রেই সেটা বাস্তবে ফ্লু নয়। তাই তথ্যটা বিপুল হলেও, কতটা নির্ভরযোগ্য, সন্দেহ থেকেই যায়।

তবু, প্রযুক্তির উন্নতির সঙ্গে সঙ্গে উপচে পড়া ‘বিগ ডেটা’-কে ঠিকঠাক বিশ্লেষণ করার ক্ষমতা কি সত্যিই আছে আজকের রাশিবিজ্ঞানের? ডেটা সায়েন্টিস্ট-দের? সমস্যা দ্বিবিধ। এই বিপুল তথ্যভান্ডারে থাকে হাজার হাজার বিষয়ের উপর কোটি কোটি তথ্যবিন্দু। রাশিবিজ্ঞানের বেশির ভাগ তত্ত্বই বিশাল সংখ্যক ভেরিয়েব্‌ল বা চলকের ক্ষেত্রে নড়বড়ে হয়ে যায়। তথ্য যে হারে বেড়েছে, আমাদের বিশ্লেষণ-ক্ষমতা তার সঙ্গে পাল্লা দিতে পারেনি। তথ্য বাড়লে যেমন খানিক প্রয়োজনীয় তথ্য বাড়ে, তেমনই তার সঙ্গে পাল্লা দিয়ে বাড়তে থাকে অপ্রয়োজনীয় অনেক কিছু। আর খড়ের গাদাটা বাড়তে থাকলে, কঠিন থেকে কঠিনতর হতে পড়ে তার ভিতর থেকে সুচ খোঁজার কাজটাও। ও দিকে আজকের শক্তিশালী কম্পিউটারও সাধারণ ভাবে এই বিপুল তথ্যকে বিশ্লেষণ করার উপযুক্ত নয়। কম্পিউটারের স্মৃতির ভাঁড়ার উপচে পড়ে এক বিশ্রী ব্যাপার হয়ে দাঁড়ায়। ভবিষ্যতে কোয়ান্টাম কম্পিউটারের বিপ্লব এলে তথ্যের মহাসমুদ্র থেকে অমৃত খোঁজার কাজটা সহজ হবে নিশ্চয়ই। তাই দক্ষ রাশিবিজ্ঞানী, প্রযুক্তিবিদ এবং কম্পিউটার বিশেষজ্ঞকে একসঙ্গে বসেই গড়ে তুলতে হবে এই তথ্য-সমুদ্র মন্থনের কৌশল।

তবে এটাও ঠিক যে, বিপুল তথ্যের মহাসমুদ্রের মধ্যে কোথাও লুকিয়ে রয়েছে অমৃত-কুম্ভ। বাস্তবিকই ‘বিগ ডেটা’ থেকে অমৃত উদ্ধারের সাধনাটা মহাসমুদ্রের অতল থেকে পীযূষভাণ্ড তোলার চাইতে কম কিছু নয়। ভুললে চলবে না, কালকূট বিষও কিন্তু এই সমুদ্র মন্থনের এক ফসল। তাই ‘বিগ ডেটা’-র মহাসমুদ্র সেচে ঠিক কী পাওয়া যাবে— অমৃত না হলাহল— তা নির্ভর করবে মন্থনকারীদের দক্ষতা, প্রযুক্তি, সদিচ্ছা এবং অনমনীয়তার উপরে।

ইন্ডিয়ান স্ট্যাটিস্টিক্যাল ইনস্টিটিউট, কলকাতা

অন্য বিষয়গুলি:

Data Science Coronavirus Big Data
সবচেয়ে আগে সব খবর, ঠিক খবর, প্রতি মুহূর্তে। ফলো করুন আমাদের মাধ্যমগুলি:
Advertisement
Advertisement

Share this article

CLOSE

Log In / Create Account

We will send you a One Time Password on this mobile number or email id

Or Continue with

By proceeding you agree with our Terms of service & Privacy Policy