दुनिया में पाँच प्रमुख सागर हैं, जिनके नाम हममें से अधिकतर लोग जानते हैं। लेकिन एक ‘महासागर’ ऐसा भी है जिसके बारे में बहुत बातें होती हैं, पर सही जानकारी का अभाव है। इसे आधुनिक दुनिया का ‘तेल’ कहा जाता है — इसका नाम है ‘बिग डेटा’।
आपने सुना होगा कि फोन हमारी बातें सुनता है। दुनिया में 4.8 बिलियन स्मार्टफोन हैं। सोचिए, इन सभी की बातों को सुनने और इस डेटा को संग्रहीत करने वाला तंत्र कैसा होगा? इतने विशाल डेटा को कैसे संभाला जाता होगा? और क्या है वह एआई (AI: Artificial intelligence, आर्टिफिशियल इंटेलिजेंस) जिससे दुनिया भयभीत रहती है?
क्या आपको पता है कि फेसबुक रोज़ 4 पेटाबाइट डेटा उत्पन्न करता है? वहीं गूगल हर दिन 20 पेटाबाइट डेटा जेनरेट करता है। एक पेटाबाइट लगभग 10,00,000 जीबी के बराबर होता है। तो सवाल उठता है, इतने विशाल डेटा का प्रबंधन कैसे होता है?
कहानी शुरू होती है 1960 से 1980 के दशक से, जब पहली बार डेटा प्रबंधन की चुनौतियाँ सामने आईं। उस समय कंप्यूटर सीमित लोगों की पहुँच में थे और बड़े-बड़े मेनफ्रेम कंप्यूटरों पर डेटा प्रोसेसिंग होती थी। 90 के दशक में RDBMS का उदय हुआ, जिसने डेटा को व्यवस्थित और संग्रहीत करने में अहम भूमिका निभाई। SQL क्वेरी लैंग्वेज भी इसी समय विकसित हुई, जो आज IT की रीढ़ मानी जाती है।
2000 का दशक, वर्ल्ड वाइड वेब की क्रांति का समय था। इस क्रांति ने डेटा की दुनिया में एक विस्फोट कर दिया। वेब ने असीमित डेटा उत्पन्न किया, लेकिन इसे प्रोसेस करने के लिए तकनीक की कमी थी।
इसी दौरान, गूगल ने इस चुनौती को स्वीकार किया और GFS (Google File System) विकसित किया। इसके बाद डग कटिंग और उनके साथियों ने HDFS (Hadoop Distributed File System) की खोज की, जिसमें कई सर्वर्स आपस में जुड़कर बड़े से बड़े डेटा को प्रोसेस कर सकते थे। इसके बाद फेसबुक के जोयदीप सेन शर्मा और आशीष ठीसू ने “Hive” विकसित किया, और फिर Spark जैसी तकनीक आई, जो Hadoop से लगभग 100 गुना तेज़ है।
2010 के बाद, क्लाउड कंपनियों का उदय हुआ, जिनमें अमेज़न, माइक्रोसॉफ्ट, और गूगल प्रमुख हैं। इन क्लाउड सेवाओं ने लोगों को यह आजादी दी कि वे अपने डेटा को दुनिया के किसी भी कोने में स्टोर कर सकें और जरूरत के अनुसार स्पेस का उपयोग करें।
आर्टिफिशियल इंटेलिजेंस (AI) के विकास ने इस तकनीक को और भी शक्तिशाली बना दिया। अब अगर आप अपने फोन पर स्पोर्ट्स शूज़ सर्च करते हैं, तो आपको विभिन्न प्लेटफॉर्मों पर स्पोर्ट्स शूज़ के विज्ञापन दिखने लगते हैं। यह AI और बिग डेटा का मेल है।
हालाँकि, जितनी यह तकनीक लाभदायक है, उतनी ही खतरनाक भी साबित हो सकती है। किसी फर्म के पास आपके हर एक सेकंड की जानकारी हो, आपकी आदतों का ब्यौरा हो, तो आपके मन को नियंत्रित करना कितना आसान हो जाएगा। गोपनीयता अब एक मिथक बन चुकी है, और यह प्रक्रिया रुकने वाली नहीं है।
किसी भी तकनीक के संभावित खतरों से बचाव के लिए ज्ञान ही हमारी सबसे बड़ी ढाल है। हमें खुद को नई जानकारियों से लैस रखना चाहिए ताकि कोई मशीन या तकनीक हमारे मौलिक निर्णयों को प्रभावित न कर सके, चाहे वह निर्णय किसी सामान की खरीदारी का हो या किसी को वोट देने का।