बिग डेटा क्या है ?
जो डेटा आकार में बहुत बड़े होते हैं उन्हें बिग डेटा कहा जाता है। आम तौर पर हम आकार एमबी (वर्डडॉक, एक्सेल) या अधिकतम जीबी (सिनेमा, कोड) के डेटा पर काम करते हैं लेकिन पेटा बाइट्स में डेटा यानी 10 ^ 15 बाइट आकार को बिग डेटा कहा जाता है। यह कहा जाता है कि आज के लगभग 90% डेटा पिछले 3 वर्षों में उत्पन्न हुए हैं।
बिग डेटा के स्रोत:-
- सोशल नेटवर्किंग साइट्स: फेसबुक, गूगल, लिंक्डइन ये सभी साइटें दिन पर दिन भारी मात्रा में डेटा तैयार करती हैं क्योंकि इनके दुनियाभर में अरबों यूजर्स हैं।
- ई-कॉमर्स साइट: अमेज़ॅन, फ्लिपकार्ट, अलीबाबा जैसी साइटें बड़ी मात्रा में लॉग उत्पन्न करती हैं, जिनसे ट्रेंड खरीदने वाले उपयोगकर्ताओं का पता लगाया जा सकता है।
- मौसम स्टेशन: सभी मौसम स्टेशन और उपग्रह बहुत विशाल डेटा देते हैं जो मौसम का पूर्वानुमान करने के लिए संग्रहीत और हेरफेर किए जाते हैं।
- टेलीकॉम कंपनी: एयरटेल, वोडाफोन जैसे टेलीकॉम दिग्गज अपने रुझान का अध्ययन करते हैं और तदनुसार अपनी योजनाओं को प्रकाशित करते हैं और इसके लिए वे अपने मिलियन उपयोगकर्ताओं का डेटा स्टोर करते हैं।
- शेयर बाजार: दुनिया भर में स्टॉक एक्सचेंज अपने दैनिक लेनदेन के माध्यम से बड़ी मात्रा में डेटा उत्पन्न करता है।
3V's of Big Data:-
- वेग: डेटा बहुत तेज दर से बढ़ रहा है। यह अनुमान है कि डेटा की मात्रा हर 2 साल में दोगुनी हो जाएगी।
- विविधता: अब एक दिन डेटा पंक्तियों और स्तंभों में संग्रहीत नहीं किया जाता है। डेटा संरचित होने के साथ-साथ असंरचित भी होता है। लॉग फ़ाइल, सीसीटीवी फुटेज असंरचित डेटा है। डेटा जो तालिका में सहेजे जा सकते हैं, वे संरचित डेटा होते हैं जैसे बैंक के लेनदेन डेटा।
- वॉल्यूम: हम जिस डेटा से निपटते हैं, वह पेटा बाइट्स के बहुत बड़े आकार का है।
Comments
Post a Comment