बिग डेटा क्या है ?




 जो डेटा आकार में बहुत बड़े होते हैं उन्हें बिग डेटा कहा जाता है। आम तौर पर हम आकार एमबी (वर्डडॉक, एक्सेल) या अधिकतम जीबी (सिनेमा, कोड) के डेटा पर काम करते हैं लेकिन पेटा बाइट्स में डेटा यानी 10 ^ 15 बाइट आकार को बिग डेटा कहा जाता है। यह कहा जाता है कि आज के लगभग 90% डेटा पिछले 3 वर्षों में उत्पन्न हुए हैं।


बिग डेटा के स्रोत:-

  • सोशल नेटवर्किंग साइट्स: फेसबुक, गूगल, लिंक्डइन ये सभी साइटें दिन पर दिन भारी मात्रा में डेटा तैयार करती हैं क्योंकि इनके दुनियाभर में अरबों यूजर्स हैं।
  • ई-कॉमर्स साइट: अमेज़ॅन, फ्लिपकार्ट, अलीबाबा जैसी साइटें बड़ी मात्रा में लॉग उत्पन्न करती हैं, जिनसे ट्रेंड खरीदने वाले उपयोगकर्ताओं का पता लगाया जा सकता है।
  • मौसम स्टेशन: सभी मौसम स्टेशन और उपग्रह बहुत विशाल डेटा देते हैं जो मौसम का पूर्वानुमान करने के लिए संग्रहीत और हेरफेर किए जाते हैं।
  • टेलीकॉम कंपनी: एयरटेल, वोडाफोन जैसे टेलीकॉम दिग्गज अपने रुझान का अध्ययन करते हैं और तदनुसार अपनी योजनाओं को प्रकाशित करते हैं और इसके लिए वे अपने मिलियन उपयोगकर्ताओं का डेटा स्टोर करते हैं।
  • शेयर बाजार: दुनिया भर में स्टॉक एक्सचेंज अपने दैनिक लेनदेन के माध्यम से बड़ी मात्रा में डेटा उत्पन्न करता है।


3V's of Big Data:-

  1. वेग: डेटा बहुत तेज दर से बढ़ रहा है। यह अनुमान है कि डेटा की मात्रा हर 2 साल में दोगुनी हो जाएगी।
  2. विविधता: अब एक दिन डेटा पंक्तियों और स्तंभों में संग्रहीत नहीं किया जाता है। डेटा संरचित होने के साथ-साथ असंरचित भी होता है। लॉग फ़ाइल, सीसीटीवी फुटेज असंरचित डेटा है। डेटा जो तालिका में सहेजे जा सकते हैं, वे संरचित डेटा होते हैं जैसे बैंक के लेनदेन डेटा।
  3. वॉल्यूम: हम जिस डेटा से निपटते हैं, वह पेटा बाइट्स के बहुत बड़े आकार का है।


Comments

Popular posts from this blog

Primary/Main features of Java

HTTrack ऑफलाइन वेबसाइट डाउनलोडर क्या है ?

Which language is used for Java?