अवधि बड़ा डाटा ऑनलाइन और ऑफ़लाइन ग्रह पर लगभग हर जगह तेजी से उपयोग किया जा रहा है। और यह केवल कंप्यूटर से संबंधित नहीं है। यह सूचना प्रौद्योगिकी नामक एक कंबल शब्द के तहत आता है, जो अब लगभग सभी अन्य प्रौद्योगिकियों और अध्ययन और व्यवसाय के क्षेत्रों का हिस्सा है। बड़ा डेटा एक बड़ा सौदा नहीं है। इसके आस-पास का प्रचार आपको भ्रमित करने के लिए एक निश्चित रूप से बहुत बड़ा सौदा है। यह लेख बिग डेटा क्या है पर एक नज़र डालें। इसमें एक उदाहरण भी शामिल है कि कैसे नेटफ्लिक्स ने अपने ग्राहकों की जरूरतों को बेहतर ढंग से सेवा देने के लिए अपने डेटा का उपयोग किया, या बल्कि बिग डेटा का उपयोग किया।
बिग डेटा क्या है
आपकी कंपनी के सर्वर में झूठ बोलने वाला डेटा कल तक डेटा था - क्रमबद्ध और दायर किया गया। अचानक, गड़बड़ी बिग डेटा लोकप्रिय हो गया, और अब आपकी कंपनी का डेटा बिग डेटा है। इस शब्द में आपके संगठन द्वारा अब तक संग्रहीत डेटा के प्रत्येक टुकड़े को शामिल किया गया है। इसमें बादलों में संग्रहीत डेटा और आपके द्वारा बुकमार्क किए गए यूआरएल भी शामिल हैं। आपकी कंपनी ने सभी डेटा डिजिटलीकृत नहीं किया हो सकता है। हो सकता है कि आपने पहले से ही सभी डेटा को संरचित नहीं किया हो। लेकिन फिर, आपकी कंपनी के साथ सभी डिजिटल, कागजात, संरचित और गैर-संरचित डेटा अब बिग डेटा है।
संक्षेप में, सभी डेटा - चाहे वर्गीकृत हों या नहीं - आपके सर्वर में मौजूद सामूहिक रूप से बिग डेटा कहा जाता है। इस प्रकार का डेटा विभिन्न प्रकार के विश्लेषण का उपयोग करके अलग-अलग परिणाम प्राप्त करने के लिए उपयोग किया जा सकता है। यह आवश्यक नहीं है कि सभी विश्लेषण सभी डेटा का उपयोग करें। अलग-अलग विश्लेषण परिणामों और भविष्यवाणियों को आवश्यक बनाने के लिए बिग डेटा के विभिन्न हिस्सों का उपयोग करते हैं।
बिग डेटा अनिवार्य रूप से वह डेटा है जिसका आप परिणामों के लिए विश्लेषण करते हैं जिसका उपयोग आप भविष्यवाणियों और अन्य उपयोगों के लिए कर सकते हैं। बिग डेटा शब्द का उपयोग करते समय, अचानक आपकी कंपनी या संगठन शीर्ष स्तर की सूचना प्रौद्योगिकी के साथ काम कर रहा है ताकि आप उसी डेटा का उपयोग करके विभिन्न प्रकार के परिणामों को कम कर सकें जिन्हें आपने जानबूझकर या अनजाने में संग्रहीत किया है।
बिग डेटा कितना बड़ा है
अनिवार्य रूप से, सभी डेटा संयुक्त डेटा बिग डेटा है, लेकिन कई शोधकर्ता इस बात से सहमत हैं कि बिग डेटा - जैसे - सामान्य स्प्रेडशीट्स और डेटाबेस प्रबंधन के नियमित उपकरण का उपयोग करके छेड़छाड़ नहीं किया जा सकता है। उन्हें हडोप जैसे विशेष विश्लेषण उपकरण की आवश्यकता है (हम इसे एक अलग पोस्ट में पढ़ लेंगे) ताकि सभी डेटा का विश्लेषण एक ही समय में किया जा सके (विश्लेषण के पुनरावृत्तियों में शामिल हो सकता है)।
उपर्युक्त के विपरीत, हालांकि मैं इस विषय पर एक विशेषज्ञ नहीं हूं, मैं कहूंगा कि किसी भी संगठन के साथ डेटा - बड़ा या छोटा, संगठित या असंगठित - उस संगठन के लिए बड़ा डेटा है और संगठन इसका विश्लेषण करने के लिए अपने स्वयं के औजारों का चयन कर सकता है डेटा।
आम तौर पर, डेटा का विश्लेषण करने के लिए, लोग एक या अधिक सामान्य क्षेत्रों के आधार पर अलग-अलग डेटा सेट बनाने के लिए उपयोग करते थे ताकि विश्लेषण आसान हो जाए। बिग डेटा के मामले में, इसका विश्लेषण करने के लिए सबसेट बनाने की कोई आवश्यकता नहीं है। अब हमारे पास ऐसे टूल्स हैं जो डेटा का विश्लेषण कर सकते हैं चाहे कितना बड़ा हो। शायद, ये टूल स्वयं डेटा का वर्गीकरण करते हैं, भले ही वे इसका विश्लेषण कर रहे हों।
मुझे जिमी गुटमैन द्वारा "बिग डेटा" पुस्तक से दो वाक्यों का उल्लेख करना महत्वपूर्ण लगता है:
“ Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”
-तथा-
“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”
तो आप देखते हैं कि वॉल्यूम और विश्लेषण दोनों बिग डेटा का एक महत्वपूर्ण हिस्सा हैं।
पढ़ना: डेटा खनन क्या है?
बिग डेटा अवधारणाओं
यह एक और मुद्दा है जहां ज्यादातर लोग सहमत नहीं हैं। कुछ विशेषज्ञों का कहना है कि बिग डेटा अवधारणाएं तीन वी हैं:
- आयतन
- वेग
- वैराइटी
कुछ अन्य अवधारणा में कुछ और वी जोड़ते हैं:
- दृश्य
- सत्यता (विश्वसनीयता)
- परिवर्तनशीलता और
- मूल्य
मैं एक अलग लेख में बिग डेटा की अवधारणाओं को कवर करूंगा क्योंकि यह पोस्ट पहले से ही बड़ा हो रहा है। मेरी राय में, पहले तीन वी के बड़े डेटा की अवधारणा को समझाने के लिए पर्याप्त हैं।
बिग डेटा उदाहरण - नेटफ्लिक्स ने इसकी समस्याओं को ठीक करने के लिए इसका उपयोग कैसे किया
2008 के लिए, नेटफ्लिक्स में एक आउटेज था जिसके कारण कई ग्राहक अंधेरे में चले गए थे। जबकि कुछ स्ट्रीमिंग सेवाओं तक पहुंच सकते हैं, उनमें से अधिकतर नहीं कर सके। कुछ ग्राहकों ने अपनी किराए पर डीवीडी प्राप्त करने में कामयाब रहे जबकि अन्य विफल रहे। वॉल स्ट्रीट जर्नल पर एक ब्लॉग पोस्ट का कहना है कि नेटफ्लिक्स ने अभी मांग-स्ट्रीमिंग शुरू कर दी है।
आउटेज ने प्रबंधन को संभावित भविष्य की समस्याओं के बारे में सोचा और इसलिए; यह बिग डेटा में बदल गया। इसने डेटा का उपयोग करके उच्च ट्रैफिक क्षेत्रों, संवेदनशील बिंदुओं, और नेटवर्क थ्रुपुट इत्यादि का विश्लेषण किया और भविष्य में समस्या होने पर वैश्विक स्तर पर आने पर डाउनटाइम को कम करने के लिए उस पर काम किया। वॉल स्ट्रीट जर्नल ब्लॉग का लिंक यहां दिया गया है, यदि आप बिग डेटा के उदाहरण देखना चाहते हैं।
ऊपर बताता है कि एक आम आदमी की भाषा में बिग डेटा क्या है। आप इसे एक बहुत ही बुनियादी परिचय कह सकते हैं। मैं संबंधित कारकों जैसे संकल्पना, विश्लेषण, उपकरण, और बिग डेटा, बिग डेटा 3 वी इत्यादि के उपयोग पर कुछ और लेख लिखने की योजना बना रहा हूं। इस बीच, यदि आप उपरोक्त में कुछ भी जोड़ना चाहते हैं, तो कृपया टिप्पणी करें और साझा करें हमें।