इंटरनेट अब कुछ दशकों से अधिक समय से रहा है। लेकिन पिछले कुछ वर्षों में बहुत से संसाधन इंटरनेट को पूरी तरह से संग्रहीत कर रहे हैं। वर्ल्ड वाइड वेब के पूर्ववर्ती ब्राउज़ करने की सबसे लोकप्रिय सेवाओं में से एक है वेबैक मशीन । इस तथ्य के अलावा कि उसने 445 अरब से अधिक वेब पेजों को संग्रहीत किया है, अजीब हिस्सा यह है कि उसने कभी भी उन वेबसाइटों की एक सूची प्रकाशित नहीं की है जो इसे संग्रहीत करती हैं या एल्गोरिदम का उपयोग यह निर्धारित करने के लिए करती है कि कैप्चर करना और कब करना है।
वेबैक मशीन
इंटरनेट पर अनुसंधान के लिए परिपक्व उम्र तक पहुंचने के साथ, ये अभिलेखागार अब पहले से कहीं अधिक महत्वपूर्ण हैं। वेबैक मशीन पर संग्रहीत 445 बिलियन वेब पेजों के बावजूद, निश्चित रूप से बहुत सारे ढीले सिरे हैं। उदाहरण के लिए, 1 99 6 में बीबीसी का संग्रह शुरू हुआ, लेकिन ठीक से गठबंधन छवियां 2012 के बाद ही दिखाई देने लगीं। और वेबसाइट जहां वेबैक मशीन पोस्ट सभी संग्रहीत वेब पेजों को थोड़ा अलग तरीके से काम करती है। यह एलेक्सा द्वारा रैंक किए गए 70 प्रमुख देशों में शीर्ष 1 मिलियन वेबसाइटों से केवल वेब पेज पोस्ट करता है।
“The WayBack Machine is used by hundreds of thousands of people every day, presenting snapshots, back in time, from more than 1.5 billion websites,” says Mark Graham, director of the Wayback Machine.
त्रुटियों को हल करने के लिए समाधान
वेबैक मशीन की एक अन्य विशेषता यह है कि जब भी आप अपनी पसंदीदा साइट ब्राउज़ करते समय 404 या किसी अन्य वेब पेज त्रुटि में आते हैं तो क्रोम प्लगइन पहचानता है। फिर यह जांचने और देखने के लिए आता है कि उस साइट का एक संग्रहीत संस्करण है या नहीं। तो, क्या कोई ऐसा वेब पेज है जिसे इंटरनेट से संदिग्ध रूप से हटा दिया गया है या साइट फ़ंक्शनिंग जारी रखने के लिए बहुत सड़ा हुआ है, वैसे ही आपके पास जांच करने के लिए वेबैक का संग्रह है। सरल शब्दों में, यह लिंक सड़ांध के खतरे से लड़ने का एक तरीका है।
सरकारी रिकॉर्ड
हालांकि, इस नए उत्पाद के लिए इंटरनेट आर्काइव में बहुत ही महत्वाकांक्षी महत्वाकांक्षा है। रिपोर्टों के मुताबिक, ओबामा प्रशासन के तहत लगभग 83% सूचना दस्तावेज, और सभी सुप्रीम कोर्ट के रिकॉर्ड का 49% इंटरनेट से गायब हैं। और यह समस्या है कि वेबैक मशीन हल करने की तलाश में है। कुख्यात लिंक सड़ांध एक बढ़ती चिंता है, और ऑनलाइन आंकड़े महत्वपूर्ण डेटा के विशाल ढांचे को संरक्षित करने के लिए महत्वपूर्ण हैं।
रुचि का अनुभव
उद्यमी पत्रिका के साथ एक साक्षात्कार में, निर्देशक मार्क ग्राहम ने सेवा के उपयोगकर्ताओं से एक दिलचस्प अनुभव साझा किया।
“On July 17, 2014, Igor (Strelkov) Girkin, a Ukrainian separatist leader, claimed responsibility online for the downing of what he thought was a Ukrainian military transport plane near the rebel-held Ukrainian city of Donetsk. When reports that Malaysian Airlines Flight MH17, with 295 passengers, had been shot down in the same area, his post was removed. But not before it had been preserved several times by the Wayback Machine, where it is available today.”
यूएसपी और भविष्य
वेबैक मशीन की सबसे बड़ी विशेषता यह है कि साइट इन सभी अरबों और ट्रिलियन वेब पृष्ठों को सूचना और स्नैपशॉट के लिए क्रॉल करती है। आधा ट्रिलियन वेब कैप्चर की उनकी सूची एक निरंतर क्रॉलिंग प्रक्रिया का परिणाम नहीं है बल्कि वर्षों से हजारों लोगों द्वारा परिभाषित लाखों अलग-अलग क्रॉल का परिणाम नहीं है। कंपनी पूरे इंटरनेट का अंतिम डेटाबेस बनाने का लक्ष्य रख रही है जो कि हर किसी के लिए स्थायी रूप से उपलब्ध है जो पहुंच के लिए उत्सुक है।
इस प्रकार आप इंटरनेट पर संग्रहीत या कैश किए गए वेब पेजों को देखने के लिए वेबैक मशीन का उपयोग कर सकते हैं और एक वेब पेज को प्रमाण के रूप में सहेज सकते हैं कि यह इंटरनेट पर पहली बार दिखाई देता है।
वेबैक मशीन क्रोम एक्सटेंशन
वेबैक मशीन जारी की गई है और उत्कृष्ट ब्राउज़र एक्सटेंशन है जो कष्टप्रद 404 पृष्ठों को कम कर सकता है। यह एक्सटेंशन त्रुटि कोड 404, 408, 410, 451, 500, 502, 503, 504, 50 9, 520, 521, 523, 524, 525, और 526 का पता लगाएगा और संग्रहीत संस्करण प्रदर्शित करने की पेशकश करेगा। आप इसे डाउनलोड कर सकते हैं यहाँ.
वेबैक मशीन विकल्प
यदि आप वेबैक मशीन विकल्पों की तलाश में हैं, तो archive.is और screenshots.com देखें।