لا يتوانى العاملون في مجال أرشفة الويب (Web Archiving) في أرشفة مختلف موارد ومحتويات المواقع الإلكترونية من صفحات الويب تحت لغات البرمجة : لغة رقم النص الفائق (HTML) ، صفحات الطرز المتراصة (CSS) ، جافا سكريبت (JavaScript) ، بالإضافة إلى الصور والفيديو .
وإلى جانب ذلك ، يقوم مؤرشف الويب بأرشفة البيانات البيانات الفوقية (Metadata) ذات العلاقة بالموارد التي تم جمعها من قبيل : زمن الوصول ، ومعرف تنسيق البيانات على الإنترنت (MIME type) ، وكذلك طول المحتوى(Content-Length) ، حيث يتم استخدام تلك البيانات الوصفية من أجل تحديد أصالة ومنشأ المجموعات المؤرشفة .
مبادرات ومشاريع أرشفة الويب (Web Archiving)
وكانت كندا من بين الدول الرائدة في مجال أرشفة الويب (Web Archiving) من خلال (EPPP) (Electronic Publication Plot Project) ، الذي افتتح منذ عام 1994 في مكتبة ومحفوظات كندا .
كما اهتمت الدول الأسكندنافية بأرشفة الويب ، حيث عملت المكتبة الملكية في السويد على النشاط في مجال إيداع الويب بشكل منتظم منذ أبريل 1997 ، أما فنلندا ، وفي إطار أرشفة محتواها على مواقع الإنترنت ، فلقد بادرت إلى إطلاق مشروع (إيفا) (EVA) .
من جهتها ، كانت الدنمارك من بين البلدان القلائل التي سارعت إلى تعديل القانون المنظم للإيداع القانوني في هذا المجال .
وتألقت المكتبة الوطنية في أستراليا حين قصت شريط نظام أرشفة الويب الخاص بها (باندورا) (PANDORA) منذ أكثر من 18 سنة .
وفي سياق متصل ، وجب الإشارة بمبادرات أرشفة الويب (Web Archiving) ذائعة الصيت من قبيل : أرشيف الإنترنت (Internet Archive) ، ذاكرة الإنترنت (Internet Memory) ، دون إغفال مشروع أرشيف البرتغال(Portuguese Web Archive) (PWA) .
طرق جمع محتويات الويب
ومن بين أساليب الجمع المعمول بها في أرشفة الويب (Web Archiving) ، نجد :
الحصاد عن بعد
وهي تقنية تلعب فيها زواحف الشبكة (Web crawler) دورا رئيسيا في أتمتة جمع صفحات الويب ، حيث يتمكن الزاحف من الوصول إلى صفحة الويب المخصصة تماما كما هو الحال بالنسبة للمستخدمين عبر متصفح الإنترنت ، وهي طريقة بسيطة لحصد محتوى الويب عن بعد .
وفيما يخص زواحف الشبكة التي يتم اعتمادها في عملية أرشفة الويب (Web Archiving) ، نذكر : (Heritrix , HTTrack , Wget) .
حسب الطلب
وتوجد العديد من الخدمات المجانية التي يمكن استخدامها لأرشفة موارد الويب (حسب الطلب) عن طريق الاستناد إلى تقنيات تتبع ارتباطات الويب .
وتتضمن تلك الخدمات المستخدمة في عملية لأرشفة الويب (Web Archiving) كلا من (Wayback Machine , Archive.today , WebCite) .
ليست هناك تعليقات:
إرسال تعليق