Növbəti araşdırmanızda internet arxivinin “Wayback Machine” serverindən istifadə

Foto: Shutterstock

Müəllif: Mark Qrəhəm

Internet arxivi və onun “Wayback Machine” serveri araşdırmaçı jurnalistlər üçün əvəzsiz alətdir. 

Qeyri-kommersiya kitabxanası olan Internet Archive (İnternet Arxivi) bu il “hamı üçün biliklərə yol açmaq” missiyasının 25 illiyini qeyd edir. Onun ən tanınmış aləti olan Wayback Machine xidmətini hazırda mən idarə edirəm. Bu server gündə bir milyarddan artıq ictimaiyyətə açıq olan URL ünvanını arxivləşdirir və ümumi istifadəyə təqdim edir. 

Jurnalistlər, tədqiqatçılar, faktları yoxlayanlar, fəallar və ictimaiyyət “WayBack Machine”dən hər gün pulsuz olaraq müxtəlif cür istifadə edirlər. Bizim haqqımızda bir neçə min məqalə yazılıb və ya yazılarda xidmətimizə istinad edilib.  Hətta GIJN-nin 2020-ci il üçün dərc etdiyi Ən Sevdiyim Alətlər silsiləsinin yekun buraxılışında  bir neçə aparıcı jurnalist bu serverin onların işinin kökündə durduğunu yazmışdı. 

Aşağıda növbəti araşdırmalarında “Wayback Machine”dən istifadə etməkdə maraqlı olan jurnalistlər üçün bu xidmət barədə məlumat verilir. 

URL ünvanların arxivləşdirilməsi 

Əgər siz məqalənizdə hansısa internet saytına istinad etmisinizsə və sonradan həmin saytın sahibləri həmin səhifəni və ya bütövlükdə saytı siliblərsə, arxiv olunmadıqları halda onlar həmişəlik yoxa çıxa bilər. Bunun baş verməsinə imkan verməyin! 

“Wayback Machine”nin “Save Page Now”(Səhifəni Yaddaşda Saxla) xidmətinin köməyilə hər gün on milyonlarla URL istifadəçilər tərəfindən arxivləşdirilir.  Bura istənilən adam URL göndərə bilər və əgər siz bura pulsuz arxiv hesabından daxil olmusunuzsa, yaddaşda saxlamaq istədiyiniz səhifədəki xarici linkləri də arxivə salmağı xahiş edə bilərsiniz. Bu halda sizin elektron poçtunuza saxlama prosesi barədə hesabat göndəriləcək.  Daha bir faydalı funksiya saxlanılmış URL-lərin WACZ formatında endirilməsi və öz alətlərinizin köməyilə təhlil edilməsidir. 

“Save Page Now” “Twitter”i də avtomatik olaraq arxivləşdirə bilir. Məsələn, siz asanlıqla istənilən “Twitter” profilinin 3200-ə qədər son tvitini onun URL-ni yerləşdirib lazımi funksiyanı seçməklə arxivləşdirə bilərsiniz. 

Bəzi texniki detallar: Əgər sizdə arxivləşdirmək istədiyiniz URL siyahısı varsa, onların “Google Sheets” elektron cədvəlinin A sütununa əlavə edin və “Save Page Now” “Google Sheets” xidməti vasitəsilə göndərin. O xidmət buradadır.  B, C və D sütunları status kodları, arxivdəki URL və “Wayback Machine” onu əvvəllər arxivləşdiribsə,  bayraqla doldurulacaq. 

Başqa bir üsul bir URL ünvanını  e-mail ilə spn@archive.org  ünvanına göndərməkdir. Bu zaman e-mailin mövsuzunda “capture outlinks” yazsanız, o zaman xarici linklər də arxiv olunacaq. Sizə bu proses başa çatanda elektron məktub göndəriləcək. 

Nəhayət, daha texniki cəhətdən savadlı istifadəçilər üçün “Wayback Machine” API və ya proqram interfeysi təklif edir. Onun vasitəsilə servisi mövcud iş axınları ilə inteqrasiya etmək və ya yeni tətbiqlərin yaradılması işini avtomatlaşdırmaq olar. Nümunə kimi San Fransiskoda yerləşən, softverlər yaradaraq və təşəbbüslərlə çıxış edərək qlobal jurnalizmin gücləndirilməsinə çalışan qeyri-kommersiya şirkəti “Meeda”nın adını çəkmək olar. Bu şirkət özünün Check (yoxlama) sistemini  “Wayback Machine” ilə inteqrasiya edib. 

Arxiv versiyalarındakı dəyişiklikləri müqayisə edin

Eyni internet səhifəsinin iki versiyasındakı fərqləri tapmağa və göstərməyə nə vaxtsa cəhd etmisinizmi? Məsələn, hansısa şirkətin və ya şəxsin öz səhifəsində dəyişikliklər etməsini və ya sözləri dəyişməsini üzə çıxarmaq üçün? Bunu “Changes” (dəyişikliklər) funksiyasının köməyilə etmək olar. 

Bunun üçün arxivdəki istənilən URL ünvanını “Wayback Machine”nin ana səhifəsindəki axtarış funksiyasına daxil edin. Sonra “Change” funksiyasını seçin. 

Sizə müxtəlif tarixlər və vaxtlarda həmin səhifənin arxivdə olan versiyalarının siyahısı göstəriləcək. Bu dəyişikliklər ciddiliyinə uyğun olaraq müxtəlif rənglərdə olacaq. 

Daha sonra URL-in vaxtı göstərilən hər hansı iki versiyasını seçin. Onlar yanbayan göstəriləcək və mətndəki fərqlər mavi və sarı rəngdə olacaq. Bu funksiyadan bir britaniyalı bloger və siyasi müşavirin tarixi dəyişmək cəhdinin  üzə çıxarılmasında istifadə edilib və aşağıdakı skrinşotda nümayiş etdirilib. 

“Wayback Machine”nin “Changes” funksiyası Britaniya Baş nazirinin keçmiş baş müşaviri Dominik Kamminqzin öz bloqunun orijinal versiyasına (solda) gizli dəyişikliklər etdiyini (mavi rəngdə, sağda) göstərdi.  

Dərin arxiv axtarışları 

“Wayback Machine”də URLs-dən istifadə etməklə açar sözlərin və ya MIME-tiplər (genişlənmə) köməyi ilə hər hansı yaddaşda qorunmuş URL-in sub-URL-ni axtara bilərsiniz. Servis maraq doğuran ünvanları tapmaq üçün nəticələri asanlıqla süzgəcdən keçirmək və lazım olan sıraya düzmək imkanı verir. 

Spesifik fayllar və vebsayt kolleksiyaları mühəndislərimiz tərəfindən indekslənib. “Wayback Machine” onlar üçün tam mətn axtarışı interfeysi təqdim edir. “Collective Search” (Kolleksiyalar üzrə axtarış) funksiyasını “Wayback Machine”nin ev səhifəsinin dibində tapın. Burada itmiş saytların səhifələrinə baxmaq olar. Belə saytlardan ən mühümləri kimi poetry.com, Rusiya Müstəqil Media saytları və 749 milyon PDF faylı kolleksiyasının adlarını çəkmək olar. “Internet Archives” saytının ev səhifəsində də kolleksiyaları əldə etməyi mümkün edən servislər var. Əgər sizə arxiv materiallarının spesifik kolleksiyalarını indeksləşdirmək lazım olsa (məsələn, müxtəlif təkrarlanan URL ünvanlarını uzlaşdırmaq), info@archive.org  ünvanına yazın. 

“Wayback Machine” ilə API interfeyslərindən istifadə

API-ın dəstəyi əsasında “Save Page Now” vasitəsilə arxivləşdirmədən başqa elə API-lər də var ki, onlardan istifadə etməklə “Wayback Machine”dən spesifik URL ünvanlarının arxivə salınıb-salınmadığını öyrənməyi istəmək olar. Bu barədə daha ətraflı məlumatı buradan ala bilərsiniz. 

Göstərdiyi başqa xidmətlərdə olduğu kimi, “Wayback” öz API-lərindən istifadənin sayına limit qoymur. Lakin bəzən servisə çıxış məhdudlaşdırıla bilər. Əgər “Wayback Machine”dən istifadədə hansısa problemlərlə rastlaşsanız, bizə email göndərin və ya “Twitter”də birbaşa mesaj yazın. Jurnalistlərə dəstək bizim üçün prioritet məsələdir. 

Arxivdəki səhifələrə kontekstin əlavəsi

Biz bilirik ki, istənilən arxiv materialının tam başa düşülməsi üçün onun konteksti və mənşəyi son dərəcə zəruridir. Bunu nəzərə alaraq, arxiv resurslarımızın istifadəçilər tərəfindən daha yaxşı anlaşılması üçün kontekst bannerlər əlavə etməyə başlamışıq. Arxivləşdirilmiş internet səhifəsi silindiyi və ya tanınmış bir tədqiqat təşkilatı həmin səhifə haqqında yazmış olduğu hallarda belə bannerlərdən istifadə oluna bilər. 

“Wayback Machine” sarı başlıqlar vastəsilə arxiv olunmuş səhifələrin kənardan istifadəsilə əlaqə yaradır və “About this capture” (Bu qeyd barədə) lövhəsi ilə səhifənin mənşəyi haqqında əlavə kontekst verir. 

Hər bir internet səhifəsini təşkil edən arxivləşdirilmiş URL ünvanlarının mənşəyi həmin səhifənin başa düşülməsində son dərəcə vacib əhəmiyyət kəsb edir. Məsələn, arxivləşdirilmiş səhifədə olan müəyyən şəkillər həmin səhifədəki digər elementlərlə eyni vaxt və eyni gündəmi yaddaşa salınmışdırlar? Bu suala cavab almaq üçün hər bir arxivləşdirilmiş URL ünvanı səhifəsinin yuxarısında və sağ tərəfində olan “About this capture” lövhəsini sıxın. 

İllər ərzində biz öz arxivlərimizin dürüstlüyünü təmin etmək üçün qayğı və diqqət göstərmişik və onların mənşəyinin şəffaflığına çalışmışıq.  Bu səylərimiz sayəsində istifadəçilərin “Wayback Machine” sisteminə olan inamı möhkəmlənib. Məhz bu səbəbdən “Wayback Machine” arxivində olan dəlillərdən istifadə dünyanın bir çox yerində məhkəmələr tərəfindən məqbul sayılır.

“Save Page Now” ilə yaratdığınız arxivlərə kontekst əlavə etməyimizi istəsəniz bizimlə əlaqə saxlayın. 

Brauzer genişlənmələri 

Bizdə Safari, Firefox və Chrome üçün brauzer genişlənmələri və eləcə də iOS və Android üçün mobil tətbiqlər var. Bundan başqa, Brave adlı axtarış mühərriki ilə əməkdaşlıq nəticəsində onun brauzerinə birbaşa olaraq özəl 404 və digər səhvləri müəyyən edən proqram yaratmışıq. Bu, müxtəlif internet saytlarına baş çəkərkən “Wayback Machine”dən istifadəni çox asanlaşdırıb. 

Yadda saxlayın ki, “İnternet Archive” və “Wayback Machine” ilə işləyərkən sizə yardım lazım gələrsə, bizə bircə email və ya “Twitter”də birbaşa mesaj yazmaq kifayətdir. Lütfən suallar və xahişlərinizi göndərin, nöqsanlar barədə xəbər verin və nailiyyətlərinizlə bölüşün.  Biz xüsusilə nədən narazı qaldığınızı öyrənmək və nəyi daha da yaxşılaşdırmaq və ya əlavə etmək barədə fikirlərinizi bilmək istərdik. Bu yolla biz öz işimizi daha yaxşı görə bilər və jurnalistlərin ehtiyaclarını və arzularını dəstəkləyə bilərik. 

Dayanın! Bunu da oxuyun…

Açıq internetin böyük hissəsini arxivləşdirməkdən başqa, “Internet Archive” həm də başqa materialların kolleksiyasını qoruyur və ictimaiyyətə açıq edir. Buraya 25 milyondan çox elmi iş daxildir və onları “Internet Archive Scholar” xidməti vasitəsilə əldə etmək olar. Az qala 30 milyondan çox elektron kitab və mətnə nəzər salmaq və endirmək olar. Burada milyonlarla saat TV xəbər arxivi var (az qala 10 il ərzində onlarla kanalın materialları). Bunları subtitrlərin tam-mətnlə indeksləndirilmiş axtarışı vasitəsilə tapmaq olar. 

“Internet Archive” və “Wayback Machine” haqqında son layihələr və xidmətlərdən xəbər tutmaq üçün bizi “Twitter”də @internetarchive və @waybackmachine hesabları vasitəsilə izləyin və bizim bloqları oxuyun. 

Mark Qrəhəm beş ildən çoxdur ki, “Wayback Machine”nin müdiri işləyir. Bundan əvvəl o, “NBC News Digital” kanalının baş vitse-prezidenti olub. Qrəhəm ilk ABŞ-Sovet e-mail xidmətinin idarəsində iştirak edib. O, onlayn müzakirə sistemi üçün ilk internetə əsaslanan interfeysin yaradılması layihəsinin müəllifidir. Qrəhəm həmçinin qadınlar üçün ilk internet xidmətlərindən biri olan iVillage servisinin idarəsində kömək edib.