Daftar Isi
Sesuai perkembangan zaman dan modernisasi tekhnologi, saat ini telah kita temui berbagai kemudahan dalam menggali informasi, salah satunya dengan cara membuka situs dan berselancar di dunia maya, dimana informasi yang segar dan terkini akan banyak disajikan oleh media daring.
Dari sisi kemudahan itu acapkali kita juga hendak mengambil manfaat untuk menyusuri informasi-informasi pada masa lampau, hanya saja adakalanya kita tak bisa menemukannya, dengan alasan macam-macam. Sebagai contoh alasannya adalah “telah dihapusnya” sebuah situs dan tak ada yang merawatnya lagi.
Saat ini kita sejatinya juga telah tertolong dengan bantuan pihak ketiga yang menyediakan data pendokumentasian file-file lama tersebut, antara lain adalah disediakannya “cache” oleh pihak perusahaan raksasa dunia berjuluk ‘google’ atau bisa pula diperiksa pada mesin pengarsipan yang disediakan oleh sebuah situs komunitas bernama “archive[dot]org“
Apa itu cache?
Cache adalah kata berbahasa Inggris yang berasal dari kata cash, yaitu tempat menyembunyikan atau tempat menyimpan sementara data-data yang ada, dengan tujuan guna meningkatkan transfer data dengan cara menyimpan data yang pernah diakses, sehingga ketika sisi pengguna hendak mengakses data yang sama maka maka akses akan dapat dilakukan lebih cepat. Dalam bahasa Indonesia, “cache” dikenal dengan istilah tembolok.
Dengan keberadaan “cache” ini kita bisa memanfaatkannya guna mencari file-file lama yang ada di dunia maya, pasalnya selain bermanfaat untuk mempercepat akses, “cache” juga memiliki fungsi sebagai tempat “pendokumentasian” karena di sana juga ada data yang bisa dianggap “back up”
Apa itu Web Archive?
Ketika berselancar di dunia maya pasti kita akan menelusurinya dengan menggunakan alamat yang telah tersedia di web browser, sebagai contoh adalah situs ensiklo ini yang memiliki alamat di https://ensiklo.com
Alamat pada situs-situs internet dunia (atau disingkat WWW –World Wide Web) itu selanjutnya disebut dengan istilah URL (Uniform Resource Locator).
-
Situs komunitas
Sebagaimana dipaparkan pada halamannya, web.archive.org merupakan situs komunitas yang akan mendokumentasikan file-file dari berbagai alamat website berbentuk URL tadi.
Artinya, web.archive.org adalah situs pengarsipan yang prosesnya berupa pengumpulan bagian dari WWW (World Wide Web) dan kemudian diawetkan dalam sebuah arsip. Bagian dari World Wide Web ini antara lain berisi informasi berupa tulisan, gambar, multimedia, dan file-file lain yang diarsipkan dengan memberdayakan web crawler untuk menangkap otomatis secara berkala informasi-informasi dari website.
-
Situs apa saja yang bisa dilihat?
Situs pun media apa saja yang pernah dipublikasikan, yaitu yang tak bersifat personal penyebarannya (sebagaimana email), maka secara umum web.archive.org akan mendokumentasikannya, termasuk apabila situs tersebut sudah tidak aktif, telah mati, ataupun sudah hangus.
Tampilan arsip situs yang disimpan juga akan terlihat tak jauh berbeda dengan situs aslinya. Sedang semua jenis informasi yang tersedia baik mengenai politik, sosial, budaya, sampai hiburan juga akan utuh seperti yang tercantum pada situs aslinya.
-
Jenis informasi yang didokumentasikan
Dengan situs web.archive.org kita memang tidak hanya mendapatkan tulisan, akan tetapi juga bisa memperoleh file lain, baik berujud gambar pun video. Hanya saja ada yang butuh dicatat, tak semua tulisan ataupun gambar bakal didokumentasikan, karena situs web.archive.org ini sifatnya hanya menangkap dari sumebr aslinya.
Artinya tatkala sumber asli telah menghilangkan sebuah file (sebaga contoh telah menghapus gambar), maka tak ada jaminan ada dokumentasi gambar di web.archive.org, apalagi ketika situs aslinya telah mati dan tak aktif lagi.
-
Langkah pendokumentasian
Dengan situs web.archive.org kita dapat langsung menemukan dokumentasi situs-situs internet apabila memang berhasil ditangkap, caranya juga terbilang mudah sekali, yaitu hanya dengan mengetikkan alamat URL situs yang hendak kita cari, lalu tinggal tekan tombol enter pun klik “search.”
Metode pengarsipan web.archive.org
Pengarsipan adalah hal penting dilakukan apalagi dalam instansi tertentu, karenanya banyak dibutuhkan tenaga ahli perpustakaan. Begitupun yang terjadi di dunia maya, berbagai jenis konten web tak bisa luput dari pendataan dan juga pendokumentasian. Lalu metode seperti apa yang diterapkan dalam pengarsipan website?
Hal yang dibidik oleh web.archive.org adalah merambah berbagai halaman, baik yang meliputi halaman HTML web, style sheet, JavaScript, gambar, ataupun halaman video. Selain itu, yang tak kalah pentingnya adalah pengarsipan berdasar metadata, yaitu tentang sumber daya pengumpulan, baik hal yang berhubungan dengan waktu akses serta panjang konten.
Selain bermanfaat dalam membangun keaslian pun asal dari koleksi arsip, metadata database mengacu pada metode pengarsipan konten yang mendasari situs database-driven, yang sering menggunakan XML sebagai alat untuk mengekstraksi konten database menuju ke skema standar. Usai tersimpan dalam format standar, konten diarsipkan oleh beberapa database yang selanjutnya tersedia menggunakan sistem akses tunggal.
Hal yang butuh dipahami adalah, bahwa dengan menggunakan XML maka bukan tidak mungkin halaman yang disajikan web.archive.org bentuknya menjadi tak rapi dan kurang menarik. Namun sebagai alat pendokumentasian, ia telah memenuhi persyaratan karena yang tersaji dan dibiarkan apa adanya itu justru mengindikasikan keaslian data yang ada. [uth]
Sumber Rujukan;
[1] Web Archiving en.wikipedia.org Diakses pada 28 September 2014
[2] Gambar adalah hasil Sreen Shoot halaman web.archive.org Diakses pada 28 September 2014
[…] banyak warga netizen menggemakan protes melalui akun media sosial bernama twitter, maka warga RT 1 Dayu, Sinduharjo, Ngaglik, Sleman, Yogyakarta juga menggelar […]
[…] Situs yang pernah dipublikasikan dan tak bersifat personal penyebarannya (sebagaimana email), maka secara umum akan didokumentasikan oleh web.archive.org […]
[…] sebagai Gubernur DKI Jakarta membuat opularitasnya semakin melejit, hal itu tak lain juga berkat rekam jejak baiknya serta pendekatan yang membumi dan manusiawi terhadap sesama. Blusukan tetap menjadi icon […]
[…] Handphone yang awalnya lebih difungsikan sebagai alat komunikasi jarak jauh pengganti telepon, yaitu sarana untuk berbicara, dan ditambah dengan sarana berkirim pesan singkat, belakangan ini telah mengalami perkembangan yang sangat cepat. Selain memungkinkan digunakan untuk bermain game, handphone juga telah menjadi sarana yang mampu menembus batas waktu dan batas wilayah, tak lain dengan difungsikan sebagai sarana berselancar menggunakan jaringan internet. […]
[…] Hal lain dari bentuk operasional Alexa yang belum banyak orang ketahui adalah juga mengarsipkan halaman web yang ditelusuri. Database penelusuran ini sejatinya juga disimpan oleh Alexa di dalam sebuah server bernama “Internet Archive,” di mana server tersebut juga disajikan kepada khalayak, yaitu dengan memberikan akses yang akan mudah ditelusuri melalui sebuah mesin pencari bernama “Wayback Machine”.[baca juga: Mencari Jejak Sebuah Website Menggunakan Arsip Cache dan Dokumentasi archive.org] […]
selain web.arvive (wayback machine) ada situs lagi ga yg semacam ini mas, soalnya kadang ada yang ga tertangkap oleh situs tersebut, trims ya mas
Apakah jika kita terdaftar di archive org maka blog kita terhapus? Atau hanya khusus blog yg sudah mati? Atau bagaimana?
Tolong penjelasanya gan, masih belum mudeng ik.
Thx
Huruf Timbul Steinless Surabaya Semarang