Panduan Cara Mengarsipkan Situs Web Atau Menyimpan Situs

Panduan Cara Mengarsipkan Situs Web Atau Menyimpan Situs post thumbnail image

Panduan Cara Mengarsipkan Situs Web Atau Menyimpan SitusMemelihara situs web Anda melibatkan strategi pencadangan khusus . Meskipun pencadangan sangat penting, itu bukan satu-satunya cara untuk melestarikan situs Anda. Ekstensi alami untuk pencadangan adalah mengarsipkan situs web—meskipun itu adalah proses yang saling melengkapi.

Panduan Cara Mengarsipkan Situs Web Atau Menyimpan Situs

inarchive.com – Ada beberapa cara fleksibel untuk mengarsipkan situs web. Berita baiknya adalah semuanya mudah digunakan dan dapat diakses. Anda hanya perlu memilih solusi yang tepat untuk kebutuhan dan persyaratan Anda.

Dalam posting ini, kita akan melihat cara mengarsipkan situs web. Kami juga akan menjelajahi berbagai jenis pengarsipan yang akan Anda temui, mengumpulkan beberapa alat pengarsipan situs yang paling menonjol, dan mendiskusikan beberapa kiat untuk mengarsipkan situs Anda.

Pengantar Pengarsipan Situs Web

Mengarsipkan situs web berarti melestarikan konten, data, dan media untuk referensi di masa mendatang. Menggunakan layanan khusus seperti Wayback Machine (meskipun kami akan membahas solusi lain nanti), Anda dapat melihat versi situs web yang lebih lama.

Pada tingkat teknis , perayap mengambil cuplikan situs web, yang merupakan arsip itu sendiri. Anda dapat mengaksesnya menggunakan kalender sederhana dan melihat setiap iterasi dalam format garis waktu jika diinginkan.

Adapun mengapa ada solusi seperti Wayback Machine, kita harus kembali ke awal 2000-an. Gelembung dot-com hampir meledak; banyak bisnis yang turun. Beberapa situs web populer ditutup atau ditinggalkan, dengan sedikit kenangan yang tertinggal.

Sama seperti format media lain sebelum internet, seperti musik dan televisi, situs web ini memiliki nilai sejarah dan nostalgia. Menyelamatkan mereka berarti memberi gambaran sekilas kepada pengguna internet di masa depan tentang seberapa jauh kita telah datang dari teknologi sebelumnya.

Baca Juga : Fitur Arsip di Pengarsipan Exchange Online

Internet Archive meluncurkan Wayback Machine untuk membantu melestarikan situs web. Jika sebuah situs telah diarsipkan di sana, Anda dapat melihat bagaimana sebuah situs berkembang selama bertahun-tahun.

Banyak perayap diperlukan untuk mengarsipkan situs web, termasuk perayapan individu besar yang bisa memakan waktu bertahun-tahun untuk diselesaikan. Gerutuan yang diperlukan untuk melakukan “ekspedisi” perayapan dan menyimpan snapshot yang dihasilkan sangat besar.

Misalnya, server 100 Terabyte (TB) pertama Wayback Machine mulai beroperasi pada tahun 2004. Pada akhir tahun 2020, Wayback Machine telah menyimpan lebih dari 70 Petabyte (PB) data . Itu lebih dari 70.000 Terabyte.

Namun, tidak semua orang merasa nyaman dengan pekerjaan yang dilakukan Internet Archive. Ada beberapa diskusi dan tantangan hukum berdasarkan apakah arsip situs web melanggar masalah hak cipta yang ada.

Namun, mengingat pertumbuhan yang cukup besar dalam jumlah arsip yang disimpan, ada keinginan yang jelas untuk melestarikan situs web.

Siap untuk mengarsipkan situs Anda? Kabar baik: ini adalah proses yang cukup ramah pengguna. Bagian terpenting adalah memilih solusi yang tepat untuk kebutuhan & persyaratan situs Anda. Lihat semua opsi di sini ️

Mengapa Anda Ingin Mengarsipkan Situs Web

Ada banyak alasan untuk ingin mengarsipkan situs web, selain hanya untuk alasan nostalgia. Untuk analogi dunia nyata, lihat GitHub .

Github menyimpan repositori proyek, bersama dengan setiap “komit” yang dibuat. Untuk membandingkan ini dengan pengarsipan internet, repositori mewakili seluruh arsip, dan komit adalah snapshot.

Dengan cara yang sama seperti repositori Git yang berharga, begitu juga arsip. Misalnya, Anda dapat melihat iterasi sebelumnya dari situs Anda—bahkan dari beberapa tahun yang lalu—untuk memengaruhi pilihan desain Anda saat ini.

Selain itu, Anda mungkin diwajibkan secara hukum untuk mengarsipkan situs Anda, terutama jika Anda berada di industri keuangan atau hukum.

Terakhir, jika Anda cukup malang untuk terlibat dalam litigasi seputar situs Anda, arsip Anda akan menjadi bukti berharga. Jika Anda dapat menyajikan arsip situs yang jelas dan lengkap, Anda dapat membuang perselisihan bahkan sebelum pengadilan terlibat.

Perbedaan Antara Pencadangan dan Pengarsipan

Sebelum kita berbicara tentang berbagai jenis pengarsipan web yang tersedia, ada baiknya kembali ke topik yang telah kita bahas sebelumnya. Di atas kertas, cadangan situs dan arsip situs web tampak serupa. Namun, mereka melakukan pekerjaan berbeda yang saling melengkapi. Pendeknya:

Cadangan berbasis data. Mereka lebih peduli dengan menjaga data situs Anda. Mengingat bahwa pencadangan sangat penting jika Anda perlu memulihkan situs , memiliki cadangan lengkap data Anda adalah yang terpenting.

Arsip mempertahankan konteks di atas data. Jika Anda menelusuri arsip situs web favorit Anda , Anda akan melihat bahwa fungsinya seringkali tidak merata. Namun, desain situs dan konten statis biasanya utuh.

Perlu dicatat bahwa pengarsipan tidak terlihat menghindari upaya pelestarian data sama sekali. Memang, salah satu manfaatnya adalah membiarkan pengguna menavigasi situs Anda seolah-olah itu hidup. Meski begitu, mengingat bahwa situs seperti Wayback Machine ada sebagai “jalur memori” virtual, menjaga visual tetap utuh membutuhkan prioritas lebih tinggi daripada mempertahankan fungsionalitas backend.

Singkatnya, Anda akan ingin menggunakan cadangan dan arsip untuk situs Anda—yang pertama sebagai perlindungan harian jika yang terburuk terjadi, dan yang terakhir sebagai cara tambahan untuk membantu mendokumentasikan evolusi situs Anda.

Berbagai Jenis Pengarsipan Web yang Akan Anda Hadapi

Pengarsipan web tidak hanya datang dalam satu rasa. Ada beberapa jenis berbeda yang akan Anda temui. Berikut uraian masing-masing:

Sisi klien: Ini melibatkan pengguna akhir yang menyimpan versi situs web yang bersangkutan. Sederhana, terukur, dan memungkinkan Anda mengarsipkan situs web tanpa repot.

Sisi server: Pendekatan Mesin Wayback dan lainnya digolongkan sebagai pengarsipan sisi server. Ini menggunakan perayap dan teknologi lain untuk mengarsipkan situs web, tetapi juga memerlukan tingkat persetujuan yang tidak ditemukan dalam pengarsipan sisi klien.

Berbasis transaksi: Meskipun ini masih didasarkan pada pengarsipan sisi server, ini lebih kompleks dan memerlukan persetujuan eksplisit dari pemilik situs. Pada dasarnya, ini mengarsipkan transaksi situs antara pengguna akhir dan server.

Untuk situs web sederhana dengan data statis , ditambah dengan strategi pengarsipan terorganisir, pengarsipan sisi klien harus sesuai dengan tagihan. Namun, sebagian besar situs lain akan menyukai arsip sisi server—pengarsipan berbasis transaksi tidak diperlukan untuk sebagian besar situs web.

Terakhir—dan kami akan membahas ini secara lebih mendetail di seluruh postingan—Anda juga perlu mempertimbangkan di mana dan bagaimana arsip Anda disimpan . Misalnya, arsip lokal bukanlah pilihan yang buruk, tetapi Anda dapat melihatnya menghilang jika komputer Anda rusak. Di sisi lain, Anda memiliki lebih sedikit kendali atas apa yang diarsipkan jika Anda memilih solusi pihak ketiga.

Seperti yang Anda harapkan, jawabannya di sini adalah menggunakan pendekatan multi-segi untuk mengarsipkan situs web. Kami menyarankan untuk memperlakukan arsip seperti cadangan: simpan tiga salinan berbeda di lokasi terpisah dan sinkronkan.

Anda mungkin juga ingin membuat salah satu arsip aktif, sehingga Anda dapat memanfaatkan fungsionalitas sisi server apa pun di situs Anda. Hasilnya adalah situs web dengan strategi pencadangan dan pengarsipan yang kuat yang tetap berguna bagi orang lain.

Panduan Pemula untuk Alat dan Situs Arsip Internet

Ada banyak solusi yang tersedia untuk mengarsipkan situs web. Kami akan membahas beberapa yang lebih populer, bersama dengan pendapat kami tentang bagaimana itu mungkin cocok untuk Anda.

  1. Mesin Wayback

Pertama, mari kita bahas Mesin Wayback . Ini adalah yang pertama dari jenisnya, sehingga menjadi patokan untuk alat pengarsipan lainnya.

Dengan demikian, kemungkinan akan menjadi yang pertama ketika mencari untuk mengarsipkan situs web. Ini memiliki banyak cara untuk membuat dan mengunggah arsip, dan bahkan API khusus untuk menghubungkan ke fungsinya. Perlu dicatat bahwa ini juga merupakan solusi arsip sisi server.

Karena itu, karena cara merayapi dan mengarsipkan situs web, Mesin Wayback mungkin tidak dapat mempertahankan semua fungsi situs Anda. Namun demikian, ini dianggap sebagai standar industri untuk pengarsip web, dan sepenuhnya gratis untuk boot. Kami akan menunjukkan cara mengarsipkan situs web secara lebih rinci menggunakan Mesin Wayback nanti di artikel ini.

  1. Arsip. hari ini

Selanjutnya adalah Archive.today . Ini mirip dalam banyak hal dengan Wayback Machine—bahkan hingga desain situs yang hampir “retro”. Server datanya berbasis di Eropa, tetapi pendekatan pengarsipannya berbeda dari Wayback Machine.

Sebagai permulaan, Archive.today tidak didasarkan pada crawler yang berjalan di web. Sebagai gantinya, Anda mengirimkan URL Anda dan menyetujui penyertaan dalam arsip. Selain itu, daftar fiturnya lebih sederhana daripada solusi lain. Tidak ada kebijakan penghapusan yang kuat, misalnya, dan proses pengarsipan mengecualikan jenis media dan file tertentu.

Tetap saja, ini gratis dan cocok jika Anda menginginkan tempat penyimpanan arsip gratis. Situs ini bahkan memiliki fungsi pencarian untuk menemukan situs yang diarsipkan sebelumnya.

  1. Warisan

Kami telah menyebutkan Arsip Internet dan Mesin Wayback hampir secara bergantian dalam posting ini sejauh ini. Mesin Wayback hanyalah satu layanan, dan Arsip Internet menawarkan beberapa produk pengarsipan lain selain itu. Heritrix adalah alat sumber terbuka gratis yang lahir dari kolaborasi antara Arsip Internet dan perpustakaan Nordik.

Ini pada dasarnya adalah perayap web daripada alat pengarsipan berfitur lengkap. Namun, Anda dapat mengemas semua hasil yang dirayapi bersama-sama. Meskipun ini tidak terjadi di masa lalu, Mesin Wayback sekarang menggunakan Heritrix untuk merayapi situs untuk dimasukkan ke situsnya sendiri. Terlebih lagi, sejumlah besar perpustakaan dan institusi menggunakan Heritrix untuk membangun arsip.

Terlepas dari fitur-fiturnya yang mengesankan, menginstal Heritrix memerlukan beberapa pengetahuan teknis. Tidak ada antarmuka yang mudah digunakan untuk menginstalnya untuk Anda, jadi Anda memerlukan pengetahuan tentang Git, GitHub, dan baris perintah .

Seperti solusi serupa lainnya, Heritrix sepenuhnya gratis untuk digunakan, sehingga cocok sebagai solusi pengarsipan mandiri yang hemat biaya.

  1. Lapisan Integrasi Pengarsipan Web (WAIL)

Jika Anda mencari Heritrix untuk mengarsipkan situs web, tetapi terhalang oleh pengetahuan teknis yang diperlukan untuk menginstal perangkat lunak, ada solusi potensial untuk Anda. Lapisan Integrasi Pengarsipan Web (WAIL) adalah aplikasi desktop lintas platform sumber terbuka dan gratis yang memberi Anda Antarmuka Pengguna Grafis (GUI) fungsional untuk digunakan, bersama dengan penginstal.

Kabar baiknya adalah bahwa Heritrix adalah mesin crawling WAIL. Ini berarti Anda dapat memanfaatkan kekuatan Heritrix tanpa harus melintasi GitHub dan baris perintah. Selain itu, WAIL menggunakan mesin OpenWayback untuk “memutar ulang” arsip web.

Dengan demikian, Anda memiliki alat pengarsipan web berfitur lengkap yang siap digunakan di mesin Anda. Kami juga akan menunjukkan kepada Anda cara kerja WAIL nanti di artikel.

  1. Stillio

Alat pengarsipan kedua dari belakang kami ditagih sebagai solusi otomatis yang mengambil snapshot pada interval yang ditentukan. Stillio adalah layanan premium yang terlihat dan terasa berbeda dari solusi pengarsipan lainnya.

Situs web terlihat apik dan memberi Anda banyak sekali pilihan untuk membuat arsip yang memenuhi kebutuhan Anda. Misalnya, Anda dapat menambahkan tag dan judul khusus ke URL Anda.

Terlebih lagi, Anda dapat memilih untuk menyimpan arsip ke Dropbox , Google Drive , dan layanan pihak ketiga lainnya .

Namun, Stillio memiliki satu kelemahan besar: tidak mendukung pengarsipan back-end. Anda dibatasi pada tangkapan layar situs web Anda daripada arsip data lengkap. Untuk banyak aplikasi, ini tidak cukup.

Namun, Stillio dapat berguna dalam beberapa kasus, seperti berfungsi sebagai manajemen merek dan alat pelacakan. Misalnya, Anda dapat mengambil tangkapan layar dari situs pesaing atau hasil mesin pencari. Ini juga bagus untuk verifikasi konten.

Harga Stillio mulai dari $29 per bulan dan naik melalui empat tingkatan hingga $299 per bulan. Ini adalah pertanyaan besar, terutama ketika ada alternatif gratis dengan fitur yang lebih kuat. Tetapi jika itu cocok dengan kasus penggunaan Anda dengan sempurna, maka itu layak untuk dilihat!

  1. Pembeku halaman

Solusi terakhir kami adalah alat otomatis lainnya. Pagefreezer menawarkan banyak manfaat yang sama seperti Stillio, tetapi juga mengarsipkan konten media sosial, pesan teks, situs lengkap, dan platform kolaborasi tingkat perusahaan .

Di permukaan, Pagefreezer tampak seperti solusi yang lebih kuat daripada Stillio dan akan memiliki nilai lebih besar dalam berbagai kasus penggunaan.

Misalnya, di mana Anda diwajibkan secara hukum untuk mengarsipkan situs sepenuhnya, Pagefreezer cocok dengan tagihannya. Ini memungkinkan Anda untuk mengotomatiskan jumlah snapshot dan meninjaunya menggunakan browser arsip situs dan alat perbandingan.

Secara keseluruhan, Pagefreezer adalah solusi tingkat perusahaan yang hebat untuk pengarsipan tempat kerja. Perusahaan yang menggunakan Yammer atau Salesforce’s Chatter akan tertarik pada jenis solusi ini, seperti halnya pengguna Workplace .