使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源

使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源
Copyright : rawpixel / 123RF Stock Photos

幾天前我介紹了「以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異」,也就是大家很熟悉的 Internet Archive 最近推出的新功能,這項服務確實非常好用,除了可以回溯查看某個網站在不同時間點樣貌,對於已經被刪除或編輯後的網頁內容也有保存紀錄或回復的效果。順帶一提,記得之前還看過付費服務可以協助網站管理員從 Wayback Machine 將以前的網頁資料恢復(因為這些備份還是得經過處理才能變回一般網頁),若網頁放在虛擬主機又沒續費而被刪除是可以救回資料的方法。

接下來想教讀者朋友們透過 Wayback Machine 來備份網頁畫面。或許你會問:螢幕擷圖就能備份畫面不是嗎?但自己擷取螢幕畫面很難證明在操作過程是否有使用任何方式改動網頁,若要做為可信的引用來源,以第三方 Wayback Machine 存檔可以證明無法以其他方式修改內容,確保紀錄正確性,對於要保留文章或網頁內容來說會很有用,特別是日後要再次查看或引用時就不必擔心鏈結失效。

使用 Wayback Machine 備份網頁畫面

可能很多人不知道 Wayback Machine 的「Save Page Now」可以立即備份網頁畫面,包括圖片、CSS 樣式表和 JavaScript 都會一併備份起來,確保日後檢視時可以完整呈現備份當下的樣貌。

不過 Save Page Now 仍有一些限制存在,例如只有在網頁允許爬蟲(web crawlers)進入時才能正確備份內容,若阻擋 Wayback Machine 進入就無法將網頁備份到這項服務上,此外,對於需要登入或驗證身分的頁面來說也無法透過這個服務備份存檔。

Wayback Machine
https://web.archive.org/

使用教學

STEP 1

開啟 Wayback Machine 網站後可以從右下角找到「Save Page Now」功能,這個服務支援桌面瀏覽器或行動裝置開啟,直接將要備份、保存的頁面鏈結貼上,點選「Save Page」就會保存內容。

使用 Wayback Machine 備份網頁畫面

STEP 2

接著 Wayback Machine 會顯示備份的網頁樣貌,可以看一下網址列為 https://web.archive.org/web/ 後面接上日期時間等資訊,現在頁面已經備份至遠端伺服器,未來就能以相同網址查看該時間點的內容。

使用 Wayback Machine 備份網頁畫面

頁面右上角會顯示該網頁備份的時間,例如這個畫面為 2019 年 10 月 19 日,點選左右的箭頭可切換不同時間的備份資料,就跟時光機一樣可快速退回到不同時間點。

使用 Wayback Machine 備份網頁畫面

STEP 3

點選右上角的「About this capture」會顯示關於此網頁擷取畫面的相關資訊,包括是由那一個爬蟲進行抓取、收錄在那一個 Collection,底下則有頁面中所有圖片及相關檔案的時間戳記,如果點選任一檔案會發現檔案也同時被備份到 Wayback Machine 伺服器。

使用 Wayback Machine 備份網頁畫面

順帶一提,在備份頁左上角會顯示該網址已經被擷取、備份過幾次,以及最早和最近的備份日期,點選後就能以 Wayback Machine 月曆模式瀏覽,每個藍色圈圈代表網站有備份紀錄的時間點,點選後可以快速返回某個時間的網頁樣貌。

使用 Wayback Machine 備份網頁畫面

之前介紹過的「Archive.is 線上備份網頁工具,可下載完整網頁內容或將畫面轉為擷圖」也是一個類似的網頁備份服務,可以在輸入網址後將網頁內容及相關檔案備份於遠端伺服器。

值得一試的三個理由:

  1. 透過 Save Page Now 立即將網頁備份到 Wayback Machine
  2. 可以將網頁裡所有圖片、CSS 和 JavaScript 複製到遠端伺服器
  3. 以服務備份並引用網頁資料更為可信,使用者無法修改或變更內容
分享本文
Pseric

Pseric

學生時代成立網站以來堅持每日更新,在挖掘資料的過程中慢慢找出自己經營網站的方法,最開心的是有一群一起長大的讀者。

文章: 6495