根據 Cloudflare 研究發現他們的用戶每天總共花費四年半時間來等待沒有回應的伺服器傳回錯誤訊息,對使用者來說沒人想看到錯誤頁面,如果在網站無法開啟時依然想看到內容,搜尋引擎提供的「頁庫存檔」功能其實很有用,可以查看搜尋引擎在爬行時索引儲存的頁面內容,當然相較於「新鮮」頁面來說可能會有時間差,不過還是能讓我們看到網頁內容,特別是一些文字資訊就能正常瀏覽,我很常在無法正常開啟的網頁使用這個技巧。
時光機
Archiveror 快速備份、永久保存當前看到的網頁內容(Chrome、Firefox)

現在放到網路上的任何資料都可能被永久保存,即使編輯或刪除頁面內容依然無解,大家都知道搜尋引擎 Google 或 Bing 會索引頁面,短時間內就會快取內容,但我之前曾經提到過的網頁時光機 Wayback Machine 可以完整備份網頁畫面及相關檔案,提供可永久引用的來源,如果某個網站營運時間夠長,重要性很高,甚至能夠回溯到更早以前某個時間點畫面。因此網路上的足跡是很難被抹除的,要將任何文字圖片放上網路時務必要更謹慎小心。
Save To The Wayback Machine 一鍵備份網頁內容,查詢已存檔頁面版本(Chrome 擴充功能)
前幾天剛寫完「使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源」教學,現在大家都知道 Internet Archive 網際網路檔案庫是可以用來備份網頁、查看不同時間網頁樣貌的工具,還能比較不同時間的內容差異。有時候如果要引用某個時間點的內容,透過 Wayback Machine 產生的網址可以永久使用而不必擔心失效,至少無法竄改內容,若是直接擷圖可能難以標示時間,也不能確保內容客觀性。
使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源

幾天前我介紹了「以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異」,也就是大家很熟悉的 Internet Archive 最近推出的新功能,這項服務確實非常好用,除了可以回溯查看某個網站在不同時間點樣貌,對於已經被刪除或編輯後的網頁內容也有保存紀錄或回復的效果。順帶一提,記得之前還看過付費服務可以協助網站管理員從 Wayback Machine 將以前的網頁資料恢復(因為這些備份還是得經過處理才能變回一般網頁),若網頁放在虛擬主機又沒續費而被刪除是可以救回資料的方法。
以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異
Internet Archive 最知名的工具「Wayback Machine」網站時光機相信大家都不陌生,這項服務的目標是將分分秒秒都在變化的網頁備份保存下來,以便使用者日後隨時返回、檢索特定時間點的網頁樣貌和內容。事實上現今搜尋引擎都有類似頁庫存檔(或稱為網頁快照)功能,當網頁暫時無法開啟時依然可以透過快取資料查看內容,以前介紹過「Cached Pages」能在網頁打不開或資料被刪除時利用頁庫存檔找回備份,當然它的資料也來自 Google 和 Archive.org,只不過提供一個更簡單、易於操作的介面。
Internet Archive 更新加入 2,500 個 MS-DOS 遊戲,可直接以模擬器線上玩
網際網路檔案館(Internet Archive)最為人熟悉的就屬 Wayback Machine 網路時光機,後來還推出 Chrome 擴充功能,讓使用者快速查看某一個網站以前的樣貌,隨意返回任何時間點,只要這個服務有索引並儲存網站就能查到。前段時間很多人跑去找以前無名小站的相簿、部落格,其實 Internet Archive 更強大的是收藏很多老東西,像是 The Great 78 Project 將兩萬張黑膠數位化,還有 Internet Arcade 收錄數千個投幣式電玩街機。
忘記按下錄音?Backtrack 幫你回溯前一小時的聲音紀錄(macOS)
Perma.cc 免費網頁網址備份工具,輕鬆將重要鏈結完整保留
有時候會遇到必須保留網頁內容的情形,通常一般人可能直接螢幕擷圖,使用抓圖功能保存為圖片,不過這會有些問題,例如你很難證明網頁時間,圖片無法編輯或取用文字內容,因此最好的方法還是將整個網頁包含動態、靜態內容通通複製起來。之前我介紹過「Archive.is 線上備份網頁工具,可下載完整網頁內容或將畫面轉為擷圖」就是一個很好的選擇,此外,Internet Archive 的 Wayback Mahine 堪稱是網頁時光機,完整記錄近一二十年來網路發展變化。
Archiver Menu 免費網頁內容備份、找回快取暫存資料 Firefox 瀏覽器外掛

俗話說「人在做,天在看」或許也可改寫成「人在做,Google 有在看」,怎麼說呢?現今網路世界幾乎任何網站資料都逃不過 Google,尤其搜尋引擎的頁庫存檔功能可以說是網頁備份裡最即時詳盡的資料庫,一旦被搜尋爬蟲記錄後,即使網頁已被刪除,仍有一段時間會備份於搜尋結果中,除此之外,還有一個「Wayback Machine 網站時光機」也正在每分每種不斷紀錄網路生態,在這裡甚至能找回數十年前的古老網頁。
Wayback Machine 免費 Chrome 外掛在網頁內容被刪除時快速取出備份

你知道嗎?如果網頁打不開或刪除,並不代表它真的永遠無法被看見,現今有很多服務是隨時在抓取頁面,例如我們熟悉的 Google 搜尋引擎內建「頁庫存檔」功能就能隨時提取已經被蜘蛛爬行暫存的頁面內容,不過頁庫存檔通常會有時間限制,想找更早以前的網頁樣貌,Wayback Machine 網頁時光機保存這十幾年的網際網路資料,數十億個古早網頁還能被看到也算奇蹟。