Internet Archive Wayback Machine Link Fixer:解決 WordPress 網站 404 失效鏈結的自動化神器

Internet Archive Wayback Machine Link Fixer

今年二月 Automattic 公司宣布與 Wayback Machine(網站時光機)攜手合作,推出一款名為「Wayback Machine Link Fixer」的免費 WordPress 外掛程式,協助使用者解決網站文章中的外部鏈結消失或失效問題。當網站營運了一大段時間,很多時候一些舊文章會出現鏈結失效、無法開啟等狀況,不過管理者很難逐一手動檢查,透過外掛可進行自動化查詢,同時將已失效、無法使用的外部網址引導至 Wayback Machine 快照版本,避免出現 404 錯誤。

什麼是 Internet Archive 與 Wayback Machine?

Internet Archive(網際網路檔案館)是美國一個非營利組織,旗下的 Wayback Machine 網頁保存計劃幾乎是 24/7 不間斷地備份、保存網路面貌,為每個網站建立不同時間點的快照(Snapshot)。如果想查某個網站在某個時間的狀態,這個工具很有用,而且還能「使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源」。

Cloudflare 也和 Wayback Machine 合作,當伺服器無法連線時提供備份頁面,只需要開啟「Always Online」選項。

外掛程式運作原理:預防鏈結腐爛

Internet Archive Wayback Machine Link Fixer 外掛程式的運作方式很簡單,它會在 WordPress 控制台自動掃描網站文章中出現的外部鏈結,並為文章內的鏈結建立快照,當使用者更新文章時,系統也會同步備份該頁面(建立快照),保存網站歷史紀錄。

值得一提的是 Wayback Machine Link Fixer 可以動態偵測、修復鏈結,當鏈結無效時,它會將使用者重新引導至網站時光機已備份的頁面,以解決 404 錯誤時只能直接關掉頁面的問題(並讓原始文章保有一些參考價值)。鏈結檢查工作會持續進行,若原本失效的鏈結恢復正常時,外掛會自動停止重新導向,恢復原始連結。

Automattic 執行長 Matt Mullenweg 認為「這個外掛可以解決鏈結腐爛(link rot)問題」,確保讀者持續獲取參考資訊。

網站資訊

網站名稱:Internet Archive Wayback Machine Link Fixer – WordPress 外掛
網站鏈結:https://wordpress.org/plugins/internet-archive-wayback-machine-link-fixer/

使用教學

操作步驟
搜尋並安裝外掛

Wayback Machine Link Fixer 已經在 WordPress 外掛目錄上架,直接從控制台外掛功能搜尋也能找到。

Internet Archive Wayback Machine Link Fixer

初始設定與掃描範圍

安裝啟用後會看到歡迎畫面,簡單介紹運作方式,大意就是外掛會自動修復壞掉的鏈結並將它們重新導向至 Wayback Machine 快照版本。

至於使用者比較會擔心的是效能部分,有沒有可能因為外掛而拖垮了整個網站運作呢?這個外掛其實都是小批量的背景運作,來確保網站正常運作,而且也不會在偵測到失效鏈結時就直接標示為損壞鏈結,而是必須符合超過九天、三次無法連線的條件才會重新導向鏈結,所有過程都會自動化進行。

Internet Archive Wayback Machine Link Fixer

第二步會詢問使用者要修復的內容形態,如果你有安裝特定的外掛程式可能會顯示不同選項,主要就是將文章、頁面打開(這個在之後的設定選項還能調整)。

Internet Archive Wayback Machine Link Fixer

接著就是選擇要自動同步、建立快照的內容。

Internet Archive Wayback Machine Link Fixer

設定就緒後就會開始運作。

Internet Archive Wayback Machine Link Fixer

檢查自動化運行進度

Wayback Machine Link Fixer 會在控制台選單新增一個「Link Fixer」頁面,整個運作的過程是全自動,不過速度很慢,基本上要超過兩週時間才會開始重新導向損壞的鏈結。

好處就是偵測的速度很慢,也不太會對網站主機造成負載問題。

Internet Archive Wayback Machine Link Fixer

分析鏈結狀態與回應碼

從 Wayback Machine Link Fixer 控制台會看到近期已檢測的鏈結、回應狀態碼,最主要還是看右邊的總覽,包括已經檢查的鏈結數量、建立快照數量、成功備份的鏈結數量等,要注意的就是標記為紅色已經失效或無法存取的鏈結。

Internet Archive Wayback Machine Link Fixer

點選後就會看到這些鏈結列表,這些都是檢查三次以上返回錯誤狀態碼的鏈結,不過要注意的是除了 404 錯誤以外,其實有不少是因為阻擋爬蟲或是網站安全防護造成無法存取的問題,因此還是需要手動去檢查這些鏈結的正確性。

如果鏈結「Archive Status」標記為打勾代表在 Wayback Machine 上有被索引(有建立快照)。

Internet Archive Wayback Machine Link Fixer

點選失效的鏈結後會有詳細資訊頁面,包括鏈結、索引狀態、快照頁面、鏈結檢查情形和發現的文章,可以方便使用者找出這個失效鏈結的位置。

Internet Archive Wayback Machine Link Fixer

當使用者瀏覽到失效鏈結時,Wayback Machine Link Fixer 就會重新導向至網頁時光機的快照頁面,即使功能不一定能用,但是可以看到原有網站的樣貌以及內容。

Internet Archive Wayback Machine Link Fixer

調整修復選項與 API 金鑰

從 Wayback Machine Link Fixer 進階設定可以找到「Fixer Option」,也就是當鏈結壞掉時,外掛提供的修復選項,預設情況會是將失效鏈結重新導向 Wayback Machine 快照頁面。

如果你覺得這個功能可能會影響到正常鏈結,建議還是先調整為不要重新導向損壞鏈結。

Internet Archive Wayback Machine Link Fixer

另外,還有一個 Archive.org API 設定功能,可以提升外掛每日建立快照的數量最大值,依照底下鏈結去設定一下、取得金鑰輸入就能完成設定,設定後每日可建立最多 30000 個快照,但一般網站應該都用不到,使用者自行斟酌,有沒有設定都不會影響檢查鏈結的速度。

Internet Archive Wayback Machine Link Fixer

Pseric

Pseric

學生時代成立網站以來堅持每日更新,在挖掘資料的過程中慢慢找出自己經營網站的方法,最開心的是有一群一起長大的讀者。