SingleFile 將完整網頁保存為單一 HTML 格式下載(Chrome 擴充功能)

SingleFile 將網頁保存為單一 HTML 格式下載(Chrome 擴充功能)

大部分的常見瀏覽器都有內建另存頁面、另存新檔功能,可以將看到的網頁保存到電腦,不過如果選擇完整網頁會發現瀏覽器其實是將所有檔案保存在另一個資料夾,像是 CSS、圖片和字型檔案等等,為了要讓網頁正常顯示,需要將 HTML 和這個資料夾放在一起才行,可能很多人覺得非常困擾吧!如果你有另存網頁的需求,可試試看接下來介紹的瀏覽器外掛。

Google Chrome 推出「閱讀清單」,收藏想閱讀還沒時間瀏覽的網頁

Google Chrome 推出「閱讀清單」,收藏想閱讀還沒時間瀏覽的網頁

前幾週介紹 Microsoft Edge 瀏覽器新加入「集錦」功能,就如同瀏覽器內建剪貼簿,可將看到的網頁、圖片或影像新增到集合中,以利於收集和整理資料,再依照需求建立不同的分類,我覺得這功能非常實用,對於要暫存資料、或當下沒時間只能「稍後閱讀」來說 Edge 集錦提供了很好的解決方案,還能透過瀏覽器內建的同步功能,在所有使用 Microsoft Edge 瀏覽器裝置上同步並存取相同紀錄。

Full Page Screen Capture 快速擷取完整網頁畫面,轉為圖片或 PDF 格式(Chrome 擴充功能)

Full Page Screen Capture 快速擷取完整網頁畫面,轉為圖片或 PDF 格式(Chrome 擴充功能

對於可以保存網頁畫面的截圖工具相信大家都不陌生,像是 WinSnapFastStone Capture 或 Mac 系統很好用的 Jing(現在是 TechSmith Screencast)都能達到類似效果,或是透過瀏覽器擴充功能和線上工具也能做到,通常保存下來的都是靜態圖片格式。如果你想要完整保存某個網頁在某個時間點的樣貌,透過第三方建立更具公信力的網頁備份可能是更好的選擇,我曾介紹過 Wayback Machine 網頁時光機就能讓使用者將頁面完整保存在線上,以便隨時回溯到特定時間:

Archiveror 快速備份、永久保存當前看到的網頁內容(Chrome、Firefox)

Archiveror 快速備份、永久保存當前看到的網頁內容(Chrome、Firefox)
Copyright : rawpixel / 123RF Stock Photos

現在放到網路上的任何資料都可能被永久保存,即使編輯或刪除頁面內容依然無解,大家都知道搜尋引擎 Google 或 Bing 會索引頁面,短時間內就會快取內容,但我之前曾經提到過的網頁時光機 Wayback Machine 可以完整備份網頁畫面及相關檔案,提供可永久引用的來源,如果某個網站營運時間夠長,重要性很高,甚至能夠回溯到更早以前某個時間點畫面。因此網路上的足跡是很難被抹除的,要將任何文字圖片放上網路時務必要更謹慎小心。

Save To The Wayback Machine 一鍵備份網頁內容,查詢已存檔頁面版本(Chrome 擴充功能)

Save To The Wayback Machine 一鍵備份網頁內容,查詢已存檔頁面版本(Chrome 擴充功能)

前幾天剛寫完「使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源」教學,現在大家都知道 Internet Archive 網際網路檔案庫是可以用來備份網頁、查看不同時間網頁樣貌的工具,還能比較不同時間的內容差異。有時候如果要引用某個時間點的內容,透過 Wayback Machine 產生的網址可以永久使用而不必擔心失效,至少無法竄改內容,若是直接擷圖可能難以標示時間,也不能確保內容客觀性。

使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源

使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源
Copyright : rawpixel / 123RF Stock Photos

幾天前我介紹了「以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異」,也就是大家很熟悉的 Internet Archive 最近推出的新功能,這項服務確實非常好用,除了可以回溯查看某個網站在不同時間點樣貌,對於已經被刪除或編輯後的網頁內容也有保存紀錄或回復的效果。順帶一提,記得之前還看過付費服務可以協助網站管理員從 Wayback Machine 將以前的網頁資料恢復(因為這些備份還是得經過處理才能變回一般網頁),若網頁放在虛擬主機又沒續費而被刪除是可以救回資料的方法。

以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異

以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異

Internet Archive 最知名的工具「Wayback Machine」網站時光機相信大家都不陌生,這項服務的目標是將分分秒秒都在變化的網頁備份保存下來,以便使用者日後隨時返回、檢索特定時間點的網頁樣貌和內容。事實上現今搜尋引擎都有類似頁庫存檔(或稱為網頁快照)功能,當網頁暫時無法開啟時依然可以透過快取資料查看內容,以前介紹過「Cached Pages」能在網頁打不開或資料被刪除時利用頁庫存檔找回備份,當然它的資料也來自 Google 和 Archive.org,只不過提供一個更簡單、易於操作的介面。

Full Page Screen Capture 線上產生網頁長擷圖,正常顯示中文內容無廣告

Full Page Screen Capture 線上產生網頁長擷圖,正常顯示中文內容無廣告

無論是電腦或行動裝置其實都有內建螢幕擷取功能,也就是透過特定的快速鍵組合就能將畫面抓下來,儲存成常見圖片格式,抓圖的功能大家應該不陌生。有時候內建的工具並不一定能滿足一些進階使用者需求,例如要拿來抓取工作上使用的圖片時就會選擇其他更專業的擷圖軟體,我個人很喜歡 Jing,但是 macOS 10.15 後只支援 64 位元應用程式,TechSmith Screenshot 將成為 Jing 的替代方案。

Screenlapse 自動網站截圖服務可設定每小時、每日、每週或每月排程

Screenlapse 自動網站截圖服務可設定每小時、每日、每週或每月排程

寫了十多年的文章,各式各樣的網路服務或軟體大概都看過,只能說大部分的需求應該都有對應的解決方案可以選擇,但有些工具就真的比較少看到有人開發,舉例來說,有定時自動偵測網頁內容有沒有發生變化並發送通知的網站監測服務,就很少看到依照排程自動擷取網頁畫面的線上工具,而接下來要介紹的這項服務可線上自動抓取網頁畫面,也能讓使用者設定要擷取的頻率或時間點。