使用 ScrapBook 在 Firefox 中下载整个网站

需要保存网页或网站以便离线查看(Need to save a webpage or website so that you can view it offline)?您是否要长时间离线,但希望能够浏览您喜欢的网站?如果您使用的是Firefox,那么有一个Firefox插件可以解决您的问题。

ScrapBook是一个很棒的Firefox 扩展(Firefox extension),它可以帮助您保存网页(web page)并以非常易于管理的方式组织它们。这个插件最酷的地方在于它非常轻巧、速度快、几乎完美地准确地缓存了网页(web page)的本地副本并支持多种语言。我在几个带有大量图形和精美CSS样式的(CSS)网页上(web page)对其进行了测试,并且非常高兴地看到离线版本看起来与在线版本完全一样。

火狐剪贴簿

您可以将ScrapBook用于以下目的:

  • 保存单个网页
  • (Save snippet or portion)保存单个网页的(Web page)片段或部分
  • 保存整个网站
  • 以与使用文件夹、子文件夹的书签(Bookmarks)相同的方式组织集合
  • 全文(Full text)搜索和快速过滤搜索整个集合
  • 编辑收集的网页
  • Text/HTML edit类似于 Opera 笔记的文本/HTML 编辑功能

安装剪贴簿

如果您运行的是最新版本的Firefox,在撰写本文时对我来说是 v33,您必须调整一些设置才能正确使用ScrapBook。默认情况下,ScrapBook 图标(ScrapBook icon)不会出现(t show)在任何地方,因此您可以使用它的唯一方法是右键单击网页。通过右键单击工具栏上的任意位置并选择自定义(Customize)将按钮添加到您的工具栏或菜单。

自定义火狐

自定义屏幕上(Customize screen),您会在左侧看到ScrapBook 图标。(ScrapBook icon)继续并将其拖到顶部的工具栏或菜单中。然后继续并单击退出自定义(Exit Customize)按钮。

自定义火狐添加

在我们开始使用ScrapBook保存网站之前,您可能需要更改插件的设置。您可以通过单击右上角的菜单按钮(menu button)(三个水平线)然后单击Add-ons来做到这一点。

火狐插件

现在点击Extensions,然后点击ScrapBook add-on旁边的Options按钮。

剪贴簿选项

您可以在此处更改键盘快捷键、数据存储位置和其他次要设置。

剪贴簿设置

使用 ScrapBook 下载站点

现在让我们深入了解实际使用该程序的细节。首先(First),加载您要下载网页的网站。开始下载的最简单方法是右键单击页面上的任意位置,然后选择菜单底部的“保存页面”(Save Page)或“页面另存为”。(Save Page As)这两个选项是由ScrapBook添加的。

保存页面右键

保存页面(Save Page)将让您选择一个文件夹,然后仅自动保存当前页面。如果您想要更多选项,我通常会这样做,请单击“将页面另存(Save Page)为”选项。您将看到另一个对话框,您可以在其中从大量选项中进行选择。

下载网页

重要部分是选项(Options)下载链接文件(Download linked files)部分,然后是深度保存(In-depth Save) 选项。默认情况下,ScrapBook会下载图像和样式,但如果网站需要 JavaScript 才能正常运行,您可以添加JavaScript 。

下载(Download)链接文件部分将只下载链接图像,但您也可以下载声音、电影文件、存档文件或指定要下载的文件的确切类型。如果您所在的网站有大量指向特定类型文件(Word 文档(Word docs)PDF(PDFs)等)的链接,并且您想快速下载所有相关文件,那么这是一个非常有用的选项。

最后,深度保存(In-depth Save)选项是您下载网站大部分内容的方式。默认情况下,它设置为 0,这意味着它不会跟随任何指向网站上其他页面的链接或任何其他链接。如果您选择一个,它将下载当前页面以及(page and everything)从该页面链接的所有内容。Depth of 2 将从当前页面、第一个链接页面以及来自第一个链接页面的任何链接下载。

开始下载网站

单击(Click)保存按钮(Save button),将弹出新窗口,页面将开始下载。你会想立即按下暂停(Pause)按钮,让我告诉你为什么。如果您只是让ScrapBook运行,它将开始从页面下载所有内容,包括源代码(source code)中可能链接到一堆其他网站或广告网络的所有内容。如上图所示,在主站点 (labnol.org) 之外,它正在从googleadservices.com 和(googleadservices.com and something)ctrlq.org 下载广告。

您真的希望广告在您离线浏览网站时显示在网站上吗?这也会浪费大量的时间和带宽(time and bandwidth),所以最好的办法是按下暂停(Pause),然后点击过滤(Filter)按钮。

下载过滤器

最好的两个选项是Restrict to DomainRestrict to Directory。通常这些是相同的,但在某些站点上它们会有所不同。如果您确切知道您想要什么页面,您甚至可以按字符串过滤并输入您自己的URL。这个选项非常棒,因为它消除了所有其他垃圾,只从您所在的实际网站下载内容,而不是从社交媒体网站、广告网络等。

继续并单击开始(Start),页面将开始下载。下载时间取决于您的Internet 连接(Internet connection)速度以及您正在下载的网站的确切数量。该插件适用于大多数网站,我遇到的唯一问题是在某些网站上,他们用于链接到自己的内容的 URL 是绝对(URLs)URL(URLs)

绝对URL(URLs)的问题在于,当您在离线时在Firefox中打开索引页面(index page)并尝试单击任何链接时,它将尝试从实际网站加载,而不是从本地缓存加载。在这些情况下,您必须手动打开下载目录(download directory)并打开页面。这很痛苦,我只在少数几个网站上发生过,但确实发生了。您可以通过单击工具栏上的ScrapBook 按钮(ScrapBook button)然后右键单击该站点并选择(site and choosing)工具(Tools)-显示文件来查看(Show Files)下载文件夹(download folder)

工具显示文件

在资源管理器中,按类型(Type)排序,然后向下滚动到名为HTML 文档的文件。 (HTML Document. )内容页面通常是 default_00x 文件,而不是 index_00x 文件。

本地复制网站

如果您没有使用Firefox,但仍想将网页下载到您的计算机,您还可以查看一个名为WinHTTrack的软件,该软件 会自动下载整个网站(web site),以便以后离线浏览。但是,WinHTTrack 会(WinHTTrack)占用大量空间,因此请确保您的硬盘驱动器上有足够的可用空间。

这两个程序都适用于下载整个网站或下载单个网页。实际上,下载整个网站几乎是不可能的,因为WordPress(WordPress)CMS 软件(CMS software)会生成大量链接。如果您有任何问题,请发表评论。享受!



About the author

电话是人们可以拥有和使用的最通用的工具之一。它允许人们与他人交流、访问互联网以及做很多其他事情。使用 iPhone 或 Android 设备,您甚至可以观看视频和下载音乐。手机也非常适合拍照、上网、听音乐等。



Related posts