Google 搜索有一个很实用的「网页快照」功能,也就是 Google 爬虫抓取网页内容时建立快照页面,用户就能利用这项功能查询到过去时间点的网页样貌(像是将网页备份在 Google ),对于查某个页面编辑前的资料或网页无法访问时就会很有用,此外,网页快照还能查看网页的纯文字版本或源代码,有时候想查资料就不需要看到一堆图片或广告,直接就能抓取到文字内容。
不知道大家最近有没有发现 Google 搜索结果的“网页快照”不见了? 以往是点击搜索结果网站名称右侧「菜单」就会在「更多选项结果」最上方出现网页快照按钮,看起来就像下图:
但最近打开后就没有这些按钮功能,而且只有在登录谷歌账户的情况下搜寻才会遇到(如果以浏览器的无痕模式测试又会出现),猜测可能是 Google 搜索在修改时发生了一些问题。
那么想使用 Google 网页快照功能要怎么解决呢? 以下提供两个方法,若有需要在 Google 搜索、查看某个网页的快照页面,浏览由 Google 搜索引擎建立的快照,可以把这个方法学起来以备不时之需喔!
方法一:在搜索时加入 Cache: 指令
STEP 1
最简单的方法就是在 Google 搜索字段使用 cache:指令,后方加上要查看快取的页面网址,例如:
cache:https://free.com.tw/about/
STEP 2
如果 Google 有对该网页建立缓存,就会显示特定时间的快照存档(也就是大家熟悉的网页快照),若搜索引擎没有抓取过、或是网页有设定要求搜索引擎不要建立暂存页面或快取的 meta 标签就会显示 404 错误。
方法二:使用 Web Cache Viewer 扩充功能
STEP 1
另一个方法是使用 Google Chrome 扩充功能「Web Cache Viewer」,虽然这个插件已经很久没更新,但是功能上很简单,还是可以正常使用。
STEP 2
安装后在页面点击右键,找到「Web Cache Viewer」选项后就有两个功能可用:
- WayBack Machine Version:查看网页的网站时光机版本。
- Google Cache Archive:Google 缓存页面索引。
相较于第一种方法,使用 Web Cache Viewer 必须在能打开网页的情况下才能使用,不过好处是可以通过另一个网页时光机功能查看更多不同时间点的网页索引,也算是 Google 页库存档的替代方案吧!
STEP 3
Wayback Machine,这是一个网页存档网站,透过Internet Archive 档案馆的服务,可以查看特定网页在不同时间点的样貌,相较于Google 只会显示最近一次索引的网页快照,这个功能可看到的资料更多。