wget和curl将网页保存为乱码(加密?)

当我使用wget或curl下载https://www.wired.com/category/security/时,结果是乱码/加密.

从命令行保存该网页(未加密/纯HTML)是否可能(如果是这样,是什么方法)?

最佳答案
执行摘要:

看起来下载的文件是压缩的,你应该解压缩它.

详细的答案

运行:

wget https://www.wired.com/category/security/

下载index.html文件的结果

在下载文件上执行file命令显示:

$file index.html 
index.html: gzip compressed data, from Unix

重命名文件并解压缩它将其转换为HTML文档

$mv index.html index.html.gz
$gunzip index.html.gz 
$file index.html 

index.html: HTML document, UTF-8 Unicode text, with very long lines, with overstriking

额外信息 – 为什么wget下载压缩文件?

How To Optimize Your Site With GZIP Compression中所述:

现代HTTP服务器/客户端使用压缩HTTP响应来减少传输文件的大小,而不是下载大型文本文件.

转载注明原文:wget和curl将网页保存为乱码(加密?) - 代码日志