摘要: 本篇Node.js开发实战 教程将会大家讲解如何解析gzip网页,看完本篇文章,会让你的Node.js 开发实战更强!
gzip网页指网页头字段Content-Encoding是gzip(GNU zip)内容编码方式,内容编码是指不丢失实体信息的前提下所进行的压缩。.
Node.js 代码如下:
// 内置https模块,提供了https服务器和客户端功能var https=require("https"); var zlib = require('zlib'); // cheerio模块,提供了类似jQuery的功能var cheerio = require("cheerio"); // 内置文件处理模块var fs=require('fs'); // 请求参数JSONvar options; // request请求var req; //-------------------------------------- // 程序入口 Accept-Encoding:gzip, deflate, br //--------------------------------------function start(){ // 初始化options options={ hostname:'www.meitulu.com', port:443, path:'/item/40.html',// 子路径 method:'GET', agent:false, gzip: true, }; req=https.request(options,function(resp){ var html = []; resp.on("data", function(data) { html.push(data); }) resp.on("end", function() { var buffer = Buffer.concat(html); zlib.gunzip(buffer, function(err, decoded) { console.log(decoded.toString());// gzip解压后的html文本 }) }).on("error", function() { console.log("获取失败") }) }); // 超时处理 req.setTimeout(5000,function(){ req.abort(); }); // 出错处理 req.on('error',function(err){ if(err.code=="ECONNRESET"){ console.log('socket端口连接超时。'); }else{ console.log('请求发生错误,err.code:'+err.code); } }); // 请求结束 req.end(); } // 调用start函数,程序开始 start();
以上就是Node.js 开发实战 解析gzip网页的内容,想学习更多有关Node.js的内容,欢迎来职坐标Node.js频道!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号