道招
nodejs爬虫superagent爬取gb2312编码网页中文乱码
今天爬取某个古老的网站的数据,发现中文乱码。 这个网站从外观上看也够古老的,是偏政企类网页,这种项目一般也都是外包出去的,技术更新速度也是可想而知,里面竟然还是写死的gb2312,还有三层table嵌套。 在网上搜了下,有的不少文章说的可能方法是过时,反正我实测没效果。 在npm上搜了下 superagent ,发现官方就提到了一个charset插件 superagent-c
关注道招网公众帐号
友情链接
消息推送
道招网关注互联网,分享IT资讯,前沿科技、编程技术,是否允许文章更新后推送通知消息。
允许
不用了