道招
nodejs爬虫superagent爬取gb2312编码网页中文乱码
今天爬取某个古老的网站的数据,发现中文乱码。 这个网站从外观上看也够古老的,是偏政企类网页,这种项目一般也都是外包出去的,技术更新速度也是可想而知,里面竟然还是写死的gb2312,还有三层table嵌套。 在网上搜了下,有的不少文章说的可能方法是过时,反正我实测没效果。 在npm上搜了下 superagent ,发现官方就提到了一个charset插件 superagent-c
关注道招网公众帐号
联系博主