gb2312 – 道招 | 关注互联网|聚焦Web

2022-08-28

吐槽

匆匆那年

今天爬取某个古老的网站的数据，发现中文乱码。这个网站从外观上看也够古老的，是偏政企类网页，这种项目一般也都是外包出去的，技术更新速度也是可想而知，里面竟然还是写死的gb2312，还有三层table嵌套。在网上搜了下，有的不少文章说的可能方法是过时，反正我实测没效果。在npm上搜了下 superagent ，发现官方就提到了一个charset插件 superagent-c

2011-07-23

管理员

用ASP实现UTF8、GB2312、二进制、十进制代码、十六进制编码转换

UTF转GB---将UTF8编码文字转换为GB编码文字 function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) '如果UTF8编码文字以%开头则进行转换 if mid(UTFStr,Dig,1)="%" then 'UTF8编码文字大于8则转换为汉字 if len(UTFStr) >= Dig+8 then GBStr=GBS

2011-07-22

Devops

管理员

ASCII码、GB2312、Big5、UTF-8、unicode编码转换知识

1. ASCII码我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。每一个二进制位（bit）有0和1两种状态，因此八个二进制位就可以组合出 256种状态，这被称为一个字节（byte）。也就是说，一个字节一共可以用来表示256种不同的状态，每一个状态对应一个符号，就是256个符号，从 0000000到11111111。上个世纪60年代，美国制定了一套字符编码，对英

友情链接