GB2312和GBK网页到UTF-8的转码方法
日期:2017-06-16
gb2312转gbk很好办,只要把网页中gb2312的位置换gbk很平滑就转过去了。
但GB2312和GBK网页到UTF-8就复杂多了。
核心问题是要明确一定,gb2312 gbk格式的文件跟utf-8格式文件不是一种文件,不能直接依靠改内容里的charset=gb2312转化。改成charset=utf-8只代表网页用ie解析时会按utf-8来解析,但网页中原来的中文内容仍然是gb2312编码没变。
1.所以首先,网页内容里gb2312源码文字到utf-8的替换
如果用Dreamweaver的替换功能,注意DW“首选参数”里编码的默认方式一定要保持gb2312不变。DW替换功能会在替换后按默认编码方式存盘,如果你默认方式改utf-8了,以前的gb2312的汉字会变成乱码并存盘,不可逆,损失大。
所以在换网页charset内容时,一定按原编码方式为默认的编码方式换,转完在DW里汉字会是乱码,但不用担心,用txt编辑器打开还是原始汉字,只是在DW里显示不正确而已。
2.然后打开EditPlus里把所有网页打开,然后文档--文件编码--文件多重编码方式,打开选中其中所有文件,确定,更改成utf-8编码。全部保存,大功告成。
这样做不仅让文件的本质由gb2312转为了utf-8,还将原来的汉字内容转成utf-8对应的汉字内容。
3.这个时候文件从骨子里实现了汉字从gb2312到utf-8的转化。