ff提供了overrid " /> 黄色理论片,99久久久久久久,91香蕉

四虎精品视频-四虎精品成人免费网站-四虎黄色网-四虎国产视频-国产免费91-国产蜜臀97一区二区三区

解決遠程頁面抓取中的亂碼問題?

由于平時使用的網頁文件基本上都是gb2312編碼方式,如果通過xmlhttp控件讀取的話,肯定會出現亂碼問題,但是要把所有文件都改成utf-8編碼,操作上比較麻煩。經過反復比較,我找到了相對實用的解決方法。

  ff提供了overrideMimeType方法,可以指定返回值的編碼,所以解決起來比較簡單,只要把這個方法指向gb2312就可以了。對于IE,可以用vbs配合來作編碼轉換,用gb2utf8來轉換接收到的二進制數據,其中利用到execScript方法來調用vbs的函數。

[Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]
ie下的轉碼可以改進,通過正則的回調過程能提高不少效率  

復制代碼 代碼如下:
this.bs2str = function(bs){  
    if(!window.jsMidB) main.vbInit("MidB", 2);  
    if(!window.jsChr) main.vbInit("Chr", 1);  
    if(!bs2str.ss) bs2str.ss = [];  
    return unescape(escape(jsMidB(bs,1)).replace(/(.{2})(.{2})(.{2})/g, "%$3%$2").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!bs2str.ss[s]) bs2str.ss[s]=jsChr(eval("0x"+s));return bs2str.ss[s];}));  
    } 

不過我還是認為載入數據用xmldom要好一些 
replace(/(.{2})(.{2})(.{2})/g, "%$3%$2") 改成 replace(/.{2}(.{2})(.{2})/g, "%$2%$1") 少一個存儲.比原來的快3倍以上. 
把eval去掉,效率還能提高一些 
復制代碼 代碼如下:
    // byte() encoding 
    this.bs2str = function(bs){ 
        if(!window.jsMidB) main.vbInit("MidB", 2); 
        if(!window.jsChr) main.vbInit("Chr", 1); 
        if(!this.bs2str.ss) this.bs2str.ss = []; 
        return unescape(escape(jsMidB(bs,1)).replace(/.{2}(.{2})(.{2})/g, "%$2%$1").replace(/%([^0-7].)(.)(.{2})/g, function(a,a1,a2,a3){var s=a1+a3;if(!This.bs2str.ss[s]) This.bs2str.ss[s]=jsChr("&H"+s);return This.bs2str.ss[s];})); 
    }  

JavaScript技術解決遠程頁面抓取中的亂碼問題?,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 电视剧零下三十八度演员表| 无内裤全透明柔术视频| 都市频道节目表| 屈原话剧| 女生被艹网站| 最新作文素材| 大尺度激情戏视频| 张梓琳个人简历| 桂林山水甲天下是几年级的课文| silk铃木一彻| 电影院电影| 亚新| 古宅老友记第四季| 花落花开电影| 九九九九九九伊人| creepshow| 1998年槟榔西施| 吻戏韩国电影| 姜洋| 非常外父| 电影《uhaw》完整版在线观看| 拔萝卜电影| 艳妇乳肉豪妇荡乳xxx| 挖掘机儿童动画片| 狐狸的夏天第二季 2017 谭松韵| 小镇追凶电影免费观看| 张静初的三级未删减版| 茶啊二中王强| 汤唯和梁朝伟拍戏原版视频在线观看| 爱情插班生| 电影喜剧明星演员表| 试衣间电影| 二年级第一单元测试卷数学| 内蒙古电视台| 西海情歌歌词全文| 七寸照片| 程慕轩| 乱世伦情 电影| 火辣身材| 礼记二则原文和译文| angelina全集在线观看|