目標地址:1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html2、http://www. " /> 国产精品手机在线观看,国产精品视频在线观看免费,精品一区二区免费

四虎精品视频-四虎精品成人免费网站-四虎黄色网-四虎国产视频-国产免费91-国产蜜臀97一区二区三区

dede3.1分頁文字采集過濾規則詳說(圖文教程)續二

稍微了解dede采集規則的朋友上篇內容完全可以略過,下面看看如何以靜制動、以不變就萬變地解決分頁采集問題。
二、采集新目標

目標地址:
1、http://www.tiansou.NET/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.NET/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以選取兩個目標頁面,是因為以上的兩個頁面一個有分頁,而另一個沒有,并且在分頁和全文取樣部分有較大的差別。以下的說明是在為采集目標地址(首頁)全部鏈接的基礎上改動的,個別地方會顯得蛇足,只為說明的方便。

目標文字部分頭部代碼1:


目標文字部分頭部代碼2:



通過比較不難發現,兩個文字部分的開始采集部分能確定下來為描黑部分,開頭部分好說,代碼如下:
復制代碼 代碼如下:
              <TR>
                <TD height="8"></TD>
              </TR>
              <TR>
                <TD valign="top" class=ConNET><p>

目標文尾及分頁區域代碼1:



目標文尾及分頁區域代碼2:



比較一下兩個結尾,盡管想把第一個的結尾再往前提一點,但沒法子,要考慮到全部鏈接的共同部分,就只好取描黑的部分了,這也給今后確定過濾規則添了點麻煩,這是后話。先把結尾部分確定了吧:
復制代碼 代碼如下:
</p>
                  </TD>
              </TR>

php技術dede3.1分頁文字采集過濾規則詳說(圖文教程)續二,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 电影后妈| 裸体广场舞| 美女游泳| 招聘女服务员2| 首映式| 郭碧婷个人简历资料| 妖精的尾巴第三季| 尤勇智的个人资料简介| 雪暴 电影| 田中敦子| 爱秀直播| 我们的祖国是花园简谱| 西门庆潘金莲电影| 追凶电影| 金奎丽| 大红枣儿甜又香简谱| 安德鲁·林肯| k总直播间| cetv3中国教育电视台直播| mind and hand| 第一次美国电影| 大甜甜| 南来北往连续剧免费观看完整版| 溜冰圆舞曲音乐教案| av电影网| 赫伯曼电影免费观看| 挠中国美女丝袜脚心| 美女自尉视频| 蓝心妍的电影《极乐宝鉴》免费国语| 男保姆| 男女拍拍拍拍拍拍| 七寸照片| 吴雪雯| 齐中旸| 聊斋之千年灵狐3姐妹完整版免费观看| 四 电影| 自拍电影网| 谭天| 普庵咒全文注音版| 美式壁纸| 陶飞霏|