四虎精品视频-四虎精品成人免费网站-四虎黄色网-四虎国产视频-国产免费91-国产蜜臀97一区二区三区

基于PHP的簡單采集數(shù)據(jù)入庫程序

說到采集,無非就是遠程獲取信息->提取所需內(nèi)容->分類存儲->讀取->展示

也算是簡單"小偷程序"的加強版吧

下面是對應核心代碼(別拿去做壞事哦^_^)

所要采集的內(nèi)容是某游戲網(wǎng)站上的公告,如下圖:

可先利用file_get_contents和簡單正則獲取基本頁面信息

整理下基本信息,采集入庫:

<?php  include_once("conn.php");   if($_GET['id']<=8&&$_GET['id']){     $id=$_GET['id'];    $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//獲取頁面內(nèi)容    $pattern="/<li><a title=/"(.*)/" target=/"_blank/" href=/"(.*)/">/iUs";//正則  preg_match_all($pattern, $conn, $arr);//匹配內(nèi)容到arr數(shù)組  //print_r($arr);die;    foreach ($arr[1] as $key => $value) {//二維數(shù)組[2]對應id和[1]剛好一樣,利用起key    $url="http://www.93moli.com/".$arr[2][$key];    $sql="insert into list(title,url) value ('$value', '$url')";    mysql_query($sql);    //echo "<a href='content.php?url=http://www.93moli.com/$url'>$value</a>"."<br/>";    }   $id++;   echo "正在采集URL數(shù)據(jù)列表$id...請稍后...";   echo "<script>window.location='list.php?id=$id'</script>"; }else{   echo "采集數(shù)據(jù)結束。"; }?>

conn.php是數(shù)據(jù)庫連接文件

list.php是本頁面

由于要采集的數(shù)據(jù)是分頁顯示的,且頁面地址是規(guī)律遞增,所以我用了js跳轉代碼,利用id傳值控制采集的頁數(shù),也避免了for循環(huán)數(shù)目過大。

輕輕松松數(shù)據(jù)入庫,下篇文章寫關于具體url采集信息的過程。

php技術基于PHP的簡單采集數(shù)據(jù)入庫程序,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 黄视频在线网站| 12月日历2024日历表| 团结就是力量歌词完整| 《棋魂》电视剧| 黄网站免费在线观看| 低糖食物一览表| 挤鼻子黑头超多视频| 山巅之城| 电商运营计划| 邵雨琪| 羽球人头像| freexxxmovies| 蜡笔小新日语| 演员刘洋| 电影网1905免费版| 无限资源日本好片| 人世间演员表| 历史试卷反思| 徐若| 永不瞑目演员表| 台版十七岁免费观看| 大侠霍元甲演员表| 借条怎么样才有法律效力| 忍石| 世界轮廓图| 寡妇激情毛片免费视频| 流浪地球海报| 血色残阳剧情简介| 视频xxxx| 漂亮主妇| 丛林总动员| 林忆莲唱哭李宗盛现场| 廖凡演的电影| 新亮剑40集免费观看完整版高清| 毕业论文3000字范文| 免费取姓名| 浙江卫视节目表电视猫| 第五单元初试身手| 伊人春色在线观看视频| 李子京| 陈宝莲徐锦江夜半2普通话|