四虎精品视频-四虎精品成人免费网站-四虎黄色网-四虎国产视频-国产免费91-国产蜜臀97一区二区三区

PHP多線程抓取網頁實現代碼

受限于php語言本身不支持多線程,所以開發爬蟲程序效率并不高,這時候往往需 要借助Curl Multi Functions 它可以實現并發多線程的訪問多個url地址。既然 Curl Multi Function如此強大,能否用 Curl Multi Functions 來寫并發多線程下載文件呢,當然可以,下面給出我的代碼:

代碼1:將獲得的代碼直接寫入某個文件
復制代碼 代碼如下:
<?php
$urls = array(
'http://www.sina.com.cn/',
'http://www.sohu.com/',
'http://www.163.com/'
); // 設置要抓取的頁面URL

$save_to='/test.txt'; // 把抓取的代碼寫入該文件

$st = fopen($save_to,"a");
$mh = curl_multi_init();

foreach ($urls as $i => $url) {
$conn[$i] = curl_init($url);
curl_setopt($conn[$i], CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)");
curl_setopt($conn[$i], CURLOPT_HEADER ,0);
curl_setopt($conn[$i], CURLOPT_CONNECTTIMEOUT,60);
curl_setopt($conn[$i], CURLOPT_FILE,$st); // 設置將爬取的代碼寫入文件
curl_multi_add_handle ($mh,$conn[$i]);
} // 初始化

do {
curl_multi_exec($mh,$active);
} while ($active); // 執行

foreach ($urls as $i => $url) {
curl_multi_remove_handle($mh,$conn[$i]);
curl_close($conn[$i]);
} // 結束清理

curl_multi_close($mh);
fclose($st);
?>

代碼2:將獲得的代碼先放入變量,再寫入某個文件
復制代碼 代碼如下:
<?php
$urls = array(
'http://www.sina.com.cn/',
'http://www.sohu.com/',
'http://www.163.com/'
);

$save_to='/test.txt'; // 把抓取的代碼寫入該文件
$st = fopen($save_to,"a");

$mh = curl_multi_init();
foreach ($urls as $i => $url) {
$conn[$i] = curl_init($url);
curl_setopt($conn[$i], CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)");
curl_setopt($conn[$i], CURLOPT_HEADER ,0);
curl_setopt($conn[$i], CURLOPT_CONNECTTIMEOUT,60);
curl_setopt($conn[$i],CURLOPT_RETURNTRANSFER,true); // 設置不將爬取代碼寫到瀏覽器,而是轉化為字符串
curl_multi_add_handle ($mh,$conn[$i]);
}

do {
curl_multi_exec($mh,$active);
} while ($active);

foreach ($urls as $i => $url) {
$data = curl_multi_getcontent($conn[$i]); // 獲得爬取的代碼字符串
fwrite($st,$data); // 將字符串寫入文件。當然,也可以不寫入文件,比如存入數據庫
} // 獲得數據變量,并寫入文件

foreach ($urls as $i => $url) {
curl_multi_remove_handle($mh,$conn[$i]);
curl_close($conn[$i]);
}

curl_multi_close($mh);
fclose($st);
?>

php技術PHP多線程抓取網頁實現代碼,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 爱情秘密| 粉嫩在线| 伴娘| 少林问道演员表| 各各他的爱的歌谱| 阮虔芷个人资料| 三年片电影| 巨乳姐妹| 寡妇高潮一级| 户田惠子| 叶子楣图片| 日韩成人av电影77777| 天津电视台体育频道节目单| 全国精神病查询系统官网| 风俗通| 性感美女喷水| 想想办法吧爸爸| 库尔斯克会战电影| 正在直播乒乓赛事| 创业史全文免费阅读| 丧尸童子军| 搜狐手机网首页新闻| 蒋芸| 7~9年级古诗词全部| 阴阳界 电影| 痛风能吃豆腐吗| 茅原实里| 邓稼先教学设计一等奖优秀教案 | 林黛玉进贾府人物形象分析 | 去分母解一元一次方程100道及答案 | 夏日福星 电影| 下截抖音| 陈浩民演的电视剧大全| 流行歌简谱| 解毒咒| 重温经典频道节目表| 唐人街探案网剧第二季| 血型父母和孩子血型表| 韩帅| 哥哥啊啊啊| 哥哥女人|