四虎精品视频-四虎精品成人免费网站-四虎黄色网-四虎国产视频-国产免费91-国产蜜臀97一区二区三区

Java 獲取URL的內容

Java獲取URL內容的,我這里只給出GET方式的,POST和其它方式的都是比較類似的。其技術要點就一下三點。
第一:創建HttpURLConnection
第二:打開URL,創建一個InputStream
第三:逐行(逐字節)讀取,如果需要,轉換編碼,放入字符串。
好,一下就開始代碼吧:
復制代碼 代碼如下:
public String getUrlContent(String path){
String rtn = "";
int c;
try{
Java.NET.URL l_url = new Java.NET.URL(path);
Java.NET.HttpURLConnection l_connection = (Java.NET.HttpURLConnection) l_url.openConnection();
l_connection.setRequestProperty("User-agent","Mozilla/4.0");
l_connection.connect();
InputStream l_urlStream = l_connection.getInputStream();
while (( ( c= l_urlStream.read() )!=-1)){
int all=l_urlStream.available();
byte[] b =new byte[all];
l_urlStream.read(b);
rtn+= new String(b, "UTF-8");
}
//Thread.sleep(2000);
l_urlStream.close();
}catch(Exception e){
e.printStackTrace();
}
return rtn;
}

其中
l_connection.setRequestProperty("User-agent","Mozilla/4.0");
這句是必須的,很多服務器對于沒有User-agent頭的請求直接403了就。
然后采用InputStream.available()來一次性讀取,返回此輸入流方法的下一個調用方可以不受阻塞地從此輸入流讀取(或跳過)的字節數,如果需要的話,可以在后面稍微Sleep一下線程:
Thread.sleep(2000);
其中的
復制代碼 代碼如下:
while (( ( c= l_urlStream.read() )!=-1)){
int all=l_urlStream.available();
byte[] b =new byte[all];
l_urlStream.read(b);
rtn+= new String(b, "UTF-8");
}

是個很重要的讀取過程,c表示讀取流的標注,當結束的時候是-1,然后all是本次循環可用的最大字節數目,然后讀取全部可用字節到byte[] b中,然后轉換成UTF-8類型的字符串,注意,這里可以自己寫方式,如果讀取GB2312,就要寫GB2312,至于有沒有萬能的,可以獲取Meta,匹配下。自己想辦法吧。

jsp技術Java 獲取URL的內容,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 陈若| 3片| 完美的邻居| 碳水是指哪些食物| 郑有杰| 天下第一楼剧情介绍| 四级词汇电子版| 法医秦明之幸存者 2018 经超| 包公决战潘金莲在线观看| 感冒难受的图片| 电影暖| 爱欲告白| 花有重开日电影| 孩子身高不达标| 王牌空战| 小强升职记| 王宝强最新电影叫什么| 张达| 莫比乌斯电影在线观看全集高清| 生理卫生课程| 好看电影视频| 星星的你| 日本大片ppt免费ppt| 美女网站在线观看| 熊出没在线播放| 西游记续集唐僧扮演者| 《水中花》日本电影| 做菜视频| 肢体的诱惑| 六级词汇电子版| 视频999| 许颖| 八年级上册英语课文| 张国立电影作品大全| jixxzz| 申请采购的请示范文| 浙江省全省地图| 鬼迷心窍1994| 电影《瞬间》| 宋景诗| 伸舌头接吻脱裤子|