标题:如何抓取网页
只看楼主
zzjking
Rank: 1
等 级:新手上路
帖 子:69
专家分:0
注 册:2007-7-16
 问题点数:0 回复次数:4 
如何抓取网页

使用javascript抓取[url=http://news.]http://news.[/url]页面中右边的今日热闻简述。
目的:熟练掌握HTML标签结构,和javascript的对象概念。
要求:新闻页面部下载到本地进行抓取。

 
求助啊~谢谢了~
搜索更多相关主题的帖子: 网页 font 
2007-11-27 16:25
lmhllr
Rank: 8Rank: 8
等 级:贵宾
威 望:44
帖 子:1504
专家分:42
注 册:2005-5-12
得分:0 
作业?
2007-11-27 16:57
zzjking
Rank: 1
等 级:新手上路
帖 子:69
专家分:0
注 册:2007-7-16
得分:0 
求助啊~不是作业~是个练习~没思路给点提示也好

2007-11-28 08:48
wakmp
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2007-11-29
得分:0 
javascript 抓不了   得用 asp / php / jsp  这些来抓
2007-11-29 14:40
渚薰
Rank: 6Rank: 6
等 级:贵宾
威 望:22
帖 子:1132
专家分:0
注 册:2006-8-6
得分:0 
用asp的DOMDocument对象
即dom=Server.createObject("Msxml2.DOMDocument");
具体对象的方法请baidu下

如果是java,就用HttpClient包,请到apache官网上搜索下

整体思路就是,通过服务器获取远端资源(完整的HTML代码),然后解析HTML代码
asp下,解析HTML代码没有现成的程序,或者你自己网上搜索下
可以利用正则表达式,或者把获取的HTML代码,通过js来的DOM来解析

在java下,有现成的HtmlParse可用

个人ajax技术专题站: " target="_blank">http://www. 我不会闲你烦,只会闲你不够烦!
2007-11-30 09:55



参与讨论请移步原网站贴子:https://bbs.bccn.net/thread-188760-1-1.html




关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 1.537137 second(s), 7 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved