搜索
编程论坛
→
WEB开发
→
『 JavaScript论坛 』
→ 如何抓取网页
标题:
如何抓取网页
只看楼主
zzjking
等 级:
新手上路
帖 子:69
专家分:0
注 册:2007-7-16
楼主
问题点数:0 回复次数:4
如何抓取网页
使用
javascript
抓取
[url=http://news.]
http://news.
[/url]
页面中右边的今日热闻简述。
目的:熟练掌握
HTML
标签结构,和
javascript
的对象概念。
要求:新闻页面部下载到本地进行抓取。
求助啊~谢谢了~
搜索更多相关主题的帖子:
网页
font
2007-11-27 16:25
lmhllr
等 级:
贵宾
威 望:
44
帖 子:1504
专家分:42
注 册:2005-5-12
第
2
楼
得分:0
作业?
2007-11-27 16:57
zzjking
等 级:
新手上路
帖 子:69
专家分:0
注 册:2007-7-16
第
3
楼
得分:0
求助啊~不是作业~是个练习~没思路给点提示也好
2007-11-28 08:48
wakmp
等 级:
新手上路
帖 子:1
专家分:0
注 册:2007-11-29
第
4
楼
得分:0
javascript 抓不了 得用 asp / php / jsp 这些来抓
2007-11-29 14:40
渚薰
等 级:
贵宾
威 望:
22
帖 子:1132
专家分:0
注 册:2006-8-6
第
5
楼
得分:0
用asp的DOMDocument对象
即dom=Server.createObject("Msxml2.DOMDocument");
具体对象的方法请baidu下
如果是java,就用HttpClient包,请到apache官网上搜索下
整体思路就是,通过服务器获取远端资源(完整的HTML代码),然后解析HTML代码
asp下,解析HTML代码没有现成的程序,或者你自己网上搜索下
可以利用正则表达式,或者把获取的HTML代码,通过js来的DOM来解析
在java下,有现成的HtmlParse可用
个人ajax技术专题站:
" target="_blank">http://www.
我不会闲你烦,只会闲你不够烦!
2007-11-30 09:55
5
1/1页
1
参与讨论请移步原网站贴子:
https://bbs.bccn.net/thread-188760-1-1.html
关于我们
|
广告合作
|
编程中国
|
清除Cookies
|
TOP
|
手机版
编程中国
版权所有,并保留所有权利。
Powered by
Discuz
, Processed in 1.537137 second(s), 7 queries.
Copyright©2004-2025, BCCN.NET, All Rights Reserved