帝国论坛
→
帝国网站管理系统交流区
→
采集使用交流
→
[求助]采集回来的网址不带后缀,缺少 .html 无法采集。
【本版专题贴子】
主题:[求助]采集回来的网址不带后缀,缺少 .html 无法采集。
[加入收藏夹]
jlitao666
用户头衔:书生
精华贴 :0
发贴数 :2
经验值 :11
注册时间:2017-03-28
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
1
楼]
[求助]采集回来的网址不带后缀,缺少 .html 无法采集。
http://www.ccgp-hebei.gov.cn/zfcg/web/getBidingList_1.html
这个网页怎么采集啊!搞了半天也没有搞好,只能求大家帮忙了。
这内容页前缀写的是:
http://www.ccgp-hebei.gov.cn/zfcg/1/bidingAnncDetail_
空容连接正则如下:
<tr onclick="watchContent('[!--newsurl--]','1');">
采集回来的网址不带后缀,缺少 .html 无法采集。
请大家帮看看有什么可以加有 .html 的方法吗,或者有其它采集方法,我用的系统自带的采集,谢谢!!!!
2017-04-05 22:06:14
已设置保密
顶部
回复
引用
报告
编辑
删除
pingpong
用户头衔:探花
精华贴 :0
发贴数 :9408
经验值 :24496
注册时间:2008-11-02
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
2
楼]
网页里没实际地址?
2017-04-06 08:54:29
已设置保密
顶部
回复
引用
报告
编辑
删除
jlitao666
用户头衔:书生
精华贴 :0
发贴数 :2
经验值 :11
注册时间:2017-03-28
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
3
楼]
没有网地,里面有一个数字变量,前面加网址,后面加.html就是网扯了,前缀会加,行面的.html不会加!
2017-04-07 21:49:11
已设置保密
顶部
回复
引用
报告
编辑
删除
yunflying
用户头衔:进士
精华贴 :0
发贴数 :1856
经验值 :4591
注册时间:2008-02-28
信息
搜索
好友
发送悄悄话
【
免费开源-EBMA系统:更安全的MYSQL管理和备份系统
】 [第
4
楼]
没地址后缀设置
2017-04-15 07:54:28
已设置保密
顶部
回复
引用
报告
编辑
删除
saintjordi
用户头衔:书生
精华贴 :0
发贴数 :111
经验值 :229
注册时间:2012-11-02
信息
搜索
好友
发送悄悄话
【
精益求精-帝国网站管理系统7.5正式版开源发布
】 [第
5
楼]
这样的网页 应该是可以采集的吧
体育装备-www.verodillan.com
2019-09-19 21:04:37
已设置保密
顶部
回复
引用
报告
编辑
删除
快速回复
内容
表情
使用EBB代码
使用smile代码
显示签名
自动分析url
自动分析img
【
进入高级模式
】
(按 Ctrl+Enter 直接提交)
顶部
加入收藏夹
关于帝国
|
广告服务
|
联系我们
|
法律声明
|
隐私条款
|
许可协议
Powered by:
EBB
Version 2.2.1