帝国论坛帝国网站管理系统交流区采集使用交流[求助]采集回来的网址不带后缀,缺少 .html 无法采集。 【本版专题贴子】  
主题:[求助]采集回来的网址不带后缀,缺少 .html 无法采集。 [加入收藏夹]   

jlitao666
用户头衔:书生

精华贴   :0
发贴数   :2
经验值   :11
注册时间:2017-03-28
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 1 楼]
[求助]采集回来的网址不带后缀,缺少 .html 无法采集。
http://www.ccgp-hebei.gov.cn/zfcg/web/getBidingList_1.html
这个网页怎么采集啊!搞了半天也没有搞好,只能求大家帮忙了。
这内容页前缀写的是:http://www.ccgp-hebei.gov.cn/zfcg/1/bidingAnncDetail_
空容连接正则如下:
                                                                        <tr onclick="watchContent('[!--newsurl--]','1');">
采集回来的网址不带后缀,缺少  .html   无法采集。
请大家帮看看有什么可以加有 .html 的方法吗,或者有其它采集方法,我用的系统自带的采集,谢谢!!!!




2017-04-05 22:06:14 已设置保密 顶部 回复 引用 报告 编辑 删除

pingpong
用户头衔:探花

精华贴   :0
发贴数   :9408
经验值   :24496
注册时间:2008-11-02
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 2 楼]

网页里没实际地址?




2017-04-06 08:54:29 已设置保密 顶部 回复 引用 报告 编辑 删除

jlitao666
用户头衔:书生

精华贴   :0
发贴数   :2
经验值   :11
注册时间:2017-03-28
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 3 楼]

没有网地,里面有一个数字变量,前面加网址,后面加.html就是网扯了,前缀会加,行面的.html不会加!




2017-04-07 21:49:11 已设置保密 顶部 回复 引用 报告 编辑 删除

yunflying
用户头衔:进士

精华贴   :0
发贴数   :1856
经验值   :4591
注册时间:2008-02-28
信息 搜索 好友 发送悄悄话 免费开源-EBMA系统:更安全的MYSQL管理和备份系统】   [第 4 楼]

没地址后缀设置




2017-04-15 07:54:28 已设置保密 顶部 回复 引用 报告 编辑 删除

saintjordi
用户头衔:书生

精华贴   :0
发贴数   :111
经验值   :229
注册时间:2012-11-02
信息 搜索 好友 发送悄悄话 精益求精-帝国网站管理系统7.5正式版开源发布】   [第 5 楼]

这样的网页 应该是可以采集的吧



体育装备-www.verodillan.com
2019-09-19 21:04:37 已设置保密 顶部 回复 引用 报告 编辑 删除

快速回复
内容

表情
使用EBB代码 使用smile代码 显示签名 自动分析url 自动分析img
     【进入高级模式】   (按 Ctrl+Enter 直接提交)
    顶部  加入收藏夹
关于帝国 | 广告服务 | 联系我们 | 法律声明 | 隐私条款 | 许可协议
Powered by: EBB Version 2.2.1