讲师问题解答率: 99% 我有问题要提问
21楼 牧海人 在 课时 通过采集器采集美女图片站合成html单页面 中发表提问
20楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
19楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
18楼 富贵如云 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
17楼 小江. 在 课程 火车头采集器技术控使用手册(高级) 中发表提问 - 我是东莞-小江,是88期搜外学员。
16楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
15楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
14楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
13楼 liuzhenwei 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
https://www.lagou.com/jobs/positionAjax.json?city=%E5%B9%BF%E5%B7%9E&needAddtionalResult=false&isSchoolJob=0
这个URL中,使用浏览器访问显示的是:
{"success":false,"msg":"您操作太频繁,请稍后再访问","clientIp":"119.145.89.*"}
使用火车头也无法访问,换了代理ip之后仍然无法访问,网上看到的解决方案是需要带上header信息,请问火车头上要怎样处理?使用的是7.6版本
12楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
11楼 像教授 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
10楼 小钢炮 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
9楼 guowano1 在 课时 利用fiddler软件分析post页面并获取列表网址的方法详解 中发表提问
8楼 鱼是海的眼泪 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
7楼 小钢炮 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
采集分页:
http://www.360kan.com/cover/switchsite?site=sohu&id=QLRsaH7kTGDqMX&category=2
http://www.360kan.com/cover/switchsite?site=huashu&id=QLRsaH7kTGDqMX&category=2
http://www.360kan.com/cover/switchsite?site=youku&id=QLRsaH7kTGDqMX&category=2
http://www.360kan.com/cover/switchsite?site=qq&id=QLRsaH7kTGDqMX&category=2
http://www.360kan.com/cover/switchsite?site=PPTV&id=QLRsaH7kTGDqMX&category=2
http://www.360kan.com/cover/switchsite?site=fengxing&id=QLRsaH7kTGDqMX&category=2
规律如下:
http://www.360kan.com/cover/switchsite?site=【网站源】&id=【同网址后的地址】&category=2
需要把这几个页全采下来。
问下这个分页设置二个参数怎么做?
http://www.360kan.com/cover/switchsite?site=[参数2]&id=[参数1]&category=2
网站源需要循环 网址后的地址单一。
6楼 钟爱一生 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
5楼 k1287988804 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
4楼 k1287988804 在 课时 weixin-sogou-com-俄罗斯签证-微信文章采集视频教程 中发表提问
3楼 郑炉山 在 课时 腾讯滚动新闻采集规则的制作详细视频教程 中发表提问
2楼 guowano1 在 课程 火车头采集器技术控使用手册(高级) 中发表提问
讲师介绍
学员提问
-
cdcdefg2021-01-29
-
董 杰2021-01-25
-
可2021-01-16
-
雪子2021-01-16
-
雪子2021-01-13
-
魏敏伟2021-01-13
-
Cherryyang2020-11-27
-
张玉华2020-11-20
这个情况是在已经清空采集内容和网址库的情况下 还是会出现
需要检查规则是否有重复采集的地方。