学会掌握:学会火车头采集器的使用,让您通过火车头采集器快速获取到您想要的数据。帮助您提高工作效率,节约成本。 课程中用到的ppt已经上传到资料下载,需要的朋友可以下载使用。 视频播放的时候可以调节视频的清晰度到..
适合人群:网站编辑人员、站长、做数据分析的人。交流QQ群917941968。
- 第1章: 火车头数据采集平台简介
- 1.1:火车头采集器的安装和功能简介
- 1.2:火车头采集器的相关术语
- 1.3:火车头采集器的学习建议
- 第2章: 采集网址规则
- 2.1:如何添加需要采集的单条网址
- 2.2:如何添加批量和多页网址
- 2.3:如何导入txt网址到开始采集地址
- 2.4:如何获取Rss地址中的网址作为起始网址
- 2.5:如何自定义一些网址的格式来采集新的数据
- 2.6:多级网址采集规则之从页面自动分析得到地址链接
- 2.7:多级网址采集规则之手动填写链接地址规则
- 2.8:多级网址采集规则之使用Xpath方式获取网址
- 2.9:如何判断Http请求方式?是get还是post?
- 2.10:多级网址采集规则之列表分页获取的方式
- 2.11:多级网址采集规则之附加参数是什么意思?
- 第3章: 采集内容规则
- 3.1:提取数据方式有哪些
- 3.2:数据处理之内容替换
- 3.3:数据处理之Html标签过滤如何使用
- 3.4:数据处理之字符截取
- 3.5:数据处理之纯正则替换如何使用
- 3.6:数据处理之数据转换
- 3.7:数据处理之自动摘要
- 3.8:数据处理之自动分词
- 3.9:数据处理之字符编码和解码
- 3.10:数据处理之同义词替换
- 3.11:数据处理之提取文章中的第一张图片
- 3.12:数据处理之空内容缺省值
- 3.13:数据处理之内容前后缀
- 3.14:数据处理之随机插入
- 3.15:数据处理之OCR图片识别
- 3.16:数据处理之对单网址进行补全
- 3.17:数据处理之文件下载的设置方法
- 3.18:数据处理之内容过滤相关设置
- 3.19:自定义固定格式的数据
- 3.20:如何循环采集一些数据
- 3.21:如何采集网址中的数据
- 第4章: 发布内容设置
- 4.1:Web在线发布到网址的设置方式
- 4.2:将采集到的数据保存为本地TXT文件形式
- 4.3:将采集到的数据保存为本地Word文件形式
- 4.4:将采集到的数据保存为本地Excel文件形式
- 4.5:将采集到的数据保存为本地Html文件形式
- 4.6:将采集到的数据保存为本地Csv文件形式
- 4.7:将采集到的数据导入到自定义数据库
- 4.8:发布数据完成之后可以对数据进行哪些操作
- 4.9:如何控制每次发布的数据的条数
- 第5章: 文件保存及部分高级设置
- 5.1:任务运行时线程设置的讲解
- 5.2:文件下载设置的相关注意事项
- 5.3:FTP同步文件上传如何设置
- 5.4:如何给采集到的图片加上水印
- 第6章: 后续中级教程解说
该讲师的其它课程
讲师介绍
学员提问
-
欲说还休2022-10-11
-
道可到2021-05-31
-
杨龙2021-05-06
-
大海2020-11-17
-
小蘑菇2020-09-27
-
小蘑菇2020-09-27
-
李小勇2020-09-26
-
张新2020-08-21