视频简介
课程描述
介绍火车头采集器使用、数据抓取、软件设置等
学习目的
学会火车头采集器的使用,让您通过火车头采集器快速获取到您想要的数据。帮助您提高工作效率,节约成本。
课程中用到的ppt已经上传到资料下载,需要的朋友可以下载使用。
视频播放的时候可以调节视频的清晰度到高清,这样视频可以清晰的播放。
适用人群
网站编辑人员、站长、做数据分析的人。交流QQ群917941968。
- 章节1: 火车头数据采集平台简介 章节介绍:火车头数据采集平台简介
- 课时1-1:火车头采集器的安装和功能简介218分钟
- 课时1-2:火车头采集器的相关术语560分钟
- 课时1-3:火车头采集器的学习建议283分钟
- 章节2: 采集网址规则 章节介绍:采集网址规则
- 课时2-1:如何添加需要采集的单条网址301分钟
- 课时2-2:如何添加批量和多页网址296分钟
- 课时2-3:如何导入txt网址到开始采集地址210分钟
- 课时2-4:如何获取Rss地址中的网址作为起始网址211分钟
- 课时2-5:如何自定义一些网址的格式来采集新的数据292分钟
- 课时2-6:多级网址采集规则之从页面自动分析得到地址链接181分钟
- 课时2-7:多级网址采集规则之手动填写链接地址规则260分钟
- 课时2-8:多级网址采集规则之使用Xpath方式获取网址185分钟
- 课时2-9:如何判断Http请求方式?是get还是post?229分钟
- 课时2-10:多级网址采集规则之列表分页获取的方式227分钟
- 课时2-11:多级网址采集规则之附加参数是什么意思?255分钟
- 章节3: 采集内容规则 章节介绍:采集内容规则
- 课时3-1:提取数据方式有哪些520分钟
- 课时3-2:数据处理之内容替换265分钟
- 课时3-3:数据处理之Html标签过滤如何使用215分钟
- 课时3-4:数据处理之字符截取167分钟
- 课时3-5:数据处理之纯正则替换如何使用418分钟
- 课时3-6:数据处理之数据转换362分钟
- 课时3-7:数据处理之自动摘要150分钟
- 课时3-8:数据处理之自动分词225分钟
- 课时3-9:数据处理之字符编码和解码255分钟
- 课时3-10:数据处理之同义词替换375分钟
- 课时3-11:数据处理之提取文章中的第一张图片164分钟
- 课时3-12:数据处理之空内容缺省值136分钟
- 课时3-13:数据处理之内容前后缀103分钟
- 课时3-14:数据处理之随机插入183分钟
- 课时3-15:数据处理之OCR图片识别319分钟
- 课时3-16:数据处理之对单网址进行补全71分钟
- 课时3-17:数据处理之文件下载的设置方法130分钟
- 课时3-18:数据处理之内容过滤相关设置104分钟
- 课时3-19:自定义固定格式的数据124分钟
- 课时3-20:如何循环采集一些数据221分钟
- 课时3-21:如何采集网址中的数据90分钟
- 章节4: 发布内容设置 章节介绍:发布内容设置
- 课时4-1:Web在线发布到网址的设置方式199分钟
- 课时4-2:将采集到的数据保存为本地TXT文件形式552分钟
- 课时4-3:将采集到的数据保存为本地Word文件形式346分钟
- 课时4-4:将采集到的数据保存为本地Excel文件形式121分钟
- 课时4-5:将采集到的数据保存为本地Html文件形式267分钟
- 课时4-6:将采集到的数据保存为本地Csv文件形式176分钟
- 课时4-7:将采集到的数据导入到自定义数据库237分钟
- 课时4-8:发布数据完成之后可以对数据进行哪些操作157分钟
- 课时4-9:如何控制每次发布的数据的条数79分钟
- 章节5: 文件保存及部分高级设置 章节介绍:文件保存及部分高级设置
- 课时5-1:任务运行时线程设置的讲解165分钟
- 课时5-2:文件下载设置的相关注意事项192分钟
- 课时5-3:FTP同步文件上传如何设置102分钟
- 课时5-4:如何给采集到的图片加上水印204分钟
- 章节6: 后续中级教程解说 章节介绍:后续中级教程解说,可以看中级教程
这个课程中还没有任何笔记,马上记录你的学习体会
下载区
采集器里面可以设置采集内容的分页。