(2)这一步就需要设置选择的内容了,点击select选项下的select 得到下图:

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

之后将鼠标移动到需要选择的内容上,这时候需要的内容就会变成绿色就表示选定了,这里需要提示一下,如果是所需要的内容是多元素的,就需要将元素都选择,例如下图所示,绿色就表示选择的内容在绿色范围内。

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

选择内容范围后,点击鼠标,选定的内容范围就会变成如下图的红色:

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

当一个内容变红后,我们就可以选择接下来的第二个内容,点击后,web scraper就会自动识别你所要的内容,具有相同元素的内容就都会变成红色的。如下图所示:

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

检查这个页面我们需要的内容全部变成红色之后,就可以点击 Done selecting选项了,就可以得到如下图所示:

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

点击save selector,保存设置。到这里后,一级选择器就创建完成了。

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

5、设置二级选择器:选择需要采集的元素内容。

(1)点击下图中红框内容,就进入一级选择器jiawei-scrap下:

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

(2)点击add new selector创建二级选择器,来选择具体内容。

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

得到下图,这跟一级选择器的内容是相同的,但是设置是有区别的。

不用代码10分钟就能学会微博知乎豆瓣淘宝数据采集

id:代表抓取的是哪个字段,可以取该字段的英文,比如要选「作者」,就写「writer」;

 3/4   首页 上一页 1 2 3 4 下一页 尾页

文章TAG:数据  数据采集  淘宝  
下一篇