我的爬虫学习之旅 (八) 爬虫实战之京东商品评论爬取

前言:

本次针对待爬取数据是由动态网页技术加载出的情形进行分析,在之前的实战案例中,爬取的数据内容都是随着URL变化来实现页面的跳转,而动态加载的形式使得我们原本可以在页面上看到的内容却在源码中找不到。这时,就需要使用另一种分析页面的方式进行爬虫的编写。


 

 

实战案例:爬取京东商品的用户评论

首先打开京东,进入某一指定商品页面,本次选择华为P30的商品信息页面

链接地址:https://item.jd.com/100004404920.html#comment

下拉页面,找到评论信息:

可以看到在这条商品页面中有很多信息元素,于是右键选择查看网页源码,试图寻找用户的评论信息。 

然而,在源码信息中,并未找到与评论相关的标签,所以得出结论:评论是由动态页面加载出来的!

依旧进入开发者模式,选择Network,查看加载的全部内容,寻找评论的加载页面。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值