
Java网络爬虫
Yes_JiangShuai
默默奋斗的攻城狮 向往掌握技术而不限于技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫中使用的数据结构
我选择HashSet和LinkedList来保存待访问URL和已访问的URL。 package com.js.demo01; /** * 队列用于保存待爬取的URL */ import java.util.LinkedList; public class Queue { private LinkedList queue = new LinkedList(); /** * 入队列原创 2017-06-11 11:10:59 · 1448 阅读 · 0 评论 -
利用Java实现搜索引擎爬虫技术
利用Java实现搜索引擎爬虫技术,此处实现一个简单的小功能,输入一个url,把该页面的图片批量抓取到本地。 package com.js.util; import java.io.BufferedReader; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import jav原创 2017-06-11 10:11:06 · 4665 阅读 · 2 评论