强力 Java 爬虫,列表分页、详细页分页、ajax、微内核高扩展、配置灵活
通过一个实际的项目,来学习如何使用scrapy爬取网络上的信息。这里以豆瓣小组为例,对组内的图片进行爬取,相关信息保存数据到MongoDB,图片下载到本地。
最好的json框架,拥有最快的序列化和反序列化速度(序列化速度是fastjson的2倍,反序列化较fastjson提高13%)。拥有所有json框架都不具备的策略能力,可以在依靠不同的策略将同一个策略序列化输出两种不同的字符串。
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。