博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
网站爬取工具
阅读量:6544 次
发布时间:2019-06-24

本文共 338 字,大约阅读时间需要 1 分钟。

有时候需要将网站资源爬取到本地,文件少的情况下可以使用Chrome一个个保存。如果文件太多,则需要使用下面的辅助工具。

1.Teleport Ultra(不是Teleport Pro)

优点:爬取文件以及结构比较完整;

缺点:会修改原文件。会在js中增加tpa标签和在html中增加tppabs标签!

 

2.Offline Explorer

优点:基本不修改源文件;

缺点:文件爬取可能缺失;偶尔崩溃;

 

针对两个工具的优缺点,结合使用Teleport Ultra的网站组织结构以及图片、音效资源,同时使用Offline Explorer的js/css/html等资源;

 

以上。

转载于:https://www.cnblogs.com/chevin/p/10268804.html

你可能感兴趣的文章
2016/10/09
查看>>
自定义HorizontalScrollView的scrollBar
查看>>
c++学习笔记和思考
查看>>
27.Docker集群部署
查看>>
DNS保存
查看>>
IOS 多线程02-pthread 、 NSThread 、GCD 、NSOperationQueue、NSRunLoop
查看>>
第一周冲刺第五天博客
查看>>
[LeetCode]Longest Increasing Path in a Matrix
查看>>
C++基础之适配器
查看>>
集合set-深入学习
查看>>
C#语言学习——面向对象的几大原则
查看>>
zk 常用资料整理(转)
查看>>
JavaScript 字符串操作
查看>>
Android中asset文件夹和raw文件夹区别
查看>>
Fuel 30 分钟快速安装openstack 分类: 软件插件学习 ...
查看>>
第二章家庭作业 2.78
查看>>
Android 下拉刷新上拉载入 多种应用场景 超级大放送(上)
查看>>
Risc-V指令集
查看>>
Python进阶04 函数的参数对应
查看>>
C语言结构体的“继承”
查看>>