Teleport Ultra/Teleport Pro的冗余代码批量清理方法
Teleport Pro 是款优秀的网站离线浏览工具(即网站整站下载工具),Teleport Ultra是其增强版,但使用此系列软件下载的离线网页里会包含大量冗余代码(如tppabs),手动去修改工作量很大,下面介绍如何通过软件进行正则表达式批量替换冗余代码(推荐notepad++或者DreamWeaver的正则替换功能,建议notepad++ 免费 体积小)。
清除tppabs标签:
html文件中:
查找:\btppabs=”h[^”]*”
替换:(空)
css文件中的图片链接(以gif图片为例):
查找:tpa=http://[^\s]*.gif
替换:(空)
css文件中的注释:
查找:/*tpa.?\/
替换:(空)
修复confirm链接:
查找:href=” javascript:if(confirm(‘(htt[^”\s]).*?”
替换:href=”$1″
冗余代码示例:href=”javascript:if(confirm(‘https://www.nnbbxx.net/ \n\n该文件无法用 Teleport Ultra 下载, 因为 不可用, 或放弃了下载, 或项目即将停止。 \n\n你想在服务器上打开它?’))window.location=’https://www.nnbbxx.net/'”
示例替换后结果:href=https://www.nnbbxx.net/