通用网站内容抓取工具,可批量抓取小说、论坛内容等并保存为TXT文档
当前为
起点以及其他知名小说站都推荐用这个脚本【小说】下载脚本,遇到没人愿意适配的垃圾站再考虑我的脚本
轻量级抓取脚本,用于下载网页中的主要内容,理论上适用于任何非Ajax写入正文的小说网站、论坛、贴吧等而无需为此写任何规则 脚本会自动检索页面中的主要内容并下载(省得复制完gal攻略还要手动逐条删除“某某某13级头衔水龙王发表于X年X月X日来自XX客户端”) 如果位于小说目录页会遍历所有章节并排序拼接后存为TXT文档
.l_chaptname>a,但是通过url无法下载正文,正文是ajax通过articlescontent下载的,此时可后接@@articles@@articlescontent将章节url中的articles替换为articlescontent,其中第一个articles可输入正则,例如@@articles\d+@@$1content代表将链接中的“articles1”“articles2”等替换为“1content”“2content”。综上,.l_chaptname>a@@articles@@articlescontent可适配该站主要是
因为我要下载驰星周的漂流街,却发现前人的轮子“【小说】下载脚本”不能用,又不想为这破站写规则,而且我就是看不上霸道总裁修仙穿越你咬我啊指不定它三天两头改个版呢。
这个脚本会自动去查找主要内容并下载,不需要写规则。当然如果你家网站广告内容比正文还多我也没办法。
遇到特殊网站还是建议用“【小说】下载脚本”。