Wenku Doc Downloader

对文档截图,合并为纯图片PDF。有限地支持(1)豆丁网(2)道客巴巴(3)360个人图书馆(4)得力文库(5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)安全文库网(11)人人文库(12)云展网(13)360文库(14)技工教育网(15)文库吧(16)中国社会科学文库(17)金锄头(18)自然资源标准。预览多少页,导出多少页。额外支持(1)食典通(2)JJG 计量技术规范,详见下方说明。

您需要先安装一个扩展,例如 篡改猴Greasemonkey暴力猴,之后才能安装此脚本。

您需要先安装一个扩展,例如 篡改猴暴力猴,之后才能安装此脚本。

您需要先安装一个扩展,例如 篡改猴暴力猴,之后才能安装此脚本。

您需要先安装一个扩展,例如 篡改猴Userscripts ,之后才能安装此脚本。

您需要先安装一款用户脚本管理器扩展,例如 Tampermonkey,才能安装此脚本。

您需要先安装用户脚本管理器扩展后才能安装此脚本。

(我已经安装了用户脚本管理器,让我安装!)

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展,比如 Stylus,才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

您需要先安装一款用户样式管理器扩展后才能安装此样式。

(我已经安装了用户样式管理器,让我安装!)

作者
JoyofFire
日安装量
10
总安装量
842,295
评分
270 18 8
版本
1.10.1
创建于
2021-11-22
更新于
2024-06-30
大小
170.3 KB
许可证
GPL-3.0-only
适用于

停止维护

已测试通过的环境:win10/11 | chrome >= 99 | tampermonkey稳定版

脚本原理是自动截图,不是黑客技术,不能预览就不能下载

野猫网(yemao.one)极有可能诈骗网站,与此脚本 无关,请防范诈骗

Wenku Doc Downloader 使用说明

0 目录

1. 重要提示

2. 图片下载合并器

3. 哪些做不到 ?

4. 为什么不能复制文字 ?

5. 为什么脚本没用 ?

6. 额外支持 / 其他工具

7. 适用于部分网站的书签脚本

8. 备注


1 重要提示

  • 付费文档和无法预览均不支持。你能预览多少页,就能得到多少页的PDF。
  • 百度文库不支持

2 图片下载合并器

  • 适用范围

    • 凡是用到【导出图片链接】的,都需要下载【图片下载合并器】以便把 urls.csv 转换为 PDF。
    • 推荐使用【图片下载合并器v2.1】。
  • 使用方法

    • 解压压缩包,得到一个文件夹。
    • 把从网页上下载得到的【urls.csv】复制(并覆盖)到该文件夹中。
    • 双击运行【启动器.bat】,等待程序结束,文件夹中出现【图片文档.pdf】。
  • 故障排查

    • 如果报错 RuntimeError: SSL is not supported,请下载【图片下载合并器v1】。
    • 请关闭网络代理。
    • 不支持 windows 7。
    • 不要用管理员运行。
    • 请用 Excel 或 记事本 打开 urls.csv,然后检查其中内容:
      • 是否存在空行 ?有的话删掉。
      • 是否存在格式奇怪的链接 ?如果复制该链接到浏览器无法打开,请删掉这条链接。

3 哪些做不到 ?

  • 不能导出 docxlsppt 等原文档格式。
  • 导出的 PDF 是纯图片的,文字无法复制。
  • 不能预览的页面无法导出:脚本的原理是自动截图,然后合并为 PDF,不是黑客技术。

4 为什么不能复制文字 ?

5 为什么脚本没用 ?

  • 为什么在同一个网站上有时有效,有时无效?

    • 因为不同文档类型的网页可能结构不同,难以100%覆盖,请自行解决或群内求助。
  • 为什么找不到按钮 ?

    • 按钮长这样👇 并且总是出现在网页左侧
    • wenku按钮区
    • 360浏览器必须使用【极速模式】而不是【兼容模式】
    • 肯定有效的浏览器:谷歌浏览器、Edge浏览器。
    • 可能无效的浏览器:QQ浏览器、油猴浏览器、2345浏览器、safari。
    • 使用的是 ViolentMonkeyTamperMonkey Beta 可能导致问题,请尝试使用 TamperMonkey
    • 在你需要起作用的网页上,同时运行了多个脚本,可能导致冲突,请暂时关闭其他脚本后刷新重试。
  • 为什么社会科学文库上没有按钮?

    • 因为很可能你是从其他图书馆页面访问的,这种网址脚本不能识别。
  • 为什么PDF中有空白页 / 黑页 ?

    • 可能有文档页尚未加载,请浏览它们,等待加载出来后再重试。
  • 为什么【原创力】PPT 导出不了 / 卡住 / 缺页 ?

    • PPT 类型难搞,我搞不定。
  • 为什么【原创力】表格不能导出 Excel ?

    • 表格只能导出 CSV 文件;技术差,见谅。
    • 如果表格中存在图片,将会以链接形式保存到 CSV 中。
    • 复杂排版的表格导出效果可能很差。
  • 【道客巴巴】文档导出 PDF 时等待时间过长 / 浏览器卡死?

    • 文章页数过多(比如超过100页)会导致该情况发生。
    • 建议导出 ZIP 压缩包,然后自行合并为 PDF。

6 额外支持 / 其他工具

若无特殊说明,这些脚本程序均运行在 Windows 10 及以上系统

7 适用于部分网站的书签脚本

  • 【社会学科文库 外部入口】

    • 【国家图书馆】
      • javascript:document.querySelector("iframe").contentWindow.eval(`(()=>{fetch("https://greasyfork.org/scripts/445312-wk-full-cli/code/wk-full-cli.user.js").then(r=>r.text()).then(c=>{Function(c)();return new Promise(r=>setTimeout(r,2000))}).then(_=>{window.wk_sklib_url="https://vpn2.nlc.cn/prx/000/https/www.sklib.cn/manuscripts/pdf/data/pdf/{id}/{index}?random=null,_ANDesc=xml";wk_main("www.sklib.cn")})})()`);
  • 【清风知己】

    • javascript:(async()=>{let t=document,e="https://greasyfork.org/scripts/445312-wk-full-cli/code/wk-full-cli.user.js";try{let t=await fetch(e),r=await t.text();Function(r)()}catch(r){console.error(r);let o=t.createElement("script");try{await(async()=>new Promise(((t,r)=>{o.onload=t,o.src=e,setTimeout(r,3e3)})))()}catch(t){return console.error(t),void alert("外部脚本加载失败!")}}try{await wk$.img_urls_to_pdf([...wk$.range(1,parseInt(wk$(".counts")[0].textContent.split("/")[1]))].map((t=>wk$("#dp")[0].value+`${t}.gif`)),window.doctitle||"知己文档"),alert("脚本执行成功")}catch(t){console.error(t),alert("脚本执行失败")}})();

8 备注

  • 本脚本完全免费。
  • 仅供学习交流,严禁用于商业用途,请勿传播下载的数据。
  • 本脚本所获取的资源完全合法,与浏览器能直接获得的资源一致,不存在逆向破解。
  • 使用脚本造成的影响由使用者承担。
  • 按钮样式由 liteyais 提供,非常感谢!
  • 兴趣使然写的脚本,更新以及意见的听取 完全取决于作者心情