Wenku Doc Downloader

下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

目前为 2022-12-03 提交的版本。查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.6.0
  5. // @description 下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author 2690874578@qq.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://swf.ishare.down.sina.com.cn/?path=*
  11. // @match *://www.deliwenku.com/p-*
  12. // @match *://www.doc88.com/p-*
  13. // @match *://www.360doc.com/content/*
  14. // @match *://wenku.baidu.com/view/*
  15. // @match *://wenku.baidu.com/tfview/*
  16. // @match *://doc.mbalib.com/view/*
  17. // @match *://www.dugen.com/p-*
  18. // @match *://max.book118.com/html/*
  19. // @match *://view-cache.book118.com/pptView.html?*
  20. // @match *://*.book118.com/?readpage=*
  21. // @match *://c.gb688.cn/bzgk/gb/showGb?*
  22. // @match *://www.safewk.com/p-*
  23. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  24. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  25. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  26. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  27. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  28. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  29. // @grant none
  30. // @license GPL-3.0-only
  31. // @create 2021-11-22
  32. // @note 1. 新增对爱问文库 SVG 图形的支持
  33. // ==/UserScript==
  34.  
  35.  
  36. (function () {
  37. 'use strict';
  38.  
  39. /**
  40. * 多元素选择器
  41. * @param {string | HTMLElement} selector 选择器或元素
  42. * @returns {NodeListOf<HTMLElement>} elements 元素列表
  43. */
  44. let _wk$ = function(selector) {
  45. if (selector instanceof Node) {
  46. return [selector];
  47. }
  48. let that = this;
  49. if (!(that instanceof HTMLElement)) {
  50. that = document;
  51. }
  52. return that.querySelectorAll(selector);
  53. };
  54.  
  55. globalThis.wk$ = _wk$;
  56.  
  57.  
  58. let utils = {
  59. /**
  60. * 使用过时的execCommand复制文字
  61. * @param {string} text
  62. */
  63. _oldCopy: function(text) {
  64. let input = document.createElement("input");
  65. input.value = text;
  66. document.body.appendChild(input);
  67. input.select();
  68. document.execCommand("copy");
  69. input.remove();
  70. },
  71.  
  72. /**
  73. * 复制text到剪贴板
  74. * @param {string} text
  75. * @returns
  76. */
  77. copy: function(text) {
  78. // 输出到控制台和剪贴板
  79. console.log(text);
  80. if (!navigator.clipboard) {
  81. this._oldCopy(text);
  82. return;
  83. }
  84. navigator.clipboard.writeText(text)
  85. .catch(err => {
  86. this._oldCopy(text);
  87. });
  88. },
  89.  
  90. /**
  91. * 装饰器, 用于打印函数执行耗时
  92. * @param {Function} func 需要计时的函数
  93. * @returns {Promise<Function>} 装饰的func => func的返回值
  94. */
  95. recTime: async function(func) {
  96. async function inner() {
  97. let begin = Date.now();
  98. let res = await func();
  99. let cost = ((Date.now() - begin) / 1000).toFixed(1);
  100. console.log(`Function <${func.name}> costed ${cost} seconds.`);
  101. return res;
  102. }
  103. return inner;
  104. },
  105.  
  106. /**
  107. * 创建并下载文件
  108. * @param {String} file_name 文件名
  109. * @param {String | Blob} content 文本或blob
  110. */
  111. createAndDownloadFile: function(file_name, content) {
  112. let aTag = document.createElement('a');
  113. let blob;
  114. if (typeof content != Blob) {
  115. blob = new Blob([content]);
  116. }
  117. aTag.download = file_name;
  118. aTag.href = URL.createObjectURL(blob);
  119. aTag.click();
  120. URL.revokeObjectURL(blob);
  121. },
  122.  
  123. /**
  124. * 创建并下载URL资源
  125. * @param {String} file_name
  126. * @param {String} src
  127. */
  128. downloadUrlFile: function(file_name, src) {
  129. let aTag = document.createElement('a');
  130. aTag.download = file_name;
  131. aTag.href = src;
  132. aTag.click();
  133. },
  134.  
  135. /**
  136. * canvas转为PNG格式的blob
  137. * @param {HTMLCanvasElement} canvas
  138. * @returns {Promise<Blob>} blob
  139. */
  140. canvasToBlob: async function(canvas) {
  141. return new Promise(res => canvas.toBlob(res));
  142. },
  143.  
  144. /**
  145. * 添加外部js到当前页面
  146. * @param {String} url
  147. */
  148. addScript2HTML: function(url) {
  149. let script = document.createElement("script");
  150. script.src = url;
  151. document.head.appendChild(script);
  152. },
  153.  
  154. /**
  155. * 显示/隐藏按钮区.
  156. * @param {Function} func
  157. */
  158. toggleBtnsSec: function() {
  159. let sec = wk$(".wk-box")[0];
  160. if (sec.style.display === "none") {
  161. sec.style.display = "block";
  162. return;
  163. }
  164. sec.style.display = "none";
  165. },
  166.  
  167. /**
  168. * 睡眠 delay 毫秒
  169. * @param {Number} delay
  170. */
  171. sleep: function(delay) {
  172. let start = (new Date()).getTime();
  173. while ((new Date()).getTime() - start < delay) {
  174. continue;
  175. }
  176. },
  177.  
  178. /**
  179. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  180. * @param {Number} delay
  181. * @returns {Promise} nextTask
  182. */
  183. sleepAsync: function(delay) {
  184. return new Promise((resolve) => setTimeout(resolve, delay));
  185. },
  186.  
  187. /**
  188. * 允许打印页面
  189. */
  190. allowPrint: function() {
  191. let style = document.createElement("style");
  192. style.innerHTML = `
  193. @media print {
  194. body{
  195. display:block;
  196. }
  197. }
  198. `;
  199. document.head.appendChild(style);
  200. },
  201.  
  202. /**
  203. * 取得get参数key对应的value
  204. * @param {String} key
  205. * @returns {String} value
  206. */
  207. getUrlParam: function(key) {
  208. let params = (new URL(window.location)).searchParams;
  209. return params.get(key);
  210. },
  211.  
  212. /**
  213. * 在指定节点后面插入节点
  214. * @param {HTMLElement} new_element
  215. * @param {HTMLElement} target_element
  216. */
  217. insertAfter: function(new_element, target_element) {
  218. let parent = target_element.parentNode;
  219. if (parent.lastChild === target_element) {
  220. parent.appendChild(new_element);
  221. } else {
  222. parent.insertBefore(new_element, target_element.nextElementSibling);
  223. }
  224. },
  225.  
  226. /**
  227. * 求main_set去除cut_set后的set
  228. * @param {Set} main_set
  229. * @param {Set} cut_set
  230. * @returns 差集
  231. */
  232. difference: function(main_set, cut_set) {
  233. let _diff = new Set(main_set);
  234. for (let elem of cut_set) {
  235. _diff.delete(elem);
  236. }
  237. return _diff;
  238. },
  239.  
  240. /**
  241. * 抛出set中的第一个元素
  242. * @param {Set} set
  243. * @returns 一个元素
  244. */
  245. setPop: function(set) {
  246. for (let item of set) {
  247. set.delete(item);
  248. return item;
  249. }
  250. },
  251.  
  252. /**
  253. * 绑定事件到指定按钮,返回按钮引用
  254. * @param {Function} event click事件
  255. * @param {Array} args 事件的参数列表
  256. * @param {string} aim_btn 按钮的变量名
  257. * @param {string} new_text 按钮的新文本,为null则不替换
  258. * @returns 按钮元素的引用
  259. */
  260. setBtnEvent: function(event, args=[], aim_btn="btn_3", new_text=null) {
  261. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  262. // 如果需要,替换按钮内文本
  263. if (new_text) {
  264. btn.textContent = new_text;
  265. }
  266. // 绑定事件,添加到页面上
  267. btn.onclick = () => {
  268. this.enhanceBtnClickReaction(aim_btn);
  269. if (args.length) {
  270. event(...args);
  271. } else {
  272. event();
  273. }
  274. };
  275. return btn;
  276. },
  277.  
  278. /**
  279. * 强制隐藏元素
  280. * @param {String} selector
  281. */
  282. forceHide: function(selector) {
  283. let style_cls = "force-hide";
  284. document.querySelectorAll(selector).forEach((elem) => {
  285. elem.className += ` ${style_cls}`;
  286. });
  287. // 判断css样式是否已经存在
  288. let style;
  289. style = document.querySelector(`style.${style_cls}`);
  290. // 如果已经存在,则无须重复创建
  291. if (style) {
  292. return;
  293. }
  294. // 否则创建
  295. style = document.createElement("style");
  296. style.innerHTML = `style.${style_cls} {
  297. visibility: hidden !important;
  298. }`;
  299. document.head.appendChild(style);
  300. },
  301.  
  302. /**
  303. * 当元素可见时,操作目标元素(异步)。最多为不可见元素等待5秒。
  304. * @param {string} s 单个元素选择器
  305. * @param {Function} callback (elem) => {...} 元素操作函数
  306. */
  307. manipulateElem: async function(s, callback) {
  308. let isVisiable = () => {
  309. let res = getComputedStyle(wk$(s)[0]).display !== "none";
  310. // console.log(`${s} visibility: ${res}`);
  311. return res;
  312. };
  313.  
  314. let max = 5 * 5; // 最多等待5秒
  315. let i = 0;
  316.  
  317. // 如果不可见就等待0.2秒/轮
  318. while (!isVisiable() && i <= max) {
  319. i++;
  320. await utils.sleepAsync(200);
  321. }
  322.  
  323. callback(wk$(s)[0]);
  324. },
  325.  
  326. /**
  327. * 隐藏按钮,打印页面,显示按钮
  328. */
  329. hideBtnThenPrint: function() {
  330. // 隐藏按钮,然后打印页面
  331. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  332. btns.forEach((elem) => {
  333. elem.style.display = "none";
  334. });
  335. window.print();
  336.  
  337. // 打印结束,显示按钮
  338. btns.forEach((elem) => {
  339. elem.style.display = "block";
  340. });
  341. },
  342.  
  343. /**
  344. * 返回times个倍数连接的str
  345. * @param {String} str
  346. * @param {Number} times
  347. * @returns multiplied_str
  348. */
  349. multiplyStr: function(str, times) {
  350. let str_list = [];
  351. for (let i = 0; i < times; i++) {
  352. str_list.push(str);
  353. }
  354. return str_list.join("");
  355. },
  356.  
  357. /**
  358. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  359. * @param {String} custom_btn 按钮变量名
  360. */
  361. enhanceBtnClickReaction: function(custom_btn = null) {
  362. let aim_btn;
  363. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  364. if (!custom_btn || custom_btn === "btn_1") {
  365. aim_btn = document.querySelector(".btn-1");
  366. } else {
  367. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  368. }
  369.  
  370. let old_color = aim_btn.style.color; // 保存旧的颜色
  371. let old_text = aim_btn.textContent; // 保存旧的文字内容
  372. // 变黑缩小
  373. aim_btn.style.color = "black";
  374. aim_btn.style.fontWeight = "normal";
  375. aim_btn.textContent = `->${old_text}<-`;
  376. // 复原加粗
  377. let changeColorBack = function() {
  378. aim_btn.style.color = old_color;
  379. aim_btn.style.fontWeight = "bold";
  380. aim_btn.textContent = old_text;
  381. };
  382. setTimeout(changeColorBack, 1250);
  383. },
  384.  
  385. /**
  386. * 切换按钮显示/隐藏状态
  387. * @param {String} aim_btn 按钮变量名
  388. * @returns 按钮元素的引用
  389. */
  390. toggleBtnStatus: function(aim_btn) {
  391. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  392. let display = getComputedStyle(btn).display;
  393. // return;
  394. if (display === "none") {
  395. btn.style.display = "block";
  396. } else {
  397. btn.style.display = "none";
  398. }
  399. return btn;
  400. },
  401.  
  402. /**
  403. * 根据canvas元素数量返回quality值
  404. * @param {Number} canvas_amount
  405. * @returns quality: Number
  406. */
  407. getQualityByCanvasAmount: function(canvas_amount) {
  408. // 如果有全局参数,优先用全局的
  409. if (window.img_quality !== undefined) {
  410. console.log(`image quality: ${window.img_quality * 100}%`);
  411. return window.img_quality;
  412. }
  413. // 否则用默认的
  414. let quality;
  415. if (canvas_amount <= 25) {
  416. quality = 1.0;
  417. } else if (25 < canvas_amount <= 50) {
  418. quality = 0.9;
  419. } else {
  420. quality = 0.8;
  421. }
  422. console.log(`image quality: ${quality * 100}%`);
  423. return quality;
  424. },
  425.  
  426. /**
  427. * 挂载func到全局
  428. * @param {Function} func
  429. */
  430. globalFunc: function(func) {
  431. globalThis[func.name] = func;
  432. },
  433.  
  434. /**
  435. * 用input框跳转到对应页码
  436. * @param {Element} cur_page 当前页码
  437. * @param {string | Number} aim_page 目标页码
  438. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  439. */
  440. jump2pageNo: function(cur_page, aim_page, event_type) {
  441. // 设置跳转页码为目标页码
  442. cur_page.value = (aim_page).toString();
  443. // 模拟回车事件来跳转
  444. let keyboard_event_enter = new KeyboardEvent(event_type, {
  445. bubbles: true,
  446. cancelable: true,
  447. keyCode: 13
  448. });
  449. cur_page.dispatchEvent(keyboard_event_enter);
  450. },
  451.  
  452. /**
  453. * 在新标签页打开链接
  454. * @param {String} href
  455. */
  456. openInNewTab: function(href) {
  457. let link = document.createElement("a");
  458. link.href = href;
  459. link.target = "_blank";
  460. link.click();
  461. },
  462.  
  463. /**
  464. * 滚动到页面底部
  465. */
  466. scrollToBottom: function() {
  467. window.scrollTo({
  468. top: document.body.scrollHeight,
  469. behavior: "smooth"
  470. });
  471. },
  472.  
  473. /**
  474. * 用try移除元素
  475. * @param {Element} element 要移除的元素
  476. */
  477. tryToRemoveElement: function(element) {
  478. try {
  479. element.remove();
  480. } catch (e) {
  481. }
  482. },
  483.  
  484. /**
  485. * 用try移除若干元素
  486. * @param {Element[]} elements 要移除的元素列表
  487. */
  488. tryToRemoveElements: function(elements) {
  489. elements.forEach((elem) => {
  490. this.tryToRemoveElement(elem);
  491. });
  492. },
  493.  
  494. /**
  495. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  496. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  497. */
  498. tryToRemoveSameElem: function(elem_list_box) {
  499. for (let elem_list of elem_list_box) {
  500. if (!elem_list) {
  501. continue;
  502. }
  503. for (let elem of elem_list) {
  504. try {
  505. elem.remove();
  506. } catch (e) {
  507. console.log();
  508. }
  509. }
  510. }
  511. },
  512.  
  513. /**
  514. * 使文档在页面上居中
  515. * @param {String} selector 文档容器的css选择器
  516. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  517. * @returns 偏移值是否合法
  518. */
  519. centerDoc: function(selector, default_offset) {
  520. let doc_main = document.querySelector(selector);
  521. let offset = window.prompt("请输入偏移百分位:", default_offset);
  522. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  523. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  524. doc_main.style.marginLeft = offset + "%";
  525. return true;
  526. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  527. doc_main.style.marginLeft = offset + "%";
  528. return true
  529. } else {
  530. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  531. return false;
  532. }
  533. },
  534.  
  535. /**
  536. * 调整按钮内文本
  537. * @param {String} aim_btn 按钮变量名
  538. * @param {String} new_text 新的文本,null则保留旧文本
  539. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  540. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  541. */
  542. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  543. // 提示文档已经展开
  544. if (use_hint) {
  545. let hint = "文档已经完全展开,可以导出";
  546. alert(hint);
  547. }
  548. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  549. // 要替换的文本
  550. if (new_text) {
  551. btn.textContent = new_text;
  552. }
  553. // 推荐按钮
  554. if (recommend_btn) {
  555. btn.textContent += "(推荐)";
  556. }
  557. },
  558.  
  559. html2Canvases: async function(elem_list) {
  560. // 如果是空元素列表,返回null并终止函数
  561. if (elem_list.length === 0) {
  562. console.log("html2canvases was called, but no element is avaiable.");
  563. return null;
  564. }
  565. let tasks = []; // 存放异步任务
  566. let contents = []; // 存放canvas元素
  567. for (let elem of elem_list) {
  568. let task = html2canvas(elem).then((canvas) => {
  569. contents.push(canvas);
  570. });
  571. tasks.push(task);
  572. }
  573. // 等待全部page转化完成
  574. await Promise.all(tasks);
  575. return contents;
  576. },
  577.  
  578. /**
  579. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  580. * @param {Array} elem_list html元素列表
  581. * @param {String} title 文档标题
  582. */
  583. html2PDF: async function(elem_list, title = "文档") {
  584. // 如果是空元素列表,终止函数
  585. let _contents = this.html2Canvases(elem_list);
  586. if (_contents === null) {
  587. return;
  588. }
  589. _contents.then((contents) => {
  590. // 控制台检查结果
  591. console.log("生成的canvas元素如下:");
  592. console.log(contents);
  593.  
  594. // 拿到canvas宽、高
  595. let model = elem_list[0];
  596. let width, height;
  597. width = model.offsetWidth;
  598. height = model.offsetHeight;
  599. // 打包为pdf
  600. this.saveCanvasesToPDF(contents, title, width, height);
  601. });
  602. },
  603.  
  604. /**
  605. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  606. * @param {string} selector 图形元素的父级元素
  607. */
  608. savePicUrls: function(selector) {
  609. let pages = document.querySelectorAll(selector);
  610. let pic_urls = [];
  611.  
  612. for (let elem of pages) {
  613. let pic_obj = elem.children[0];
  614. let url = pic_obj.src;
  615. pic_urls.push(url);
  616. }
  617. let content = pic_urls.join("\n");
  618. // 启动下载
  619. this.createAndDownloadFile("urls.csv", content);
  620. },
  621.  
  622. /**
  623. * 存储所有canvas图形为png到一个压缩包
  624. * @param {Array} node_list canvas元素列表
  625. * @param {String} title 文档标题
  626. */
  627. saveCanvasesToZip: function(node_list, title) {
  628. // canvas元素转为png图像
  629. // 所有png合并为一个zip压缩包
  630. let zip = new JSZip();
  631. let n = node_list.length;
  632.  
  633. for (let i = 0; i < n; i++) {
  634. let canvas = node_list[i];
  635. let data_base64 = canvas.toDataURL();
  636. let blob = atob(data_base64.split(",")[1]);
  637. zip.file(`page-${i + 1}.png`, blob, { binary: true });
  638. }
  639.  
  640. // 导出zip
  641. // promise.then(onCompleted, onRejected);
  642. zip.generateAsync({ type: "blob" }).then(function(content) {
  643. // see filesaver.js
  644. console.log(content);
  645. saveAs(content, `${title}.zip`);
  646. });
  647. },
  648.  
  649. /**
  650. * 将canvas转为jpeg,然后导出PDF
  651. * @param {Iterable<HTMLCanvasElement>} canvas_box canvas元素列表
  652. * @param {string} title 文档标题
  653. */
  654. saveCanvasesToPDF: function(canvas_box, title, width = 0, height = 0) {
  655. // 如果没有手动指定canvas的长宽,则自动检测
  656. if (!width && !height) {
  657. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  658. let first_canvas = canvas_box[0];
  659.  
  660. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  661. [width, height] = [first_canvas.width, first_canvas.height];
  662. } else {
  663. let [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  664. [width, height] = [parseInt(width_str), parseInt(height_str)];
  665. }
  666. }
  667.  
  668. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  669. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  670. let orientation = width > height ? 'l' : 'p';
  671. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  672. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  673.  
  674. // 保存每一页文档到每一页pdf
  675. let canvas_list = Array.from(canvas_box);
  676. let last_canvas = canvas_list.pop();
  677. canvas_list.forEach(canvas => {
  678. pdf.addImage(canvas, 'png', 0, 0, width, height);
  679. pdf.addPage();
  680. });
  681. // 添加尾页
  682. pdf.addImage(last_canvas, 'png', 0, 0, width, height);
  683. // 导出文件
  684. pdf.save(`${title}.pdf`);
  685. },
  686.  
  687. /**
  688. * Image元素列表合并到一个PDF中
  689. * @param {NodeList} imgs Image元素列表
  690. * @param {String} title 文档名
  691. */
  692. imgs2pdf: function(imgs, title) {
  693. // 取得宽高
  694. let model = imgs[0];
  695. let width = model.offsetWidth;
  696. let height = model.offsetHeight;
  697.  
  698. // 创建pdf
  699. let orientation = width > height ? 'l' : 'p';
  700. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  701.  
  702. // 添加图像到pdf
  703. imgs.forEach((img, index) => {
  704. pdf.addImage(img, 'PNG', 0, 0, width, height);
  705. // 如果当前不是文档最后一页,则需要添加下一个空白页
  706. if (index !== imgs.length - 1) {
  707. pdf.addPage();
  708. }
  709. });
  710.  
  711. // 导出文件
  712. pdf.save(`${title}.pdf`);
  713. },
  714.  
  715.  
  716. /**
  717. * imageBitMap转canvas
  718. * @param {ImageBitmap} bmp
  719. * @returns {HTMLCanvasElement} canvas
  720. */
  721. bmpToCanvas: function(bmp) {
  722. let canvas = document.createElement("canvas");
  723. canvas.height = bmp.height;
  724. canvas.width = bmp.width;
  725. let ctx = canvas.getContext("bitmaprenderer");
  726. ctx.transferFromImageBitmap(bmp);
  727. return canvas;
  728. },
  729.  
  730. /**
  731. * 下载可以简单直接请求的图片,合并到PDF并导出
  732. * @param {Iterable<string>} urls 图片链接列表
  733. * @param {string} title 文档名称
  734. */
  735. imgUrlsToPDF: async function(urls, title) {
  736. // 发起请求
  737. let tasks = [];
  738. Array.from(urls).forEach(url => {
  739. tasks.push(
  740. (async () => {
  741. return await (await fetch(url)).blob();
  742. })()
  743. );
  744. });
  745. // 接收响应
  746. let blobs = await Promise.all(tasks);
  747. // 格式转换:img blob -> bmp
  748. let tasks2 = [];
  749. blobs.map(
  750. blob => {
  751. let bmp = createImageBitmap(blob);
  752. tasks2.push(
  753. (async () => await bmp)()
  754. );
  755. }
  756. );
  757. // 等待格式转换完成
  758. let bmp_items = await Promise.all(tasks2);
  759.  
  760. // 转为canvas
  761. let canvas_box = bmp_items.map(
  762. bmp => this.bmpToCanvas(bmp)
  763. );
  764.  
  765. // 导出PDF
  766. this.saveCanvasesToPDF(canvas_box, title);
  767. },
  768.  
  769. /**
  770. * 取得elem的class为class_name的父级元素
  771. * @param {String} class_name
  772. * @param {Element} elem 起点元素
  773. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  774. * @param {Boolean} miss 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  775. * @returns {null | Element} parent_element
  776. */
  777. getParentByClassName: function(class_name, elem, JSobj, miss = false) {
  778. let parent = elem.parentElement;
  779. let iterator_count = JSobj.iterator_count;
  780. let now_name;
  781.  
  782. try {
  783. now_name = parent.className;
  784. } catch (e) {
  785. JSobj.iterator_count = 0;
  786. // 没有父级元素了
  787. return "no parent node";
  788. }
  789.  
  790. // 如果不忽略递归次数计数器
  791. if (!miss) {
  792. if (iterator_count > 9) {
  793. // 超过最大迭代次数,认为不存在,返回null
  794. JSobj.iterator_count = 0;
  795. return "over max iterator counts limit";
  796. } else {
  797. JSobj.iterator_count += 1;
  798. }
  799. }
  800. // 如果类名匹配,返回该节点
  801. if (now_name.split(" ").includes(class_name)) {
  802. iterator_count = 0;
  803. return parent;
  804. }
  805. return this.getParentByClassName(class_name, parent, JSobj);
  806. },
  807.  
  808. /**
  809. * 将func绑定到window.onscroll,并设置触发频率
  810. * @param {Function} func scroll的监听函数
  811. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  812. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  813. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  814. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  815. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  816. */
  817. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  818. if (JSobj.scroll_count === undefined) {
  819. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  820. return;
  821. }
  822.  
  823. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  824. JSobj.scroll_count += 1;
  825. if (JSobj.scroll_count < useful_range) {
  826. func();
  827. console.log(hint);
  828. } else if (JSobj.scroll_count > wait_range) {
  829. JSobj.scroll_count = 0;
  830. }
  831. };
  832. // 如果没有指定的window对象,则使用默认的window
  833. if (!inner_window) {
  834. window.onscroll = () => {
  835. new_func(func, JSobj, useful_range, wait_range, hint);
  836. };
  837. return;
  838. }
  839. // 特定的window对象,一般用于iframe,追加scroll监听器
  840. let scrollFunc = () => {
  841. new_func(func, JSobj, useful_range, wait_range, hint);
  842. };
  843. JSobj.scrollFunc = scrollFunc;
  844. inner_window.addEventListener("scroll", scrollFunc, false);
  845. },
  846.  
  847. /**
  848. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;除第1个外默认均为隐藏
  849. */
  850. createBtns: function() {
  851. // 创建大容器
  852. let box = document.createElement("div");
  853. box.className = "wk-box";
  854. document.body.appendChild(box);
  855.  
  856. // 创建按钮组
  857. let section = document.createElement("section");
  858. section.className = "btns_section";
  859. section.innerHTML = `
  860. <p class="logo_tit">Wenku Doc Downloader</p>
  861. <button class="btn-1">展开文档 😈</button>
  862. <button class="btn-2">未设定2</button>
  863. <button class="btn-3">未设定3</button>
  864. <button class="btn-4">未设定4</button>
  865. <button class="btn-5">未设定5</button>
  866. `;
  867. box.appendChild(section);
  868.  
  869. // 添加隐藏/展示按钮
  870. // 隐藏【🙈】,展开【🐵】
  871. let hide_btn = document.createElement("p");
  872. hide_btn.className = "hide_btn_wk";
  873. hide_btn.textContent = "🐵";
  874. hide_btn.onclick = () => {
  875. // 显示 -> 隐藏
  876. if (getComputedStyle(section).display === "block") {
  877. section.style.display = "none";
  878. hide_btn.style.left = "20px";
  879. hide_btn.textContent = "🙈";
  880. // 隐藏 -> 显示
  881. } else {
  882. section.style.display = "block";
  883. hide_btn.style.left = "155px";
  884. hide_btn.textContent = "🐵";
  885. }
  886. };
  887. box.appendChild(hide_btn);
  888.  
  889. // 设定样式
  890. let style = document.createElement("style");
  891. style.innerHTML = `
  892. .hide_btn_wk {
  893. position: fixed;
  894. left: 155px;
  895. top: 36%;
  896. user-select: none;
  897. font-size: large;
  898. z-index: 5001;
  899. }
  900. .btns_section{
  901. position: fixed;
  902. width: 154px;
  903. left: 10px;
  904. top: 32%;
  905. background: #E7F1FF;
  906. border: 2px solid #1676FF;
  907. padding: 0px 0px 10px 0px;
  908. font-weight: 600;
  909. border-radius: 2px;
  910. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  911. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  912. 'Segoe UI Emoji', 'Segoe UI Symbol';
  913. z-index: 5000;
  914. }
  915. .logo_tit{
  916. width: 100%;
  917. background: #1676FF;
  918. text-align: center;
  919. font-size:12px ;
  920. color: #E7F1FF;
  921. line-height: 40px;
  922. height: 40px;
  923. margin: 0 0 16px 0;
  924. }
  925.  
  926. .btn-1{
  927. display: block;
  928. width: 128px;
  929. height: 28px;
  930. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  931. border-radius: 4px;
  932. color: #fff;
  933. font-size: 12px;
  934. border: none;
  935. outline: none;
  936. margin: 8px auto;
  937. font-weight: bold;
  938. cursor: pointer;
  939. opacity: .9;
  940. }
  941. .btn-2{
  942. display: none;
  943. width: 128px;
  944. height: 28px;
  945. background: #07C160;
  946. border-radius: 4px;
  947. color: #fff;
  948. font-size: 12px;
  949. border: none;
  950. outline: none;
  951. margin: 8px auto;
  952. font-weight: bold;
  953. cursor: pointer;
  954. opacity: .9;
  955. }
  956. .btn-3{
  957. display: none;
  958. width: 128px;
  959. height: 28px;
  960. background:#FA5151;
  961. border-radius: 4px;
  962. color: #fff;
  963. font-size: 12px;
  964. border: none;
  965. outline: none;
  966. margin: 8px auto;
  967. font-weight: bold;
  968. cursor: pointer;
  969. opacity: .9;
  970. }
  971. .btn-4{
  972. display: none;
  973. width: 128px;
  974. height: 28px;
  975. background: #1676FF;
  976. border-radius: 4px;
  977. color: #fff;
  978. font-size: 12px;
  979. border: none;
  980. outline: none;
  981. margin: 8px auto;
  982. font-weight: bold;
  983. cursor: pointer;
  984. opacity: .9;
  985. }
  986. .btn-5{
  987. display: none;
  988. width: 128px;
  989. height: 28px;
  990. background: #ff6600;
  991. border-radius: 4px;
  992. color: #fff;
  993. font-size: 12px;
  994. border: none;
  995. outline: none;
  996. margin: 8px auto;
  997. font-weight: bold;
  998. cursor: pointer;
  999. opacity: .9;
  1000. }
  1001. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  1002. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  1003. document.head.appendChild(style);
  1004.  
  1005. // 根据配置选择:是否默认显示
  1006. if (!globalThis._wk_on) {
  1007. hide_btn.click();
  1008. }
  1009. }
  1010. };
  1011.  
  1012. /**
  1013. * 清理百度文库页面的无关元素
  1014. */
  1015. function clearPage_Baidu() {
  1016. let selectors = [
  1017. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  1018. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  1019. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  1020. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  1021. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  1022. ".hx-recom-wrapper, .reader-topbar, #page-footer, .copyright-wrap",
  1023. ".bg-theme-wap"
  1024. ];
  1025. let elem_list = document.querySelectorAll(selectors.join(", "));
  1026. for (let elem of elem_list) {
  1027. utils.tryToRemoveElement(elem);
  1028. }
  1029. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  1030. utils.forceHide(nut_selector);
  1031.  
  1032. // 页边距调整
  1033. // 顶部距离改为0
  1034. let rc = document.querySelector("#reader-container");
  1035. rc.style.paddingTop = "0";
  1036. let cw = document.querySelector(".content-wrapper");
  1037. cw.style.paddingTop = "0";
  1038. // 底部距离改为0
  1039. let foot = document.querySelector(".try-end-fold-page");
  1040. foot.style.paddingBottom = "0";
  1041. foot.style.height = "0";
  1042. }
  1043.  
  1044.  
  1045. /**
  1046. * 调整页间距为 width px
  1047. */
  1048. function adjustPageGap() {
  1049. let old_gap = window.baiduJS.page_gap;
  1050. let hints = [
  1051. `旧的页间距为 ${old_gap} px`,
  1052. "请输入新的页间距(0-500的整数):\n"
  1053. ];
  1054. let new_gap = prompt(hints.join("\n"));
  1055. new_gap = parseInt(new_gap);
  1056.  
  1057. // 创建空白段落节点充当间隔
  1058. let div = document.createElement("div");
  1059. // 取得实心填充物
  1060. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  1061. block.style.height = `${new_gap}px`;
  1062. // 创建间隔
  1063. div.style.background = "rgb(255, 255, 255)"; // 页间距设置为白色
  1064. div.appendChild(block);
  1065. div.className = "page-gap";
  1066.  
  1067. // 调整页间距
  1068. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  1069. let next_elem = elem.nextElementSibling;
  1070.  
  1071. if (next_elem === null) {
  1072. return; // 最后一个节点后面无需间隔
  1073. }
  1074.  
  1075. let cls = next_elem.className;
  1076. if (cls === "page-gap") {
  1077. next_elem.style.height = `${new_gap}px`;
  1078. } else {
  1079. utils.insertAfter(div.cloneNode(true), elem);
  1080. }
  1081. });
  1082. window.baiduJS.page_gap = new_gap;
  1083. console.log(`页间距已经调整为:${new_gap} px`);
  1084. }
  1085.  
  1086.  
  1087. /**
  1088. * 判断是否所有可预览页面都冻结了
  1089. * @returns {Boolean}
  1090. */
  1091. function areAllFrozen() {
  1092. let frozen = 0;
  1093. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1094. if (canvas.getAttribute("width") !== "0") {
  1095. frozen += 1;
  1096. }
  1097. });
  1098. if (frozen < window.free_page) {
  1099. return false;
  1100. }
  1101. return true;
  1102. }
  1103.  
  1104.  
  1105. /**
  1106. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  1107. */
  1108. function freezeDocView() {
  1109. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1110. if (canvas.getAttribute("width") !== "0") {
  1111. canvas.id = "";
  1112. }
  1113. });
  1114.  
  1115. if (areAllFrozen()) {
  1116. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  1117. console.log("wk: 文档页: 全部冻结完毕");
  1118. window.baiduJS.finished = true;
  1119. window.onscroll = () => { };
  1120. }
  1121. }
  1122.  
  1123.  
  1124. /**
  1125. * 优化阅读体验的零碎任务
  1126. */
  1127. function better() {
  1128. /**
  1129. * 内部主函数,便于捕获异常
  1130. * 代码改自 https://greasyfork.org/zh-CN/scripts/438420
  1131. */
  1132. let _better = function() {
  1133. let pageData = window.pageData;
  1134. // 改为本地 VIP
  1135. pageData.vipInfo.global_svip_status = 1;
  1136. pageData.vipInfo.global_vip_status = 1;
  1137. pageData.vipInfo.isVip = 1;
  1138. pageData.vipInfo.isWenkuVip = 1;
  1139.  
  1140. // 手机版优化
  1141. if (pageData.appUniv) {
  1142. // 取消百度文库对谷歌、搜狗浏览器 referrer 的屏蔽
  1143. pageData.appUniv.blackBrowser = [];
  1144. // 隐藏 APP 下载按钮
  1145. pageData.viewBiz.docInfo.needHideDownload = true;
  1146. }
  1147.  
  1148. // 强制改变背景为中灰色
  1149. document.querySelector("#app")
  1150. .style.backgroundColor = "rgb(95, 99, 104)";
  1151. };
  1152.  
  1153. try {
  1154. console.log("wk: 优化");
  1155. _better();
  1156. } catch (error) {
  1157. console.log("wk: baiduWenku: better: main:");
  1158. console.error(error);
  1159. }
  1160. }
  1161.  
  1162.  
  1163. /**
  1164. * 展开文档
  1165. */
  1166. function readAllOld() {
  1167. better();
  1168. let btn = document.querySelector(".read-all");
  1169. if (!btn) {
  1170. // 显示按钮
  1171. utils.toggleBtnStatus("btn_1");
  1172. utils.toggleBtnStatus("btn_2");
  1173. utils.toggleBtnStatus("btn_3");
  1174. // utils.toggleBtnStatus("btn_4");
  1175. } else {
  1176. btn.click();
  1177. }
  1178. }
  1179.  
  1180.  
  1181. function getTips() {
  1182. let hints = [
  1183. `一共 ${window.all_page} 页, 免费预览 ${window.free_page} 页,`,
  1184. "请优先尝试【导出图片链接】,如果不行再【打印页面到PDF】。",
  1185. "!!由于百度改版,图片链接可能是假的,如若发生请尝试其他办法!!",
  1186. "",
  1187. "如果<免费预览页数>等于<总页数>,",
  1188. "但点击展开文档, 却跳转到vip付费,",
  1189. "请尝试:",
  1190. "1. 清除全部cookies,刷新页面并登录账号",
  1191. "2. 复制以下链接,并在【新标签页】中打开,然后尝试展开文档。",
  1192. "如果还不行就没办法了。",
  1193. "",
  1194. "如果出现空白页,请浏览对应页面使其加载,然后再打印页面。",
  1195. "页数超过20页时,打印预览明显缓慢,请耐心等待,真的只是很慢。",
  1196. "",
  1197. "页面间距通过按钮调整。",
  1198. "页面宽度通过打印时缩放比调整。",
  1199. "推荐缩放比: 114%",
  1200. "",
  1201. "打印时设置:",
  1202. "更多设置 -> 缩放 -> 自定义",
  1203. "选项 -> ☑ 背景图形",
  1204. ];
  1205. let url_no_params = window.location.href.replace(/[?].*/, "");
  1206. prompt(hints.join("\n"), url_no_params);
  1207. alert(
  1208. [
  1209. "只能导出可以【免费预览】的页面。",
  1210. "脚本的能力是有限的,烦请谅解。",
  1211. "",
  1212. "百度文库会记住你打开文档的操作路径,如:",
  1213. "百度搜索 -> 文档,或 文库搜索 -> 百度文档,",
  1214. "百度会让通过特定路径打开免费文档的人必须付费,",
  1215. "所以解决办法是复制刚才弹窗中的链接,",
  1216. "新建标签页,粘贴链接,然后回车打开,这样的操作是零路径。",
  1217. "",
  1218. "此外,发现此脚本与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  1219. "应该是此脚本删去文档页id所导致的,",
  1220. "暂无解决方案, 如需复制文字请禁用此脚本。"
  1221. ].join("\n")
  1222. );
  1223. }
  1224.  
  1225.  
  1226. /**
  1227. * 清理页面,然后打印页面
  1228. */
  1229. function clearThenPrint() {
  1230. // 清理页面
  1231. clearPage_Baidu();
  1232. // 调整文档内容的定位
  1233. let content = document.querySelector(".left-wrapper");
  1234. content.style.marginLeft = "0";
  1235. // 打印页面
  1236. utils.hideBtnThenPrint();
  1237. }
  1238.  
  1239.  
  1240. /**
  1241. * 取得pageData接口中的urls并下载
  1242. * @returns {Boolean} 是否成功下载(是否存在图片元素)
  1243. */
  1244. function downloadPicUrls() {
  1245. let warn = () => {
  1246. let hints = [
  1247. "当前文档非ppt或pdf, 无法使用该功能。",
  1248. "请在展开文档后使用【打印页面到PDF】"
  1249. ];
  1250. alert(hints.join("\n"));
  1251. };
  1252.  
  1253. let html_urls = window.pageData.readerInfo.htmlUrls;
  1254. if (!html_urls) {
  1255. warn();
  1256. return false;
  1257. }
  1258.  
  1259. // pdf
  1260. if (html_urls.png && html_urls.png.length > 0) {
  1261. let urls = [];
  1262. let pngs = html_urls.png;
  1263. pngs.forEach((png) => {
  1264. urls.push(png.pageLoadUrl);
  1265. });
  1266. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  1267. return true;
  1268. }
  1269. // 非图形
  1270. if (html_urls.length === undefined) {
  1271. warn();
  1272. return false;
  1273. }
  1274. // ppt
  1275. utils.createAndDownloadFile("urls.csv", html_urls.join("\n"));
  1276. return true;
  1277. }
  1278.  
  1279.  
  1280. /**
  1281. * 百度文档下载策略
  1282. */
  1283. function baiduWenkuOld() {
  1284. // 允许打印页面
  1285. utils.allowPrint();
  1286. better();
  1287.  
  1288. // 绑定监听器给滚动。在滚动时冻结文档页面
  1289. let log = "wk: 文档页: 冻结";
  1290. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  1291.  
  1292. // 创建按钮
  1293. utils.createBtns();
  1294. // 按钮1: 展开预览
  1295. utils.setBtnEvent(readAllOld, [], "btn_1");
  1296. // 按钮2: 清理页面元素,打印页面
  1297. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  1298. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  1299. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  1300. // 按钮4: 导出图片链接(如果文档是ppt或pdf)
  1301. utils.setBtnEvent(downloadPicUrls, [], "btn_4", "导出图片链接");
  1302. utils.toggleBtnStatus("btn_4");
  1303. // 按钮5: 提示说明
  1304. utils.setBtnEvent(getTips, [], "btn_5", "有问题点我");
  1305. utils.toggleBtnStatus("btn_5");
  1306. }
  1307.  
  1308.  
  1309. /**
  1310. * 居中百度文库文档
  1311. */
  1312. function centerDoc() {
  1313. // 居中文档
  1314. $(".content-wrapper")[0].style = `
  1315. display: flex;
  1316. flex-direction: row;
  1317. justify-content: space-around;
  1318. `.replace(/\s/g, "");
  1319.  
  1320. $(".left-wrapper")[0].style = "margin: 0;";
  1321.  
  1322. let academic = $(".doc-info-wrapper")[0];
  1323. if (academic) {academic.style = "display: none;";}}
  1324.  
  1325.  
  1326. function readAll$1() {
  1327. let vip_read = $(".page-text")[0];
  1328. if (!vip_read) {return;}
  1329.  
  1330. let read_all = $(".read-all")[0];
  1331. // read_all.style = "color: red; font-weight: bold;";
  1332. read_all.textContent += "*";
  1333. read_all.parentElement.onclick = () => {
  1334. location.href = location.origin + location.pathname;
  1335. };
  1336. }
  1337.  
  1338.  
  1339. function baiduWenku() {
  1340. // 取得页码,创建全局对象
  1341. window.free_page = window.pageData.readerInfo.freePage;
  1342. window.all_page = window.pageData.readerInfo.page;
  1343. window.baiduJS = {
  1344. finished: false, // 文档页是否全部冻结
  1345. free_page: window.free_page, // 免费页数
  1346. all_page: window.all_page, // 全部页数
  1347. scroll_count: 0, // 滚动事件触发次数
  1348. page_gap: 0, // 页间距
  1349. oldTech: baiduWenkuOld // 旧版主函数入口
  1350. };
  1351.  
  1352. // 便捷选择器
  1353. window.$ = (s) => {
  1354. return document.querySelectorAll(s);
  1355. };
  1356. // 允许打印页面
  1357. utils.allowPrint();
  1358. better();
  1359.  
  1360. // 居中文档
  1361. centerDoc();
  1362.  
  1363. // 增加预览功能
  1364. setTimeout(readAll$1, 500);
  1365. }
  1366.  
  1367. /**
  1368. * 多元素选择器
  1369. * @param {string} s
  1370. * @returns {NodeListOf<Element>} elements
  1371. */
  1372. let $$1 = (s) => {
  1373. return document.querySelectorAll(s);
  1374. };
  1375.  
  1376.  
  1377. // 全局对象
  1378. globalThis.doc88JS = {
  1379. last_copy_time: 0 // 上一次 ctrl + c 的时间戳(毫秒)
  1380. };
  1381.  
  1382.  
  1383. /**
  1384. * 展开道客巴巴的文档
  1385. */
  1386. function readAllDoc88() {
  1387. // 获取“继续阅读”按钮
  1388. let continue_btn = document.querySelector("#continueButton");
  1389. // 如果存在“继续阅读”按钮
  1390. if (continue_btn) {
  1391. // 跳转到文末(等同于展开全文)
  1392. let cur_page = document.querySelector("#pageNumInput");
  1393. // 取得最大页码
  1394. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1395. // 跳转到尾页
  1396. utils.jump2pageNo(cur_page, page_max, "keypress");
  1397. // 返回顶部
  1398. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1399. }
  1400. // 文档展开后,显示按钮2、3
  1401. else {
  1402. // 隐藏按钮
  1403. utils.toggleBtnStatus("btn_1");
  1404. // 显示按钮
  1405. utils.toggleBtnStatus("btn_2");
  1406. utils.toggleBtnStatus("btn_3");
  1407. utils.toggleBtnStatus("btn_4");
  1408. }
  1409. }
  1410.  
  1411.  
  1412. /**
  1413. * 隐藏搜索框
  1414. */
  1415. async function hideSearchBox() {
  1416. let s = "#min-search-result";
  1417. let hide = (elem) => {
  1418. elem.style.display = "none";
  1419. };
  1420. utils.manipulateElem(s, hide);
  1421. }
  1422.  
  1423.  
  1424. /**
  1425. * 移除vip复制弹窗
  1426. */
  1427. async function removeCopyPopup() {
  1428. let s = "#ym-window";
  1429. let remove = (elem) => {
  1430. let popup = elem.parentElement;
  1431. utils.tryToRemoveElement(popup);
  1432. };
  1433. utils.manipulateElem(s, remove);
  1434. }
  1435.  
  1436.  
  1437. /**
  1438. * 隐藏选择文字的弹窗
  1439. */
  1440. async function hideSelectPopup() {
  1441. let s = "#left-menu";
  1442. let hide = (elem) => {
  1443. elem.style.zIndex = -1;
  1444. };
  1445. utils.manipulateElem(s, hide);
  1446. }
  1447.  
  1448.  
  1449. /**
  1450. * 只会执行一次的初始化任务
  1451. */
  1452. async function lazyService() {
  1453. // 只允许执行一次
  1454. let counter = Symbol.for("counter");
  1455. if (globalThis[counter]) {
  1456. return;
  1457. }
  1458. globalThis[counter] = true;
  1459.  
  1460. // 初始化
  1461. console.log("正在执行初始化任务");
  1462. // 1. 隐藏选中文字的提示框
  1463. hideSelectPopup();
  1464. // 2. 隐藏搜索框
  1465. hideSearchBox();
  1466. // 3. 移除vip复制弹窗
  1467. removeCopyPopup();
  1468. }
  1469.  
  1470.  
  1471. /**
  1472. * 使用过时的execCommand复制文字
  1473. * @param {string} text
  1474. */
  1475. function textToClipBoardOldTech(text) {
  1476. let input = document.createElement("input");
  1477. input.value = text;
  1478. document.body.appendChild(input);
  1479. input.select();
  1480. document.execCommand("copy");
  1481. input.remove();
  1482. }
  1483.  
  1484.  
  1485. /**
  1486. * 复制选中的文字
  1487. * @returns
  1488. */
  1489. function copySelected() {
  1490. // 执行一次初始化任务
  1491. lazyService();
  1492.  
  1493. // 尚未选中文字
  1494. if (getComputedStyle($$1("#left-menu")[0]).display === "none") {
  1495. console.log("尚未选中文字");
  1496. return;
  1497. }
  1498. // 选中文字
  1499. // 搜索文字,弹出搜索框
  1500. let search = $$1("#lmenu_search")[0];
  1501. search.click();
  1502. // 取得input内容
  1503. let input = $$1(".min-text input")[0];
  1504. let text = input.value;
  1505. // 输出到控制台和剪贴板
  1506. console.log(text);
  1507. if (!navigator.clipboard) {
  1508. textToClipBoardOldTech(text);
  1509. return;
  1510. } navigator.clipboard.writeText(text).catch(textToClipBoardOldTech);
  1511. // 清空input
  1512. input.value = "";
  1513. }
  1514.  
  1515.  
  1516. /**
  1517. * 捕获 ctrl + c 并关闭弹窗
  1518. * @param {KeyboardEvent} keydown
  1519. * @returns
  1520. */
  1521. function catchCtrlC(keydown) {
  1522. // 判断是否为 ctrl + c
  1523. if (!(keydown.code === "KeyC" && keydown.ctrlKey === true)) {
  1524. return;
  1525. }
  1526.  
  1527. // 判断触发间隔
  1528. let now = Date.now();
  1529.  
  1530. // 距离上次小于1秒
  1531. if (now - doc88JS.last_copy_time < 1000 * 1) {
  1532. doc88JS.last_copy_time = now;
  1533. return;
  1534. }
  1535.  
  1536. // 大于1秒
  1537. // 刷新最近一次触发时间
  1538. doc88JS.last_copy_time = now;
  1539. // 复制文字
  1540. copySelected();
  1541. }
  1542.  
  1543.  
  1544. /**
  1545. * 道客巴巴文档下载策略
  1546. */
  1547. async function doc88() {
  1548. // 创建脚本启动按钮1、2
  1549. utils.createBtns();
  1550.  
  1551. // 绑定主函数
  1552. let prepare = function() {
  1553. // 获取canvas元素列表
  1554. let node_list = document.querySelectorAll(".inner_page");
  1555. // 获取文档标题
  1556. let title;
  1557. if (document.querySelector(".doctopic h1")) {
  1558. title = document.querySelector(".doctopic h1").title;
  1559. } else {
  1560. title = "文档";
  1561. }
  1562. return [node_list, title];
  1563. };
  1564.  
  1565. // btn_1: 展开文档
  1566. utils.setBtnEvent(() => {
  1567. readAllDoc88();
  1568. }, [], "btn_1");
  1569.  
  1570. // btn_2: 导出zip
  1571. utils.setBtnEvent(() => {
  1572. if (confirm("确定每页内容都加载完成了吗?")) {
  1573. utils.saveCanvasesToZip(...prepare());
  1574. }
  1575. }, [], "btn_2", "导出图片到zip");
  1576. // btn_3: 导出PDF
  1577. utils.setBtnEvent(() => {
  1578. if (confirm("确定每页内容都加载完成了吗?")) {
  1579. utils.saveCanvasesToPDF(...prepare());
  1580. }
  1581. }, [], "btn_3", "导出图片到PDF");
  1582.  
  1583. // btn_4: 复制选中文字
  1584. utils.setBtnEvent(() => {
  1585. copySelected();
  1586. utils.modifyBtnText("btn_4", "复制成功!", false, false);
  1587. }, [], "btn_4", "复制选中文字");
  1588. // 为 ctrl + c 添加响应
  1589. document.addEventListener("keydown", catchCtrlC);
  1590. }
  1591.  
  1592. // 绑定主函数
  1593. function getCanvasList() {
  1594. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1595. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1596. let node_list = [];
  1597. for (let node of parent_node_list) {
  1598. node_list.push(node.children[0]);
  1599. }
  1600. return node_list;
  1601. }
  1602.  
  1603.  
  1604. function prepare() {
  1605. // 获取canvas元素列表
  1606. let node_list = getCanvasList();
  1607. // 获取文档标题
  1608. let title;
  1609. if (document.querySelector("h1 [title=doc]")) {
  1610. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1611. } else if (document.querySelector(".doc_title")) {
  1612. title = document.querySelector(".doc_title").textContent;
  1613. } else {
  1614. title = "文档";
  1615. }
  1616. return [node_list, title];
  1617. }
  1618.  
  1619.  
  1620. // 判断是否有canvas元素
  1621. function detectCanvas() {
  1622. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1623.  
  1624. // 隐藏按钮
  1625. utils.toggleBtnStatus("btn_1");
  1626. // 显示按钮
  1627. utils.toggleBtnStatus("btn_2");
  1628.  
  1629. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1630. if (!haveCanvas) {
  1631. // btn_2: 导出图片链接
  1632. utils.setBtnEvent(() => {
  1633. if (confirm("确定每页内容都加载完成了吗?")) {
  1634. utils.savePicUrls("[id*=img_]");
  1635. }
  1636. }, [], "btn_2", "导出全部图片链接");
  1637. } else {
  1638. // 显示按钮3
  1639. utils.toggleBtnStatus("btn_3");
  1640. // btn_2: 导出zip
  1641. utils.setBtnEvent(() => {
  1642. if (confirm("确定每页内容都加载完成了吗?")) {
  1643. utils.saveCanvasesToZip(...prepare());
  1644. }
  1645. }, [], "btn_2", "导出图片到zip");
  1646. // btn_3: 导出PDF
  1647. utils.setBtnEvent(() => {
  1648. if (confirm("确定每页内容都加载完成了吗?")) {
  1649. utils.saveCanvasesToPDF(...prepare());
  1650. }
  1651. }, [], "btn_3", "导出图片到PDF");
  1652. }
  1653. }
  1654.  
  1655.  
  1656. /**
  1657. * 豆丁文档下载策略
  1658. */
  1659. function docin() {
  1660. // 创建脚本启动按钮
  1661. utils.createBtns();
  1662.  
  1663. // 隐藏底部工具栏
  1664. document.querySelector("#j_select").click(); // 选择指针
  1665. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1666. tool_bar.style.display = "none";
  1667.  
  1668. // btn_1: 判断文档类型
  1669. utils.setBtnEvent(() => {
  1670. utils.forceHide(".jz_watermark");
  1671. detectCanvas();
  1672. }, [], "btn_1", "判断文档类型");
  1673. }
  1674.  
  1675. function jumpToHost() {
  1676. // https://swf.ishare.down.sina.com.cn/1DrH4Qt2cvKd.jpg?ssig=DUf5x%2BXnKU&Expires=1673867307&KID=sina,ishare&range={}-{}
  1677. let url = wk$(".data-detail img, .data-detail embed")[0].src;
  1678. if (!url) {
  1679. alert("找不到图片元素");
  1680. return;
  1681. }
  1682.  
  1683. let url_obj = new URL(url);
  1684. let path = url_obj.pathname.slice(1);
  1685. let query = url_obj.search.slice(1).split("&range")[0];
  1686. let title = document.title.split(" - ")[0];
  1687. let target = `${url_obj.protocol}//${url_obj.host}?path=${path}&fname=${title}&${query}`;
  1688. // https://swf.ishare.down.sina.com.cn/
  1689. globalThis.open(target, "hostage");
  1690. // 然后在跳板页面发起对图片的请求
  1691. }
  1692.  
  1693.  
  1694. /**
  1695. * 爱问文库下载跳转策略
  1696. */
  1697. function ishare() {
  1698. // 创建按钮区
  1699. utils.createBtns();
  1700.  
  1701. // btn_1: 识别文档类型 -> 导出PDF
  1702. utils.setBtnEvent(jumpToHost, [], "btn_1", "到下载页面");
  1703. // btn_2: 不支持爱问办公
  1704. utils.setBtnEvent(() => null, [], "btn_2", "不支持爱问办公");
  1705. // utils.toggleBtnStatus("btn_4");
  1706. }
  1707.  
  1708. /**
  1709. * 返回子串个数
  1710. * @param {string} str
  1711. * @param {string} sub
  1712. */
  1713. function countSubStr(str, sub) {
  1714. let i = 0;
  1715. let counter = 0;
  1716.  
  1717. while (true) {
  1718. i = str.indexOf(sub, i);
  1719. if (i === -1) {
  1720. return counter;
  1721. } else {
  1722. i++;
  1723. counter++;
  1724. }
  1725. }
  1726. }
  1727.  
  1728.  
  1729. /**
  1730. * 统计svg数量
  1731. * @param {string} data
  1732. * @returns {number} num
  1733. */
  1734. function countSVG(data) {
  1735. return countSubStr(data, "<!DOCTYPE svg");
  1736.  
  1737. }
  1738.  
  1739.  
  1740. /**
  1741. * 返回包含对于数量svg元素的html元素
  1742. * @param {string} data
  1743. * @returns {HTMLDivElement} article
  1744. */
  1745. function _createDiv(data) {
  1746. let num = countSVG(data);
  1747.  
  1748. let article = document.createElement("div");
  1749. article.id = "article";
  1750. article.innerHTML = `
  1751. <style class="wk-settings">
  1752. body {
  1753. width: 100%;
  1754. background-color: rgb(95,99,104);
  1755. }
  1756. #article {
  1757. width: 100%;
  1758. display: flex;
  1759. flex-direction: row;
  1760. justify-content: space-around;
  1761. }
  1762. #root-box {
  1763. height: fit-content;
  1764. display: flex;
  1765. flex-direction: column;
  1766. background-color: white;
  1767. }
  1768. .gap {
  1769. height: 50px;
  1770. width: 100%;
  1771. background-color: transparent;
  1772. }
  1773. </style>
  1774. <div id="root-box">
  1775. ${
  1776. `<object class="svg-box"></object>
  1777. <div class="gap"></div>`.repeat(num)
  1778. }
  1779. `;
  1780. // 移除最后一个多出的gap
  1781. Array.from(article.querySelectorAll(".gap")).at(-1).remove();
  1782. return article;
  1783. }
  1784.  
  1785.  
  1786. function setGap(height) {
  1787. let style = wk$(".wk-settings")[0].innerHTML;
  1788. wk$(".wk-settings")[0].innerHTML = style.replace(
  1789. /[.]gap.*?{.*?height:.+?;/s,
  1790. `.gap { height: ${parseInt(height)}px;`
  1791. );
  1792. }
  1793.  
  1794.  
  1795. function setGapGUI() {
  1796. let now = getComputedStyle(wk$(".gap")[0]).height;
  1797. let new_h = prompt(`当前间距:${now}\n请输入新间距:`);
  1798. if (new_h) {
  1799. setGap(new_h);
  1800. }
  1801. }
  1802.  
  1803.  
  1804. /**
  1805. * 处理svg的url
  1806. * @param {string} svg_url
  1807. */
  1808. async function handleSVGurl(svg_url) {
  1809. let resp = await fetch(svg_url);
  1810. let data = await resp.text();
  1811.  
  1812. let sep = "<!DOCTYPE svg";
  1813. let svg_texts = data
  1814. .split(sep)
  1815. .slice(1)
  1816. .map(svg_text => sep + svg_text);
  1817.  
  1818. console.log(`共 ${svg_texts.length} 张图片`);
  1819.  
  1820. let article = _createDiv(data);
  1821. let boxes = article.querySelectorAll(".svg-box");
  1822. boxes.forEach((obj, i) => {
  1823. let blob = new Blob([svg_texts[i]], {type: "image/svg+xml"});
  1824. let url = URL.createObjectURL(blob);
  1825. obj.data = url;
  1826. URL.revokeObjectURL(blob);
  1827. });
  1828.  
  1829. let body = wk$("body")[0];
  1830. body.innerHTML = "";
  1831. body.appendChild(article);
  1832.  
  1833. utils.createBtns();
  1834. utils.setBtnEvent(utils.hideBtnThenPrint, [], "btn_1", "打印页面到PDF");
  1835. utils.setBtnEvent(setGapGUI, [], "btn_2", "重设页间距");
  1836.  
  1837. utils.toggleBtnStatus("btn_2");
  1838. console.log("请按下【CTRL + P】以打印页面");
  1839. }
  1840.  
  1841.  
  1842. /**
  1843. * 取得图片下载地址
  1844. * @param {string} fname
  1845. * @param {string} path
  1846. * @returns
  1847. */
  1848. function getImgUrl(fname, path) {
  1849. if (!fname) {
  1850. throw new Error("URL Param `fname` does not exist.");
  1851. }
  1852. return location.href
  1853. .replace(/[?].+?&ssig/, "?ssig")
  1854. .replace("?", path + "?");
  1855. }
  1856.  
  1857.  
  1858. /**
  1859. * 下载整个图片包
  1860. * @param {string} img_url
  1861. * @returns
  1862. */
  1863. async function getData(img_url) {
  1864. let resp = await fetch(img_url);
  1865. let buffer = await resp.arrayBuffer();
  1866. return new Uint8Array(buffer);
  1867. }
  1868.  
  1869.  
  1870. /**
  1871. * 分切图片包为若干图片
  1872. * @param {Uint8Array} data 多张图片合集数据包
  1873. * @returns {Array<Uint8Array>} 图片列表
  1874. */
  1875. function parseData(data) {
  1876. // 判断图像类型/拿到文件头
  1877. let head = data.slice(0, 10);
  1878. // let type = getImgType(head);
  1879. let sep = head.join() + ",";
  1880. // 切断,重组,格式转换
  1881. return data.join().split(sep).slice(1).map(
  1882. val => new Uint8Array((sep + val).split(","))
  1883. );
  1884. }
  1885.  
  1886.  
  1887. /**
  1888. * 图像Uint8数组列表合并然后导出PDF
  1889. * @param {string} fname
  1890. * @param {Array<Uint8Array>} img_data_list
  1891. */
  1892. async function imgDataArrsToPDF(fname, img_data_list) {
  1893. let cover_blob = new Blob([img_data_list[0]]);
  1894. let cover = await createImageBitmap(cover_blob);
  1895.  
  1896. utils.saveCanvasesToPDF(
  1897. img_data_list,
  1898. fname,
  1899. cover.width,
  1900. cover.height
  1901. );
  1902. }
  1903.  
  1904.  
  1905. async function exportPDF() {
  1906. let fname = utils.getUrlParam("fname");
  1907. let path = utils.getUrlParam("path");
  1908. let img_url = getImgUrl(fname, path);
  1909.  
  1910. // 处理svg
  1911. if (path.includes(".svg")) {
  1912. document.title = fname;
  1913. await handleSVGurl(img_url);
  1914. return;
  1915. }
  1916. // 处理常规图像
  1917. let data = await getData(img_url);
  1918. let img_data_list = parseData(data);
  1919. console.log(`共 ${img_data_list.length} 张图片`);
  1920. await imgDataArrsToPDF(fname, img_data_list);
  1921. }
  1922.  
  1923.  
  1924. function showHints() {
  1925. wk$("h1")[0].textContent = "wk 温馨提示";
  1926. wk$("p")[0].innerHTML = [
  1927. "下载 270 页的 PPT (70 MB) 需要约 30 秒",
  1928. "请耐心等待,无需反复点击按钮",
  1929. "如果很久没反应,请加 QQ 群反馈问题"
  1930. ].join("<br>");
  1931. wk$("hr")[0].nextSibling.textContent = "403 Page Hostaged By Wenku Doc Downloader";
  1932. }
  1933.  
  1934.  
  1935. /**
  1936. * 爱问文库下载策略
  1937. */
  1938. async function ishareData() {
  1939. // 显示提示
  1940. showHints();
  1941.  
  1942. // 创建按钮区
  1943. utils.createBtns();
  1944.  
  1945. // btn_1: 识别文档类型 -> 导出PDF
  1946. exportPDF = await utils.recTime(exportPDF);
  1947. utils.setBtnEvent(exportPDF, [], "btn_1", "下载并导出PDF");
  1948. }
  1949.  
  1950. /**
  1951. * 清理并打印得力文库的文档页
  1952. */
  1953. function printPageDeliwenku() {
  1954. // 移除页面上的无关元素
  1955. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1956. let elem_list = document.querySelectorAll(selector);
  1957. for (let elem of elem_list) {
  1958. utils.tryToRemoveElement(elem);
  1959. }
  1960. // 修改页间距
  1961. let outer_pages = document.getElementsByClassName("outer_page");
  1962. for (let page of outer_pages) {
  1963. page.style.marginBottom = "20px";
  1964. }
  1965. // 使文档居中
  1966. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1967. if (!utils.centerDoc("#boxleft", "3")) {
  1968. return; // 如果输入非法,终止函数调用
  1969. }
  1970. // 打印文档
  1971. utils.hideBtnThenPrint();
  1972. }
  1973.  
  1974.  
  1975. /**
  1976. * 点击“继续阅读”,适用性:得力文库
  1977. */
  1978. function readAllDeliwenku() {
  1979. // 点击“同意并开始预览全文”
  1980. let start_btn = document.getElementsByClassName("pre_button")[0];
  1981. let display = start_btn.parentElement.parentElement.style.display;
  1982. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1983. if (!display) {
  1984. start_btn.children[0].click();
  1985. setTimeout(() => {
  1986. scroll(0, document.body.scrollHeight);
  1987. }, 200);
  1988. return;
  1989. }
  1990. // 增强按钮点击效果
  1991. utils.enhanceBtnClickReaction();
  1992.  
  1993. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1994. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1995. // 继续阅读
  1996. if (display2 !== "none") {
  1997. // 获取input元素
  1998. let cur_page = document.querySelector("#pageNumInput");
  1999. let page_old = cur_page.value;
  2000. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  2001. // 跳转到尾页
  2002. utils.jump2pageNo(cur_page, page_max, "keydown");
  2003. // 跳转回来
  2004. utils.jump2pageNo(cur_page, page_old, "keydown");
  2005.  
  2006. // 切换按钮准备导出
  2007. } else {
  2008. // 推荐导出图片链接
  2009. utils.modifyBtnText("btn_2", null, true);
  2010. // 隐藏按钮
  2011. utils.toggleBtnStatus("btn_1");
  2012. // 显示按钮
  2013. utils.toggleBtnStatus("btn_2");
  2014. utils.toggleBtnStatus("btn_3");
  2015. // btn_3 橙色按钮
  2016. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  2017. }
  2018. }
  2019.  
  2020.  
  2021. /**
  2022. * 得力文库文档下载策略
  2023. */
  2024. function deliwenku() {
  2025. // 创建脚本启动按钮1、2
  2026. utils.createBtns();
  2027.  
  2028. // btn_1: 展开文档
  2029. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  2030. // btn_2: 导出图片链接
  2031. utils.setBtnEvent(() => {
  2032. if (confirm("确定每页内容都加载完成了吗?")) {
  2033. utils.savePicUrls('.inner_page div');
  2034. }
  2035. }, [], "btn_2", "导出图片链接");
  2036.  
  2037. // 尝试关闭页面弹窗
  2038. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  2039. // 解除打印限制
  2040. utils.allowPrint();
  2041. }
  2042.  
  2043. function readAll360Doc() {
  2044. // 展开文档
  2045. document.querySelector(".article_showall a").click();
  2046. // 隐藏按钮
  2047. utils.toggleBtnStatus("btn_1");
  2048. // 显示按钮
  2049. utils.toggleBtnStatus("btn_2");
  2050. utils.toggleBtnStatus("btn_3");
  2051. }
  2052.  
  2053.  
  2054. function saveText_360Doc() {
  2055. // 捕获图片链接
  2056. let images = document.querySelectorAll("#artContent img");
  2057. let content = [];
  2058.  
  2059. for (let i = 0; i < images.length; i++) {
  2060. let src = images[i].src;
  2061. content.push(`图${i+1},链接:${src}`);
  2062. }
  2063. // 捕获文本
  2064. let text = document.querySelector("#artContent").textContent;
  2065. content.push(text);
  2066.  
  2067. // 保存纯文本文档
  2068. let title = document.querySelector("#titiletext").textContent;
  2069. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  2070. }
  2071.  
  2072.  
  2073. function printPage360Doc() {
  2074. // # 清理并打印360doc的文档页
  2075. // ## 移除页面上无关的元素
  2076. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  2077. let elem_list = document.querySelectorAll(selector);
  2078. let under_doc_1, under_doc_2;
  2079. try {
  2080. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  2081. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  2082. } catch (e) { console.log(); }
  2083. // 执行移除
  2084. for (let elem of elem_list) {
  2085. utils.tryToRemoveElement(elem);
  2086. }
  2087. utils.tryToRemoveElement(under_doc_1);
  2088. utils.tryToRemoveElement(under_doc_2);
  2089. // 执行隐藏
  2090. document.querySelector("a[title]").style.display = "none";
  2091.  
  2092. // 使文档居中
  2093. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  2094. if (!utils.centerDoc(".a_left", "20")) {
  2095. return; // 如果输入非法,终止函数调用
  2096. }
  2097. // 隐藏按钮,然后打印页面
  2098. utils.hideBtnThenPrint();
  2099. }
  2100.  
  2101.  
  2102. /**
  2103. * 360doc个人图书馆下载策略
  2104. */
  2105. function doc360() {
  2106. // 创建按钮区
  2107. utils.createBtns();
  2108. // btn_1: 展开文档
  2109. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  2110. // btn_2: 导出纯文本
  2111. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  2112. // btn_3: 打印页面到PDF
  2113. utils.setBtnEvent(() => {
  2114. if (confirm("确定每页内容都加载完成了吗?")) {
  2115. printPage360Doc();
  2116. }
  2117. }, [], "btn_3", "打印页面到PDF");
  2118. }
  2119.  
  2120. /**
  2121. * 查找出所有未被捕获的页码,并返回列表
  2122. * @returns 未捕获页码列表
  2123. */
  2124. function getMissedPages() {
  2125. let all = []; // 全部页码
  2126. for (let i = 0; i < window.mbaJS.max_page; i++) {
  2127. all[i] = i + 1;
  2128. }
  2129. let missed = []; // 未捕获页码
  2130. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  2131.  
  2132. // 排除并录入未捕获页码
  2133. for (let num of all) {
  2134. if (!possessed.includes(`page${num}`)) {
  2135. missed.push(num);
  2136. }
  2137. }
  2138. return missed;
  2139. }
  2140.  
  2141.  
  2142. /**
  2143. * 根据键中的id数字对map排序
  2144. * @param {Map} elems_map
  2145. * @returns sorted_map
  2146. */
  2147. function sortMapByID(elems_map) {
  2148. // id形式:page2
  2149. let elems_arr = Array.from(elems_map);
  2150. elems_arr.sort((item1, item2) => {
  2151. // 从key中取出id
  2152. let id1 = parseInt(item1[0].replace("page", ""));
  2153. let id2 = parseInt(item2[0].replace("page", ""));
  2154. // 升序排序
  2155. return id1 - id2;
  2156. });
  2157. // 返回排序好的map
  2158. return new Map(elems_arr);
  2159. }
  2160.  
  2161.  
  2162. /**
  2163. * 存储动态加载的canvas元素、textContent
  2164. */
  2165. function storeElements_MBA() {
  2166. let canvases_map = window.mbaJS.canvases_map;
  2167. let texts_map = window.mbaJS.texts_map;
  2168. let quality = window.mbaJS.quality;
  2169.  
  2170. document.querySelectorAll(".page[data-loaded=true]").forEach(
  2171. (elem) => {
  2172. let capture = (elem) => {
  2173. // (1) 存储页面为canvas图形
  2174. let canvas, data_base64;
  2175. // 导出canvas数据防止丢失
  2176. try {
  2177. // 存储canvas
  2178. canvas = elem.querySelector("canvas[id*=page]");
  2179. if (window.mbaJS.only_text) {
  2180. data_base64 = null;
  2181. } else {
  2182. data_base64 = canvas.toDataURL("image/jpeg", quality);
  2183. }
  2184. } catch (e) {
  2185. // utils.sleep(500);
  2186. return;
  2187. }
  2188. // 增量录入map
  2189. let id = canvas.id; // id的形式:page2
  2190. if (!canvases_map.has(id)) {
  2191. canvases_map.set(id, data_base64);
  2192. }
  2193. // 确定canvas长宽
  2194. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  2195. window.mbaJS.width = parseInt(canvas.width);
  2196. window.mbaJS.height = parseInt(canvas.height);
  2197. }
  2198.  
  2199. // (2) 存储text
  2200. let text = elem.textContent;
  2201. if (!texts_map.has(id)) {
  2202. texts_map.set(id, text);
  2203. }
  2204. };
  2205. setTimeout(capture, 500, elem);
  2206. });
  2207. if (canvases_map.size === window.mbaJS.max_page) {
  2208. // 根据id排序
  2209. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  2210. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  2211. window.mbaJS.finished = true;
  2212. window.onscroll = null;
  2213. }
  2214. }
  2215.  
  2216.  
  2217. /**
  2218. * 将canvas转为jpeg,然后导出PDF
  2219. * @param {Array} base64_list canvas元素列表
  2220. * @param {String} title 文档标题
  2221. */
  2222. function saveCanvasesToPDF_MBA(base64_list, title) {
  2223. let width = window.mbaJS.width;
  2224. let height = window.mbaJS.height;
  2225.  
  2226. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  2227. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  2228. let orientation = width > height ? 'l' : 'p';
  2229. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  2230.  
  2231. // 保存每一页文档到每一页pdf
  2232. let i = 0;
  2233. for (let base64 of base64_list) {
  2234. i += 1;
  2235. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  2236. // 如果当前不是文档最后一页,则需要添加下一个空白页
  2237. if (i < window.mbaJS.max_page) {
  2238. pdf.addPage();
  2239. }
  2240. }
  2241. // 导出文件
  2242. pdf.save(`${title}.pdf`);
  2243. }
  2244.  
  2245. /**
  2246. * 判断文档页是否收集完毕,当不行时给出提示
  2247. * @returns boolean
  2248. */
  2249. function ready2use() {
  2250. removeAds(); // 顺便清理广告
  2251. // 如果是首次点击按钮,给出提示
  2252. if (window.mbaJS.first_hint) {
  2253. let hint = [
  2254. "如果浏览速度过快,比如:",
  2255. "当前页面还没完全加载好就滚动页面去看下一页",
  2256. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  2257. "由防范技术的干扰,该功能目前很不好用,见谅"
  2258. ].join("\n");
  2259. alert(hint);
  2260. window.mbaJS.first_hint = false;
  2261. }
  2262. // 如果文档页没有收集完,给出提示
  2263. if (!window.mbaJS.finished) {
  2264. let hint = [
  2265. "仍有内容未加载完,无法使用该功能",
  2266. "建议从头到尾慢速地再浏览一遍",
  2267. "以下是没有加载完成页面的页码:",
  2268. getMissedPages().join(",")
  2269. ];
  2270. alert(hint.join("\n"));
  2271. return false;
  2272. }
  2273. return true;
  2274. }
  2275.  
  2276.  
  2277. /**
  2278. * 用捕获好的canvas转jpg,生成PDF
  2279. * @returns
  2280. */
  2281. function canvas2PDF_mba() {
  2282. if (!ready2use()) {
  2283. return;
  2284. }
  2285. let canvases = window.mbaJS.canvases_map.values();
  2286. // 导出PDF
  2287. let title = document.title.split("-")[0].trim();
  2288. saveCanvasesToPDF_MBA(canvases, title);
  2289. }
  2290.  
  2291.  
  2292. /**
  2293. * 拼合捕获好的文本,保存到txt文件
  2294. * @returns
  2295. */
  2296. function saveText_mba() {
  2297. if (!ready2use()) {
  2298. return;
  2299. }
  2300. let content = Array.from(window.mbaJS.texts_map.values());
  2301. let title = document.title.split("-")[0].trim();
  2302. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  2303. }
  2304.  
  2305.  
  2306. /**
  2307. * 移除广告
  2308. */
  2309. function removeAds() {
  2310. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  2311. utils.tryToRemoveElement(ad_elem);
  2312. });
  2313. }
  2314.  
  2315.  
  2316. function mbalib_() {
  2317. // 移除广告和左侧工具栏
  2318. removeAds();
  2319. let tool_bar = document.querySelector(".tool-bar");
  2320. utils.tryToRemoveElement(tool_bar);
  2321.  
  2322. // 创建按钮
  2323. utils.createBtns();
  2324. // 隐藏按钮
  2325. utils.toggleBtnStatus("btn_1");
  2326. // 显示按钮
  2327. utils.toggleBtnStatus("btn_2");
  2328. utils.toggleBtnStatus("btn_3");
  2329. utils.toggleBtnStatus("btn_4");
  2330.  
  2331. // 取得页数
  2332. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  2333. let quality = utils.getQualityByCanvasAmount(max_page);
  2334.  
  2335. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  2336. window.mbaJS = {
  2337. max_page: max_page,
  2338. texts_map: new Map(), // id: text
  2339. canvases_map: new Map(), // id: canvas_data_base64
  2340. quality: quality, // canvas转jpg的质量
  2341. width: null, // canvas宽度(px)
  2342. height: null,
  2343. finished: false, // 是否收集完了全部文档页元素
  2344. first_hint: true,
  2345. scroll_count: 0, // 用于统计累计触发scroll的次数,
  2346. only_text: false // 是否仅捕获文本
  2347. };
  2348. // 跟随浏览,动态收集页面元素
  2349. window.onscroll = () => {
  2350. storeElements_MBA();
  2351. };
  2352. // 跟随浏览,动态收集页面元素
  2353. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2354. // 绑定事件
  2355. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2356. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2357.  
  2358. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2359. let btn_text, aim_btn, hint;
  2360. if (max_page > 40) {
  2361. btn_text = "失效说明";
  2362. aim_btn = "btn_3";
  2363. hint = [
  2364. "页数超过40,脚本无效",
  2365. "只能使用导出文本功能",
  2366. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2367. ];
  2368. utils.setBtnEvent(
  2369. () => {
  2370. utils.toggleBtnsSec();
  2371. window.onscroll = null;
  2372. },
  2373. [],
  2374. "btn_4",
  2375. "临时禁用脚本"
  2376. );
  2377. } else {
  2378. btn_text = "空白页说明";
  2379. aim_btn = "btn_4";
  2380. hint = [
  2381. "导致空白页的原因如下",
  2382. "加载该页的时间超过2秒 / 明显等待",
  2383. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2384. ];
  2385. }
  2386.  
  2387. utils.setBtnEvent(() => {
  2388. alert(hint.join("\n"));
  2389. }, [], aim_btn, btn_text);
  2390. }
  2391.  
  2392.  
  2393. function mbalib() {
  2394. setTimeout(mbalib_, 2000);
  2395. }
  2396.  
  2397. /**
  2398. * 判断是否进入预览模式
  2399. * @returns Boolean
  2400. */
  2401. function isInPreview() {
  2402. let p_elem = document.querySelector("#preview_tips");
  2403. if (p_elem.style.display === "none") {
  2404. return true;
  2405. }
  2406. return false;
  2407. }
  2408.  
  2409.  
  2410. /**
  2411. * 判断是否展开了全文
  2412. * @returns Boolean
  2413. */
  2414. function isNoMorePage() {
  2415. let read_more = document.querySelector("#ntip2");
  2416. if (read_more.style.display === "none") {
  2417. return true;
  2418. }
  2419. return false;
  2420. }
  2421.  
  2422.  
  2423. /**
  2424. * 确保进入预览模式
  2425. */
  2426. function ensureInPreview() {
  2427. if (!isInPreview()) {
  2428. // 如果没有进入预览,则先进入
  2429. document.querySelector(".pre_button a").click();
  2430. utils.sleep(500);
  2431. }
  2432. }
  2433.  
  2434.  
  2435. /**
  2436. * 展开全文预览,当展开完成后再次调用时,返回true
  2437. * @returns
  2438. */
  2439. function unfoldAll() {
  2440. ensureInPreview();
  2441. if (isNoMorePage()) {
  2442. // 如果全文展开了,则切换按钮,然后退出
  2443. utils.toggleBtnStatus("btn_1");
  2444. utils.toggleBtnStatus("btn_2");
  2445. return true;
  2446. }
  2447. // 跳转到最后一页,以展开全文
  2448. let cur_page = document.querySelector("#pageNumInput");
  2449. utils.jump2pageNo(cur_page, "999", "keydown");
  2450. }
  2451.  
  2452.  
  2453. /**
  2454. * 取得最大页码(最大20)
  2455. * @returns {Number} 页码int
  2456. */
  2457. function getPageCounts$2() {
  2458. let counts_str = document.querySelector(".counts").textContent;
  2459. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2460. if (counts > 20) {
  2461. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2462. }
  2463. return parseInt(counts);
  2464. }
  2465.  
  2466.  
  2467. /**
  2468. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2469. * @returns Array | null
  2470. */
  2471. function getImgUrls() {
  2472. let pages = document.querySelectorAll("[id*=pageflash_]");
  2473. // 尚未浏览完全部页面,返回null
  2474. if (pages.length < window.dugenJS.page_counts) {
  2475. return null;
  2476. }
  2477. // 浏览完全部页面,返回urls
  2478. let urls = [];
  2479. pages.forEach((page) => {
  2480. let url = page.querySelector("img").src;
  2481. urls.push(url);
  2482. });
  2483. return urls;
  2484. }
  2485.  
  2486.  
  2487. /**
  2488. * 返回当前未加载页面的页码
  2489. * @returns not_loaded
  2490. */
  2491. function getNotloadedPages() {
  2492. // 已经取得的页码
  2493. let pages = document.querySelectorAll("[id*=pageflash_]");
  2494. let loaded = new Set();
  2495. pages.forEach((page) => {
  2496. let id = page.id.split("_")[1];
  2497. id = parseInt(id);
  2498. loaded.add(id);
  2499. });
  2500. // 未取得的页码
  2501. let not_loaded = [];
  2502. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2503. if (!loaded.has(i)) {
  2504. not_loaded.push(i);
  2505. }
  2506. }
  2507. return not_loaded;
  2508. }
  2509.  
  2510.  
  2511. function WantImgUrls() {
  2512. let res = getImgUrls();
  2513. // 页面尚未加载完
  2514. if (res === null) {
  2515. let hints = [
  2516. "尚未加载完全部页面",
  2517. "以下页面需要浏览并加载:",
  2518. getNotloadedPages().join(",")
  2519. ];
  2520. alert(hints.join("\n"));
  2521. return;
  2522. }
  2523. // 页面全部加载完
  2524. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2525. }
  2526.  
  2527.  
  2528. /**
  2529. * dugen文档下载策略
  2530. */
  2531. function dugen() {
  2532. ensureInPreview();
  2533. // 全局对象
  2534. window.dugenJS = {
  2535. page_counts: getPageCounts$2() // 最大页码(int)
  2536. };
  2537.  
  2538. // 创建按钮区
  2539. utils.createBtns();
  2540.  
  2541. // 绑定监听器
  2542. // 按钮1:展开文档
  2543. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2544. // 按钮2:导出图片链接
  2545. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2546. }
  2547.  
  2548. /**
  2549. * 取得文档类型
  2550. * @returns {String} 文档类型str
  2551. */
  2552. function getDocType() {
  2553. let type_elem = document.querySelector(".title .icon.icon-format");
  2554. // ["icon", "icon-format", "icon-format-doc"]
  2555. let cls_str = type_elem.classList[2];
  2556. // "icon-format-doc"
  2557. let type = cls_str.split("-")[2];
  2558. return type;
  2559. }
  2560.  
  2561.  
  2562. /**
  2563. * 判断文档类型是否为type_list其中之一
  2564. * @returns 是否为type
  2565. */
  2566. function isTypeof(type_list) {
  2567. let type = getDocType();
  2568. if (type_list.includes(type)) {
  2569. return true;
  2570. }
  2571. return false;
  2572. }
  2573.  
  2574.  
  2575. /**
  2576. * 判断文档类型是否为PPT
  2577. * @returns 是否为PPT
  2578. */
  2579. function isPPT() {
  2580. return isTypeof(["ppt", "pptx"]);
  2581. }
  2582.  
  2583.  
  2584. /**
  2585. * 判断文档类型是否为Excel
  2586. * @returns 是否为Excel
  2587. */
  2588. function isEXCEL() {
  2589. return isTypeof(["xls", "xlsm", "xlsx"]);
  2590. }
  2591.  
  2592.  
  2593. /**
  2594. * 取得最大页码
  2595. * @returns {Number} 最大页码
  2596. */
  2597. function getPageCounts$1() {
  2598. let page_counts_str = document.querySelector(".intro-list").textContent;
  2599. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2600. return page_counts;
  2601. }
  2602.  
  2603.  
  2604. /**
  2605. * 取得未加载页面的页码
  2606. * @param {Set} loaded 已加载的页码集合
  2607. * @returns {Array} not_loaded 未加载页码列表
  2608. */
  2609. function getNotLoaded(loaded) {
  2610. let not_loaded = [];
  2611. let page_counts = window.book118JS.page_counts;
  2612. for (let i = 1; i <= page_counts; i++) {
  2613. if (!loaded.has(i)) {
  2614. not_loaded.push(i);
  2615. }
  2616. }
  2617. return not_loaded;
  2618. }
  2619.  
  2620.  
  2621. /**
  2622. * 取得全部文档页的url
  2623. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2624. */
  2625. function getUrls() {
  2626. let loaded = new Set(); // 存储已加载页面的页码
  2627. let urls = []; // 存储已加载页面的图形src
  2628. // 收集已加载页面的url
  2629. document.querySelectorAll("div[data-id]").forEach((div) => {
  2630. let src = div.querySelector("img").src;
  2631. if (src) {
  2632. // "1": "https://view-cache.book118.com/..."
  2633. loaded.add(parseInt(div.getAttribute("data-id")));
  2634. urls.push(src);
  2635. }
  2636. });
  2637. // 如果所有页面加载完毕
  2638. if (loaded.size === window.book118JS.page_counts) {
  2639. return [true, urls];
  2640. }
  2641. // 否则收集未加载页面的url
  2642. return [false, getNotLoaded(loaded)];
  2643. }
  2644.  
  2645.  
  2646. /**
  2647. * 展开全文
  2648. */
  2649. function readAll() {
  2650. window.preview.jump(999);
  2651. }
  2652.  
  2653.  
  2654. /**
  2655. * btn_2: 导出图片链接
  2656. */
  2657. function wantUrls() {
  2658. let [flag, res] = getUrls();
  2659. // 页面都加载完毕,下载urls
  2660. if (flag) {
  2661. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2662. return;
  2663. }
  2664. // 没有加载完,提示出未加载好的页码
  2665. let hints = [
  2666. "仍有页面没有加载",
  2667. "请浏览并加载如下页面:",
  2668. res.join(",")
  2669. ];
  2670. alert(hints.join("\n"));
  2671. }
  2672.  
  2673.  
  2674. /**
  2675. * 打开PPT预览页面
  2676. */
  2677. function openPPTpage() {
  2678. window.preview.getSrc();
  2679. let openPPT = () => {
  2680. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2681. utils.openInNewTab(ppt_src);
  2682. window.preview.close();
  2683. };
  2684. setTimeout(openPPT, 1000);
  2685. }
  2686.  
  2687.  
  2688. /**
  2689. * 原创力文档(非PPT或Excel)下载策略
  2690. */
  2691. function book118_CommonDoc() {
  2692. // 创建全局对象
  2693. window.book118JS = {
  2694. doc_type: getDocType(),
  2695. page_counts: getPageCounts$1()
  2696. };
  2697.  
  2698. // 处理非PPT文档
  2699. // 创建按钮组
  2700. utils.createBtns();
  2701. // 绑定监听器到按钮
  2702. // 按钮1:展开文档
  2703. utils.setBtnEvent(() => {
  2704. readAll();
  2705. utils.toggleBtnStatus("btn_1");
  2706. utils.toggleBtnStatus("btn_2");
  2707. }, [], "btn_1");
  2708. // 按钮2:导出图片链接
  2709. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2710. }
  2711.  
  2712.  
  2713. /**
  2714. * 取得PPT文档最大页码
  2715. * @returns PPT文档最大页码int
  2716. */
  2717. function getPageCountsPPT() {
  2718. let counts_str = document.querySelector("#PageCount").textContent;
  2719. let counts = parseInt(counts_str);
  2720. // console.log(`get page counts: ${counts}`);
  2721. return counts;
  2722. }
  2723.  
  2724.  
  2725. /**
  2726. * 取得当前的页码
  2727. * @returns {Number} this_page
  2728. */
  2729. function getThisPage() {
  2730. let this_page = document.querySelector("#PageIndex").textContent;
  2731. this_page = parseInt(this_page);
  2732. return this_page;
  2733. }
  2734.  
  2735.  
  2736. /**
  2737. * 点击下一动画直到变成下一页,再切回上一页
  2738. * @param {Number} next_page 下一页的页码
  2739. */
  2740. async function __nextFrameUntillNextPage(next_page) {
  2741. // 如果已经抵达下一页,则返回上一页
  2742. let this_page = getThisPage();
  2743.  
  2744. // 最后一页直接退出
  2745. if (next_page > getPageCountsPPT()) {
  2746. return;
  2747. }
  2748. // 不是最后一页,但完成了任务
  2749. else if (this_page === next_page) {
  2750. document.querySelector(".btmLeft").click();
  2751. await utils.sleepAsync(500);
  2752. return;
  2753. }
  2754. // 否则递归的点击下一动画
  2755. document.querySelector(".btmRight").click();
  2756. await utils.sleepAsync(500);
  2757. await __nextFrameUntillNextPage(next_page);
  2758. }
  2759.  
  2760.  
  2761. /**
  2762. * 确保当前页面是最后一帧动画
  2763. */
  2764. async function ensurePageLoaded() {
  2765. // 取得当前页码和下一页页码
  2766. let this_page = getThisPage();
  2767. let next_page = this_page + 1;
  2768. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2769. await __nextFrameUntillNextPage(next_page);
  2770. }
  2771.  
  2772.  
  2773. /**
  2774. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2775. */
  2776. async function docView2Canvas() {
  2777. await ensurePageLoaded();
  2778. // 取得页码
  2779. let cur_page = getThisPage();
  2780. // 取得视图元素,计数从0开始
  2781. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2782. // 转化为canvas
  2783. let canvas_promise = html2canvas(doc_view);
  2784. console.log(canvas_promise); // 打印信息以检查状况
  2785.  
  2786. await canvas_promise.then((canvas) => {
  2787. // 保存canvas到全局对象
  2788. window.book118JS.canvases.push(canvas);
  2789. // 打印日志
  2790. console.log(`wk: ${cur_page} complete`);
  2791. });
  2792.  
  2793. // 如果到最后一页
  2794. let page_counts = getPageCountsPPT();
  2795. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2796. if (cur_page === page_counts) {
  2797. // 终止递归,并且显示导出PDF按钮
  2798. utils.toggleBtnStatus("btn_2");
  2799. return;
  2800. }
  2801. // 否则下一次递归(继续捕获下一页)
  2802. document.querySelector(".pgRight").click();
  2803. await utils.sleepAsync(500);
  2804. await docView2Canvas();
  2805. }
  2806.  
  2807.  
  2808. /**
  2809. * 将捕获的canvases合并并导出为pdf
  2810. * @returns
  2811. */
  2812. function canvases2pdf() {
  2813. // 已经捕获的页面数量
  2814. let stored_amount = window.book118JS.canvases.length;
  2815. // 总页面数量
  2816. let page_counts = window.book118JS.page_counts;
  2817. // 校验数量
  2818. let diff = page_counts - stored_amount;
  2819. if (diff > 0) {
  2820. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2821. if (!confirm("是否仍要导出PDF?")) {
  2822. // 不坚持导出PDF的情况
  2823. return;
  2824. }
  2825. }
  2826. // 导出PDF
  2827. let canvases = window.book118JS.canvases;
  2828. // 取得宽高
  2829. let model = canvases[0];
  2830. let width = model.width;
  2831. let height = model.height;
  2832. // 取得标题然后导出pdf
  2833. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2834. }
  2835.  
  2836.  
  2837. /**
  2838. * 原创力文档(PPT)下载策略
  2839. */
  2840. function book118_PPT() {
  2841. // 创建全局对象
  2842. window.book118JS = {
  2843. page_counts: getPageCountsPPT(),
  2844. canvases: [] // 存储每页文档转化的canvas
  2845. };
  2846.  
  2847. // 创建按钮区
  2848. utils.createBtns();
  2849. // 绑定监听器到按钮1
  2850. utils.setBtnEvent(() => {
  2851. let hints = [
  2852. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2853. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2854. ];
  2855. alert(hints.join("\n"));
  2856. // 隐藏按钮1
  2857. utils.toggleBtnStatus("btn_1");
  2858. // 开始捕获页面(异步)
  2859. docView2Canvas(window.book118JS.page_counts);
  2860. }, [], "btn_1", "捕获页面");
  2861. // 为按钮2绑定监听器
  2862. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2863. }
  2864.  
  2865.  
  2866. /**
  2867. * 取得当前页面的excel,返回csv string
  2868. * @returns {String} csv
  2869. */
  2870. function excel2CSV() {
  2871. let table = [];
  2872. let rows = document.querySelectorAll("tr[id]");
  2873.  
  2874. // 遍历行
  2875. for (let row of rows) {
  2876. let csv_row = [];
  2877. // 遍历列(单元格)
  2878. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2879. // 判断单元格是否存储图片
  2880. let img = cell.querySelector("img");
  2881. if (img) {
  2882. // 如果是图片,保存图片链接
  2883. csv_row.push(img.src);
  2884. } else {
  2885. // 否则保存单元格文本
  2886. csv_row.push(cell.textContent);
  2887. }
  2888. }
  2889. table.push(csv_row.join(","));
  2890. }
  2891.  
  2892. let csv = table.join("\n");
  2893. csv = csv.replace(/\n{2,}/g, "\n");
  2894. return csv;
  2895. }
  2896.  
  2897.  
  2898. /**
  2899. * 下载当前表格内容,保存为csv(utf-8编码)
  2900. */
  2901. function wantEXCEL() {
  2902. let file_name = "原创力表格_UTF-8.csv";
  2903. utils.createAndDownloadFile(file_name, excel2CSV());
  2904. }
  2905.  
  2906.  
  2907. /**
  2908. * 在Excel预览页面给出操作提示
  2909. */
  2910. function help() {
  2911. let hints = [
  2912. "【导出表格到CSV】只能导出当前sheet,",
  2913. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2914. "CSV是一种简单的表格格式,可以被Excel打开,",
  2915. "并转为 xls 或 xlsx 格式存储,",
  2916. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2917. "",
  2918. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2919. "有两个办法:",
  2920. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2921. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2922. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2923. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2924. ];
  2925. alert(hints.join("\n"));
  2926. }
  2927.  
  2928.  
  2929. /**
  2930. * 原创力文档(EXCEL)下载策略
  2931. */
  2932. function book118_EXCEL() {
  2933. // 创建按钮区
  2934. utils.createBtns();
  2935. // 绑定监听器到按钮
  2936. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2937. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2938. // 显示按钮
  2939. utils.toggleBtnStatus("btn_2");
  2940. }
  2941.  
  2942.  
  2943. /**
  2944. * 打开Excel预览页面
  2945. */
  2946. function openEXCELpage() {
  2947. openPPTpage();
  2948. }
  2949.  
  2950.  
  2951. /**
  2952. * 原创力文档下载策略
  2953. */
  2954. function book118() {
  2955. let host = window.location.hostname;
  2956. if (host === 'max.book118.com') {
  2957. if (isEXCEL()) {
  2958. utils.createBtns();
  2959. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2960. } else if (isPPT()) {
  2961. utils.createBtns();
  2962. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2963. } else {
  2964. book118_CommonDoc();
  2965. }
  2966. } else if (host === "view-cache.book118.com") {
  2967. book118_PPT();
  2968. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2969. book118_EXCEL();
  2970. } else {
  2971. console.log(`wk: Unknown host: ${host}`);
  2972. }
  2973. }
  2974.  
  2975. // test url: https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=E86BBCE32DA8E67F3DA04ED98F2465DB
  2976.  
  2977.  
  2978. /**
  2979. * 绘制0x0的bmp, 作为请求失败时返回的page
  2980. * @returns {Promise<ImageBitmap>} blank_page
  2981. */
  2982. async function blankBMP() {
  2983. let canvas = document.createElement("canvas");
  2984. [canvas.width, canvas.height] = [0, 0];
  2985. return createImageBitmap(canvas);
  2986. }
  2987.  
  2988.  
  2989. /**
  2990. * resp导出bmp
  2991. * @param {string} page_url
  2992. * @param {Promise<Response> | ImageBitmap} pms_or_bmp
  2993. * @returns {Promise<ImageBitmap>} page
  2994. */
  2995. async function respToPage(page_url, pms_or_bmp) {
  2996. let center = globalThis.gb688JS;
  2997. // 此时是bmp
  2998. if (pms_or_bmp instanceof ImageBitmap) {
  2999. return pms_or_bmp;
  3000. }
  3001.  
  3002. // 第一次下载, 且无人处理
  3003. if (!center.pages_status.get(page_url)) {
  3004. // 处理中, 设为占用
  3005. center.pages_status.set(page_url, 1);
  3006.  
  3007. // 处理
  3008. let resp;
  3009. try {
  3010. resp = await pms_or_bmp;
  3011. } catch(err) {
  3012. console.log("下载页面失败");
  3013. console.error(err);
  3014. return blankBMP();
  3015. }
  3016.  
  3017. let page_blob = await resp.blob();
  3018. let page = await createImageBitmap(page_blob);
  3019. center.pages.set(page_url, page);
  3020. // 处理结束, 设为释放
  3021. center.pages_status.set(page_url, 0);
  3022. return page;
  3023. }
  3024.  
  3025. // 有人正在下载且出于处理中
  3026. while (center.pages_status.get(page_url)) {
  3027. await utils.sleepAsync(500);
  3028. }
  3029. return center.pages.get(page_url);
  3030. }
  3031.  
  3032.  
  3033. /**
  3034. * 获得PNG页面
  3035. * @param {string} page_url
  3036. * @returns {Promise<ImageBitmap>} bmp
  3037. */
  3038. async function getPage(page_url) {
  3039. // 如果下载过, 直接返回缓存
  3040. let pages = globalThis.gb688JS.pages;
  3041. if (pages.has(page_url)) {
  3042. return respToPage(page_url, pages.get(page_url));
  3043. }
  3044.  
  3045. // 如果从未下载过, 就下载
  3046. let resp = fetch(page_url, {
  3047. "headers": {
  3048. "accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
  3049. "accept-language": "zh-CN,zh;q=0.9,en;q=0.8",
  3050. "proxy-connection": "keep-alive"
  3051. },
  3052. "referrer": location.href,
  3053. "referrerPolicy": "strict-origin-when-cross-origin",
  3054. "body": null,
  3055. "method": "GET",
  3056. "mode": "cors",
  3057. "credentials": "include"
  3058. });
  3059. pages.set(page_url, resp);
  3060. return respToPage(page_url, resp);
  3061. }
  3062.  
  3063.  
  3064. /**
  3065. * 返回文档页div的裁切和粘贴位置信息: [[cut_x, cut_y, paste_x%, paset_y%],...]
  3066. * @param {HTMLDivElement} page_div 文档页元素
  3067. * @returns {Array<Array<number>>} positions
  3068. */
  3069. function getPostions(page_div) {
  3070. let positions = [];
  3071.  
  3072. Array.from(page_div.children).forEach(span => {
  3073. // 'pdfImg-3-8' -> {left: 30%; top: 80%;}
  3074. let paste_pos = span.className.split("-").slice(1).map(
  3075. v => parseInt(v) / 10
  3076. );
  3077. // '-600px 0px' -> [600, 0]
  3078. let cut_pos = span.style.backgroundPosition.split(" ").map(
  3079. v => Math.abs(parseInt(v))
  3080. );
  3081. positions.push([...cut_pos, ...paste_pos]);
  3082. });
  3083. return positions;
  3084. }
  3085.  
  3086.  
  3087. /**
  3088. * 取得文档页的图像url
  3089. * @param {HTMLDivElement} page_div
  3090. * @returns {string} url
  3091. */
  3092. function getPageURL(page_div) {
  3093. // 拿到目标图像url
  3094. let path = location.pathname.split("/").slice(0, -1).join("/");
  3095. let prefix = location.origin + path + "/";
  3096. let url = page_div.getAttribute("bg");
  3097. if (!url) {
  3098. // 'url("viewGbImg?fileName=VS72l67k0jw5g3j0vErP8DTsnWvk5QsqnNLLxaEtX%2FM%3D")'
  3099. url = page_div.children[0].style.backgroundImage.split('"')[1];
  3100. }
  3101. return prefix + url;
  3102. }
  3103.  
  3104.  
  3105. /**
  3106. * 下载目标图像并拆解重绘, 返回canvas
  3107. * @param {number} i 第 i 页 (从0开始)
  3108. * @param {HTMLDivElement} page_div
  3109. * @returns {Promise<Array>} [页码, Canvas]
  3110. */
  3111. async function getAndDrawPage(i, page_div) {
  3112. // 拿到目标图像
  3113. let url = getPageURL(page_div);
  3114. let page = await getPage(url);
  3115.  
  3116. // 绘制空白A4纸背景
  3117. let [page_w, page_h] = [1190, 1680];
  3118. let bg = document.createElement("canvas");
  3119. bg.width = page_w; // 注意canvas作为取景框的大小
  3120. bg.height = page_h; // 如果不设置等于一个很小的取景框
  3121. let bg_ctx = bg.getContext("2d");
  3122. bg_ctx.fillStyle = "white";
  3123. bg_ctx.fillRect(0, 0, page_w, page_h);
  3124.  
  3125. // 逐个区块剪切取出并粘贴
  3126. // wk$("#viewer .page").forEach(page_div => {
  3127. getPostions(page_div).forEach(pos => {
  3128. bg_ctx.drawImage(
  3129. page, // image source
  3130. pos[0], // source x
  3131. pos[1], // source y
  3132. 120, // source width
  3133. 169, // source height
  3134. pos[2] * page_w, // destination x = left: x%
  3135. pos[3] * page_h, // destination y = top: y%
  3136. 120, // destination width
  3137. 169 // destination height
  3138. );
  3139. });
  3140. // });
  3141. return [i, bg];
  3142. }
  3143.  
  3144.  
  3145. /**
  3146. * 页面批量请求、裁剪重绘, 合成PDF并下载
  3147. */
  3148. async function turnPagesToPDF() {
  3149. // 渲染每页
  3150. let tasks = [];
  3151. wk$("#viewer .page").forEach((page_div, i) => {
  3152. tasks.push(
  3153. getAndDrawPage(i, page_div)
  3154. );
  3155. });
  3156. // 等待每页渲染完成后,排序
  3157. let results = await Promise.all(tasks);
  3158. results.sort((prev, next) => prev[0] - next[0]);
  3159. // 合并为PDF并导出
  3160. utils.saveCanvasesToPDF(
  3161. results.map(item => item[1]),
  3162. // '在线预览|GB 14023-2022'
  3163. document.title.split("|")[1]
  3164. );
  3165. }
  3166.  
  3167.  
  3168. /**
  3169. * 提示预估下载耗时,然后下载
  3170. */
  3171. function hintThenDownload$1() {
  3172. // '/93'
  3173. let page_num = parseInt(wk$("#numPages")[0].textContent.slice(1));
  3174. let estimate = Math.ceil(page_num / 3);
  3175. alert(`页数: ${page_num},预计花费: ${estimate}秒;如遇网络异常可能更久\n请勿反复点击按钮;如果无法导出请 QQ 群反馈`);
  3176. turnPagesToPDF();
  3177. }
  3178.  
  3179.  
  3180. /**
  3181. * gb688文档下载策略
  3182. */
  3183. async function gb688() {
  3184. // 创建全局对象
  3185. globalThis.gb688JS = {
  3186. pages: new Map(), // {url: bmp}
  3187. pages_status: new Map() // {url: 0或1} 0释放, 1占用
  3188. };
  3189.  
  3190. // 创建按钮区
  3191. utils.createBtns();
  3192. // 绑定监听器
  3193. // 按钮1:导出PDF
  3194. turnPagesToPDF = await utils.recTime(turnPagesToPDF);
  3195. utils.setBtnEvent(hintThenDownload$1, [], "btn_1", "导出PDF");
  3196. }
  3197.  
  3198. function getPageCounts() {
  3199. // " / 39"
  3200. let counts_str = wk$(".counts")[0].textContent.split("/")[1];
  3201. let counts = parseInt(counts_str);
  3202. return counts > 20 ? 20 : counts;
  3203. }
  3204.  
  3205.  
  3206. /**
  3207. * 返回图片基础路径
  3208. * @returns {string} base_url
  3209. */
  3210. function getImgBaseURL() {
  3211. return wk$("#dp")[0].value;
  3212. }
  3213.  
  3214.  
  3215. function* genImgURLs() {
  3216. let counts = getPageCounts();
  3217. let base_url = getImgBaseURL();
  3218. for (let i=1; i<=counts; i++) {
  3219. yield base_url + `${i}.gif`;
  3220. }
  3221. }
  3222.  
  3223.  
  3224. /**
  3225. * 下载图片,转为canvas,合并为PDF并下载
  3226. */
  3227. function fetchThenExportPDF() {
  3228. let url_vendor = genImgURLs();
  3229. // db2092-2014-河北特种设备使用安全管理规范_安全文库网safewk.com
  3230. let title = document.title.split("_")[0];
  3231. return utils.imgUrlsToPDF(url_vendor, title);
  3232. }
  3233.  
  3234.  
  3235. /**
  3236. * 提示预估下载耗时,然后下载
  3237. */
  3238. async function hintThenDownload() {
  3239. let hint = [
  3240. "只能导出可预览的页面(最多20页)",
  3241. "请勿短时间反复点击按钮,导出用时大约不到 10 秒",
  3242. "点完后很久没动静请至 QQ 群反馈"
  3243. ];
  3244. alert(hint.join("\n"));
  3245. await fetchThenExportPDF();
  3246. }
  3247.  
  3248.  
  3249. /**
  3250. * safewk文档下载策略
  3251. */
  3252. async function safewk() {
  3253. // 创建按钮区
  3254. utils.createBtns();
  3255. // 绑定监听器
  3256. // 按钮1:导出PDF
  3257. hintThenDownload = await utils.recTime(hintThenDownload);
  3258. utils.setBtnEvent(hintThenDownload, [], "btn_1", "导出PDF");
  3259. }
  3260.  
  3261. /**
  3262. * 主函数:识别网站,执行对应文档下载策略
  3263. */
  3264. function main() {
  3265. // 显示当前位置
  3266. let host = window.location.host;
  3267. console.log(`当前host: ${host}`);
  3268. // 挂载工具包到全局
  3269. window.user_utils = utils;
  3270. console.log("wk: user_utils已经挂载到全局");
  3271.  
  3272. // 附加任务
  3273. // utils.globalFunc(HD); // 全局设置高清图片的函数
  3274.  
  3275. // 主任务
  3276. if (host.includes("docin.com")) {
  3277. docin();
  3278. } else if (host === "swf.ishare.down.sina.com.cn") {
  3279. ishareData();
  3280. } else if (host.includes("ishare.iask")) {
  3281. ishare();
  3282. } else if (host === "www.deliwenku.com") {
  3283. deliwenku();
  3284. } else if (host === "www.doc88.com") {
  3285. doc88();
  3286. } else if (host === "www.360doc.com") {
  3287. doc360();
  3288. } else if (host === "wenku.baidu.com") {
  3289. baiduWenku();
  3290. } else if (host === "doc.mbalib.com") {
  3291. mbalib();
  3292. } else if (host === "www.dugen.com") {
  3293. dugen();
  3294. } else if (host === "c.gb688.cn") {
  3295. gb688();
  3296. } else if (host === "www.safewk.com") {
  3297. safewk();
  3298. } else if (host.includes("book118.com")) {
  3299. book118();
  3300. } else {
  3301. console.log("匹配到了无效网页");
  3302. }
  3303. }
  3304.  
  3305. let options = {
  3306. fast_mode: true,
  3307. activation_test: false,
  3308. show_buttons: true,
  3309. cli_mode: false
  3310. };
  3311. globalThis._wk_on = options.show_buttons;
  3312. if (options.activation_test) {
  3313. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  3314. }
  3315. if (options.cli_mode) {
  3316. (() => {
  3317. loadExternalScripts();
  3318. setTimeout(main, 2000);
  3319. })();
  3320. } else if (options.fast_mode) {
  3321. utils.manipulateElem("body", main);
  3322. } else {
  3323. window.onload = main;
  3324. }
  3325.  
  3326. })();