Wenku Doc Downloader

下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

目前為 2022-12-05 提交的版本,檢視 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.6.6
  5. // @description 下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author 2690874578@qq.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://swf.ishare.down.sina.com.cn/?path=*
  11. // @match *://www.deliwenku.com/p-*
  12. // @match *://file.deliwenku.com/?num=*
  13. // @match *://file3.deliwenku.com/?num=*
  14. // @match *://www.doc88.com/p-*
  15. // @match *://www.360doc.com/content/*
  16. // @match *://doc.mbalib.com/view/*
  17. // @match *://www.dugen.com/p-*
  18. // @match *://max.book118.com/html/*
  19. // @match *://view-cache.book118.com/pptView.html?*
  20. // @match *://*.book118.com/?readpage=*
  21. // @match *://c.gb688.cn/bzgk/gb/showGb?*
  22. // @match *://www.safewk.com/p-*
  23. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  24. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  25. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  26. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  27. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  28. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  29. // @grant none
  30. // @license GPL-3.0-only
  31. // @create 2021-11-22
  32. // @note 1. 得力文库下载优化
  33. // ==/UserScript==
  34.  
  35.  
  36. (function () {
  37. 'use strict';
  38.  
  39. /**
  40. * 多元素选择器
  41. * @param {string | HTMLElement} selector 选择器或元素
  42. * @returns {NodeListOf<HTMLElement>} elements 元素列表
  43. */
  44. let _wk$ = function(selector) {
  45. if (selector instanceof Node) {
  46. return [selector];
  47. }
  48. let that = this;
  49. if (!(that instanceof HTMLElement)) {
  50. that = document;
  51. }
  52. return that.querySelectorAll(selector);
  53. };
  54.  
  55. globalThis.wk$ = _wk$;
  56.  
  57.  
  58. let utils = {
  59. /**
  60. * 使用过时的execCommand复制文字
  61. * @param {string} text
  62. */
  63. _oldCopy: function(text) {
  64. let input = document.createElement("input");
  65. input.value = text;
  66. document.body.appendChild(input);
  67. input.select();
  68. document.execCommand("copy");
  69. input.remove();
  70. },
  71.  
  72. /**
  73. * 复制text到剪贴板
  74. * @param {string} text
  75. * @returns
  76. */
  77. copy: function(text) {
  78. // 输出到控制台和剪贴板
  79. console.log(text);
  80. if (!navigator.clipboard) {
  81. this._oldCopy(text);
  82. return;
  83. }
  84. navigator.clipboard.writeText(text)
  85. .catch(err => {
  86. this._oldCopy(text);
  87. });
  88. },
  89.  
  90. /**
  91. * 装饰器, 用于打印函数执行耗时
  92. * @param {Function} func 需要计时的函数
  93. * @returns {Promise<Function>} 装饰的func => func的返回值
  94. */
  95. recTime: async function(func) {
  96. async function inner() {
  97. let begin = Date.now();
  98. let res = await func();
  99. let cost = ((Date.now() - begin) / 1000).toFixed(1);
  100. console.log(`Function <${func.name}> costed ${cost} seconds.`);
  101. return res;
  102. }
  103. return inner;
  104. },
  105.  
  106. /**
  107. * 创建并下载文件
  108. * @param {string} file_name 文件名
  109. * @param {string | Blob} content 文本或blob
  110. */
  111. createAndDownloadFile: function(file_name, content) {
  112. let aTag = document.createElement('a');
  113. let blob;
  114. if (typeof content != Blob) {
  115. blob = new Blob([content]);
  116. }
  117. aTag.download = file_name;
  118. aTag.href = URL.createObjectURL(blob);
  119. aTag.click();
  120. URL.revokeObjectURL(blob);
  121. },
  122.  
  123. /**
  124. * 创建并下载URL资源
  125. * @param {string} file_name
  126. * @param {string} src
  127. */
  128. downloadUrlFile: function(file_name, src) {
  129. let aTag = document.createElement('a');
  130. aTag.download = file_name;
  131. aTag.href = src;
  132. aTag.click();
  133. },
  134.  
  135. /**
  136. * canvas转为PNG格式的blob
  137. * @param {HTMLCanvasElement} canvas
  138. * @returns {Promise<Blob>} blob
  139. */
  140. canvasToBlob: async function(canvas) {
  141. return new Promise(res => canvas.toBlob(res));
  142. },
  143.  
  144. /**
  145. * 添加外部js到当前页面
  146. * @param {string} url
  147. */
  148. addScript2HTML: function(url) {
  149. let script = document.createElement("script");
  150. script.src = url;
  151. document.head.appendChild(script);
  152. },
  153.  
  154. /**
  155. * 显示/隐藏按钮区.
  156. * @param {Function} func
  157. */
  158. toggleBtnsSec: function() {
  159. let sec = wk$(".wk-box")[0];
  160. if (sec.style.display === "none") {
  161. sec.style.display = "block";
  162. return;
  163. }
  164. sec.style.display = "none";
  165. },
  166.  
  167. /**
  168. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  169. * @param {number} delay
  170. * @returns {Promise} nextTask
  171. */
  172. sleep: function(delay) {
  173. return new Promise(resolve => setTimeout(resolve, delay));
  174. },
  175.  
  176. /**
  177. * 允许打印页面
  178. */
  179. allowPrint: function() {
  180. let style = document.createElement("style");
  181. style.innerHTML = `
  182. @media print {
  183. body{
  184. display:block;
  185. }
  186. }
  187. `;
  188. document.head.appendChild(style);
  189. },
  190.  
  191. /**
  192. * 取得get参数key对应的value
  193. * @param {string} key
  194. * @returns {string} value
  195. */
  196. getUrlParam: function(key) {
  197. let params = (new URL(window.location)).searchParams;
  198. return params.get(key);
  199. },
  200.  
  201. /**
  202. * 在指定节点后面插入节点
  203. * @param {HTMLElement} new_element
  204. * @param {HTMLElement} target_element
  205. */
  206. insertAfter: function(new_element, target_element) {
  207. let parent = target_element.parentNode;
  208. if (parent.lastChild === target_element) {
  209. parent.appendChild(new_element);
  210. } else {
  211. parent.insertBefore(new_element, target_element.nextElementSibling);
  212. }
  213. },
  214.  
  215. /**
  216. * 求main_set去除cut_set后的set
  217. * @param {Set} main_set
  218. * @param {Set} cut_set
  219. * @returns 差集
  220. */
  221. difference: function(main_set, cut_set) {
  222. let _diff = new Set(main_set);
  223. for (let elem of cut_set) {
  224. _diff.delete(elem);
  225. }
  226. return _diff;
  227. },
  228.  
  229. /**
  230. * 抛出set中的第一个元素
  231. * @param {Set} set
  232. * @returns 一个元素
  233. */
  234. setPop: function(set) {
  235. for (let item of set) {
  236. set.delete(item);
  237. return item;
  238. }
  239. },
  240.  
  241. /**
  242. * 绑定事件到指定按钮,返回按钮引用
  243. * @param {Function} event click事件
  244. * @param {Array} args 事件的参数列表
  245. * @param {string} aim_btn 按钮的变量名
  246. * @param {string} new_text 按钮的新文本,为null则不替换
  247. * @returns 按钮元素的引用
  248. */
  249. setBtnEvent: function(event, args=[], aim_btn="btn_3", new_text=null) {
  250. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  251. // 如果需要,替换按钮内文本
  252. if (new_text) {
  253. btn.textContent = new_text;
  254. }
  255. // 绑定事件,添加到页面上
  256. btn.onclick = () => {
  257. this.enhanceBtnClickReaction(aim_btn);
  258. if (args.length) {
  259. event(...args);
  260. } else {
  261. event();
  262. }
  263. };
  264. return btn;
  265. },
  266.  
  267. /**
  268. * 强制隐藏元素
  269. * @param {string} selector
  270. */
  271. forceHide: function(selector) {
  272. let style_cls = "force-hide";
  273. document.querySelectorAll(selector).forEach((elem) => {
  274. elem.className += ` ${style_cls}`;
  275. });
  276. // 判断css样式是否已经存在
  277. let style;
  278. style = document.querySelector(`style.${style_cls}`);
  279. // 如果已经存在,则无须重复创建
  280. if (style) {
  281. return;
  282. }
  283. // 否则创建
  284. style = document.createElement("style");
  285. style.innerHTML = `style.${style_cls} {
  286. visibility: hidden !important;
  287. }`;
  288. document.head.appendChild(style);
  289. },
  290.  
  291. /**
  292. * 当元素可见时,操作目标元素(异步)。最多为不可见元素等待5秒。
  293. * @param {string} s 单个元素选择器
  294. * @param {Function} callback (elem) => {...} 元素操作函数
  295. */
  296. manipulateElem: async function(s, callback) {
  297. let isVisiable = () => {
  298. let res = getComputedStyle(wk$(s)[0]).display !== "none";
  299. // console.log(`${s} visibility: ${res}`);
  300. return res;
  301. };
  302.  
  303. let max = 5 * 5; // 最多等待5秒
  304. let i = 0;
  305.  
  306. // 如果不可见就等待0.2秒/轮
  307. while (!isVisiable() && i <= max) {
  308. i++;
  309. await utils.sleep(200);
  310. }
  311.  
  312. callback(wk$(s)[0]);
  313. },
  314.  
  315. /**
  316. * 隐藏按钮,打印页面,显示按钮
  317. */
  318. hideBtnThenPrint: function() {
  319. // 隐藏按钮,然后打印页面
  320. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  321. btns.forEach((elem) => {
  322. elem.style.display = "none";
  323. });
  324. window.print();
  325.  
  326. // 打印结束,显示按钮
  327. btns.forEach((elem) => {
  328. elem.style.display = "block";
  329. });
  330. },
  331.  
  332. /**
  333. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  334. * @param {string} custom_btn 按钮变量名
  335. */
  336. enhanceBtnClickReaction: function(custom_btn = null) {
  337. let aim_btn;
  338. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  339. if (!custom_btn || custom_btn === "btn_1") {
  340. aim_btn = document.querySelector(".btn-1");
  341. } else {
  342. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  343. }
  344.  
  345. let old_color = aim_btn.style.color; // 保存旧的颜色
  346. let old_text = aim_btn.textContent; // 保存旧的文字内容
  347. // 变黑缩小
  348. aim_btn.style.color = "black";
  349. aim_btn.style.fontWeight = "normal";
  350. aim_btn.textContent = `->${old_text}<-`;
  351. // 复原加粗
  352. let changeColorBack = function() {
  353. aim_btn.style.color = old_color;
  354. aim_btn.style.fontWeight = "bold";
  355. aim_btn.textContent = old_text;
  356. };
  357. setTimeout(changeColorBack, 1250);
  358. },
  359.  
  360. /**
  361. * 切换按钮显示/隐藏状态
  362. * @param {string} aim_btn 按钮变量名
  363. * @returns 按钮元素的引用
  364. */
  365. toggleBtnStatus: function(aim_btn) {
  366. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  367. let display = getComputedStyle(btn).display;
  368. // return;
  369. if (display === "none") {
  370. btn.style.display = "block";
  371. } else {
  372. btn.style.display = "none";
  373. }
  374. return btn;
  375. },
  376.  
  377. /**
  378. * 挂载func到全局
  379. * @param {Function} func
  380. */
  381. globalFunc: function(func) {
  382. globalThis[func.name] = func;
  383. },
  384.  
  385. /**
  386. * 用input框跳转到对应页码
  387. * @param {Element} cur_page 当前页码
  388. * @param {string | Number} aim_page 目标页码
  389. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  390. */
  391. jump2pageNo: function(cur_page, aim_page, event_type) {
  392. // 设置跳转页码为目标页码
  393. cur_page.value = (aim_page).toString();
  394. // 模拟回车事件来跳转
  395. let keyboard_event_enter = new KeyboardEvent(event_type, {
  396. bubbles: true,
  397. cancelable: true,
  398. keyCode: 13
  399. });
  400. cur_page.dispatchEvent(keyboard_event_enter);
  401. },
  402.  
  403. /**
  404. * 在新标签页打开链接
  405. * @param {string} href
  406. */
  407. openInNewTab: function(href) {
  408. let link = document.createElement("a");
  409. link.href = href;
  410. link.target = "_blank";
  411. link.click();
  412. },
  413.  
  414. /**
  415. * 滚动到页面底部
  416. */
  417. scrollToBottom: function() {
  418. window.scrollTo({
  419. top: document.body.scrollHeight,
  420. behavior: "smooth"
  421. });
  422. },
  423.  
  424. /**
  425. * 用try移除元素
  426. * @param {Element} element 要移除的元素
  427. */
  428. tryToRemoveElement: function(element) {
  429. try {
  430. element.remove();
  431. } catch (e) {
  432. }
  433. },
  434.  
  435. /**
  436. * 用try移除若干元素
  437. * @param {Element[]} elements 要移除的元素列表
  438. */
  439. tryToRemoveElements: function(elements) {
  440. elements.forEach((elem) => {
  441. this.tryToRemoveElement(elem);
  442. });
  443. },
  444.  
  445. /**
  446. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  447. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  448. */
  449. tryToRemoveSameElem: function(elem_list_box) {
  450. for (let elem_list of elem_list_box) {
  451. if (!elem_list) {
  452. continue;
  453. }
  454. for (let elem of elem_list) {
  455. try {
  456. elem.remove();
  457. } catch (e) {
  458. console.log();
  459. }
  460. }
  461. }
  462. },
  463.  
  464. /**
  465. * 使文档在页面上居中
  466. * @param {string} selector 文档容器的css选择器
  467. * @param {string} default_offset 文档部分向右偏移的百分比(0-59)
  468. * @returns 偏移值是否合法
  469. */
  470. centerDoc: function(selector, default_offset) {
  471. let doc_main = document.querySelector(selector);
  472. let offset = window.prompt("请输入偏移百分位:", default_offset);
  473. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  474. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  475. doc_main.style.marginLeft = offset + "%";
  476. return true;
  477. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  478. doc_main.style.marginLeft = offset + "%";
  479. return true
  480. } else {
  481. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  482. return false;
  483. }
  484. },
  485.  
  486. /**
  487. * 调整按钮内文本
  488. * @param {string} aim_btn 按钮变量名
  489. * @param {string} new_text 新的文本,null则保留旧文本
  490. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  491. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  492. */
  493. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  494. // 提示文档已经展开
  495. if (use_hint) {
  496. let hint = "文档已经完全展开,可以导出";
  497. alert(hint);
  498. }
  499. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  500. // 要替换的文本
  501. if (new_text) {
  502. btn.textContent = new_text;
  503. }
  504. // 推荐按钮
  505. if (recommend_btn) {
  506. btn.textContent += "(推荐)";
  507. }
  508. },
  509.  
  510. html2Canvases: async function(elem_list) {
  511. // 如果是空元素列表,返回null并终止函数
  512. if (elem_list.length === 0) {
  513. console.log("html2canvases was called, but no element is avaiable.");
  514. return null;
  515. }
  516. let tasks = []; // 存放异步任务
  517. let contents = []; // 存放canvas元素
  518. for (let elem of elem_list) {
  519. let task = html2canvas(elem).then((canvas) => {
  520. contents.push(canvas);
  521. });
  522. tasks.push(task);
  523. }
  524. // 等待全部page转化完成
  525. await Promise.all(tasks);
  526. return contents;
  527. },
  528.  
  529. /**
  530. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  531. * @param {Array} elem_list html元素列表
  532. * @param {string} title 文档标题
  533. */
  534. html2PDF: async function(elem_list, title = "文档") {
  535. // 如果是空元素列表,终止函数
  536. let _contents = this.html2Canvases(elem_list);
  537. if (_contents === null) {
  538. return;
  539. }
  540. _contents.then((contents) => {
  541. // 控制台检查结果
  542. console.log("生成的canvas元素如下:");
  543. console.log(contents);
  544.  
  545. // 拿到canvas宽、高
  546. let model = elem_list[0];
  547. let width, height;
  548. width = model.offsetWidth;
  549. height = model.offsetHeight;
  550. // 打包为pdf
  551. this.saveCanvasesToPDF(contents, title, width, height);
  552. });
  553. },
  554.  
  555. /**
  556. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  557. * @param {string} selector 图形元素的父级元素
  558. */
  559. savePicUrls: function(selector) {
  560. let pages = document.querySelectorAll(selector);
  561. let pic_urls = [];
  562.  
  563. for (let elem of pages) {
  564. let pic_obj = elem.children[0];
  565. let url = pic_obj.src;
  566. pic_urls.push(url);
  567. }
  568. let content = pic_urls.join("\n");
  569. // 启动下载
  570. this.createAndDownloadFile("urls.csv", content);
  571. },
  572.  
  573. /**
  574. * 存储所有canvas图形为png到一个压缩包
  575. * @param {Array} node_list canvas元素列表
  576. * @param {string} title 文档标题
  577. */
  578. saveCanvasesToZip: function(node_list, title) {
  579. // canvas元素转为png图像
  580. // 所有png合并为一个zip压缩包
  581. let zip = new JSZip();
  582. let n = node_list.length;
  583.  
  584. for (let i = 0; i < n; i++) {
  585. let canvas = node_list[i];
  586. let data_base64 = canvas.toDataURL();
  587. let blob = atob(data_base64.split(",")[1]);
  588. zip.file(`page-${i + 1}.png`, blob, { binary: true });
  589. }
  590.  
  591. // 导出zip
  592. // promise.then(onCompleted, onRejected);
  593. zip.generateAsync({ type: "blob" }).then(function(content) {
  594. // see filesaver.js
  595. console.log(content);
  596. saveAs(content, `${title}.zip`);
  597. });
  598. },
  599.  
  600. /**
  601. * 将canvas转为jpeg,然后导出PDF
  602. * @param {Iterable<HTMLCanvasElement>} canvas_box canvas元素列表
  603. * @param {string} title 文档标题
  604. */
  605. saveCanvasesToPDF: function(canvas_box, title, width = 0, height = 0) {
  606. // 如果没有手动指定canvas的长宽,则自动检测
  607. if (!width && !height) {
  608. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  609. let first_canvas = canvas_box[0];
  610.  
  611. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  612. [width, height] = [first_canvas.width, first_canvas.height];
  613. } else {
  614. let [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  615. [width, height] = [parseInt(width_str), parseInt(height_str)];
  616. }
  617. }
  618.  
  619. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  620. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  621. let orientation = width > height ? 'l' : 'p';
  622. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  623. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  624.  
  625. // 保存每一页文档到每一页pdf
  626. let canvas_list = Array.from(canvas_box);
  627. let last_canvas = canvas_list.pop();
  628. canvas_list.forEach(canvas => {
  629. pdf.addImage(canvas, 'png', 0, 0, width, height);
  630. pdf.addPage();
  631. });
  632. // 添加尾页
  633. pdf.addImage(last_canvas, 'png', 0, 0, width, height);
  634. // 导出文件
  635. pdf.save(`${title}.pdf`);
  636. },
  637.  
  638. /**
  639. * Image元素列表合并到一个PDF中
  640. * @param {NodeList} imgs Image元素列表
  641. * @param {string} title 文档名
  642. */
  643. imgs2pdf: function(imgs, title) {
  644. // 取得宽高
  645. let model = imgs[0];
  646. let width = model.offsetWidth;
  647. let height = model.offsetHeight;
  648.  
  649. // 创建pdf
  650. let orientation = width > height ? 'l' : 'p';
  651. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  652.  
  653. // 添加图像到pdf
  654. imgs.forEach((img, index) => {
  655. pdf.addImage(img, 'PNG', 0, 0, width, height);
  656. // 如果当前不是文档最后一页,则需要添加下一个空白页
  657. if (index !== imgs.length - 1) {
  658. pdf.addPage();
  659. }
  660. });
  661.  
  662. // 导出文件
  663. pdf.save(`${title}.pdf`);
  664. },
  665.  
  666.  
  667. /**
  668. * imageBitMap转canvas
  669. * @param {ImageBitmap} bmp
  670. * @returns {HTMLCanvasElement} canvas
  671. */
  672. bmpToCanvas: function(bmp) {
  673. let canvas = document.createElement("canvas");
  674. canvas.height = bmp.height;
  675. canvas.width = bmp.width;
  676. let ctx = canvas.getContext("bitmaprenderer");
  677. ctx.transferFromImageBitmap(bmp);
  678. return canvas;
  679. },
  680.  
  681. /**
  682. * 下载可以简单直接请求的图片,合并到PDF并导出
  683. * @param {Iterable<string>} urls 图片链接列表
  684. * @param {string} title 文档名称
  685. * @param {number} retry_num 如果请求成功数量 < retry_num, 则等待 2 秒后重试; 默认 0 不重试
  686. * @param {boolean} clear 是否在请求完成后清理控制台输出,默认false
  687. */
  688. imgUrlsToPDF: async function(urls, title, retry_num=0, clear=false) {
  689. let tasks, img_blobs, i = 3;
  690. // 根据请求成功数量判断是否递归
  691. do {
  692. i -= 1;
  693. // 发起请求
  694. tasks = [];
  695. Array.from(urls).forEach(url => {
  696. tasks.push(
  697. (async () => {
  698. return await (await fetch(url)).blob();
  699. })()
  700. );
  701. });
  702. // 接收响应
  703. let blobs = await Promise.all(tasks);
  704. img_blobs = blobs.filter(blob => blob.type.startsWith("image/"));
  705.  
  706. if (clear) {
  707. console.clear();
  708. }
  709.  
  710. if (
  711. retry_num
  712. && img_blobs.length < retry_num
  713. && i
  714. ) {
  715. // 下轮行动前冷却
  716. console.log(`打盹 2 秒`);
  717. await utils.sleep(2);
  718. } else {
  719. // 结束循环
  720. break;
  721. }
  722. } while (true)
  723. // 格式转换:img blob -> bmp
  724. let tasks2 = [];
  725. img_blobs.map(
  726. blob => {
  727. let bmp = createImageBitmap(blob);
  728. tasks2.push(
  729. (async () => await bmp)()
  730. );
  731. }
  732. );
  733. // 等待格式转换完成
  734. let bmp_items = await Promise.all(tasks2);
  735.  
  736. // 转为canvas
  737. let canvas_box = bmp_items.map(
  738. bmp => this.bmpToCanvas(bmp)
  739. );
  740.  
  741. // 导出PDF
  742. this.saveCanvasesToPDF(canvas_box, title);
  743. },
  744.  
  745. /**
  746. * 返回子串个数
  747. * @param {string} str
  748. * @param {string} sub
  749. */
  750. countSubStr: function(str, sub) {
  751. let i = 0;
  752. let counter = 0;
  753.  
  754. while (true) {
  755. i = str.indexOf(sub, i);
  756. if (i === -1) {
  757. return counter;
  758. } else {
  759. i++;
  760. counter++;
  761. }
  762. }
  763. },
  764.  
  765. /**
  766. * 取得elem的class为class_name的父级元素
  767. * @param {string} class_name
  768. * @param {Element} elem 起点元素
  769. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  770. * @param {Boolean} miss 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  771. * @returns {null | Element} parent_element
  772. */
  773. getParentByClassName: function(class_name, elem, JSobj, miss = false) {
  774. let parent = elem.parentElement;
  775. let iterator_count = JSobj.iterator_count;
  776. let now_name;
  777.  
  778. try {
  779. now_name = parent.className;
  780. } catch (e) {
  781. JSobj.iterator_count = 0;
  782. // 没有父级元素了
  783. return "no parent node";
  784. }
  785.  
  786. // 如果不忽略递归次数计数器
  787. if (!miss) {
  788. if (iterator_count > 9) {
  789. // 超过最大迭代次数,认为不存在,返回null
  790. JSobj.iterator_count = 0;
  791. return "over max iterator counts limit";
  792. } else {
  793. JSobj.iterator_count += 1;
  794. }
  795. }
  796. // 如果类名匹配,返回该节点
  797. if (now_name.split(" ").includes(class_name)) {
  798. iterator_count = 0;
  799. return parent;
  800. }
  801. return this.getParentByClassName(class_name, parent, JSobj);
  802. },
  803.  
  804. /**
  805. * 将func绑定到window.onscroll,并设置触发频率
  806. * @param {Function} func scroll的监听函数
  807. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  808. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  809. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  810. * @param {string} hint 触发函数后的日志内容,默认为空字符串。
  811. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  812. */
  813. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  814. if (JSobj.scroll_count === undefined) {
  815. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  816. return;
  817. }
  818.  
  819. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  820. JSobj.scroll_count += 1;
  821. if (JSobj.scroll_count < useful_range) {
  822. func();
  823. console.log(hint);
  824. } else if (JSobj.scroll_count > wait_range) {
  825. JSobj.scroll_count = 0;
  826. }
  827. };
  828. // 如果没有指定的window对象,则使用默认的window
  829. if (!inner_window) {
  830. window.onscroll = () => {
  831. new_func(func, JSobj, useful_range, wait_range, hint);
  832. };
  833. return;
  834. }
  835. // 特定的window对象,一般用于iframe,追加scroll监听器
  836. let scrollFunc = () => {
  837. new_func(func, JSobj, useful_range, wait_range, hint);
  838. };
  839. JSobj.scrollFunc = scrollFunc;
  840. inner_window.addEventListener("scroll", scrollFunc, false);
  841. },
  842.  
  843. /**
  844. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;除第1个外默认均为隐藏
  845. */
  846. createBtns: function() {
  847. // 创建大容器
  848. let box = document.createElement("div");
  849. box.className = "wk-box";
  850. document.body.appendChild(box);
  851.  
  852. // 创建按钮组
  853. let section = document.createElement("section");
  854. section.className = "btns_section";
  855. section.innerHTML = `
  856. <p class="logo_tit">Wenku Doc Downloader</p>
  857. <button class="btn-1">展开文档 😈</button>
  858. <button class="btn-2">未设定2</button>
  859. <button class="btn-3">未设定3</button>
  860. <button class="btn-4">未设定4</button>
  861. <button class="btn-5">未设定5</button>
  862. `;
  863. box.appendChild(section);
  864.  
  865. // 添加隐藏/展示按钮
  866. // 隐藏【🙈】,展开【🐵】
  867. let hide_btn = document.createElement("p");
  868. hide_btn.className = "hide_btn_wk";
  869. hide_btn.textContent = "🐵";
  870. hide_btn.onclick = () => {
  871. // 显示 -> 隐藏
  872. if (getComputedStyle(section).display === "block") {
  873. section.style.display = "none";
  874. hide_btn.style.left = "20px";
  875. hide_btn.textContent = "🙈";
  876. // 隐藏 -> 显示
  877. } else {
  878. section.style.display = "block";
  879. hide_btn.style.left = "155px";
  880. hide_btn.textContent = "🐵";
  881. }
  882. };
  883. box.appendChild(hide_btn);
  884.  
  885. // 设定样式
  886. let style = document.createElement("style");
  887. style.innerHTML = `
  888. .hide_btn_wk {
  889. position: fixed;
  890. left: 155px;
  891. top: 36%;
  892. user-select: none;
  893. font-size: large;
  894. z-index: 5001;
  895. }
  896. .btns_section{
  897. position: fixed;
  898. width: 154px;
  899. left: 10px;
  900. top: 32%;
  901. background: #E7F1FF;
  902. border: 2px solid #1676FF;
  903. padding: 0px 0px 10px 0px;
  904. font-weight: 600;
  905. border-radius: 2px;
  906. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  907. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  908. 'Segoe UI Emoji', 'Segoe UI Symbol';
  909. z-index: 5000;
  910. }
  911. .logo_tit{
  912. width: 100%;
  913. background: #1676FF;
  914. text-align: center;
  915. font-size:12px ;
  916. color: #E7F1FF;
  917. line-height: 40px;
  918. height: 40px;
  919. margin: 0 0 16px 0;
  920. }
  921.  
  922. .btn-1{
  923. display: block;
  924. width: 128px;
  925. height: 28px;
  926. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  927. border-radius: 4px;
  928. color: #fff;
  929. font-size: 12px;
  930. border: none;
  931. outline: none;
  932. margin: 8px auto;
  933. font-weight: bold;
  934. cursor: pointer;
  935. opacity: .9;
  936. }
  937. .btn-2{
  938. display: none;
  939. width: 128px;
  940. height: 28px;
  941. background: #07C160;
  942. border-radius: 4px;
  943. color: #fff;
  944. font-size: 12px;
  945. border: none;
  946. outline: none;
  947. margin: 8px auto;
  948. font-weight: bold;
  949. cursor: pointer;
  950. opacity: .9;
  951. }
  952. .btn-3{
  953. display: none;
  954. width: 128px;
  955. height: 28px;
  956. background:#FA5151;
  957. border-radius: 4px;
  958. color: #fff;
  959. font-size: 12px;
  960. border: none;
  961. outline: none;
  962. margin: 8px auto;
  963. font-weight: bold;
  964. cursor: pointer;
  965. opacity: .9;
  966. }
  967. .btn-4{
  968. display: none;
  969. width: 128px;
  970. height: 28px;
  971. background: #1676FF;
  972. border-radius: 4px;
  973. color: #fff;
  974. font-size: 12px;
  975. border: none;
  976. outline: none;
  977. margin: 8px auto;
  978. font-weight: bold;
  979. cursor: pointer;
  980. opacity: .9;
  981. }
  982. .btn-5{
  983. display: none;
  984. width: 128px;
  985. height: 28px;
  986. background: #ff6600;
  987. border-radius: 4px;
  988. color: #fff;
  989. font-size: 12px;
  990. border: none;
  991. outline: none;
  992. margin: 8px auto;
  993. font-weight: bold;
  994. cursor: pointer;
  995. opacity: .9;
  996. }
  997. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  998. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  999. document.head.appendChild(style);
  1000. }
  1001. };
  1002.  
  1003. /**
  1004. * 多元素选择器
  1005. * @param {string} s
  1006. * @returns {NodeListOf<Element>} elements
  1007. */
  1008. let $ = (s) => {
  1009. return document.querySelectorAll(s);
  1010. };
  1011.  
  1012.  
  1013. // 全局对象
  1014. globalThis.doc88JS = {
  1015. last_copy_time: 0 // 上一次 ctrl + c 的时间戳(毫秒)
  1016. };
  1017.  
  1018.  
  1019. /**
  1020. * 展开道客巴巴的文档
  1021. */
  1022. function readAllDoc88() {
  1023. // 获取“继续阅读”按钮
  1024. let continue_btn = document.querySelector("#continueButton");
  1025. // 如果存在“继续阅读”按钮
  1026. if (continue_btn) {
  1027. // 跳转到文末(等同于展开全文)
  1028. let cur_page = document.querySelector("#pageNumInput");
  1029. // 取得最大页码
  1030. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1031. // 跳转到尾页
  1032. utils.jump2pageNo(cur_page, page_max, "keypress");
  1033. // 返回顶部
  1034. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1035. }
  1036. // 文档展开后,显示按钮2、3
  1037. else {
  1038. // 隐藏按钮
  1039. utils.toggleBtnStatus("btn_1");
  1040. // 显示按钮
  1041. utils.toggleBtnStatus("btn_2");
  1042. utils.toggleBtnStatus("btn_3");
  1043. utils.toggleBtnStatus("btn_4");
  1044. }
  1045. }
  1046.  
  1047.  
  1048. /**
  1049. * 隐藏搜索框
  1050. */
  1051. async function hideSearchBox() {
  1052. let s = "#min-search-result";
  1053. let hide = (elem) => {
  1054. elem.style.display = "none";
  1055. };
  1056. utils.manipulateElem(s, hide);
  1057. }
  1058.  
  1059.  
  1060. /**
  1061. * 移除vip复制弹窗
  1062. */
  1063. async function removeCopyPopup() {
  1064. let s = "#ym-window";
  1065. let remove = (elem) => {
  1066. let popup = elem.parentElement;
  1067. utils.tryToRemoveElement(popup);
  1068. };
  1069. utils.manipulateElem(s, remove);
  1070. }
  1071.  
  1072.  
  1073. /**
  1074. * 隐藏选择文字的弹窗
  1075. */
  1076. async function hideSelectPopup() {
  1077. let s = "#left-menu";
  1078. let hide = (elem) => {
  1079. elem.style.zIndex = -1;
  1080. };
  1081. utils.manipulateElem(s, hide);
  1082. }
  1083.  
  1084.  
  1085. /**
  1086. * 只会执行一次的初始化任务
  1087. */
  1088. async function lazyService() {
  1089. // 只允许执行一次
  1090. let counter = Symbol.for("counter");
  1091. if (globalThis[counter]) {
  1092. return;
  1093. }
  1094. globalThis[counter] = true;
  1095.  
  1096. // 初始化
  1097. console.log("正在执行初始化任务");
  1098. // 1. 隐藏选中文字的提示框
  1099. hideSelectPopup();
  1100. // 2. 隐藏搜索框
  1101. hideSearchBox();
  1102. // 3. 移除vip复制弹窗
  1103. removeCopyPopup();
  1104. }
  1105.  
  1106.  
  1107. /**
  1108. * 使用过时的execCommand复制文字
  1109. * @param {string} text
  1110. */
  1111. function textToClipBoardOldTech(text) {
  1112. let input = document.createElement("input");
  1113. input.value = text;
  1114. document.body.appendChild(input);
  1115. input.select();
  1116. document.execCommand("copy");
  1117. input.remove();
  1118. }
  1119.  
  1120.  
  1121. /**
  1122. * 复制选中的文字
  1123. * @returns
  1124. */
  1125. function copySelected() {
  1126. // 执行一次初始化任务
  1127. lazyService();
  1128.  
  1129. // 尚未选中文字
  1130. if (getComputedStyle($("#left-menu")[0]).display === "none") {
  1131. console.log("尚未选中文字");
  1132. return;
  1133. }
  1134. // 选中文字
  1135. // 搜索文字,弹出搜索框
  1136. let search = $("#lmenu_search")[0];
  1137. search.click();
  1138. // 取得input内容
  1139. let input = $(".min-text input")[0];
  1140. let text = input.value;
  1141. // 输出到控制台和剪贴板
  1142. console.log(text);
  1143. if (!navigator.clipboard) {
  1144. textToClipBoardOldTech(text);
  1145. return;
  1146. } navigator.clipboard.writeText(text).catch(textToClipBoardOldTech);
  1147. // 清空input
  1148. input.value = "";
  1149. }
  1150.  
  1151.  
  1152. /**
  1153. * 捕获 ctrl + c 并关闭弹窗
  1154. * @param {KeyboardEvent} keydown
  1155. * @returns
  1156. */
  1157. function catchCtrlC(keydown) {
  1158. // 判断是否为 ctrl + c
  1159. if (!(keydown.code === "KeyC" && keydown.ctrlKey === true)) {
  1160. return;
  1161. }
  1162.  
  1163. // 判断触发间隔
  1164. let now = Date.now();
  1165.  
  1166. // 距离上次小于1秒
  1167. if (now - doc88JS.last_copy_time < 1000 * 1) {
  1168. doc88JS.last_copy_time = now;
  1169. return;
  1170. }
  1171.  
  1172. // 大于1秒
  1173. // 刷新最近一次触发时间
  1174. doc88JS.last_copy_time = now;
  1175. // 复制文字
  1176. copySelected();
  1177. }
  1178.  
  1179.  
  1180. /**
  1181. * 道客巴巴文档下载策略
  1182. */
  1183. async function doc88() {
  1184. // 创建脚本启动按钮1、2
  1185. utils.createBtns();
  1186.  
  1187. // 绑定主函数
  1188. let prepare = function() {
  1189. // 获取canvas元素列表
  1190. let node_list = document.querySelectorAll(".inner_page");
  1191. // 获取文档标题
  1192. let title;
  1193. if (document.querySelector(".doctopic h1")) {
  1194. title = document.querySelector(".doctopic h1").title;
  1195. } else {
  1196. title = "文档";
  1197. }
  1198. return [node_list, title];
  1199. };
  1200.  
  1201. // btn_1: 展开文档
  1202. utils.setBtnEvent(() => {
  1203. readAllDoc88();
  1204. }, [], "btn_1");
  1205.  
  1206. // btn_2: 导出zip
  1207. utils.setBtnEvent(() => {
  1208. if (confirm("确定每页内容都加载完成了吗?")) {
  1209. utils.saveCanvasesToZip(...prepare());
  1210. }
  1211. }, [], "btn_2", "导出图片到zip");
  1212. // btn_3: 导出PDF
  1213. utils.setBtnEvent(() => {
  1214. if (confirm("确定每页内容都加载完成了吗?")) {
  1215. utils.saveCanvasesToPDF(...prepare());
  1216. }
  1217. }, [], "btn_3", "导出图片到PDF");
  1218.  
  1219. // btn_4: 复制选中文字
  1220. utils.setBtnEvent(() => {
  1221. copySelected();
  1222. utils.modifyBtnText("btn_4", "复制成功!", false, false);
  1223. }, [], "btn_4", "复制选中文字");
  1224. // 为 ctrl + c 添加响应
  1225. document.addEventListener("keydown", catchCtrlC);
  1226. }
  1227.  
  1228. // 绑定主函数
  1229. function getCanvasList() {
  1230. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1231. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1232. let node_list = [];
  1233. for (let node of parent_node_list) {
  1234. node_list.push(node.children[0]);
  1235. }
  1236. return node_list;
  1237. }
  1238.  
  1239.  
  1240. function prepare() {
  1241. // 获取canvas元素列表
  1242. let node_list = getCanvasList();
  1243. // 获取文档标题
  1244. let title;
  1245. if (document.querySelector("h1 [title=doc]")) {
  1246. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1247. } else if (document.querySelector(".doc_title")) {
  1248. title = document.querySelector(".doc_title").textContent;
  1249. } else {
  1250. title = "文档";
  1251. }
  1252. return [node_list, title];
  1253. }
  1254.  
  1255.  
  1256. // 判断是否有canvas元素
  1257. function detectCanvas() {
  1258. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1259.  
  1260. // 隐藏按钮
  1261. utils.toggleBtnStatus("btn_1");
  1262. // 显示按钮
  1263. utils.toggleBtnStatus("btn_2");
  1264.  
  1265. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1266. if (!haveCanvas) {
  1267. // btn_2: 导出图片链接
  1268. utils.setBtnEvent(() => {
  1269. if (confirm("确定每页内容都加载完成了吗?")) {
  1270. utils.savePicUrls("[id*=img_]");
  1271. }
  1272. }, [], "btn_2", "导出全部图片链接");
  1273. } else {
  1274. // 显示按钮3
  1275. utils.toggleBtnStatus("btn_3");
  1276. // btn_2: 导出zip
  1277. utils.setBtnEvent(() => {
  1278. if (confirm("确定每页内容都加载完成了吗?")) {
  1279. utils.saveCanvasesToZip(...prepare());
  1280. }
  1281. }, [], "btn_2", "导出图片到zip");
  1282. // btn_3: 导出PDF
  1283. utils.setBtnEvent(() => {
  1284. if (confirm("确定每页内容都加载完成了吗?")) {
  1285. utils.saveCanvasesToPDF(...prepare());
  1286. }
  1287. }, [], "btn_3", "导出图片到PDF");
  1288. }
  1289. }
  1290.  
  1291.  
  1292. /**
  1293. * 豆丁文档下载策略
  1294. */
  1295. function docin() {
  1296. // 创建脚本启动按钮
  1297. utils.createBtns();
  1298.  
  1299. // 隐藏底部工具栏
  1300. document.querySelector("#j_select").click(); // 选择指针
  1301. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1302. tool_bar.style.display = "none";
  1303.  
  1304. // btn_1: 判断文档类型
  1305. utils.setBtnEvent(() => {
  1306. utils.forceHide(".jz_watermark");
  1307. detectCanvas();
  1308. }, [], "btn_1", "判断文档类型");
  1309. }
  1310.  
  1311. function jumpToHost() {
  1312. // https://swf.ishare.down.sina.com.cn/1DrH4Qt2cvKd.jpg?ssig=DUf5x%2BXnKU&Expires=1673867307&KID=sina,ishare&range={}-{}
  1313. let url = wk$(".data-detail img, .data-detail embed")[0].src;
  1314. if (!url) {
  1315. alert("找不到图片元素");
  1316. return;
  1317. }
  1318.  
  1319. let url_obj = new URL(url);
  1320. let path = url_obj.pathname.slice(1);
  1321. let query = url_obj.search.slice(1).split("&range")[0];
  1322. let title = document.title.split(" - ")[0];
  1323. let target = `${url_obj.protocol}//${url_obj.host}?path=${path}&fname=${title}&${query}`;
  1324. // https://swf.ishare.down.sina.com.cn/
  1325. globalThis.open(target, "hostage");
  1326. // 然后在跳板页面发起对图片的请求
  1327. }
  1328.  
  1329.  
  1330. /**
  1331. * 爱问文库下载跳转策略
  1332. */
  1333. function ishare() {
  1334. // 创建按钮区
  1335. utils.createBtns();
  1336.  
  1337. // btn_1: 识别文档类型 -> 导出PDF
  1338. utils.setBtnEvent(jumpToHost, [], "btn_1", "到下载页面");
  1339. // btn_2: 不支持爱问办公
  1340. utils.setBtnEvent(() => null, [], "btn_2", "不支持爱问办公");
  1341. // utils.toggleBtnStatus("btn_4");
  1342. }
  1343.  
  1344. /**
  1345. * 返回包含对于数量svg元素的html元素
  1346. * @param {string} data
  1347. * @returns {HTMLDivElement} article
  1348. */
  1349. function _createDiv(data) {
  1350. let num = utils.countSubStr(data, data.slice(0, 10));
  1351. let article = document.createElement("div");
  1352. article.id = "article";
  1353. article.innerHTML = `
  1354. <style class="wk-settings">
  1355. body {
  1356. margin: 0px;
  1357. width: 100%;
  1358. background-color: rgb(95,99,104);
  1359. }
  1360. #article {
  1361. width: 100%;
  1362. display: flex;
  1363. flex-direction: row;
  1364. justify-content: space-around;
  1365. }
  1366. #root-box {
  1367. display: flex;
  1368. flex-direction: column;
  1369. background-color: white;
  1370. padding: 0 2em;
  1371. }
  1372. .gap {
  1373. height: 50px;
  1374. width: 100%;
  1375. background-color: transparent;
  1376. }
  1377. </style>
  1378. <div id="root-box">
  1379. ${
  1380. `<object class="svg-box"></object>
  1381. <div class="gap"></div>`.repeat(num)
  1382. }
  1383. `;
  1384. // 移除最后一个多出的gap
  1385. Array.from(article.querySelectorAll(".gap")).at(-1).remove();
  1386. return article;
  1387. }
  1388.  
  1389.  
  1390. function setGap(height) {
  1391. let style = wk$(".wk-settings")[0].innerHTML;
  1392. wk$(".wk-settings")[0].innerHTML = style.replace(
  1393. /[.]gap.*?{.*?height:.+?;/s,
  1394. `.gap { height: ${parseInt(height)}px;`
  1395. );
  1396. }
  1397.  
  1398.  
  1399. function setGapGUI() {
  1400. let now = getComputedStyle(wk$(".gap")[0]).height;
  1401. let new_h = prompt(`当前间距:${now}\n请输入新间距:`);
  1402. if (new_h) {
  1403. setGap(new_h);
  1404. }
  1405. }
  1406.  
  1407.  
  1408. function getSVGtext(data) {
  1409. let div = document.createElement("div");
  1410. div.innerHTML = data;
  1411. return div.textContent;
  1412. }
  1413.  
  1414.  
  1415. function toDisplayMode1() {
  1416. let content = globalThis["ishareJS"].content_1;
  1417. if (!content) {
  1418. content = globalThis["ishareJS"].text
  1419. .replace(/\n{2,}/g, "<hr>")
  1420. .replace(/\n/g, "<br>")
  1421. .replace(/\s/g, "&nbsp;")
  1422. .replace(/([a-z])([A-Z])/g, "$1 $2"); // 英文简单分词
  1423.  
  1424. globalThis["ishareJS"].content_1 = content;
  1425. }
  1426.  
  1427. wk$("#root-box")[0].innerHTML = content;
  1428. }
  1429.  
  1430.  
  1431. function toDisplayMode2() {
  1432. let content = globalThis["ishareJS"].content_2;
  1433. if (!content) {
  1434. content = globalThis["ishareJS"].text
  1435. .replace(/\n{2,}/g, "<hr>")
  1436. .replace(/\n/g, "")
  1437. .replace(/\s/g, "&nbsp;")
  1438. .replace(/([a-z])([A-Z])/g, "$1 $2")
  1439. .split("<hr>")
  1440. .map(paragraph => `<p>${paragraph}</p>`)
  1441. .join("");
  1442. globalThis["ishareJS"].content_2 = content;
  1443. wk$(".wk-settings")[0].innerHTML += `
  1444. #root-box > p {
  1445. text-indent: 2em;
  1446. width: 40em;
  1447. word-break: break-word;
  1448. }
  1449. `;
  1450. }
  1451.  
  1452. wk$("#root-box")[0].innerHTML = content;
  1453. }
  1454.  
  1455.  
  1456. function changeDisplayModeWrapper() {
  1457. let flag = true;
  1458.  
  1459. function inner() {
  1460. if (flag) {
  1461. toDisplayMode1();
  1462. } else {
  1463. toDisplayMode2();
  1464. }
  1465. flag = !flag;
  1466. }
  1467. return inner;
  1468. }
  1469.  
  1470.  
  1471. function handleSVGtext() {
  1472. globalThis["ishareJS"].text = getSVGtext(
  1473. globalThis["ishareJS"].data
  1474. );
  1475.  
  1476. let change = changeDisplayModeWrapper();
  1477. utils.setBtnEvent(change, [], "btn_4", "切换显示模式");
  1478.  
  1479. utils.toggleBtnStatus("btn_2");
  1480. utils.toggleBtnStatus("btn_3");
  1481. utils.toggleBtnStatus("btn_4");
  1482. change();
  1483. }
  1484.  
  1485.  
  1486. /**
  1487. * 处理svg的url
  1488. * @param {string} svg_url
  1489. */
  1490. async function handleSVGurl(svg_url) {
  1491. let resp = await fetch(svg_url);
  1492. let data = await resp.text();
  1493. globalThis["ishareJS"].data = data;
  1494.  
  1495. let sep = data.slice(0, 10);
  1496. let svg_texts = data
  1497. .split(sep)
  1498. .slice(1)
  1499. .map(svg_text => sep + svg_text);
  1500.  
  1501. console.log(`共 ${svg_texts.length} 张图片`);
  1502.  
  1503. let article = _createDiv(data);
  1504. let boxes = article.querySelectorAll(".svg-box");
  1505. boxes.forEach((obj, i) => {
  1506. let blob = new Blob([svg_texts[i]], {type: "image/svg+xml"});
  1507. let url = URL.createObjectURL(blob);
  1508. obj.data = url;
  1509. URL.revokeObjectURL(blob);
  1510. });
  1511.  
  1512. let body = wk$("body")[0];
  1513. body.innerHTML = "";
  1514. body.appendChild(article);
  1515.  
  1516. utils.createBtns();
  1517. utils.setBtnEvent(utils.hideBtnThenPrint, [], "btn_1", "打印页面到PDF");
  1518. utils.setBtnEvent(setGapGUI, [], "btn_2", "重设页间距");
  1519. utils.setBtnEvent(handleSVGtext, [], "btn_3", "显示空白点我");
  1520.  
  1521. utils.toggleBtnStatus("btn_2");
  1522. utils.toggleBtnStatus("btn_3");
  1523. }
  1524.  
  1525.  
  1526. /**
  1527. * 取得图片下载地址
  1528. * @param {string} fname
  1529. * @param {string} path
  1530. * @returns
  1531. */
  1532. function getImgUrl(fname, path) {
  1533. if (!fname) {
  1534. throw new Error("URL Param `fname` does not exist.");
  1535. }
  1536. return location.href
  1537. .replace(/[?].+?&ssig/, "?ssig")
  1538. .replace("?", path + "?");
  1539. }
  1540.  
  1541.  
  1542. /**
  1543. * 下载整个图片包
  1544. * @param {string} img_url
  1545. * @returns
  1546. */
  1547. async function getData(img_url) {
  1548. let resp = await fetch(img_url);
  1549. let buffer = await resp.arrayBuffer();
  1550. return new Uint8Array(buffer);
  1551. }
  1552.  
  1553.  
  1554. /**
  1555. * 分切图片包为若干图片
  1556. * @param {Uint8Array} data 多张图片合集数据包
  1557. * @returns {Array<Uint8Array>} 图片列表
  1558. */
  1559. function parseData(data) {
  1560. // 判断图像类型/拿到文件头
  1561. let head = data.slice(0, 10);
  1562. // let type = getImgType(head);
  1563. let sep = head.join() + ",";
  1564. // 切断,重组,格式转换
  1565. return data.join().split(sep).slice(1).map(
  1566. val => new Uint8Array((sep + val).split(","))
  1567. );
  1568. }
  1569.  
  1570.  
  1571. /**
  1572. * 图像Uint8数组列表合并然后导出PDF
  1573. * @param {string} fname
  1574. * @param {Array<Uint8Array>} img_data_list
  1575. */
  1576. async function imgDataArrsToPDF(fname, img_data_list) {
  1577. let cover_blob = new Blob([img_data_list[0]]);
  1578. let cover = await createImageBitmap(cover_blob);
  1579.  
  1580. utils.saveCanvasesToPDF(
  1581. img_data_list,
  1582. fname,
  1583. cover.width,
  1584. cover.height
  1585. );
  1586. }
  1587.  
  1588.  
  1589. async function exportPDF$1() {
  1590. let fname = utils.getUrlParam("fname");
  1591. let path = utils.getUrlParam("path");
  1592. let img_url = getImgUrl(fname, path);
  1593.  
  1594. // 处理svg
  1595. if (path.includes(".svg")) {
  1596. document.title = fname;
  1597. await handleSVGurl(img_url);
  1598. return;
  1599. }
  1600. // 处理常规图像
  1601. let data = await getData(img_url);
  1602. let img_data_list = parseData(data);
  1603. console.log(`共 ${img_data_list.length} 张图片`);
  1604. await imgDataArrsToPDF(fname, img_data_list);
  1605. }
  1606.  
  1607.  
  1608. function showHints$1() {
  1609. wk$("h1")[0].textContent = "wk 温馨提示";
  1610. wk$("p")[0].innerHTML = [
  1611. "下载 270 页的 PPT (70 MB) 需要约 30 秒",
  1612. "请耐心等待,无需反复点击按钮",
  1613. "如果很久没反应,请加 QQ 群反馈问题"
  1614. ].join("<br>");
  1615. wk$("hr")[0].nextSibling.textContent = "403 Page Hostaged By Wenku Doc Downloader";
  1616. }
  1617.  
  1618.  
  1619. /**
  1620. * 爱问文库下载策略
  1621. */
  1622. async function ishareData() {
  1623. // 全局对象
  1624. globalThis["ishareJS"] = {
  1625. data: "",
  1626. text: "",
  1627. content_1: "",
  1628. content_2: ""
  1629. };
  1630.  
  1631. // 显示提示
  1632. showHints$1();
  1633.  
  1634. // 创建按钮区
  1635. utils.createBtns();
  1636.  
  1637. // btn_1: 识别文档类型 -> 导出PDF
  1638. exportPDF$1 = await utils.recTime(exportPDF$1);
  1639. utils.setBtnEvent(exportPDF$1, [], "btn_1", "下载并导出PDF");
  1640. }
  1641.  
  1642. // /**
  1643. // * 清理并打印得力文库的文档页
  1644. // */
  1645. // function printPageDeliwenku() {
  1646. // // 移除页面上的无关元素
  1647. // let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1648. // let elem_list = document.querySelectorAll(selector);
  1649. // for (let elem of elem_list) {
  1650. // utils.tryToRemoveElement(elem);
  1651. // }
  1652. // // 修改页间距
  1653. // let outer_pages = document.getElementsByClassName("outer_page");
  1654. // for (let page of outer_pages) {
  1655. // page.style.marginBottom = "20px";
  1656. // }
  1657. // // 使文档居中
  1658. // alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1659. // if (!utils.centerDoc("#boxleft", "3")) {
  1660. // return; // 如果输入非法,终止函数调用
  1661. // }
  1662. // // 打印文档
  1663. // utils.hideBtnThenPrint();
  1664. // }
  1665.  
  1666.  
  1667. // /**
  1668. // * 点击“继续阅读”,适用性:得力文库
  1669. // */
  1670. // function readAllDeliwenku() {
  1671. // // 点击“同意并开始预览全文”
  1672. // let start_btn = document.getElementsByClassName("pre_button")[0];
  1673. // let display = start_btn.parentElement.parentElement.style.display;
  1674. // // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1675. // if (!display) {
  1676. // start_btn.children[0].click();
  1677. // setTimeout(() => {
  1678. // scroll(0, document.body.scrollHeight);
  1679. // }, 200);
  1680. // return;
  1681. // }
  1682. // // 增强按钮点击效果
  1683. // utils.enhanceBtnClickReaction();
  1684.  
  1685. // let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1686. // let display2 = read_all_btn.parentElement.parentElement.style.display
  1687. // // 继续阅读
  1688. // if (display2 !== "none") {
  1689. // // 获取input元素
  1690. // let cur_page = document.querySelector("#pageNumInput");
  1691. // let page_old = cur_page.value;
  1692. // let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1693. // // 跳转到尾页
  1694. // utils.jump2pageNo(cur_page, page_max, "keydown");
  1695. // // 跳转回来
  1696. // utils.jump2pageNo(cur_page, page_old, "keydown");
  1697.  
  1698. // // 切换按钮准备导出
  1699. // } else {
  1700. // // 推荐导出图片链接
  1701. // utils.modifyBtnText("btn_2", null, true);
  1702. // // 隐藏按钮
  1703. // utils.toggleBtnStatus("btn_1");
  1704. // // 显示按钮
  1705. // utils.toggleBtnStatus("btn_2");
  1706. // utils.toggleBtnStatus("btn_3");
  1707. // // btn_3 橙色按钮
  1708. // utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1709. // }
  1710. // }
  1711.  
  1712.  
  1713. // /**
  1714. // * 得力文库文档下载策略
  1715. // */
  1716. // function deliwenkuDeprecated() {
  1717. // // 创建脚本启动按钮1、2
  1718. // utils.createBtns();
  1719.  
  1720. // // btn_1: 展开文档
  1721. // utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1722. // // btn_2: 导出图片链接
  1723. // utils.setBtnEvent(() => {
  1724. // if (confirm("确定每页内容都加载完成了吗?")) {
  1725. // utils.savePicUrls('.inner_page div');
  1726. // }
  1727. // }, [], "btn_2", "导出图片链接");
  1728.  
  1729. // // 尝试关闭页面弹窗
  1730. // try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1731. // // 解除打印限制
  1732. // utils.allowPrint();
  1733. // }
  1734.  
  1735.  
  1736. function getPageNum() {
  1737. // ' / 6 ' -> ' 6 '
  1738. let num_str = wk$("span.counts")[0].textContent.split("/")[1];
  1739. return parseInt(num_str);
  1740. }
  1741.  
  1742.  
  1743. function jumpToHostage() {
  1744. let url = new URL(wk$("#pageflash_1 > img")[0].src);
  1745. // '/fileroot/2019-9/23/73598bfa-6b91-4cbe-a548-9996f46653a2/73598bfa-6b91-4cbe-a548-9996f46653a21.gif'
  1746. let num = getPageNum();
  1747. // '七年级上册地理期末试卷精编.doc-得力文库'
  1748. let fname = document.title.slice(0, -5);
  1749. let path = url.pathname;
  1750. let tail = "1.gif";
  1751. if (!path.endsWith(tail)) {
  1752. throw new Error(`url尾部不为【${tail}】!path:【${path}】`);
  1753. }
  1754. let base_path = path.slice(0, -5);
  1755.  
  1756. globalThis.open(
  1757. `${url.protocol}//${url.host}/?num=${num}&lmt=${lmt}&fname=${fname}&path=${base_path}`,
  1758. "hostage"
  1759. );
  1760. }
  1761.  
  1762.  
  1763. function deliwenku() {
  1764. utils.createBtns();
  1765. utils.setBtnEvent(jumpToHostage, [], "btn_1", "到下载页面");
  1766. }
  1767.  
  1768. function showHints() {
  1769. let info = globalThis["deliJS"];
  1770. let body = `
  1771. <style>
  1772. h1 {
  1773. color: black;
  1774. }
  1775.  
  1776. #main {
  1777. margin: 1vw 5%;
  1778. border-radius: 10%;
  1779. }
  1780.  
  1781. p {
  1782. font-size: large;
  1783. }
  1784.  
  1785. .info {
  1786. color: rgb(230,214,110);
  1787. background: rgb(39,40,34);
  1788. text-align: right;
  1789. font-size: medium;
  1790. padding: 1vw;
  1791. border-radius: 4px;
  1792. }
  1793. </style>
  1794. <div id="main">
  1795. <h1>wk: 跳板页面</h1>
  1796. <p>有时候点一次下载等半天没反应,就再试一次</p>
  1797. <p>如果试了 2 次还不行加 QQ 群反馈吧...</p>
  1798. <p>导出的PDF如果页面数量少于应有的,那么意味着免费页数就这么多,我也爱莫能助</p>
  1799. <p>短时间连续使用导出按钮会导致 IP 被封禁</p>
  1800. <hr>
  1801. <div class="info">
  1802. 文档名称:${info.fname}<br>
  1803. 原始文档页数:${info.num}<br>
  1804. 最大免费页数:${info.lmt}<br>
  1805. </div>
  1806. </div>
  1807. `;
  1808. document.title = utils.getUrlParam("fname"); document.body.innerHTML = body;
  1809. }
  1810.  
  1811.  
  1812. /**
  1813. * url生成器
  1814. * @param {string} base_url
  1815. * @param {number} num
  1816. */
  1817. function* genUrls(base_url, num) {
  1818. for (let i=1; i<=num; i++) {
  1819. yield `${base_url}${i}.gif`;
  1820. }
  1821. }
  1822.  
  1823.  
  1824. function genBaseURL(path) {
  1825. return `${location.protocol}//${location.host}${path}`;
  1826. }
  1827.  
  1828.  
  1829. function parseParamsToDeliJS() {
  1830. let path = utils.getUrlParam("path");
  1831. let base_url = genBaseURL(path);
  1832. let fname = utils.getUrlParam("fname");
  1833. let num = parseInt(utils.getUrlParam("num"));
  1834. let lmt = parseInt(utils.getUrlParam("lmt"));
  1835.  
  1836. lmt = lmt > 3? lmt: 20;
  1837. lmt = lmt > num? num: lmt;
  1838.  
  1839. globalThis["deliJS"] = {
  1840. base_url,
  1841. num,
  1842. fname,
  1843. lmt
  1844. };
  1845. }
  1846.  
  1847.  
  1848. async function exportPDF() {
  1849. let info = globalThis["deliJS"];
  1850. await utils.imgUrlsToPDF(
  1851. genUrls(info.base_url, info.num),
  1852. info.fname,
  1853. info.lmt,
  1854. true // 请求完成后清理控制台
  1855. );
  1856. }
  1857.  
  1858.  
  1859. /**
  1860. * 得力文库跳板页面下载策略
  1861. */
  1862. async function deliFile() {
  1863. // 从URL解析文档参数
  1864. parseParamsToDeliJS();
  1865. // 显示提示
  1866. showHints();
  1867.  
  1868. // 创建按钮区
  1869. utils.createBtns();
  1870. // btn_1: 导出PDF
  1871. exportPDF = await utils.recTime(exportPDF);
  1872. utils.setBtnEvent(exportPDF, [], "btn_1", "下载并导出PDF");
  1873. }
  1874.  
  1875. function readAll360Doc() {
  1876. // 展开文档
  1877. document.querySelector(".article_showall a").click();
  1878. // 隐藏按钮
  1879. utils.toggleBtnStatus("btn_1");
  1880. // 显示按钮
  1881. utils.toggleBtnStatus("btn_2");
  1882. utils.toggleBtnStatus("btn_3");
  1883. }
  1884.  
  1885.  
  1886. function saveText_360Doc() {
  1887. // 捕获图片链接
  1888. let images = document.querySelectorAll("#artContent img");
  1889. let content = [];
  1890.  
  1891. for (let i = 0; i < images.length; i++) {
  1892. let src = images[i].src;
  1893. content.push(`图${i+1},链接:${src}`);
  1894. }
  1895. // 捕获文本
  1896. let text = document.querySelector("#artContent").textContent;
  1897. content.push(text);
  1898.  
  1899. // 保存纯文本文档
  1900. let title = document.querySelector("#titiletext").textContent;
  1901. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1902. }
  1903.  
  1904.  
  1905. function printPage360Doc() {
  1906. // # 清理并打印360doc的文档页
  1907. // ## 移除页面上无关的元素
  1908. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1909. let elem_list = document.querySelectorAll(selector);
  1910. let under_doc_1, under_doc_2;
  1911. try {
  1912. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1913. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1914. } catch (e) { console.log(); }
  1915. // 执行移除
  1916. for (let elem of elem_list) {
  1917. utils.tryToRemoveElement(elem);
  1918. }
  1919. utils.tryToRemoveElement(under_doc_1);
  1920. utils.tryToRemoveElement(under_doc_2);
  1921. // 执行隐藏
  1922. document.querySelector("a[title]").style.display = "none";
  1923.  
  1924. // 使文档居中
  1925. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1926. if (!utils.centerDoc(".a_left", "20")) {
  1927. return; // 如果输入非法,终止函数调用
  1928. }
  1929. // 隐藏按钮,然后打印页面
  1930. utils.hideBtnThenPrint();
  1931. }
  1932.  
  1933.  
  1934. /**
  1935. * 360doc个人图书馆下载策略
  1936. */
  1937. function doc360() {
  1938. // 创建按钮区
  1939. utils.createBtns();
  1940. // btn_1: 展开文档
  1941. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1942. // btn_2: 导出纯文本
  1943. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1944. // btn_3: 打印页面到PDF
  1945. utils.setBtnEvent(() => {
  1946. if (confirm("确定每页内容都加载完成了吗?")) {
  1947. printPage360Doc();
  1948. }
  1949. }, [], "btn_3", "打印页面到PDF");
  1950. }
  1951.  
  1952. /**
  1953. * 查找出所有未被捕获的页码,并返回列表
  1954. * @returns 未捕获页码列表
  1955. */
  1956. function getMissedPages() {
  1957. let all = []; // 全部页码
  1958. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1959. all[i] = i + 1;
  1960. }
  1961. let missed = []; // 未捕获页码
  1962. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1963.  
  1964. // 排除并录入未捕获页码
  1965. for (let num of all) {
  1966. if (!possessed.includes(`page${num}`)) {
  1967. missed.push(num);
  1968. }
  1969. }
  1970. return missed;
  1971. }
  1972.  
  1973.  
  1974. /**
  1975. * 根据键中的id数字对map排序
  1976. * @param {Map} elems_map
  1977. * @returns sorted_map
  1978. */
  1979. function sortMapByID(elems_map) {
  1980. // id形式:page2
  1981. let elems_arr = Array.from(elems_map);
  1982. elems_arr.sort((item1, item2) => {
  1983. // 从key中取出id
  1984. let id1 = parseInt(item1[0].replace("page", ""));
  1985. let id2 = parseInt(item2[0].replace("page", ""));
  1986. // 升序排序
  1987. return id1 - id2;
  1988. });
  1989. // 返回排序好的map
  1990. return new Map(elems_arr);
  1991. }
  1992.  
  1993.  
  1994. /**
  1995. * 存储动态加载的canvas元素、textContent
  1996. */
  1997. function storeElements_MBA() {
  1998. let canvases_map = window.mbaJS.canvases_map;
  1999. let texts_map = window.mbaJS.texts_map;
  2000. let quality = window.mbaJS.quality;
  2001.  
  2002. document.querySelectorAll(".page[data-loaded=true]").forEach(
  2003. (elem) => {
  2004. let capture = (elem) => {
  2005. // (1) 存储页面为canvas图形
  2006. let canvas, data_base64;
  2007. // 导出canvas数据防止丢失
  2008. try {
  2009. // 存储canvas
  2010. canvas = elem.querySelector("canvas[id*=page]");
  2011. if (window.mbaJS.only_text) {
  2012. data_base64 = null;
  2013. } else {
  2014. data_base64 = canvas.toDataURL("image/jpeg", quality);
  2015. }
  2016. } catch (e) {
  2017. // utils.sleep(500);
  2018. return;
  2019. }
  2020. // 增量录入map
  2021. let id = canvas.id; // id的形式:page2
  2022. if (!canvases_map.has(id)) {
  2023. canvases_map.set(id, data_base64);
  2024. }
  2025. // 确定canvas长宽
  2026. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  2027. window.mbaJS.width = parseInt(canvas.width);
  2028. window.mbaJS.height = parseInt(canvas.height);
  2029. }
  2030.  
  2031. // (2) 存储text
  2032. let text = elem.textContent;
  2033. if (!texts_map.has(id)) {
  2034. texts_map.set(id, text);
  2035. }
  2036. };
  2037. setTimeout(capture, 500, elem);
  2038. });
  2039. if (canvases_map.size === window.mbaJS.max_page) {
  2040. // 根据id排序
  2041. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  2042. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  2043. window.mbaJS.finished = true;
  2044. window.onscroll = null;
  2045. }
  2046. }
  2047.  
  2048.  
  2049. /**
  2050. * 将canvas转为jpeg,然后导出PDF
  2051. * @param {Array} base64_list canvas元素列表
  2052. * @param {String} title 文档标题
  2053. */
  2054. function saveCanvasesToPDF_MBA(base64_list, title) {
  2055. let width = window.mbaJS.width;
  2056. let height = window.mbaJS.height;
  2057.  
  2058. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  2059. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  2060. let orientation = width > height ? 'l' : 'p';
  2061. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  2062.  
  2063. // 保存每一页文档到每一页pdf
  2064. let i = 0;
  2065. for (let base64 of base64_list) {
  2066. i += 1;
  2067. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  2068. // 如果当前不是文档最后一页,则需要添加下一个空白页
  2069. if (i < window.mbaJS.max_page) {
  2070. pdf.addPage();
  2071. }
  2072. }
  2073. // 导出文件
  2074. pdf.save(`${title}.pdf`);
  2075. }
  2076.  
  2077. /**
  2078. * 判断文档页是否收集完毕,当不行时给出提示
  2079. * @returns boolean
  2080. */
  2081. function ready2use() {
  2082. removeAds(); // 顺便清理广告
  2083. // 如果是首次点击按钮,给出提示
  2084. if (window.mbaJS.first_hint) {
  2085. let hint = [
  2086. "如果浏览速度过快,比如:",
  2087. "当前页面还没完全加载好就滚动页面去看下一页",
  2088. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  2089. "由防范技术的干扰,该功能目前很不好用,见谅"
  2090. ].join("\n");
  2091. alert(hint);
  2092. window.mbaJS.first_hint = false;
  2093. }
  2094. // 如果文档页没有收集完,给出提示
  2095. if (!window.mbaJS.finished) {
  2096. let hint = [
  2097. "仍有内容未加载完,无法使用该功能",
  2098. "建议从头到尾慢速地再浏览一遍",
  2099. "以下是没有加载完成页面的页码:",
  2100. getMissedPages().join(",")
  2101. ];
  2102. alert(hint.join("\n"));
  2103. return false;
  2104. }
  2105. return true;
  2106. }
  2107.  
  2108.  
  2109. /**
  2110. * 用捕获好的canvas转jpg,生成PDF
  2111. * @returns
  2112. */
  2113. function canvas2PDF_mba() {
  2114. if (!ready2use()) {
  2115. return;
  2116. }
  2117. let canvases = window.mbaJS.canvases_map.values();
  2118. // 导出PDF
  2119. let title = document.title.split("-")[0].trim();
  2120. saveCanvasesToPDF_MBA(canvases, title);
  2121. }
  2122.  
  2123.  
  2124. /**
  2125. * 拼合捕获好的文本,保存到txt文件
  2126. * @returns
  2127. */
  2128. function saveText_mba() {
  2129. if (!ready2use()) {
  2130. return;
  2131. }
  2132. let content = Array.from(window.mbaJS.texts_map.values());
  2133. let title = document.title.split("-")[0].trim();
  2134. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  2135. }
  2136.  
  2137.  
  2138. /**
  2139. * 移除广告
  2140. */
  2141. function removeAds() {
  2142. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  2143. utils.tryToRemoveElement(ad_elem);
  2144. });
  2145. }
  2146.  
  2147.  
  2148. function mbalib_() {
  2149. // 移除广告和左侧工具栏
  2150. removeAds();
  2151. let tool_bar = document.querySelector(".tool-bar");
  2152. utils.tryToRemoveElement(tool_bar);
  2153.  
  2154. // 创建按钮
  2155. utils.createBtns();
  2156. // 隐藏按钮
  2157. utils.toggleBtnStatus("btn_1");
  2158. // 显示按钮
  2159. utils.toggleBtnStatus("btn_2");
  2160. utils.toggleBtnStatus("btn_3");
  2161. utils.toggleBtnStatus("btn_4");
  2162.  
  2163. // 取得页数
  2164. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  2165.  
  2166. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  2167. window.mbaJS = {
  2168. max_page: max_page,
  2169. texts_map: new Map(), // id: text
  2170. canvases_map: new Map(), // id: canvas_data_base64
  2171. quality: 1, // canvas转jpg的质量
  2172. width: null, // canvas宽度(px)
  2173. height: null,
  2174. finished: false, // 是否收集完了全部文档页元素
  2175. first_hint: true,
  2176. scroll_count: 0, // 用于统计累计触发scroll的次数,
  2177. only_text: false // 是否仅捕获文本
  2178. };
  2179. // 跟随浏览,动态收集页面元素
  2180. window.onscroll = () => {
  2181. storeElements_MBA();
  2182. };
  2183. // 跟随浏览,动态收集页面元素
  2184. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2185. // 绑定事件
  2186. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2187. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2188.  
  2189. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2190. let btn_text, aim_btn, hint;
  2191. if (max_page > 40) {
  2192. btn_text = "失效说明";
  2193. aim_btn = "btn_3";
  2194. hint = [
  2195. "页数超过40,脚本无效",
  2196. "只能使用导出文本功能",
  2197. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2198. ];
  2199. utils.setBtnEvent(
  2200. () => {
  2201. utils.toggleBtnsSec();
  2202. window.onscroll = null;
  2203. },
  2204. [],
  2205. "btn_4",
  2206. "临时禁用脚本"
  2207. );
  2208. } else {
  2209. btn_text = "空白页说明";
  2210. aim_btn = "btn_4";
  2211. hint = [
  2212. "导致空白页的原因如下",
  2213. "加载该页的时间超过2秒 / 明显等待",
  2214. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2215. ];
  2216. }
  2217.  
  2218. utils.setBtnEvent(() => {
  2219. alert(hint.join("\n"));
  2220. }, [], aim_btn, btn_text);
  2221. }
  2222.  
  2223.  
  2224. function mbalib() {
  2225. setTimeout(mbalib_, 2000);
  2226. }
  2227.  
  2228. /**
  2229. * 判断是否进入预览模式
  2230. * @returns Boolean
  2231. */
  2232. function isInPreview() {
  2233. let p_elem = document.querySelector("#preview_tips");
  2234. if (p_elem.style.display === "none") {
  2235. return true;
  2236. }
  2237. return false;
  2238. }
  2239.  
  2240.  
  2241. /**
  2242. * 判断是否展开了全文
  2243. * @returns Boolean
  2244. */
  2245. function isNoMorePage() {
  2246. let read_more = document.querySelector("#ntip2");
  2247. if (read_more.style.display === "none") {
  2248. return true;
  2249. }
  2250. return false;
  2251. }
  2252.  
  2253.  
  2254. /**
  2255. * 确保进入预览模式
  2256. */
  2257. async function ensureInPreview() {
  2258. if (!isInPreview()) {
  2259. // 如果没有进入预览,则先进入
  2260. document.querySelector(".pre_button a").click();
  2261. await utils.sleep(500);
  2262. }
  2263. }
  2264.  
  2265.  
  2266. /**
  2267. * 展开全文预览,当展开完成后再次调用时,返回true
  2268. * @returns
  2269. */
  2270. async function unfoldAll() {
  2271. await ensureInPreview();
  2272. if (isNoMorePage()) {
  2273. // 如果全文展开了,则切换按钮,然后退出
  2274. utils.toggleBtnStatus("btn_1");
  2275. utils.toggleBtnStatus("btn_2");
  2276. return true;
  2277. }
  2278. // 跳转到最后一页,以展开全文
  2279. let cur_page = document.querySelector("#pageNumInput");
  2280. utils.jump2pageNo(cur_page, "999", "keydown");
  2281. }
  2282.  
  2283.  
  2284. /**
  2285. * 取得最大页码(最大20)
  2286. * @returns {number} 页码int
  2287. */
  2288. function getPageCounts$2() {
  2289. let counts_str = document.querySelector(".counts").textContent;
  2290. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2291. if (counts > 20) {
  2292. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2293. }
  2294. return parseInt(counts);
  2295. }
  2296.  
  2297.  
  2298. /**
  2299. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2300. * @returns Array | null
  2301. */
  2302. function getImgUrls() {
  2303. let pages = document.querySelectorAll("[id*=pageflash_]");
  2304. // 尚未浏览完全部页面,返回null
  2305. if (pages.length < window.dugenJS.page_counts) {
  2306. return null;
  2307. }
  2308. // 浏览完全部页面,返回urls
  2309. let urls = [];
  2310. pages.forEach((page) => {
  2311. let url = page.querySelector("img").src;
  2312. urls.push(url);
  2313. });
  2314. return urls;
  2315. }
  2316.  
  2317.  
  2318. /**
  2319. * 返回当前未加载页面的页码
  2320. * @returns not_loaded
  2321. */
  2322. function getNotloadedPages() {
  2323. // 已经取得的页码
  2324. let pages = document.querySelectorAll("[id*=pageflash_]");
  2325. let loaded = new Set();
  2326. pages.forEach((page) => {
  2327. let id = page.id.split("_")[1];
  2328. id = parseInt(id);
  2329. loaded.add(id);
  2330. });
  2331. // 未取得的页码
  2332. let not_loaded = [];
  2333. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2334. if (!loaded.has(i)) {
  2335. not_loaded.push(i);
  2336. }
  2337. }
  2338. return not_loaded;
  2339. }
  2340.  
  2341.  
  2342. function WantImgUrls() {
  2343. let res = getImgUrls();
  2344. // 页面尚未加载完
  2345. if (res === null) {
  2346. let hints = [
  2347. "尚未加载完全部页面",
  2348. "以下页面需要浏览并加载:",
  2349. getNotloadedPages().join(",")
  2350. ];
  2351. alert(hints.join("\n"));
  2352. return;
  2353. }
  2354. // 页面全部加载完
  2355. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2356. }
  2357.  
  2358.  
  2359. /**
  2360. * dugen文档下载策略
  2361. */
  2362. async function dugen() {
  2363. await ensureInPreview();
  2364. // 全局对象
  2365. window.dugenJS = {
  2366. page_counts: getPageCounts$2() // 最大页码(int)
  2367. };
  2368.  
  2369. // 创建按钮区
  2370. utils.createBtns();
  2371.  
  2372. // 绑定监听器
  2373. // 按钮1:展开文档
  2374. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2375. // 按钮2:导出图片链接
  2376. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2377. }
  2378.  
  2379. /**
  2380. * 取得文档类型
  2381. * @returns {String} 文档类型str
  2382. */
  2383. function getDocType() {
  2384. let type_elem = document.querySelector(".title .icon.icon-format");
  2385. // ["icon", "icon-format", "icon-format-doc"]
  2386. let cls_str = type_elem.classList[2];
  2387. // "icon-format-doc"
  2388. let type = cls_str.split("-")[2];
  2389. return type;
  2390. }
  2391.  
  2392.  
  2393. /**
  2394. * 判断文档类型是否为type_list其中之一
  2395. * @returns 是否为type
  2396. */
  2397. function isTypeof(type_list) {
  2398. let type = getDocType();
  2399. if (type_list.includes(type)) {
  2400. return true;
  2401. }
  2402. return false;
  2403. }
  2404.  
  2405.  
  2406. /**
  2407. * 判断文档类型是否为PPT
  2408. * @returns 是否为PPT
  2409. */
  2410. function isPPT() {
  2411. return isTypeof(["ppt", "pptx"]);
  2412. }
  2413.  
  2414.  
  2415. /**
  2416. * 判断文档类型是否为Excel
  2417. * @returns 是否为Excel
  2418. */
  2419. function isEXCEL() {
  2420. return isTypeof(["xls", "xlsm", "xlsx"]);
  2421. }
  2422.  
  2423.  
  2424. /**
  2425. * 取得最大页码
  2426. * @returns {Number} 最大页码
  2427. */
  2428. function getPageCounts$1() {
  2429. let page_counts_str = document.querySelector(".intro-list").textContent;
  2430. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2431. return page_counts;
  2432. }
  2433.  
  2434.  
  2435. /**
  2436. * 取得未加载页面的页码
  2437. * @param {Set} loaded 已加载的页码集合
  2438. * @returns {Array} not_loaded 未加载页码列表
  2439. */
  2440. function getNotLoaded(loaded) {
  2441. let not_loaded = [];
  2442. let page_counts = window.book118JS.page_counts;
  2443. for (let i = 1; i <= page_counts; i++) {
  2444. if (!loaded.has(i)) {
  2445. not_loaded.push(i);
  2446. }
  2447. }
  2448. return not_loaded;
  2449. }
  2450.  
  2451.  
  2452. /**
  2453. * 取得全部文档页的url
  2454. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2455. */
  2456. function getUrls() {
  2457. let loaded = new Set(); // 存储已加载页面的页码
  2458. let urls = []; // 存储已加载页面的图形src
  2459. // 收集已加载页面的url
  2460. document.querySelectorAll("div[data-id]").forEach((div) => {
  2461. let src = div.querySelector("img").src;
  2462. if (src) {
  2463. // "1": "https://view-cache.book118.com/..."
  2464. loaded.add(parseInt(div.getAttribute("data-id")));
  2465. urls.push(src);
  2466. }
  2467. });
  2468. // 如果所有页面加载完毕
  2469. if (loaded.size === window.book118JS.page_counts) {
  2470. return [true, urls];
  2471. }
  2472. // 否则收集未加载页面的url
  2473. return [false, getNotLoaded(loaded)];
  2474. }
  2475.  
  2476.  
  2477. /**
  2478. * 展开全文
  2479. */
  2480. function readAll() {
  2481. window.preview.jump(999);
  2482. }
  2483.  
  2484.  
  2485. /**
  2486. * btn_2: 导出图片链接
  2487. */
  2488. function wantUrls() {
  2489. let [flag, res] = getUrls();
  2490. // 页面都加载完毕,下载urls
  2491. if (flag) {
  2492. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2493. return;
  2494. }
  2495. // 没有加载完,提示出未加载好的页码
  2496. let hints = [
  2497. "仍有页面没有加载",
  2498. "请浏览并加载如下页面:",
  2499. res.join(",")
  2500. ];
  2501. alert(hints.join("\n"));
  2502. }
  2503.  
  2504.  
  2505. /**
  2506. * 打开PPT预览页面
  2507. */
  2508. function openPPTpage() {
  2509. window.preview.getSrc();
  2510. let openPPT = () => {
  2511. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2512. utils.openInNewTab(ppt_src);
  2513. window.preview.close();
  2514. };
  2515. setTimeout(openPPT, 1000);
  2516. }
  2517.  
  2518.  
  2519. /**
  2520. * 原创力文档(非PPT或Excel)下载策略
  2521. */
  2522. function book118_CommonDoc() {
  2523. // 创建全局对象
  2524. window.book118JS = {
  2525. doc_type: getDocType(),
  2526. page_counts: getPageCounts$1()
  2527. };
  2528.  
  2529. // 处理非PPT文档
  2530. // 创建按钮组
  2531. utils.createBtns();
  2532. // 绑定监听器到按钮
  2533. // 按钮1:展开文档
  2534. utils.setBtnEvent(() => {
  2535. readAll();
  2536. utils.toggleBtnStatus("btn_1");
  2537. utils.toggleBtnStatus("btn_2");
  2538. }, [], "btn_1");
  2539. // 按钮2:导出图片链接
  2540. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2541. }
  2542.  
  2543.  
  2544. /**
  2545. * 取得PPT文档最大页码
  2546. * @returns PPT文档最大页码int
  2547. */
  2548. function getPageCountsPPT() {
  2549. let counts_str = document.querySelector("#PageCount").textContent;
  2550. let counts = parseInt(counts_str);
  2551. // console.log(`get page counts: ${counts}`);
  2552. return counts;
  2553. }
  2554.  
  2555.  
  2556. /**
  2557. * 取得当前的页码
  2558. * @returns {Number} this_page
  2559. */
  2560. function getThisPage() {
  2561. let this_page = document.querySelector("#PageIndex").textContent;
  2562. this_page = parseInt(this_page);
  2563. return this_page;
  2564. }
  2565.  
  2566.  
  2567. /**
  2568. * 点击下一动画直到变成下一页,再切回上一页
  2569. * @param {Number} next_page 下一页的页码
  2570. */
  2571. async function __nextFrameUntillNextPage(next_page) {
  2572. // 如果已经抵达下一页,则返回上一页
  2573. let this_page = getThisPage();
  2574.  
  2575. // 最后一页直接退出
  2576. if (next_page > getPageCountsPPT()) {
  2577. return;
  2578. }
  2579. // 不是最后一页,但完成了任务
  2580. else if (this_page === next_page) {
  2581. document.querySelector(".btmLeft").click();
  2582. await utils.sleep(500);
  2583. return;
  2584. }
  2585. // 否则递归的点击下一动画
  2586. document.querySelector(".btmRight").click();
  2587. await utils.sleep(500);
  2588. await __nextFrameUntillNextPage(next_page);
  2589. }
  2590.  
  2591.  
  2592. /**
  2593. * 确保当前页面是最后一帧动画
  2594. */
  2595. async function ensurePageLoaded() {
  2596. // 取得当前页码和下一页页码
  2597. let this_page = getThisPage();
  2598. let next_page = this_page + 1;
  2599. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2600. await __nextFrameUntillNextPage(next_page);
  2601. }
  2602.  
  2603.  
  2604. /**
  2605. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2606. */
  2607. async function docView2Canvas() {
  2608. await ensurePageLoaded();
  2609. // 取得页码
  2610. let cur_page = getThisPage();
  2611. // 取得视图元素,计数从0开始
  2612. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2613. // 转化为canvas
  2614. let canvas_promise = html2canvas(doc_view);
  2615. console.log(canvas_promise); // 打印信息以检查状况
  2616.  
  2617. await canvas_promise.then((canvas) => {
  2618. // 保存canvas到全局对象
  2619. window.book118JS.canvases.push(canvas);
  2620. // 打印日志
  2621. console.log(`wk: ${cur_page} complete`);
  2622. });
  2623.  
  2624. // 如果到最后一页
  2625. let page_counts = getPageCountsPPT();
  2626. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2627. if (cur_page === page_counts) {
  2628. // 终止递归,并且显示导出PDF按钮
  2629. utils.toggleBtnStatus("btn_2");
  2630. return;
  2631. }
  2632. // 否则下一次递归(继续捕获下一页)
  2633. document.querySelector(".pgRight").click();
  2634. await utils.sleep(500);
  2635. await docView2Canvas();
  2636. }
  2637.  
  2638.  
  2639. /**
  2640. * 将捕获的canvases合并并导出为pdf
  2641. * @returns
  2642. */
  2643. function canvases2pdf() {
  2644. // 已经捕获的页面数量
  2645. let stored_amount = window.book118JS.canvases.length;
  2646. // 总页面数量
  2647. let page_counts = window.book118JS.page_counts;
  2648. // 校验数量
  2649. let diff = page_counts - stored_amount;
  2650. if (diff > 0) {
  2651. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2652. if (!confirm("是否仍要导出PDF?")) {
  2653. // 不坚持导出PDF的情况
  2654. return;
  2655. }
  2656. }
  2657. // 导出PDF
  2658. let canvases = window.book118JS.canvases;
  2659. // 取得宽高
  2660. let model = canvases[0];
  2661. let width = model.width;
  2662. let height = model.height;
  2663. // 取得标题然后导出pdf
  2664. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2665. }
  2666.  
  2667.  
  2668. /**
  2669. * 原创力文档(PPT)下载策略
  2670. */
  2671. function book118_PPT() {
  2672. // 创建全局对象
  2673. window.book118JS = {
  2674. page_counts: getPageCountsPPT(),
  2675. canvases: [] // 存储每页文档转化的canvas
  2676. };
  2677.  
  2678. // 创建按钮区
  2679. utils.createBtns();
  2680. // 绑定监听器到按钮1
  2681. utils.setBtnEvent(() => {
  2682. let hints = [
  2683. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2684. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2685. ];
  2686. alert(hints.join("\n"));
  2687. // 隐藏按钮1
  2688. utils.toggleBtnStatus("btn_1");
  2689. // 开始捕获页面(异步)
  2690. docView2Canvas(window.book118JS.page_counts);
  2691. }, [], "btn_1", "捕获页面");
  2692. // 为按钮2绑定监听器
  2693. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2694. }
  2695.  
  2696.  
  2697. /**
  2698. * 取得当前页面的excel,返回csv string
  2699. * @returns {String} csv
  2700. */
  2701. function excel2CSV() {
  2702. let table = [];
  2703. let rows = document.querySelectorAll("tr[id]");
  2704.  
  2705. // 遍历行
  2706. for (let row of rows) {
  2707. let csv_row = [];
  2708. // 遍历列(单元格)
  2709. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2710. // 判断单元格是否存储图片
  2711. let img = cell.querySelector("img");
  2712. if (img) {
  2713. // 如果是图片,保存图片链接
  2714. csv_row.push(img.src);
  2715. } else {
  2716. // 否则保存单元格文本
  2717. csv_row.push(cell.textContent);
  2718. }
  2719. }
  2720. table.push(csv_row.join(","));
  2721. }
  2722.  
  2723. let csv = table.join("\n");
  2724. csv = csv.replace(/\n{2,}/g, "\n");
  2725. return csv;
  2726. }
  2727.  
  2728.  
  2729. /**
  2730. * 下载当前表格内容,保存为csv(utf-8编码)
  2731. */
  2732. function wantEXCEL() {
  2733. let file_name = "原创力表格_UTF-8.csv";
  2734. utils.createAndDownloadFile(file_name, excel2CSV());
  2735. }
  2736.  
  2737.  
  2738. /**
  2739. * 在Excel预览页面给出操作提示
  2740. */
  2741. function help() {
  2742. let hints = [
  2743. "【导出表格到CSV】只能导出当前sheet,",
  2744. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2745. "CSV是一种简单的表格格式,可以被Excel打开,",
  2746. "并转为 xls 或 xlsx 格式存储,",
  2747. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2748. "",
  2749. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2750. "有两个办法:",
  2751. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2752. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2753. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2754. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2755. ];
  2756. alert(hints.join("\n"));
  2757. }
  2758.  
  2759.  
  2760. /**
  2761. * 原创力文档(EXCEL)下载策略
  2762. */
  2763. function book118_EXCEL() {
  2764. // 创建按钮区
  2765. utils.createBtns();
  2766. // 绑定监听器到按钮
  2767. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2768. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2769. // 显示按钮
  2770. utils.toggleBtnStatus("btn_2");
  2771. }
  2772.  
  2773.  
  2774. /**
  2775. * 打开Excel预览页面
  2776. */
  2777. function openEXCELpage() {
  2778. openPPTpage();
  2779. }
  2780.  
  2781.  
  2782. /**
  2783. * 原创力文档下载策略
  2784. */
  2785. function book118() {
  2786. let host = window.location.hostname;
  2787. if (host === 'max.book118.com') {
  2788. if (isEXCEL()) {
  2789. utils.createBtns();
  2790. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2791. } else if (isPPT()) {
  2792. utils.createBtns();
  2793. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2794. } else {
  2795. book118_CommonDoc();
  2796. }
  2797. } else if (host === "view-cache.book118.com") {
  2798. book118_PPT();
  2799. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2800. book118_EXCEL();
  2801. } else {
  2802. console.log(`wk: Unknown host: ${host}`);
  2803. }
  2804. }
  2805.  
  2806. // test url: https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=E86BBCE32DA8E67F3DA04ED98F2465DB
  2807.  
  2808.  
  2809. /**
  2810. * 绘制0x0的bmp, 作为请求失败时返回的page
  2811. * @returns {Promise<ImageBitmap>} blank_page
  2812. */
  2813. async function blankBMP() {
  2814. let canvas = document.createElement("canvas");
  2815. [canvas.width, canvas.height] = [0, 0];
  2816. return createImageBitmap(canvas);
  2817. }
  2818.  
  2819.  
  2820. /**
  2821. * resp导出bmp
  2822. * @param {string} page_url
  2823. * @param {Promise<Response> | ImageBitmap} pms_or_bmp
  2824. * @returns {Promise<ImageBitmap>} page
  2825. */
  2826. async function respToPage(page_url, pms_or_bmp) {
  2827. let center = globalThis.gb688JS;
  2828. // 此时是bmp
  2829. if (pms_or_bmp instanceof ImageBitmap) {
  2830. return pms_or_bmp;
  2831. }
  2832.  
  2833. // 第一次下载, 且无人处理
  2834. if (!center.pages_status.get(page_url)) {
  2835. // 处理中, 设为占用
  2836. center.pages_status.set(page_url, 1);
  2837.  
  2838. // 处理
  2839. let resp;
  2840. try {
  2841. resp = await pms_or_bmp;
  2842. } catch(err) {
  2843. console.log("下载页面失败");
  2844. console.error(err);
  2845. return blankBMP();
  2846. }
  2847.  
  2848. let page_blob = await resp.blob();
  2849. let page = await createImageBitmap(page_blob);
  2850. center.pages.set(page_url, page);
  2851. // 处理结束, 设为释放
  2852. center.pages_status.set(page_url, 0);
  2853. return page;
  2854. }
  2855.  
  2856. // 有人正在下载且出于处理中
  2857. while (center.pages_status.get(page_url)) {
  2858. await utils.sleep(500);
  2859. }
  2860. return center.pages.get(page_url);
  2861. }
  2862.  
  2863.  
  2864. /**
  2865. * 获得PNG页面
  2866. * @param {string} page_url
  2867. * @returns {Promise<ImageBitmap>} bmp
  2868. */
  2869. async function getPage(page_url) {
  2870. // 如果下载过, 直接返回缓存
  2871. let pages = globalThis.gb688JS.pages;
  2872. if (pages.has(page_url)) {
  2873. return respToPage(page_url, pages.get(page_url));
  2874. }
  2875.  
  2876. // 如果从未下载过, 就下载
  2877. let resp = fetch(page_url, {
  2878. "headers": {
  2879. "accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
  2880. "accept-language": "zh-CN,zh;q=0.9,en;q=0.8",
  2881. "proxy-connection": "keep-alive"
  2882. },
  2883. "referrer": location.href,
  2884. "referrerPolicy": "strict-origin-when-cross-origin",
  2885. "body": null,
  2886. "method": "GET",
  2887. "mode": "cors",
  2888. "credentials": "include"
  2889. });
  2890. pages.set(page_url, resp);
  2891. return respToPage(page_url, resp);
  2892. }
  2893.  
  2894.  
  2895. /**
  2896. * 返回文档页div的裁切和粘贴位置信息: [[cut_x, cut_y, paste_x%, paset_y%],...]
  2897. * @param {HTMLDivElement} page_div 文档页元素
  2898. * @returns {Array<Array<number>>} positions
  2899. */
  2900. function getPostions(page_div) {
  2901. let positions = [];
  2902.  
  2903. Array.from(page_div.children).forEach(span => {
  2904. // 'pdfImg-3-8' -> {left: 30%; top: 80%;}
  2905. let paste_pos = span.className.split("-").slice(1).map(
  2906. v => parseInt(v) / 10
  2907. );
  2908. // '-600px 0px' -> [600, 0]
  2909. let cut_pos = span.style.backgroundPosition.split(" ").map(
  2910. v => Math.abs(parseInt(v))
  2911. );
  2912. positions.push([...cut_pos, ...paste_pos]);
  2913. });
  2914. return positions;
  2915. }
  2916.  
  2917.  
  2918. /**
  2919. * 取得文档页的图像url
  2920. * @param {HTMLDivElement} page_div
  2921. * @returns {string} url
  2922. */
  2923. function getPageURL(page_div) {
  2924. // 拿到目标图像url
  2925. let path = location.pathname.split("/").slice(0, -1).join("/");
  2926. let prefix = location.origin + path + "/";
  2927. let url = page_div.getAttribute("bg");
  2928. if (!url) {
  2929. // 'url("viewGbImg?fileName=VS72l67k0jw5g3j0vErP8DTsnWvk5QsqnNLLxaEtX%2FM%3D")'
  2930. url = page_div.children[0].style.backgroundImage.split('"')[1];
  2931. }
  2932. return prefix + url;
  2933. }
  2934.  
  2935.  
  2936. /**
  2937. * 下载目标图像并拆解重绘, 返回canvas
  2938. * @param {number} i 第 i 页 (从0开始)
  2939. * @param {HTMLDivElement} page_div
  2940. * @returns {Promise<Array>} [页码, Canvas]
  2941. */
  2942. async function getAndDrawPage(i, page_div) {
  2943. // 拿到目标图像
  2944. let url = getPageURL(page_div);
  2945. let page = await getPage(url);
  2946.  
  2947. // 绘制空白A4纸背景
  2948. let [page_w, page_h] = [1190, 1680];
  2949. let bg = document.createElement("canvas");
  2950. bg.width = page_w; // 注意canvas作为取景框的大小
  2951. bg.height = page_h; // 如果不设置等于一个很小的取景框
  2952. let bg_ctx = bg.getContext("2d");
  2953. bg_ctx.fillStyle = "white";
  2954. bg_ctx.fillRect(0, 0, page_w, page_h);
  2955.  
  2956. // 逐个区块剪切取出并粘贴
  2957. // wk$("#viewer .page").forEach(page_div => {
  2958. getPostions(page_div).forEach(pos => {
  2959. bg_ctx.drawImage(
  2960. page, // image source
  2961. pos[0], // source x
  2962. pos[1], // source y
  2963. 120, // source width
  2964. 169, // source height
  2965. pos[2] * page_w, // destination x = left: x%
  2966. pos[3] * page_h, // destination y = top: y%
  2967. 120, // destination width
  2968. 169 // destination height
  2969. );
  2970. });
  2971. // });
  2972. return [i, bg];
  2973. }
  2974.  
  2975.  
  2976. /**
  2977. * 页面批量请求、裁剪重绘, 合成PDF并下载
  2978. */
  2979. async function turnPagesToPDF() {
  2980. // 渲染每页
  2981. let tasks = [];
  2982. wk$("#viewer .page").forEach((page_div, i) => {
  2983. tasks.push(
  2984. getAndDrawPage(i, page_div)
  2985. );
  2986. });
  2987. // 等待每页渲染完成后,排序
  2988. let results = await Promise.all(tasks);
  2989. results.sort((prev, next) => prev[0] - next[0]);
  2990. // 合并为PDF并导出
  2991. utils.saveCanvasesToPDF(
  2992. results.map(item => item[1]),
  2993. // '在线预览|GB 14023-2022'
  2994. document.title.split("|")[1]
  2995. );
  2996. }
  2997.  
  2998.  
  2999. /**
  3000. * 提示预估下载耗时,然后下载
  3001. */
  3002. function hintThenDownload$1() {
  3003. // '/93'
  3004. let page_num = parseInt(wk$("#numPages")[0].textContent.slice(1));
  3005. let estimate = Math.ceil(page_num / 3);
  3006. alert(`页数: ${page_num},预计花费: ${estimate}秒;如遇网络异常可能更久\n请勿反复点击按钮;如果无法导出请 QQ 群反馈`);
  3007. turnPagesToPDF();
  3008. }
  3009.  
  3010.  
  3011. /**
  3012. * gb688文档下载策略
  3013. */
  3014. async function gb688() {
  3015. // 创建全局对象
  3016. globalThis.gb688JS = {
  3017. pages: new Map(), // {url: bmp}
  3018. pages_status: new Map() // {url: 0或1} 0释放, 1占用
  3019. };
  3020.  
  3021. // 创建按钮区
  3022. utils.createBtns();
  3023. // 绑定监听器
  3024. // 按钮1:导出PDF
  3025. turnPagesToPDF = await utils.recTime(turnPagesToPDF);
  3026. utils.setBtnEvent(hintThenDownload$1, [], "btn_1", "导出PDF");
  3027. }
  3028.  
  3029. function getPageCounts() {
  3030. // " / 39"
  3031. let counts_str = wk$(".counts")[0].textContent.split("/")[1];
  3032. let counts = parseInt(counts_str);
  3033. return counts > 20 ? 20 : counts;
  3034. }
  3035.  
  3036.  
  3037. /**
  3038. * 返回图片基础路径
  3039. * @returns {string} base_url
  3040. */
  3041. function getImgBaseURL() {
  3042. return wk$("#dp")[0].value;
  3043. }
  3044.  
  3045.  
  3046. function* genImgURLs() {
  3047. let counts = getPageCounts();
  3048. let base_url = getImgBaseURL();
  3049. for (let i=1; i<=counts; i++) {
  3050. yield base_url + `${i}.gif`;
  3051. }
  3052. }
  3053.  
  3054.  
  3055. /**
  3056. * 下载图片,转为canvas,合并为PDF并下载
  3057. */
  3058. function fetchThenExportPDF() {
  3059. // db2092-2014-河北特种设备使用安全管理规范_安全文库网safewk.com
  3060. let title = document.title.split("_")[0];
  3061. return utils.imgUrlsToPDF(genImgURLs(), title);
  3062. }
  3063.  
  3064.  
  3065. /**
  3066. * 提示预估下载耗时,然后下载
  3067. */
  3068. async function hintThenDownload() {
  3069. let hint = [
  3070. "只能导出可预览的页面(最多20页)",
  3071. "请勿短时间反复点击按钮,导出用时大约不到 10 秒",
  3072. "点完后很久没动静请至 QQ 群反馈"
  3073. ];
  3074. alert(hint.join("\n"));
  3075. await fetchThenExportPDF();
  3076. }
  3077.  
  3078.  
  3079. /**
  3080. * safewk文档下载策略
  3081. */
  3082. async function safewk() {
  3083. // 创建按钮区
  3084. utils.createBtns();
  3085. // 绑定监听器
  3086. // 按钮1:导出PDF
  3087. hintThenDownload = await utils.recTime(hintThenDownload);
  3088. utils.setBtnEvent(hintThenDownload, [], "btn_1", "导出PDF");
  3089. }
  3090.  
  3091. /**
  3092. * 主函数:识别网站,执行对应文档下载策略
  3093. */
  3094. function main() {
  3095. // 显示当前位置
  3096. let host = window.location.host;
  3097. console.log(`当前host: ${host}`);
  3098. // 挂载工具包到全局
  3099. window.user_utils = utils;
  3100. console.log("wk: user_utils已经挂载到全局");
  3101.  
  3102. // 主任务
  3103. if (host.includes("docin.com")) {
  3104. docin();
  3105. } else if (host === "swf.ishare.down.sina.com.cn") {
  3106. ishareData();
  3107. } else if (host.includes("ishare.iask")) {
  3108. ishare();
  3109. } else if (host === "www.deliwenku.com") {
  3110. deliwenku();
  3111. } else if (host.includes("file") && host.includes("deliwenku.com")) {
  3112. deliFile();
  3113. } else if (host === "www.doc88.com") {
  3114. doc88();
  3115. } else if (host === "www.360doc.com") {
  3116. doc360();
  3117. } else if (host === "doc.mbalib.com") {
  3118. mbalib();
  3119. } else if (host === "www.dugen.com") {
  3120. dugen();
  3121. } else if (host === "c.gb688.cn") {
  3122. gb688();
  3123. } else if (host === "www.safewk.com") {
  3124. safewk();
  3125. } else if (host.includes("book118.com")) {
  3126. book118();
  3127. } else {
  3128. console.log("匹配到了无效网页");
  3129. }
  3130. }
  3131.  
  3132.  
  3133. let options = {
  3134. fast_mode: true,
  3135. activation_test: false,
  3136. show_buttons: true,
  3137. cli_mode: false
  3138. };
  3139. function loadExternalScripts() {
  3140. let urls = [
  3141. "https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js",
  3142. "https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js",
  3143. "https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js",
  3144. "https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js",
  3145. ];
  3146. for (let url of urls) {
  3147. utils.addScript2HTML(url);
  3148. let temp = url.split("/");
  3149. let n = temp.length;
  3150. let module_name = temp[n - 1];
  3151. console.log(`${module_name}模块已经加载`);
  3152. }
  3153. }
  3154. if (options.activation_test) {
  3155. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  3156. }
  3157. // 根据配置选择:是否默认显示
  3158. if (!options.show_buttons) {
  3159. utils.toggleBtnsSec();
  3160. }
  3161. if (options.cli_mode) {
  3162. loadExternalScripts();
  3163. setTimeout(main, 2000);
  3164. } else if (options.fast_mode) {
  3165. utils.manipulateElem("body", main);
  3166. } else {
  3167. window.onload = main;
  3168. }
  3169.  
  3170. })();