Wenku Doc Downloader

下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-12-08 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.6.8
  5. // @description 下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author 2690874578@qq.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://swf.ishare.down.sina.com.cn/?path=*
  11. // @match *://www.deliwenku.com/p-*
  12. // @match *://file.deliwenku.com/?num=*
  13. // @match *://file3.deliwenku.com/?num=*
  14. // @match *://www.doc88.com/p-*
  15. // @match *://www.360doc.com/content/*
  16. // @match *://doc.mbalib.com/view/*
  17. // @match *://www.dugen.com/p-*
  18. // @match *://max.book118.com/html/*
  19. // @match *://view-cache.book118.com/pptView.html?*
  20. // @match *://*.book118.com/?readpage=*
  21. // @match *://c.gb688.cn/bzgk/gb/showGb?*
  22. // @match *://www.safewk.com/p-*
  23. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  24. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  25. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  26. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  27. // @grant none
  28. // @license GPL-3.0-only
  29. // @create 2021-11-22
  30. // @note 1. 道客巴巴新增【加载所有页面】按钮
  31. // @note 2. 道客巴巴移除【导出zip】按钮
  32. // @note 3. 优化 `user_utils.saveCanvasesToZip` 函数
  33. // ==/UserScript==
  34.  
  35.  
  36. (function () {
  37. 'use strict';
  38.  
  39. /**
  40. * 多元素选择器
  41. * @param {string | HTMLElement} selector 选择器或元素
  42. * @returns {NodeListOf<HTMLElement>} elements 元素列表
  43. */
  44. let _wk$ = function(selector) {
  45. if (selector instanceof Node) {
  46. return [selector];
  47. }
  48. let that = this;
  49. if (!(that instanceof HTMLElement)) {
  50. that = document;
  51. }
  52. return that.querySelectorAll(selector);
  53. };
  54.  
  55. globalThis.wk$ = _wk$;
  56.  
  57.  
  58. let utils = {
  59. /**
  60. * 使用过时的execCommand复制文字
  61. * @param {string} text
  62. */
  63. _oldCopy: function(text) {
  64. let input = document.createElement("input");
  65. input.value = text;
  66. document.body.appendChild(input);
  67. input.select();
  68. document.execCommand("copy");
  69. input.remove();
  70. },
  71.  
  72. /**
  73. * 复制text到剪贴板
  74. * @param {string} text
  75. * @returns
  76. */
  77. copy: function(text) {
  78. // 输出到控制台和剪贴板
  79. console.log(text);
  80. if (!navigator.clipboard) {
  81. this._oldCopy(text);
  82. return;
  83. }
  84. navigator.clipboard.writeText(text)
  85. .catch(err => {
  86. this._oldCopy(text);
  87. });
  88. },
  89.  
  90. /**
  91. * 装饰器, 用于打印函数执行耗时
  92. * @param {Function} func 需要计时的函数
  93. * @returns {Promise<Function>} 装饰的func => func的返回值
  94. */
  95. recTime: async function(func) {
  96. async function inner() {
  97. let begin = Date.now();
  98. let res = await func();
  99. let cost = ((Date.now() - begin) / 1000).toFixed(1);
  100. console.log(`Function <${func.name}> costed ${cost} seconds.`);
  101. return res;
  102. }
  103. return inner;
  104. },
  105.  
  106. /**
  107. * 创建并下载文件
  108. * @param {string} file_name 文件名
  109. * @param {ArrayBuffer | ArrayBufferView | Blob | string} content blob_part
  110. */
  111. saveAs: function(file_name, content) {
  112. let a = document.createElement("a");
  113. let blob = new Blob([content]);
  114. a.download = file_name;
  115. let url = URL.createObjectURL(blob);
  116. a.href = url;
  117. a.click();
  118. URL.revokeObjectURL(url);
  119. },
  120.  
  121. /**
  122. * 创建并下载URL资源
  123. * @param {string} file_name
  124. * @param {string} src
  125. */
  126. downloadUrlFile: function(file_name, src) {
  127. let aTag = document.createElement('a');
  128. aTag.download = file_name;
  129. aTag.href = src;
  130. aTag.click();
  131. },
  132.  
  133. /**
  134. * canvas转为PNG格式的blob
  135. * @param {HTMLCanvasElement} canvas
  136. * @returns {Promise<Blob>} blob
  137. */
  138. canvasToBlob: async function(canvas) {
  139. return new Promise(res => canvas.toBlob(res));
  140. },
  141.  
  142. /**
  143. * 添加外部js到当前页面
  144. * @param {string} url
  145. */
  146. addScript2HTML: function(url) {
  147. let script = document.createElement("script");
  148. script.src = url;
  149. document.head.appendChild(script);
  150. },
  151.  
  152. /**
  153. * 显示/隐藏按钮区.
  154. * @param {Function} func
  155. */
  156. toggleBtnsSec: function() {
  157. let sec = wk$(".wk-box")[0];
  158. if (sec.style.display === "none") {
  159. sec.style.display = "block";
  160. return;
  161. }
  162. sec.style.display = "none";
  163. },
  164.  
  165. /**
  166. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  167. * @param {number} delay
  168. * @returns {Promise} nextTask
  169. */
  170. sleep: function(delay) {
  171. return new Promise(resolve => setTimeout(resolve, delay));
  172. },
  173.  
  174. /**
  175. * 允许打印页面
  176. */
  177. allowPrint: function() {
  178. let style = document.createElement("style");
  179. style.innerHTML = `
  180. @media print {
  181. body{
  182. display:block;
  183. }
  184. }
  185. `;
  186. document.head.appendChild(style);
  187. },
  188.  
  189. /**
  190. * 取得get参数key对应的value
  191. * @param {string} key
  192. * @returns {string} value
  193. */
  194. getUrlParam: function(key) {
  195. let params = (new URL(window.location)).searchParams;
  196. return params.get(key);
  197. },
  198.  
  199. /**
  200. * 在指定节点后面插入节点
  201. * @param {HTMLElement} new_element
  202. * @param {HTMLElement} target_element
  203. */
  204. insertAfter: function(new_element, target_element) {
  205. let parent = target_element.parentNode;
  206. if (parent.lastChild === target_element) {
  207. parent.appendChild(new_element);
  208. } else {
  209. parent.insertBefore(new_element, target_element.nextElementSibling);
  210. }
  211. },
  212.  
  213. /**
  214. * 求main_set去除cut_set后的set
  215. * @param {Set} main_set
  216. * @param {Set} cut_set
  217. * @returns 差集
  218. */
  219. difference: function(main_set, cut_set) {
  220. let _diff = new Set(main_set);
  221. for (let elem of cut_set) {
  222. _diff.delete(elem);
  223. }
  224. return _diff;
  225. },
  226.  
  227. /**
  228. * 抛出set中的第一个元素
  229. * @param {Set} set
  230. * @returns 一个元素
  231. */
  232. setPop: function(set) {
  233. for (let item of set) {
  234. set.delete(item);
  235. return item;
  236. }
  237. },
  238.  
  239. /**
  240. * 绑定事件到指定按钮,返回按钮引用
  241. * @param {Function} event click事件
  242. * @param {Array} args 事件的参数列表
  243. * @param {string} aim_btn 按钮的变量名
  244. * @param {string} new_text 按钮的新文本,为null则不替换
  245. * @returns 按钮元素的引用
  246. */
  247. setBtnEvent: function(event, args=[], aim_btn="btn_3", new_text=null) {
  248. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  249. // 如果需要,替换按钮内文本
  250. if (new_text) {
  251. btn.textContent = new_text;
  252. }
  253. // 绑定事件,添加到页面上
  254. btn.onclick = () => {
  255. this.enhanceBtnClickReaction(aim_btn);
  256. if (args.length) {
  257. event(...args);
  258. } else {
  259. event();
  260. }
  261. };
  262. return btn;
  263. },
  264.  
  265. /**
  266. * 强制隐藏元素
  267. * @param {string} selector
  268. */
  269. forceHide: function(selector) {
  270. let style_cls = "force-hide";
  271. document.querySelectorAll(selector).forEach((elem) => {
  272. elem.className += ` ${style_cls}`;
  273. });
  274. // 判断css样式是否已经存在
  275. let style;
  276. style = document.querySelector(`style.${style_cls}`);
  277. // 如果已经存在,则无须重复创建
  278. if (style) {
  279. return;
  280. }
  281. // 否则创建
  282. style = document.createElement("style");
  283. style.innerHTML = `style.${style_cls} {
  284. visibility: hidden !important;
  285. }`;
  286. document.head.appendChild(style);
  287. },
  288.  
  289. /**
  290. * 当元素可见时,操作目标元素(异步)。最多为不可见元素等待5秒。
  291. * @param {string} s 单个元素选择器
  292. * @param {Function} callback (elem) => {...} 元素操作函数
  293. */
  294. manipulateElem: async function(s, callback) {
  295. let isVisiable = () => {
  296. let res = getComputedStyle(wk$(s)[0]).display !== "none";
  297. // console.log(`${s} visibility: ${res}`);
  298. return res;
  299. };
  300.  
  301. let max = 5 * 5; // 最多等待5秒
  302. let i = 0;
  303.  
  304. // 如果不可见就等待0.2秒/轮
  305. while (!isVisiable() && i <= max) {
  306. i++;
  307. await utils.sleep(200);
  308. }
  309.  
  310. callback(wk$(s)[0]);
  311. },
  312.  
  313. /**
  314. * 等待直到函数返回true
  315. * @param {Function | Promise<Function>} isReady 判断条件达成与否的函数
  316. * @param {number} timeout 最大等待秒数
  317. */
  318. waitUntil: async function(isReady, timeout=5) {
  319. let gap = 200;
  320. let chances = parseInt(timeout * 1000 / gap);
  321. chances = chances < 1? 1: chances;
  322. while (! await isReady()) {
  323. await this.sleep(200);
  324. chances -= 1;
  325. if (!chances) {
  326. break;
  327. }
  328. }
  329. },
  330.  
  331. /**
  332. * 隐藏按钮,打印页面,显示按钮
  333. */
  334. hideBtnThenPrint: function() {
  335. // 隐藏按钮,然后打印页面
  336. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  337. btns.forEach((elem) => {
  338. elem.style.display = "none";
  339. });
  340. window.print();
  341.  
  342. // 打印结束,显示按钮
  343. btns.forEach((elem) => {
  344. elem.style.display = "block";
  345. });
  346. },
  347.  
  348. /**
  349. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  350. * @param {string} custom_btn 按钮变量名
  351. */
  352. enhanceBtnClickReaction: function(custom_btn = null) {
  353. let aim_btn;
  354. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  355. if (!custom_btn || custom_btn === "btn_1") {
  356. aim_btn = document.querySelector(".btn-1");
  357. } else {
  358. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  359. }
  360.  
  361. let old_color = aim_btn.style.color; // 保存旧的颜色
  362. let old_text = aim_btn.textContent; // 保存旧的文字内容
  363. // 变黑缩小
  364. aim_btn.style.color = "black";
  365. aim_btn.style.fontWeight = "normal";
  366. aim_btn.textContent = `->${old_text}<-`;
  367. // 复原加粗
  368. let changeColorBack = function() {
  369. aim_btn.style.color = old_color;
  370. aim_btn.style.fontWeight = "bold";
  371. aim_btn.textContent = old_text;
  372. };
  373. setTimeout(changeColorBack, 1250);
  374. },
  375.  
  376. /**
  377. * 切换按钮显示/隐藏状态
  378. * @param {string} aim_btn 按钮变量名
  379. * @returns 按钮元素的引用
  380. */
  381. toggleBtnStatus: function(aim_btn) {
  382. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  383. let display = getComputedStyle(btn).display;
  384. // return;
  385. if (display === "none") {
  386. btn.style.display = "block";
  387. } else {
  388. btn.style.display = "none";
  389. }
  390. return btn;
  391. },
  392.  
  393. /**
  394. * 挂载func到全局
  395. * @param {Function} func
  396. */
  397. globalFunc: function(func) {
  398. globalThis[func.name] = func;
  399. },
  400.  
  401. /**
  402. * 用input框跳转到对应页码
  403. * @param {Element} cur_page 当前页码
  404. * @param {string | Number} aim_page 目标页码
  405. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  406. */
  407. jump2pageNo: function(cur_page, aim_page, event_type) {
  408. // 设置跳转页码为目标页码
  409. cur_page.value = (aim_page).toString();
  410. // 模拟回车事件来跳转
  411. let keyboard_event_enter = new KeyboardEvent(event_type, {
  412. bubbles: true,
  413. cancelable: true,
  414. keyCode: 13
  415. });
  416. cur_page.dispatchEvent(keyboard_event_enter);
  417. },
  418.  
  419. /**
  420. * 在新标签页打开链接
  421. * @param {string} href
  422. */
  423. openInNewTab: function(href) {
  424. let link = document.createElement("a");
  425. link.href = href;
  426. link.target = "_blank";
  427. link.click();
  428. },
  429.  
  430. /**
  431. * 滚动到页面底部
  432. */
  433. scrollToBottom: function() {
  434. window.scrollTo({
  435. top: document.body.scrollHeight,
  436. behavior: "smooth"
  437. });
  438. },
  439.  
  440. /**
  441. * 用try移除元素
  442. * @param {Element} element 要移除的元素
  443. */
  444. tryToRemoveElement: function(element) {
  445. try {
  446. element.remove();
  447. } catch (e) {
  448. }
  449. },
  450.  
  451. /**
  452. * 用try移除若干元素
  453. * @param {Element[]} elements 要移除的元素列表
  454. */
  455. tryToRemoveElements: function(elements) {
  456. elements.forEach((elem) => {
  457. this.tryToRemoveElement(elem);
  458. });
  459. },
  460.  
  461. /**
  462. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  463. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  464. */
  465. tryToRemoveSameElem: function(elem_list_box) {
  466. for (let elem_list of elem_list_box) {
  467. if (!elem_list) {
  468. continue;
  469. }
  470. for (let elem of elem_list) {
  471. try {
  472. elem.remove();
  473. } catch (e) {
  474. console.log();
  475. }
  476. }
  477. }
  478. },
  479.  
  480. /**
  481. * 使文档在页面上居中
  482. * @param {string} selector 文档容器的css选择器
  483. * @param {string} default_offset 文档部分向右偏移的百分比(0-59)
  484. * @returns 偏移值是否合法
  485. */
  486. centerDoc: function(selector, default_offset) {
  487. let doc_main = document.querySelector(selector);
  488. let offset = window.prompt("请输入偏移百分位:", default_offset);
  489. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  490. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  491. doc_main.style.marginLeft = offset + "%";
  492. return true;
  493. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  494. doc_main.style.marginLeft = offset + "%";
  495. return true
  496. } else {
  497. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  498. return false;
  499. }
  500. },
  501.  
  502. /**
  503. * 调整按钮内文本
  504. * @param {string} aim_btn 按钮变量名
  505. * @param {string} new_text 新的文本,null则保留旧文本
  506. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  507. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  508. */
  509. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  510. // 提示文档已经展开
  511. if (use_hint) {
  512. let hint = "文档已经完全展开,可以导出";
  513. alert(hint);
  514. }
  515. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  516. // 要替换的文本
  517. if (new_text) {
  518. btn.textContent = new_text;
  519. }
  520. // 推荐按钮
  521. if (recommend_btn) {
  522. btn.textContent += "(推荐)";
  523. }
  524. },
  525.  
  526. html2Canvases: async function(elem_list) {
  527. // 如果是空元素列表,返回null并终止函数
  528. if (elem_list.length === 0) {
  529. console.log("html2canvases was called, but no element is avaiable.");
  530. return null;
  531. }
  532. let tasks = []; // 存放异步任务
  533. let contents = []; // 存放canvas元素
  534. for (let elem of elem_list) {
  535. let task = html2canvas(elem).then((canvas) => {
  536. contents.push(canvas);
  537. });
  538. tasks.push(task);
  539. }
  540. // 等待全部page转化完成
  541. await Promise.all(tasks);
  542. return contents;
  543. },
  544.  
  545. /**
  546. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  547. * @param {Array} elem_list html元素列表
  548. * @param {string} title 文档标题
  549. */
  550. html2PDF: async function(elem_list, title = "文档") {
  551. // 如果是空元素列表,终止函数
  552. let _contents = this.html2Canvases(elem_list);
  553. if (_contents === null) {
  554. return;
  555. }
  556. _contents.then((contents) => {
  557. // 控制台检查结果
  558. console.log("生成的canvas元素如下:");
  559. console.log(contents);
  560.  
  561. // 拿到canvas宽、高
  562. let model = elem_list[0];
  563. let width, height;
  564. width = model.offsetWidth;
  565. height = model.offsetHeight;
  566. // 打包为pdf
  567. this.saveCanvasesToPDF(contents, title, width, height);
  568. });
  569. },
  570.  
  571. /**
  572. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  573. * @param {string} selector 图形元素的父级元素
  574. */
  575. savePicUrls: function(selector) {
  576. let pages = document.querySelectorAll(selector);
  577. let pic_urls = [];
  578.  
  579. for (let elem of pages) {
  580. let pic_obj = elem.children[0];
  581. let url = pic_obj.src;
  582. pic_urls.push(url);
  583. }
  584. let content = pic_urls.join("\n");
  585. // 启动下载
  586. this.saveAs("urls.csv", content);
  587. },
  588.  
  589. /**
  590. * 加载CDN脚本
  591. * @param {string} url
  592. */
  593. loadWebScript: async function(url) {
  594. let resp = await fetch(url);
  595. Function(await resp.text())();
  596. },
  597.  
  598. b64ToUint6: function(nChr) {
  599. return nChr > 64 && nChr < 91 ?
  600. nChr - 65
  601. : nChr > 96 && nChr < 123 ?
  602. nChr - 71
  603. : nChr > 47 && nChr < 58 ?
  604. nChr + 4
  605. : nChr === 43 ?
  606. 62
  607. : nChr === 47 ?
  608. 63
  609. :
  610. 0;
  611. },
  612.  
  613. /**
  614. * b64编码字符串转Uint8Array
  615. * @param {string} sBase64 b64编码的字符串
  616. * @param {number} nBlockSize 字节数
  617. * @returns {Uint8Array} arr
  618. */
  619. base64DecToArr: function(sBase64, nBlockSize=1) {
  620. var
  621. sB64Enc = sBase64.replace(/[^A-Za-z0-9\+\/]/g, ""), nInLen = sB64Enc.length,
  622. nOutLen = nBlockSize ? Math.ceil((nInLen * 3 + 1 >>> 2) / nBlockSize) * nBlockSize : nInLen * 3 + 1 >>> 2, aBytes = new Uint8Array(nOutLen);
  623.  
  624. for (var nMod3, nMod4, nUint24 = 0, nOutIdx = 0, nInIdx = 0; nInIdx < nInLen; nInIdx++) {
  625. nMod4 = nInIdx & 3;
  626. nUint24 |= this.b64ToUint6(sB64Enc.charCodeAt(nInIdx)) << 18 - 6 * nMod4;
  627. if (nMod4 === 3 || nInLen - nInIdx === 1) {
  628. for (nMod3 = 0; nMod3 < 3 && nOutIdx < nOutLen; nMod3++, nOutIdx++) {
  629. aBytes[nOutIdx] = nUint24 >>> (16 >>> nMod3 & 24) & 255;
  630. }
  631. nUint24 = 0;
  632. }
  633. }
  634. return aBytes;
  635. },
  636.  
  637. /**
  638. * canvas转blob
  639. * @param {HTMLCanvasElement} canvas
  640. * @returns {Promise<Blob>}
  641. */
  642. canvasToBlob: function(canvas) {
  643. return new Promise(resolve => canvas.toBlob(resolve));
  644. },
  645.  
  646. /**
  647. * 存储所有canvas图形为png到一个压缩包
  648. * @param {Iterable<HTMLCanvasElement>} canvases canvas元素列表
  649. * @param {string} title 文档标题
  650. */
  651. saveCanvasesToZip: async function(canvases, title) {
  652. // if (!(window.JSZip && window.saveAs)) {
  653. if (!window.JSZip) {
  654. // 根据需要加载依赖
  655. let urls = [
  656. // "https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js",
  657. "https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js"
  658. ];
  659. for (let url of urls) {
  660. await this.loadWebScript(url);
  661. }
  662. }
  663. // canvas元素转为png图像
  664. // 所有png合并为一个zip压缩包
  665. let zip = new JSZip();
  666. let tasks = [];
  667.  
  668. for (let canvas of canvases) {
  669. tasks.push(this.canvasToBlob(canvas));
  670. }
  671. let blobs = await Promise.all(tasks);
  672. blobs.forEach(
  673. (blob, i) => zip.file(`page-${i+1}.png`, blob, { binary: true })
  674. );
  675. // 导出zip
  676. let zip_blob = await zip.generateAsync({ type: "blob" });
  677. console.log(zip_blob);
  678. // saveAs(content, `${title}.zip`);
  679. utils.saveAs(`${title}.zip`, zip_blob);
  680. },
  681.  
  682. /**
  683. * 将canvas转为jpeg,然后导出PDF
  684. * @param {Iterable<HTMLCanvasElement>} canvas_box canvas元素列表
  685. * @param {string} title 文档标题
  686. */
  687. saveCanvasesToPDF: function(canvas_box, title, width = 0, height = 0) {
  688. // 如果没有手动指定canvas的长宽,则自动检测
  689. if (!width && !height) {
  690. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  691. let first_canvas = canvas_box[0];
  692.  
  693. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  694. [width, height] = [first_canvas.width, first_canvas.height];
  695. } else {
  696. let [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  697. [width, height] = [parseInt(width_str), parseInt(height_str)];
  698. }
  699. }
  700.  
  701. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  702. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  703. let orientation = width > height ? 'l' : 'p';
  704. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  705. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  706.  
  707. // 保存每一页文档到每一页pdf
  708. let canvas_list = Array.from(canvas_box);
  709. let last_canvas = canvas_list.pop();
  710. canvas_list.forEach(canvas => {
  711. pdf.addImage(canvas, 'png', 0, 0, width, height);
  712. pdf.addPage();
  713. });
  714. // 添加尾页
  715. pdf.addImage(last_canvas, 'png', 0, 0, width, height);
  716. // 导出文件
  717. pdf.save(`${title}.pdf`);
  718. },
  719.  
  720. /**
  721. * Image元素列表合并到一个PDF中
  722. * @param {NodeList} imgs Image元素列表
  723. * @param {string} title 文档名
  724. */
  725. imgs2pdf: function(imgs, title) {
  726. // 取得宽高
  727. let model = imgs[0];
  728. let width = model.offsetWidth;
  729. let height = model.offsetHeight;
  730.  
  731. // 创建pdf
  732. let orientation = width > height ? 'l' : 'p';
  733. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  734.  
  735. // 添加图像到pdf
  736. imgs.forEach((img, index) => {
  737. pdf.addImage(img, 'PNG', 0, 0, width, height);
  738. // 如果当前不是文档最后一页,则需要添加下一个空白页
  739. if (index !== imgs.length - 1) {
  740. pdf.addPage();
  741. }
  742. });
  743.  
  744. // 导出文件
  745. pdf.save(`${title}.pdf`);
  746. },
  747.  
  748.  
  749. /**
  750. * imageBitMap转canvas
  751. * @param {ImageBitmap} bmp
  752. * @returns {HTMLCanvasElement} canvas
  753. */
  754. bmpToCanvas: function(bmp) {
  755. let canvas = document.createElement("canvas");
  756. canvas.height = bmp.height;
  757. canvas.width = bmp.width;
  758. let ctx = canvas.getContext("bitmaprenderer");
  759. ctx.transferFromImageBitmap(bmp);
  760. return canvas;
  761. },
  762.  
  763. /**
  764. * 下载可以简单直接请求的图片,合并到PDF并导出
  765. * @param {Iterable<string>} urls 图片链接列表
  766. * @param {string} title 文档名称
  767. * @param {number} retry_num 如果请求成功数量 < retry_num, 则等待 2 秒后重试; 默认 0 不重试
  768. * @param {boolean} clear 是否在请求完成后清理控制台输出,默认false
  769. */
  770. imgUrlsToPDF: async function(urls, title, retry_num=0, clear=false) {
  771. let tasks, img_blobs, i = 3;
  772. // 根据请求成功数量判断是否循环
  773. do {
  774. i -= 1;
  775. // 发起请求
  776. tasks = [];
  777. for (let url of urls) {
  778. tasks.push(
  779. (async () => {
  780. return (await fetch(url)).blob();
  781. })()
  782. );
  783. }
  784. // 接收响应
  785. let blobs = await Promise.all(tasks);
  786. img_blobs = blobs.filter(blob => blob.type.startsWith("image/"));
  787.  
  788. if (clear) {
  789. console.clear();
  790. }
  791.  
  792. if (
  793. retry_num
  794. && img_blobs.length < retry_num
  795. && i
  796. ) {
  797. // 下轮行动前冷却
  798. console.log(`打盹 2 秒`);
  799. await utils.sleep(2);
  800. } else {
  801. // 结束循环
  802. break;
  803. }
  804. } while (true)
  805. // 格式转换:img blob -> bmp
  806. let tasks2 = [];
  807. img_blobs.map(
  808. blob => tasks2.push(createImageBitmap(blob))
  809. );
  810. // 等待格式转换完成
  811. let bmp_items = await Promise.all(tasks2);
  812.  
  813. // 转为canvas
  814. let canvas_box = bmp_items.map(
  815. bmp => this.bmpToCanvas(bmp)
  816. );
  817.  
  818. // 导出PDF
  819. this.saveCanvasesToPDF(canvas_box, title);
  820. },
  821.  
  822. /**
  823. * 返回子串个数
  824. * @param {string} str
  825. * @param {string} sub
  826. */
  827. countSubStr: function(str, sub) {
  828. let i = 0;
  829. let counter = 0;
  830.  
  831. while (true) {
  832. i = str.indexOf(sub, i);
  833. if (i === -1) {
  834. return counter;
  835. } else {
  836. i++;
  837. counter++;
  838. }
  839. }
  840. },
  841.  
  842. /**
  843. * 取得elem的class为class_name的父级元素
  844. * @param {string} class_name
  845. * @param {Element} elem 起点元素
  846. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  847. * @param {Boolean} miss 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  848. * @returns {null | Element} parent_element
  849. */
  850. getParentByClassName: function(class_name, elem, JSobj, miss = false) {
  851. let parent = elem.parentElement;
  852. let iterator_count = JSobj.iterator_count;
  853. let now_name;
  854.  
  855. try {
  856. now_name = parent.className;
  857. } catch (e) {
  858. JSobj.iterator_count = 0;
  859. // 没有父级元素了
  860. return "no parent node";
  861. }
  862.  
  863. // 如果不忽略递归次数计数器
  864. if (!miss) {
  865. if (iterator_count > 9) {
  866. // 超过最大迭代次数,认为不存在,返回null
  867. JSobj.iterator_count = 0;
  868. return "over max iterator counts limit";
  869. } else {
  870. JSobj.iterator_count += 1;
  871. }
  872. }
  873. // 如果类名匹配,返回该节点
  874. if (now_name.split(" ").includes(class_name)) {
  875. iterator_count = 0;
  876. return parent;
  877. }
  878. return this.getParentByClassName(class_name, parent, JSobj);
  879. },
  880.  
  881. /**
  882. * 将func绑定到window.onscroll,并设置触发频率
  883. * @param {Function} func scroll的监听函数
  884. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  885. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  886. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  887. * @param {string} hint 触发函数后的日志内容,默认为空字符串。
  888. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  889. */
  890. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  891. if (JSobj.scroll_count === undefined) {
  892. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  893. return;
  894. }
  895.  
  896. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  897. JSobj.scroll_count += 1;
  898. if (JSobj.scroll_count < useful_range) {
  899. func();
  900. console.log(hint);
  901. } else if (JSobj.scroll_count > wait_range) {
  902. JSobj.scroll_count = 0;
  903. }
  904. };
  905. // 如果没有指定的window对象,则使用默认的window
  906. if (!inner_window) {
  907. window.onscroll = () => {
  908. new_func(func, JSobj, useful_range, wait_range, hint);
  909. };
  910. return;
  911. }
  912. // 特定的window对象,一般用于iframe,追加scroll监听器
  913. let scrollFunc = () => {
  914. new_func(func, JSobj, useful_range, wait_range, hint);
  915. };
  916. JSobj.scrollFunc = scrollFunc;
  917. inner_window.addEventListener("scroll", scrollFunc, false);
  918. },
  919.  
  920. /**
  921. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;除第1个外默认均为隐藏
  922. */
  923. createBtns: function() {
  924. // 创建大容器
  925. let box = document.createElement("div");
  926. box.className = "wk-box";
  927. document.body.appendChild(box);
  928.  
  929. // 创建按钮组
  930. let section = document.createElement("section");
  931. section.className = "btns_section";
  932. section.innerHTML = `
  933. <p class="logo_tit">Wenku Doc Downloader</p>
  934. <button class="btn-1">展开文档 😈</button>
  935. <button class="btn-2">未设定2</button>
  936. <button class="btn-3">未设定3</button>
  937. <button class="btn-4">未设定4</button>
  938. <button class="btn-5">未设定5</button>
  939. `;
  940. box.appendChild(section);
  941.  
  942. // 添加隐藏/展示按钮
  943. // 隐藏【🙈】,展开【🐵】
  944. let hide_btn = document.createElement("p");
  945. hide_btn.className = "hide_btn_wk";
  946. hide_btn.textContent = "🐵";
  947. hide_btn.onclick = () => {
  948. // 显示 -> 隐藏
  949. if (getComputedStyle(section).display === "block") {
  950. section.style.display = "none";
  951. hide_btn.style.left = "20px";
  952. hide_btn.textContent = "🙈";
  953. // 隐藏 -> 显示
  954. } else {
  955. section.style.display = "block";
  956. hide_btn.style.left = "155px";
  957. hide_btn.textContent = "🐵";
  958. }
  959. };
  960. box.appendChild(hide_btn);
  961.  
  962. // 设定样式
  963. let style = document.createElement("style");
  964. style.innerHTML = `
  965. .hide_btn_wk {
  966. position: fixed;
  967. left: 155px;
  968. top: 36%;
  969. user-select: none;
  970. font-size: large;
  971. z-index: 5001;
  972. }
  973. .btns_section{
  974. position: fixed;
  975. width: 154px;
  976. left: 10px;
  977. top: 32%;
  978. background: #E7F1FF;
  979. border: 2px solid #1676FF;
  980. padding: 0px 0px 10px 0px;
  981. font-weight: 600;
  982. border-radius: 2px;
  983. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  984. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  985. 'Segoe UI Emoji', 'Segoe UI Symbol';
  986. z-index: 5000;
  987. }
  988. .logo_tit{
  989. width: 100%;
  990. background: #1676FF;
  991. text-align: center;
  992. font-size:12px ;
  993. color: #E7F1FF;
  994. line-height: 40px;
  995. height: 40px;
  996. margin: 0 0 16px 0;
  997. }
  998.  
  999. .btn-1{
  1000. display: block;
  1001. width: 128px;
  1002. height: 28px;
  1003. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  1004. border-radius: 4px;
  1005. color: #fff;
  1006. font-size: 12px;
  1007. border: none;
  1008. outline: none;
  1009. margin: 8px auto;
  1010. font-weight: bold;
  1011. cursor: pointer;
  1012. opacity: .9;
  1013. }
  1014. .btn-2{
  1015. display: none;
  1016. width: 128px;
  1017. height: 28px;
  1018. background: #07C160;
  1019. border-radius: 4px;
  1020. color: #fff;
  1021. font-size: 12px;
  1022. border: none;
  1023. outline: none;
  1024. margin: 8px auto;
  1025. font-weight: bold;
  1026. cursor: pointer;
  1027. opacity: .9;
  1028. }
  1029. .btn-3{
  1030. display: none;
  1031. width: 128px;
  1032. height: 28px;
  1033. background:#FA5151;
  1034. border-radius: 4px;
  1035. color: #fff;
  1036. font-size: 12px;
  1037. border: none;
  1038. outline: none;
  1039. margin: 8px auto;
  1040. font-weight: bold;
  1041. cursor: pointer;
  1042. opacity: .9;
  1043. }
  1044. .btn-4{
  1045. display: none;
  1046. width: 128px;
  1047. height: 28px;
  1048. background: #1676FF;
  1049. border-radius: 4px;
  1050. color: #fff;
  1051. font-size: 12px;
  1052. border: none;
  1053. outline: none;
  1054. margin: 8px auto;
  1055. font-weight: bold;
  1056. cursor: pointer;
  1057. opacity: .9;
  1058. }
  1059. .btn-5{
  1060. display: none;
  1061. width: 128px;
  1062. height: 28px;
  1063. background: #ff6600;
  1064. border-radius: 4px;
  1065. color: #fff;
  1066. font-size: 12px;
  1067. border: none;
  1068. outline: none;
  1069. margin: 8px auto;
  1070. font-weight: bold;
  1071. cursor: pointer;
  1072. opacity: .9;
  1073. }
  1074. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  1075. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  1076. document.head.appendChild(style);
  1077. }
  1078. };
  1079.  
  1080. // 全局对象
  1081. globalThis.doc88JS = {
  1082. last_copy_time: 0 // 上一次 ctrl + c 的时间戳(毫秒)
  1083. };
  1084.  
  1085.  
  1086. /**
  1087. * 展开道客巴巴的文档
  1088. */
  1089. function readAllDoc88() {
  1090. // 获取“继续阅读”按钮
  1091. let continue_btn = document.querySelector("#continueButton");
  1092. // 如果存在“继续阅读”按钮
  1093. if (continue_btn) {
  1094. // 跳转到文末(等同于展开全文)
  1095. let cur_page = document.querySelector("#pageNumInput");
  1096. // 取得最大页码
  1097. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1098. // 跳转到尾页
  1099. utils.jump2pageNo(cur_page, page_max, "keypress");
  1100. // 返回顶部
  1101. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1102. }
  1103. // 文档展开后,显示按钮2、3
  1104. else {
  1105. // 隐藏按钮
  1106. utils.toggleBtnStatus("btn_1");
  1107. // 显示按钮
  1108. utils.toggleBtnStatus("btn_2");
  1109. utils.toggleBtnStatus("btn_3");
  1110. utils.toggleBtnStatus("btn_4");
  1111. utils.toggleBtnStatus("btn_5");
  1112. }
  1113. }
  1114.  
  1115.  
  1116. /**
  1117. * 隐藏搜索框
  1118. */
  1119. async function hideSearchBox() {
  1120. let s = "#min-search-result";
  1121. let hide = (elem) => {
  1122. elem.style.display = "none";
  1123. };
  1124. utils.manipulateElem(s, hide);
  1125. }
  1126.  
  1127.  
  1128. /**
  1129. * 移除vip复制弹窗
  1130. */
  1131. function removeCopyPopup() {
  1132. let s = "#ym-window";
  1133. let hide = (elem) => {
  1134. let popup = elem.parentElement;
  1135. popup.style = "display: none";
  1136. };
  1137. utils.manipulateElem(s, hide);
  1138. }
  1139.  
  1140.  
  1141. /**
  1142. * 隐藏选择文字的弹窗
  1143. */
  1144. function hideSelectPopup() {
  1145. let s = "#left-menu";
  1146. let hide = (elem) => {
  1147. elem.style.zIndex = -1;
  1148. };
  1149. utils.manipulateElem(s, hide);
  1150. }
  1151.  
  1152.  
  1153. /**
  1154. * 只会执行一次的初始化任务
  1155. */
  1156. function lazyService() {
  1157. // 只允许执行一次
  1158. let counter = Symbol.for("counter");
  1159. if (globalThis[counter]) {
  1160. return;
  1161. }
  1162. globalThis[counter] = true;
  1163.  
  1164. // 初始化
  1165. console.log("正在执行初始化任务");
  1166. // 1. 隐藏选中文字的提示框
  1167. hideSelectPopup();
  1168. // 2. 隐藏搜索框
  1169. hideSearchBox();
  1170. // 3. 移除vip复制弹窗
  1171. removeCopyPopup();
  1172. }
  1173.  
  1174.  
  1175. /**
  1176. * 使用过时的execCommand复制文字
  1177. * @param {string} text
  1178. */
  1179. function textToClipBoardOldTech(text) {
  1180. let input = document.createElement("input");
  1181. input.value = text;
  1182. document.body.appendChild(input);
  1183. input.select();
  1184. document.execCommand("copy");
  1185. input.remove();
  1186. }
  1187.  
  1188.  
  1189. function doc88copy() {
  1190. var _KI = "";
  1191. var _tP = Core.Annotation.api._D9.split(":");
  1192. for (var _LU = 0; _LU < _tP.length; _LU++) {
  1193. var _qh = _tP[_LU].split("-");
  1194. var _Bj = parseInt(_qh[0]);
  1195. var _1T = parseInt(_qh[1]);
  1196. var _xl = parseInt(_qh[2]);
  1197. _KI = _KI + Core.Annotation.api._37(_Bj, _1T, _xl);
  1198. }
  1199. return _KI;
  1200. }
  1201.  
  1202.  
  1203. /**
  1204. * 复制选中的文字
  1205. * @returns
  1206. */
  1207. function copySelected() {
  1208. // 执行一次初始化任务
  1209. lazyService();
  1210.  
  1211. // 尚未选中文字
  1212. if (getComputedStyle(wk$("#left-menu")[0]).display === "none") {
  1213. console.log("尚未选中文字");
  1214. return;
  1215. }
  1216. // 先用官方复制函数
  1217. let text = doc88copy();
  1218. // 失败则使用搜索功能
  1219. if (!text) {
  1220. // 选中文字,搜索文字,弹出搜索框
  1221. let search = wk$("#lmenu_search")[0];
  1222. search.click();
  1223. // 取得input内容
  1224. let input = wk$(".min-text input")[0];
  1225. text = input.value;
  1226. // 清空input
  1227. input.value = "";
  1228. }
  1229.  
  1230. // 输出到控制台和剪贴板
  1231. console.log(text);
  1232. if (!navigator.clipboard) {
  1233. textToClipBoardOldTech(text);
  1234. return;
  1235. } navigator.clipboard.writeText(text).catch(textToClipBoardOldTech);
  1236. }
  1237.  
  1238.  
  1239. /**
  1240. * 捕获 ctrl + c 并关闭弹窗
  1241. * @param {KeyboardEvent} keydown
  1242. * @returns
  1243. */
  1244. function catchCtrlC(keydown) {
  1245. // 判断是否为 ctrl + c
  1246. if (!(keydown.code === "KeyC" && keydown.ctrlKey === true)) {
  1247. return;
  1248. }
  1249.  
  1250. // 判断触发间隔
  1251. let now = Date.now();
  1252.  
  1253. // 距离上次小于1秒
  1254. if (now - doc88JS.last_copy_time < 1000 * 1) {
  1255. doc88JS.last_copy_time = now;
  1256. return;
  1257. }
  1258.  
  1259. // 大于1秒
  1260. // 刷新最近一次触发时间
  1261. doc88JS.last_copy_time = now;
  1262. // 复制文字
  1263. copySelected();
  1264. }
  1265.  
  1266.  
  1267. function getXDF() {
  1268. DOC88Window.win({
  1269. message: `/doc.php?act=getxdf&pcode=${Config.p_code}`,
  1270. height: 220,
  1271. width: 600,
  1272. title: "",
  1273. iframe: true
  1274. });
  1275. setTimeout(() => {
  1276. wk$("#ym-header-text")[0].textContent = "WK 提示:这是道客巴巴的功能,可能付费;XDF 需要稻壳阅读器查看";
  1277. }, 1000);
  1278. }
  1279.  
  1280.  
  1281. /**
  1282. * 随机改变字体颜色、大小、粗细
  1283. * @param {HTMLElement} elem
  1284. */
  1285. function emphasizeText(elem) {
  1286. let rand = Math.random;
  1287. elem.style = `
  1288. font-weight: ${200 + parseInt(700 * rand())};
  1289. font-size: ${(1 + rand()).toFixed(1)}em;
  1290. color: hsl(${parseInt(360 * rand())}, ${parseInt(40 + 60 * rand())}%, ${parseInt(60 * rand())}%);
  1291. background-color: yellow;
  1292. `;
  1293. }
  1294.  
  1295.  
  1296. /**
  1297. * 浏览并加载所有页面
  1298. */
  1299. async function walkThrough() {
  1300. // 文档容器
  1301. let container = wk$("#pageContainer")[0];
  1302. container.style.display = "none";
  1303. // 页码
  1304. let page_num = wk$("#pageNumInput")[0];
  1305. // 文末提示
  1306. let tail = wk$("#readEndDiv > p")[0];
  1307. let origin = tail.textContent;
  1308. // 按钮
  1309. wk$(".btns_section > .btn-3, .btns_section > .btn-5").forEach(
  1310. btn => btn.style = "display: none"
  1311. );
  1312.  
  1313. // 逐页渲染
  1314. let total = parseInt(Config.p_pagecount);
  1315. try {
  1316. for (let i = 1; i <= total; i++) {
  1317. // 前往页码
  1318. GotoPage(i);
  1319. await utils.waitUntil(async() => {
  1320. let page = wk$(`#page_${i}`)[0];
  1321. // page无法选中说明有弹窗
  1322. if (!page) {
  1323. // 关闭弹窗,等待,然后递归
  1324. wk$("#ym-window .DOC88Window_close")[0].click();
  1325. await utils.sleep(500);
  1326. walkThrough();
  1327. throw new Error("walkThrough 递归完成,终止函数");
  1328. }
  1329. // canvas尚未绘制时width=300
  1330. return page.width !== 300;
  1331. });
  1332. // 凸显页码
  1333. emphasizeText(page_num);
  1334. tail.textContent = `请勿反复点击按钮,耐心等待页面渲染:${i}/${total}`;
  1335. }
  1336. } catch(e) {
  1337. // 捕获退出信号,然后退出
  1338. console.info(e);
  1339. return;
  1340. }
  1341.  
  1342. // 恢复原本显示
  1343. container.style.display = "";
  1344. page_num.style = "";
  1345. tail.textContent = origin;
  1346. wk$(".btns_section > .btn-3, .btns_section > .btn-5").forEach(
  1347. btn => btn.style = "display: block;"
  1348. );
  1349. }
  1350.  
  1351.  
  1352. /**
  1353. * 道客巴巴文档下载策略
  1354. */
  1355. async function doc88() {
  1356. // 创建脚本启动按钮1、2
  1357. utils.createBtns();
  1358.  
  1359. // 绑定主函数
  1360. let prepare = function() {
  1361. // 获取canvas元素列表
  1362. let node_list = document.querySelectorAll(".inner_page");
  1363. // 获取文档标题
  1364. let title;
  1365. if (document.querySelector(".doctopic h1")) {
  1366. title = document.querySelector(".doctopic h1").title;
  1367. } else {
  1368. title = "文档";
  1369. }
  1370. return [node_list, title];
  1371. };
  1372.  
  1373. // btn_1: 展开文档
  1374. utils.setBtnEvent(() => {
  1375. readAllDoc88();
  1376. }, [], "btn_1");
  1377.  
  1378. // // btn_2: 导出zip
  1379. // utils.setBtnEvent(() => {
  1380. // if (confirm("确定每页内容都加载完成了吗?")) {
  1381. // utils.saveCanvasesToZip(...prepare());
  1382. // }
  1383. // }, [], "btn_2", "导出图片到zip");
  1384. utils.setBtnEvent(walkThrough, [], "btn_2", "加载所有页面");
  1385. // btn_3: 导出PDF
  1386. utils.setBtnEvent(() => {
  1387. if (confirm("确定每页内容都加载完成了吗?")) {
  1388. utils.saveCanvasesToPDF(...prepare());
  1389. }
  1390. }, [], "btn_3", "导出图片到PDF");
  1391.  
  1392. // btn_4: 下载XDF
  1393. utils.setBtnEvent(getXDF, [], "btn_4", "下载XDF");
  1394.  
  1395. // btn_5: 复制选中文字
  1396. utils.setBtnEvent(
  1397. () => {
  1398. copySelected();
  1399. utils.modifyBtnText("btn_5", "复制成功!", false, false);
  1400. },
  1401. [],
  1402. "btn_5",
  1403. "复制选中文字"
  1404. );
  1405. // 为 ctrl + c 添加响应
  1406. document.addEventListener("keydown", catchCtrlC);
  1407. }
  1408.  
  1409. // 绑定主函数
  1410. function getCanvasList() {
  1411. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1412. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1413. let node_list = [];
  1414. for (let node of parent_node_list) {
  1415. node_list.push(node.children[0]);
  1416. }
  1417. return node_list;
  1418. }
  1419.  
  1420.  
  1421. function prepare() {
  1422. // 获取canvas元素列表
  1423. let node_list = getCanvasList();
  1424. // 获取文档标题
  1425. let title;
  1426. if (document.querySelector("h1 [title=doc]")) {
  1427. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1428. } else if (document.querySelector(".doc_title")) {
  1429. title = document.querySelector(".doc_title").textContent;
  1430. } else {
  1431. title = "文档";
  1432. }
  1433. return [node_list, title];
  1434. }
  1435.  
  1436.  
  1437. // 判断是否有canvas元素
  1438. function detectCanvas() {
  1439. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1440.  
  1441. // 隐藏按钮
  1442. utils.toggleBtnStatus("btn_1");
  1443. // 显示按钮
  1444. utils.toggleBtnStatus("btn_2");
  1445.  
  1446. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1447. if (!haveCanvas) {
  1448. // btn_2: 导出图片链接
  1449. utils.setBtnEvent(() => {
  1450. if (confirm("确定每页内容都加载完成了吗?")) {
  1451. utils.savePicUrls("[id*=img_]");
  1452. }
  1453. }, [], "btn_2", "导出全部图片链接");
  1454. } else {
  1455. // 显示按钮3
  1456. utils.toggleBtnStatus("btn_3");
  1457. // btn_2: 导出zip
  1458. utils.setBtnEvent(() => {
  1459. if (confirm("确定每页内容都加载完成了吗?")) {
  1460. utils.saveCanvasesToZip(...prepare());
  1461. }
  1462. }, [], "btn_2", "导出图片到zip");
  1463. // btn_3: 导出PDF
  1464. utils.setBtnEvent(() => {
  1465. if (confirm("确定每页内容都加载完成了吗?")) {
  1466. utils.saveCanvasesToPDF(...prepare());
  1467. }
  1468. }, [], "btn_3", "导出图片到PDF");
  1469. }
  1470. }
  1471.  
  1472.  
  1473. /**
  1474. * 豆丁文档下载策略
  1475. */
  1476. function docin() {
  1477. // 创建脚本启动按钮
  1478. utils.createBtns();
  1479.  
  1480. // 隐藏底部工具栏
  1481. document.querySelector("#j_select").click(); // 选择指针
  1482. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1483. tool_bar.style.display = "none";
  1484.  
  1485. // btn_1: 判断文档类型
  1486. utils.setBtnEvent(() => {
  1487. utils.forceHide(".jz_watermark");
  1488. detectCanvas();
  1489. }, [], "btn_1", "判断文档类型");
  1490. }
  1491.  
  1492. function jumpToHost() {
  1493. // https://swf.ishare.down.sina.com.cn/1DrH4Qt2cvKd.jpg?ssig=DUf5x%2BXnKU&Expires=1673867307&KID=sina,ishare&range={}-{}
  1494. let url = wk$(".data-detail img, .data-detail embed")[0].src;
  1495. if (!url) {
  1496. alert("找不到图片元素");
  1497. return;
  1498. }
  1499.  
  1500. let url_obj = new URL(url);
  1501. let path = url_obj.pathname.slice(1);
  1502. let query = url_obj.search.slice(1).split("&range")[0];
  1503. let title = document.title.split(" - ")[0];
  1504. let target = `${url_obj.protocol}//${url_obj.host}?path=${path}&fname=${title}&${query}`;
  1505. // https://swf.ishare.down.sina.com.cn/
  1506. globalThis.open(target, "hostage");
  1507. // 然后在跳板页面发起对图片的请求
  1508. }
  1509.  
  1510.  
  1511. /**
  1512. * 爱问文库下载跳转策略
  1513. */
  1514. function ishare() {
  1515. // 创建按钮区
  1516. utils.createBtns();
  1517.  
  1518. // btn_1: 识别文档类型 -> 导出PDF
  1519. utils.setBtnEvent(jumpToHost, [], "btn_1", "到下载页面");
  1520. // btn_2: 不支持爱问办公
  1521. utils.setBtnEvent(() => null, [], "btn_2", "不支持爱问办公");
  1522. // utils.toggleBtnStatus("btn_4");
  1523. }
  1524.  
  1525. /**
  1526. * 返回包含对于数量svg元素的html元素
  1527. * @param {string} data
  1528. * @returns {HTMLDivElement} article
  1529. */
  1530. function _createDiv(data) {
  1531. let num = utils.countSubStr(data, data.slice(0, 10));
  1532. let article = document.createElement("div");
  1533. article.id = "article";
  1534. article.innerHTML = `
  1535. <style class="wk-settings">
  1536. body {
  1537. margin: 0px;
  1538. width: 100%;
  1539. background-color: rgb(95,99,104);
  1540. }
  1541. #article {
  1542. width: 100%;
  1543. display: flex;
  1544. flex-direction: row;
  1545. justify-content: space-around;
  1546. }
  1547. #root-box {
  1548. display: flex;
  1549. flex-direction: column;
  1550. background-color: white;
  1551. padding: 0 2em;
  1552. }
  1553. .gap {
  1554. height: 50px;
  1555. width: 100%;
  1556. background-color: transparent;
  1557. }
  1558. </style>
  1559. <div id="root-box">
  1560. ${
  1561. `<object class="svg-box"></object>
  1562. <div class="gap"></div>`.repeat(num)
  1563. }
  1564. `;
  1565. // 移除最后一个多出的gap
  1566. Array.from(article.querySelectorAll(".gap")).at(-1).remove();
  1567. return article;
  1568. }
  1569.  
  1570.  
  1571. function setGap(height) {
  1572. let style = wk$(".wk-settings")[0].innerHTML;
  1573. wk$(".wk-settings")[0].innerHTML = style.replace(
  1574. /[.]gap.*?{.*?height:.+?;/s,
  1575. `.gap { height: ${parseInt(height)}px;`
  1576. );
  1577. }
  1578.  
  1579.  
  1580. function setGapGUI() {
  1581. let now = getComputedStyle(wk$(".gap")[0]).height;
  1582. let new_h = prompt(`当前间距:${now}\n请输入新间距:`);
  1583. if (new_h) {
  1584. setGap(new_h);
  1585. }
  1586. }
  1587.  
  1588.  
  1589. function getSVGtext(data) {
  1590. let div = document.createElement("div");
  1591. div.innerHTML = data;
  1592. return div.textContent;
  1593. }
  1594.  
  1595.  
  1596. function toDisplayMode1() {
  1597. let content = globalThis["ishareJS"].content_1;
  1598. if (!content) {
  1599. content = globalThis["ishareJS"].text
  1600. .replace(/\n{2,}/g, "<hr>")
  1601. .replace(/\n/g, "<br>")
  1602. .replace(/\s/g, "&nbsp;")
  1603. .replace(/([a-z])([A-Z])/g, "$1 $2"); // 英文简单分词
  1604.  
  1605. globalThis["ishareJS"].content_1 = content;
  1606. }
  1607.  
  1608. wk$("#root-box")[0].innerHTML = content;
  1609. }
  1610.  
  1611.  
  1612. function toDisplayMode2() {
  1613. let content = globalThis["ishareJS"].content_2;
  1614. if (!content) {
  1615. content = globalThis["ishareJS"].text
  1616. .replace(/\n{2,}/g, "<hr>")
  1617. .replace(/\n/g, "")
  1618. .replace(/\s/g, "&nbsp;")
  1619. .replace(/([a-z])([A-Z])/g, "$1 $2")
  1620. .split("<hr>")
  1621. .map(paragraph => `<p>${paragraph}</p>`)
  1622. .join("");
  1623. globalThis["ishareJS"].content_2 = content;
  1624. wk$(".wk-settings")[0].innerHTML += `
  1625. #root-box > p {
  1626. text-indent: 2em;
  1627. width: 40em;
  1628. word-break: break-word;
  1629. }
  1630. `;
  1631. }
  1632.  
  1633. wk$("#root-box")[0].innerHTML = content;
  1634. }
  1635.  
  1636.  
  1637. function changeDisplayModeWrapper() {
  1638. let flag = true;
  1639.  
  1640. function inner() {
  1641. if (flag) {
  1642. toDisplayMode1();
  1643. } else {
  1644. toDisplayMode2();
  1645. }
  1646. flag = !flag;
  1647. }
  1648. return inner;
  1649. }
  1650.  
  1651.  
  1652. function handleSVGtext() {
  1653. globalThis["ishareJS"].text = getSVGtext(
  1654. globalThis["ishareJS"].data
  1655. );
  1656.  
  1657. let change = changeDisplayModeWrapper();
  1658. utils.setBtnEvent(change, [], "btn_4", "切换显示模式");
  1659.  
  1660. utils.toggleBtnStatus("btn_2");
  1661. utils.toggleBtnStatus("btn_3");
  1662. utils.toggleBtnStatus("btn_4");
  1663. change();
  1664. }
  1665.  
  1666.  
  1667. /**
  1668. * 处理svg的url
  1669. * @param {string} svg_url
  1670. */
  1671. async function handleSVGurl(svg_url) {
  1672. let resp = await fetch(svg_url);
  1673. let data = await resp.text();
  1674. globalThis["ishareJS"].data = data;
  1675.  
  1676. let sep = data.slice(0, 10);
  1677. let svg_texts = data
  1678. .split(sep)
  1679. .slice(1)
  1680. .map(svg_text => sep + svg_text);
  1681.  
  1682. console.log(`共 ${svg_texts.length} 张图片`);
  1683.  
  1684. let article = _createDiv(data);
  1685. let boxes = article.querySelectorAll(".svg-box");
  1686. boxes.forEach((obj, i) => {
  1687. let blob = new Blob([svg_texts[i]], {type: "image/svg+xml"});
  1688. let url = URL.createObjectURL(blob);
  1689. obj.data = url;
  1690. URL.revokeObjectURL(blob);
  1691. });
  1692.  
  1693. let body = wk$("body")[0];
  1694. body.innerHTML = "";
  1695. body.appendChild(article);
  1696.  
  1697. utils.createBtns();
  1698. utils.setBtnEvent(utils.hideBtnThenPrint, [], "btn_1", "打印页面到PDF");
  1699. utils.setBtnEvent(setGapGUI, [], "btn_2", "重设页间距");
  1700. utils.setBtnEvent(handleSVGtext, [], "btn_3", "显示空白点我");
  1701.  
  1702. utils.toggleBtnStatus("btn_2");
  1703. utils.toggleBtnStatus("btn_3");
  1704. }
  1705.  
  1706.  
  1707. /**
  1708. * 取得图片下载地址
  1709. * @param {string} fname
  1710. * @param {string} path
  1711. * @returns
  1712. */
  1713. function getImgUrl(fname, path) {
  1714. if (!fname) {
  1715. throw new Error("URL Param `fname` does not exist.");
  1716. }
  1717. return location.href
  1718. .replace(/[?].+?&ssig/, "?ssig")
  1719. .replace("?", path + "?");
  1720. }
  1721.  
  1722.  
  1723. /**
  1724. * 下载整个图片包
  1725. * @param {string} img_url
  1726. * @returns
  1727. */
  1728. async function getData(img_url) {
  1729. let resp = await fetch(img_url);
  1730. let buffer = await resp.arrayBuffer();
  1731. return new Uint8Array(buffer);
  1732. }
  1733.  
  1734.  
  1735. /**
  1736. * 分切图片包为若干图片
  1737. * @param {Uint8Array} data 多张图片合集数据包
  1738. * @returns {Array<Uint8Array>} 图片列表
  1739. */
  1740. function parseData(data) {
  1741. // 判断图像类型/拿到文件头
  1742. let head = data.slice(0, 10);
  1743. // let type = getImgType(head);
  1744. let sep = head.join() + ",";
  1745. // 切断,重组,格式转换
  1746. return data.join().split(sep).slice(1).map(
  1747. val => new Uint8Array((sep + val).split(","))
  1748. );
  1749. }
  1750.  
  1751.  
  1752. /**
  1753. * 图像Uint8数组列表合并然后导出PDF
  1754. * @param {string} fname
  1755. * @param {Array<Uint8Array>} img_data_list
  1756. */
  1757. async function imgDataArrsToPDF(fname, img_data_list) {
  1758. let cover_blob = new Blob([img_data_list[0]]);
  1759. let cover = await createImageBitmap(cover_blob);
  1760.  
  1761. utils.saveCanvasesToPDF(
  1762. img_data_list,
  1763. fname,
  1764. cover.width,
  1765. cover.height
  1766. );
  1767. }
  1768.  
  1769.  
  1770. async function exportPDF$1() {
  1771. let fname = utils.getUrlParam("fname");
  1772. let path = utils.getUrlParam("path");
  1773. let img_url = getImgUrl(fname, path);
  1774.  
  1775. // 处理svg
  1776. if (path.includes(".svg")) {
  1777. document.title = fname;
  1778. await handleSVGurl(img_url);
  1779. return;
  1780. }
  1781. // 处理常规图像
  1782. let data = await getData(img_url);
  1783. let img_data_list = parseData(data);
  1784. console.log(`共 ${img_data_list.length} 张图片`);
  1785. await imgDataArrsToPDF(fname, img_data_list);
  1786. }
  1787.  
  1788.  
  1789. function showHints$1() {
  1790. wk$("h1")[0].textContent = "wk 温馨提示";
  1791. wk$("p")[0].innerHTML = [
  1792. "下载 270 页的 PPT (70 MB) 需要约 30 秒",
  1793. "请耐心等待,无需反复点击按钮",
  1794. "如果很久没反应,请加 QQ 群反馈问题"
  1795. ].join("<br>");
  1796. wk$("hr")[0].nextSibling.textContent = "403 Page Hostaged By Wenku Doc Downloader";
  1797. }
  1798.  
  1799.  
  1800. /**
  1801. * 爱问文库下载策略
  1802. */
  1803. async function ishareData() {
  1804. // 全局对象
  1805. globalThis["ishareJS"] = {
  1806. data: "",
  1807. text: "",
  1808. content_1: "",
  1809. content_2: ""
  1810. };
  1811.  
  1812. // 显示提示
  1813. showHints$1();
  1814.  
  1815. // 创建按钮区
  1816. utils.createBtns();
  1817.  
  1818. // btn_1: 识别文档类型 -> 导出PDF
  1819. exportPDF$1 = await utils.recTime(exportPDF$1);
  1820. utils.setBtnEvent(exportPDF$1, [], "btn_1", "下载并导出PDF");
  1821. }
  1822.  
  1823. // /**
  1824. // * 清理并打印得力文库的文档页
  1825. // */
  1826. // function printPageDeliwenku() {
  1827. // // 移除页面上的无关元素
  1828. // let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1829. // let elem_list = document.querySelectorAll(selector);
  1830. // for (let elem of elem_list) {
  1831. // utils.tryToRemoveElement(elem);
  1832. // }
  1833. // // 修改页间距
  1834. // let outer_pages = document.getElementsByClassName("outer_page");
  1835. // for (let page of outer_pages) {
  1836. // page.style.marginBottom = "20px";
  1837. // }
  1838. // // 使文档居中
  1839. // alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1840. // if (!utils.centerDoc("#boxleft", "3")) {
  1841. // return; // 如果输入非法,终止函数调用
  1842. // }
  1843. // // 打印文档
  1844. // utils.hideBtnThenPrint();
  1845. // }
  1846.  
  1847.  
  1848. // /**
  1849. // * 点击“继续阅读”,适用性:得力文库
  1850. // */
  1851. // function readAllDeliwenku() {
  1852. // // 点击“同意并开始预览全文”
  1853. // let start_btn = document.getElementsByClassName("pre_button")[0];
  1854. // let display = start_btn.parentElement.parentElement.style.display;
  1855. // // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1856. // if (!display) {
  1857. // start_btn.children[0].click();
  1858. // setTimeout(() => {
  1859. // scroll(0, document.body.scrollHeight);
  1860. // }, 200);
  1861. // return;
  1862. // }
  1863. // // 增强按钮点击效果
  1864. // utils.enhanceBtnClickReaction();
  1865.  
  1866. // let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1867. // let display2 = read_all_btn.parentElement.parentElement.style.display
  1868. // // 继续阅读
  1869. // if (display2 !== "none") {
  1870. // // 获取input元素
  1871. // let cur_page = document.querySelector("#pageNumInput");
  1872. // let page_old = cur_page.value;
  1873. // let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1874. // // 跳转到尾页
  1875. // utils.jump2pageNo(cur_page, page_max, "keydown");
  1876. // // 跳转回来
  1877. // utils.jump2pageNo(cur_page, page_old, "keydown");
  1878.  
  1879. // // 切换按钮准备导出
  1880. // } else {
  1881. // // 推荐导出图片链接
  1882. // utils.modifyBtnText("btn_2", null, true);
  1883. // // 隐藏按钮
  1884. // utils.toggleBtnStatus("btn_1");
  1885. // // 显示按钮
  1886. // utils.toggleBtnStatus("btn_2");
  1887. // utils.toggleBtnStatus("btn_3");
  1888. // // btn_3 橙色按钮
  1889. // utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1890. // }
  1891. // }
  1892.  
  1893.  
  1894. // /**
  1895. // * 得力文库文档下载策略
  1896. // */
  1897. // function deliwenkuDeprecated() {
  1898. // // 创建脚本启动按钮1、2
  1899. // utils.createBtns();
  1900.  
  1901. // // btn_1: 展开文档
  1902. // utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1903. // // btn_2: 导出图片链接
  1904. // utils.setBtnEvent(() => {
  1905. // if (confirm("确定每页内容都加载完成了吗?")) {
  1906. // utils.savePicUrls('.inner_page div');
  1907. // }
  1908. // }, [], "btn_2", "导出图片链接");
  1909.  
  1910. // // 尝试关闭页面弹窗
  1911. // try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1912. // // 解除打印限制
  1913. // utils.allowPrint();
  1914. // }
  1915.  
  1916.  
  1917. function getPageNum() {
  1918. // ' / 6 ' -> ' 6 '
  1919. let num_str = wk$("span.counts")[0].textContent.split("/")[1];
  1920. return parseInt(num_str);
  1921. }
  1922.  
  1923.  
  1924. function jumpToHostage() {
  1925. let url = new URL(wk$("#pageflash_1 > img")[0].src);
  1926. // '/fileroot/2019-9/23/73598bfa-6b91-4cbe-a548-9996f46653a2/73598bfa-6b91-4cbe-a548-9996f46653a21.gif'
  1927. let num = getPageNum();
  1928. // '七年级上册地理期末试卷精编.doc-得力文库'
  1929. let fname = document.title.slice(0, -5);
  1930. let path = url.pathname;
  1931. let tail = "1.gif";
  1932. if (!path.endsWith(tail)) {
  1933. throw new Error(`url尾部不为【${tail}】!path:【${path}】`);
  1934. }
  1935. let base_path = path.slice(0, -5);
  1936.  
  1937. globalThis.open(
  1938. `${url.protocol}//${url.host}/?num=${num}&lmt=${lmt}&fname=${fname}&path=${base_path}`,
  1939. "hostage"
  1940. );
  1941. }
  1942.  
  1943.  
  1944. function deliwenku() {
  1945. utils.createBtns();
  1946. utils.setBtnEvent(jumpToHostage, [], "btn_1", "到下载页面");
  1947. }
  1948.  
  1949. function showHints() {
  1950. let info = globalThis["deliJS"];
  1951. let body = `
  1952. <style>
  1953. h1 {
  1954. color: black;
  1955. }
  1956.  
  1957. #main {
  1958. margin: 1vw 5%;
  1959. border-radius: 10%;
  1960. }
  1961.  
  1962. p {
  1963. font-size: large;
  1964. }
  1965.  
  1966. .info {
  1967. color: rgb(230,214,110);
  1968. background: rgb(39,40,34);
  1969. text-align: right;
  1970. font-size: medium;
  1971. padding: 1vw;
  1972. border-radius: 4px;
  1973. }
  1974. </style>
  1975. <div id="main">
  1976. <h1>wk: 跳板页面</h1>
  1977. <p>有时候点一次下载等半天没反应,就再试一次</p>
  1978. <p>如果试了 2 次还不行加 QQ 群反馈吧...</p>
  1979. <p>导出的PDF如果页面数量少于应有的,那么意味着免费页数就这么多,我也爱莫能助</p>
  1980. <p>短时间连续使用导出按钮会导致 IP 被封禁</p>
  1981. <hr>
  1982. <div class="info">
  1983. 文档名称:${info.fname}<br>
  1984. 原始文档页数:${info.num}<br>
  1985. 最大免费页数:${info.lmt}<br>
  1986. </div>
  1987. </div>
  1988. `;
  1989. document.title = utils.getUrlParam("fname"); document.body.innerHTML = body;
  1990. }
  1991.  
  1992.  
  1993. /**
  1994. * url生成器
  1995. * @param {string} base_url
  1996. * @param {number} num
  1997. */
  1998. function* genUrls(base_url, num) {
  1999. for (let i=1; i<=num; i++) {
  2000. yield `${base_url}${i}.gif`;
  2001. }
  2002. }
  2003.  
  2004.  
  2005. function genBaseURL(path) {
  2006. return `${location.protocol}//${location.host}${path}`;
  2007. }
  2008.  
  2009.  
  2010. function parseParamsToDeliJS() {
  2011. let path = utils.getUrlParam("path");
  2012. let base_url = genBaseURL(path);
  2013. let fname = utils.getUrlParam("fname");
  2014. let num = parseInt(utils.getUrlParam("num"));
  2015. let lmt = parseInt(utils.getUrlParam("lmt"));
  2016.  
  2017. lmt = lmt > 3? lmt: 20;
  2018. lmt = lmt > num? num: lmt;
  2019.  
  2020. globalThis["deliJS"] = {
  2021. base_url,
  2022. num,
  2023. fname,
  2024. lmt
  2025. };
  2026. }
  2027.  
  2028.  
  2029. async function exportPDF() {
  2030. let info = globalThis["deliJS"];
  2031. await utils.imgUrlsToPDF(
  2032. genUrls(info.base_url, info.num),
  2033. info.fname,
  2034. info.lmt,
  2035. true // 请求完成后清理控制台
  2036. );
  2037. }
  2038.  
  2039.  
  2040. /**
  2041. * 得力文库跳板页面下载策略
  2042. */
  2043. async function deliFile() {
  2044. // 从URL解析文档参数
  2045. parseParamsToDeliJS();
  2046. // 显示提示
  2047. showHints();
  2048.  
  2049. // 创建按钮区
  2050. utils.createBtns();
  2051. // btn_1: 导出PDF
  2052. exportPDF = await utils.recTime(exportPDF);
  2053. utils.setBtnEvent(exportPDF, [], "btn_1", "下载并导出PDF");
  2054. }
  2055.  
  2056. function readAll360Doc() {
  2057. // 展开文档
  2058. document.querySelector(".article_showall a").click();
  2059. // 隐藏按钮
  2060. utils.toggleBtnStatus("btn_1");
  2061. // 显示按钮
  2062. utils.toggleBtnStatus("btn_2");
  2063. utils.toggleBtnStatus("btn_3");
  2064. }
  2065.  
  2066.  
  2067. function saveText_360Doc() {
  2068. // 捕获图片链接
  2069. let images = document.querySelectorAll("#artContent img");
  2070. let content = [];
  2071.  
  2072. for (let i = 0; i < images.length; i++) {
  2073. let src = images[i].src;
  2074. content.push(`图${i+1},链接:${src}`);
  2075. }
  2076. // 捕获文本
  2077. let text = document.querySelector("#artContent").textContent;
  2078. content.push(text);
  2079.  
  2080. // 保存纯文本文档
  2081. let title = document.querySelector("#titiletext").textContent;
  2082. utils.saveAs(`${title}.txt`, content.join("\n"));
  2083. }
  2084.  
  2085.  
  2086. function printPage360Doc() {
  2087. // # 清理并打印360doc的文档页
  2088. // ## 移除页面上无关的元素
  2089. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  2090. let elem_list = document.querySelectorAll(selector);
  2091. let under_doc_1, under_doc_2;
  2092. try {
  2093. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  2094. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  2095. } catch (e) { console.log(); }
  2096. // 执行移除
  2097. for (let elem of elem_list) {
  2098. utils.tryToRemoveElement(elem);
  2099. }
  2100. utils.tryToRemoveElement(under_doc_1);
  2101. utils.tryToRemoveElement(under_doc_2);
  2102. // 执行隐藏
  2103. document.querySelector("a[title]").style.display = "none";
  2104.  
  2105. // 使文档居中
  2106. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  2107. if (!utils.centerDoc(".a_left", "20")) {
  2108. return; // 如果输入非法,终止函数调用
  2109. }
  2110. // 隐藏按钮,然后打印页面
  2111. utils.hideBtnThenPrint();
  2112. }
  2113.  
  2114.  
  2115. /**
  2116. * 360doc个人图书馆下载策略
  2117. */
  2118. function doc360() {
  2119. // 创建按钮区
  2120. utils.createBtns();
  2121. // btn_1: 展开文档
  2122. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  2123. // btn_2: 导出纯文本
  2124. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  2125. // btn_3: 打印页面到PDF
  2126. utils.setBtnEvent(() => {
  2127. if (confirm("确定每页内容都加载完成了吗?")) {
  2128. printPage360Doc();
  2129. }
  2130. }, [], "btn_3", "打印页面到PDF");
  2131. }
  2132.  
  2133. /**
  2134. * 查找出所有未被捕获的页码,并返回列表
  2135. * @returns 未捕获页码列表
  2136. */
  2137. function getMissedPages() {
  2138. let all = []; // 全部页码
  2139. for (let i = 0; i < window.mbaJS.max_page; i++) {
  2140. all[i] = i + 1;
  2141. }
  2142. let missed = []; // 未捕获页码
  2143. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  2144.  
  2145. // 排除并录入未捕获页码
  2146. for (let num of all) {
  2147. if (!possessed.includes(`page${num}`)) {
  2148. missed.push(num);
  2149. }
  2150. }
  2151. return missed;
  2152. }
  2153.  
  2154.  
  2155. /**
  2156. * 根据键中的id数字对map排序
  2157. * @param {Map} elems_map
  2158. * @returns sorted_map
  2159. */
  2160. function sortMapByID(elems_map) {
  2161. // id形式:page2
  2162. let elems_arr = Array.from(elems_map);
  2163. elems_arr.sort((item1, item2) => {
  2164. // 从key中取出id
  2165. let id1 = parseInt(item1[0].replace("page", ""));
  2166. let id2 = parseInt(item2[0].replace("page", ""));
  2167. // 升序排序
  2168. return id1 - id2;
  2169. });
  2170. // 返回排序好的map
  2171. return new Map(elems_arr);
  2172. }
  2173.  
  2174.  
  2175. /**
  2176. * 存储动态加载的canvas元素、textContent
  2177. */
  2178. function storeElements_MBA() {
  2179. let canvases_map = window.mbaJS.canvases_map;
  2180. let texts_map = window.mbaJS.texts_map;
  2181. let quality = window.mbaJS.quality;
  2182.  
  2183. document.querySelectorAll(".page[data-loaded=true]").forEach(
  2184. (elem) => {
  2185. let capture = (elem) => {
  2186. // (1) 存储页面为canvas图形
  2187. let canvas, data_base64;
  2188. // 导出canvas数据防止丢失
  2189. try {
  2190. // 存储canvas
  2191. canvas = elem.querySelector("canvas[id*=page]");
  2192. if (window.mbaJS.only_text) {
  2193. data_base64 = null;
  2194. } else {
  2195. data_base64 = canvas.toDataURL("image/jpeg", quality);
  2196. }
  2197. } catch (e) {
  2198. // utils.sleep(500);
  2199. return;
  2200. }
  2201. // 增量录入map
  2202. let id = canvas.id; // id的形式:page2
  2203. if (!canvases_map.has(id)) {
  2204. canvases_map.set(id, data_base64);
  2205. }
  2206. // 确定canvas长宽
  2207. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  2208. window.mbaJS.width = parseInt(canvas.width);
  2209. window.mbaJS.height = parseInt(canvas.height);
  2210. }
  2211.  
  2212. // (2) 存储text
  2213. let text = elem.textContent;
  2214. if (!texts_map.has(id)) {
  2215. texts_map.set(id, text);
  2216. }
  2217. };
  2218. setTimeout(capture, 500, elem);
  2219. });
  2220. if (canvases_map.size === window.mbaJS.max_page) {
  2221. // 根据id排序
  2222. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  2223. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  2224. window.mbaJS.finished = true;
  2225. window.onscroll = null;
  2226. }
  2227. }
  2228.  
  2229.  
  2230. /**
  2231. * 将canvas转为jpeg,然后导出PDF
  2232. * @param {Array} base64_list canvas元素列表
  2233. * @param {String} title 文档标题
  2234. */
  2235. function saveCanvasesToPDF_MBA(base64_list, title) {
  2236. let width = window.mbaJS.width;
  2237. let height = window.mbaJS.height;
  2238.  
  2239. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  2240. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  2241. let orientation = width > height ? 'l' : 'p';
  2242. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  2243.  
  2244. // 保存每一页文档到每一页pdf
  2245. let i = 0;
  2246. for (let base64 of base64_list) {
  2247. i += 1;
  2248. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  2249. // 如果当前不是文档最后一页,则需要添加下一个空白页
  2250. if (i < window.mbaJS.max_page) {
  2251. pdf.addPage();
  2252. }
  2253. }
  2254. // 导出文件
  2255. pdf.save(`${title}.pdf`);
  2256. }
  2257.  
  2258. /**
  2259. * 判断文档页是否收集完毕,当不行时给出提示
  2260. * @returns boolean
  2261. */
  2262. function ready2use() {
  2263. removeAds(); // 顺便清理广告
  2264. // 如果是首次点击按钮,给出提示
  2265. if (window.mbaJS.first_hint) {
  2266. let hint = [
  2267. "如果浏览速度过快,比如:",
  2268. "当前页面还没完全加载好就滚动页面去看下一页",
  2269. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  2270. "由防范技术的干扰,该功能目前很不好用,见谅"
  2271. ].join("\n");
  2272. alert(hint);
  2273. window.mbaJS.first_hint = false;
  2274. }
  2275. // 如果文档页没有收集完,给出提示
  2276. if (!window.mbaJS.finished) {
  2277. let hint = [
  2278. "仍有内容未加载完,无法使用该功能",
  2279. "建议从头到尾慢速地再浏览一遍",
  2280. "以下是没有加载完成页面的页码:",
  2281. getMissedPages().join(",")
  2282. ];
  2283. alert(hint.join("\n"));
  2284. return false;
  2285. }
  2286. return true;
  2287. }
  2288.  
  2289.  
  2290. /**
  2291. * 用捕获好的canvas转jpg,生成PDF
  2292. * @returns
  2293. */
  2294. function canvas2PDF_mba() {
  2295. if (!ready2use()) {
  2296. return;
  2297. }
  2298. let canvases = window.mbaJS.canvases_map.values();
  2299. // 导出PDF
  2300. let title = document.title.split("-")[0].trim();
  2301. saveCanvasesToPDF_MBA(canvases, title);
  2302. }
  2303.  
  2304.  
  2305. /**
  2306. * 拼合捕获好的文本,保存到txt文件
  2307. * @returns
  2308. */
  2309. function saveText_mba() {
  2310. if (!ready2use()) {
  2311. return;
  2312. }
  2313. let content = Array.from(window.mbaJS.texts_map.values());
  2314. let title = document.title.split("-")[0].trim();
  2315. utils.saveAs(`${title}.txt`, content.join("\n"));
  2316. }
  2317.  
  2318.  
  2319. /**
  2320. * 移除广告
  2321. */
  2322. function removeAds() {
  2323. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  2324. utils.tryToRemoveElement(ad_elem);
  2325. });
  2326. }
  2327.  
  2328.  
  2329. function mbalib_() {
  2330. // 移除广告和左侧工具栏
  2331. removeAds();
  2332. let tool_bar = document.querySelector(".tool-bar");
  2333. utils.tryToRemoveElement(tool_bar);
  2334.  
  2335. // 创建按钮
  2336. utils.createBtns();
  2337. // 隐藏按钮
  2338. utils.toggleBtnStatus("btn_1");
  2339. // 显示按钮
  2340. utils.toggleBtnStatus("btn_2");
  2341. utils.toggleBtnStatus("btn_3");
  2342. utils.toggleBtnStatus("btn_4");
  2343.  
  2344. // 取得页数
  2345. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  2346.  
  2347. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  2348. window.mbaJS = {
  2349. max_page: max_page,
  2350. texts_map: new Map(), // id: text
  2351. canvases_map: new Map(), // id: canvas_data_base64
  2352. quality: 1, // canvas转jpg的质量
  2353. width: null, // canvas宽度(px)
  2354. height: null,
  2355. finished: false, // 是否收集完了全部文档页元素
  2356. first_hint: true,
  2357. scroll_count: 0, // 用于统计累计触发scroll的次数,
  2358. only_text: false // 是否仅捕获文本
  2359. };
  2360. // 跟随浏览,动态收集页面元素
  2361. window.onscroll = () => {
  2362. storeElements_MBA();
  2363. };
  2364. // 跟随浏览,动态收集页面元素
  2365. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2366. // 绑定事件
  2367. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2368. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2369.  
  2370. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2371. let btn_text, aim_btn, hint;
  2372. if (max_page > 40) {
  2373. btn_text = "失效说明";
  2374. aim_btn = "btn_3";
  2375. hint = [
  2376. "页数超过40,脚本无效",
  2377. "只能使用导出文本功能",
  2378. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2379. ];
  2380. utils.setBtnEvent(
  2381. () => {
  2382. utils.toggleBtnsSec();
  2383. window.onscroll = null;
  2384. },
  2385. [],
  2386. "btn_4",
  2387. "临时禁用脚本"
  2388. );
  2389. } else {
  2390. btn_text = "空白页说明";
  2391. aim_btn = "btn_4";
  2392. hint = [
  2393. "导致空白页的原因如下",
  2394. "加载该页的时间超过2秒 / 明显等待",
  2395. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2396. ];
  2397. }
  2398.  
  2399. utils.setBtnEvent(() => {
  2400. alert(hint.join("\n"));
  2401. }, [], aim_btn, btn_text);
  2402. }
  2403.  
  2404.  
  2405. function mbalib() {
  2406. setTimeout(mbalib_, 2000);
  2407. }
  2408.  
  2409. /**
  2410. * 判断是否进入预览模式
  2411. * @returns Boolean
  2412. */
  2413. function isInPreview() {
  2414. let p_elem = document.querySelector("#preview_tips");
  2415. if (p_elem.style.display === "none") {
  2416. return true;
  2417. }
  2418. return false;
  2419. }
  2420.  
  2421.  
  2422. /**
  2423. * 判断是否展开了全文
  2424. * @returns Boolean
  2425. */
  2426. function isNoMorePage() {
  2427. let read_more = document.querySelector("#ntip2");
  2428. if (read_more.style.display === "none") {
  2429. return true;
  2430. }
  2431. return false;
  2432. }
  2433.  
  2434.  
  2435. /**
  2436. * 确保进入预览模式
  2437. */
  2438. async function ensureInPreview() {
  2439. if (!isInPreview()) {
  2440. // 如果没有进入预览,则先进入
  2441. document.querySelector(".pre_button a").click();
  2442. await utils.sleep(500);
  2443. }
  2444. }
  2445.  
  2446.  
  2447. /**
  2448. * 展开全文预览,当展开完成后再次调用时,返回true
  2449. * @returns
  2450. */
  2451. async function unfoldAll() {
  2452. await ensureInPreview();
  2453. if (isNoMorePage()) {
  2454. // 如果全文展开了,则切换按钮,然后退出
  2455. utils.toggleBtnStatus("btn_1");
  2456. utils.toggleBtnStatus("btn_2");
  2457. return true;
  2458. }
  2459. // 跳转到最后一页,以展开全文
  2460. let cur_page = document.querySelector("#pageNumInput");
  2461. utils.jump2pageNo(cur_page, "999", "keydown");
  2462. }
  2463.  
  2464.  
  2465. /**
  2466. * 取得最大页码(最大20)
  2467. * @returns {number} 页码int
  2468. */
  2469. function getPageCounts$2() {
  2470. let counts_str = document.querySelector(".counts").textContent;
  2471. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2472. if (counts > 20) {
  2473. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2474. }
  2475. return parseInt(counts);
  2476. }
  2477.  
  2478.  
  2479. /**
  2480. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2481. * @returns Array | null
  2482. */
  2483. function getImgUrls() {
  2484. let pages = document.querySelectorAll("[id*=pageflash_]");
  2485. // 尚未浏览完全部页面,返回null
  2486. if (pages.length < window.dugenJS.page_counts) {
  2487. return null;
  2488. }
  2489. // 浏览完全部页面,返回urls
  2490. let urls = [];
  2491. pages.forEach((page) => {
  2492. let url = page.querySelector("img").src;
  2493. urls.push(url);
  2494. });
  2495. return urls;
  2496. }
  2497.  
  2498.  
  2499. /**
  2500. * 返回当前未加载页面的页码
  2501. * @returns not_loaded
  2502. */
  2503. function getNotloadedPages() {
  2504. // 已经取得的页码
  2505. let pages = document.querySelectorAll("[id*=pageflash_]");
  2506. let loaded = new Set();
  2507. pages.forEach((page) => {
  2508. let id = page.id.split("_")[1];
  2509. id = parseInt(id);
  2510. loaded.add(id);
  2511. });
  2512. // 未取得的页码
  2513. let not_loaded = [];
  2514. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2515. if (!loaded.has(i)) {
  2516. not_loaded.push(i);
  2517. }
  2518. }
  2519. return not_loaded;
  2520. }
  2521.  
  2522.  
  2523. function WantImgUrls() {
  2524. let res = getImgUrls();
  2525. // 页面尚未加载完
  2526. if (res === null) {
  2527. let hints = [
  2528. "尚未加载完全部页面",
  2529. "以下页面需要浏览并加载:",
  2530. getNotloadedPages().join(",")
  2531. ];
  2532. alert(hints.join("\n"));
  2533. return;
  2534. }
  2535. // 页面全部加载完
  2536. utils.saveAs("urls.csv", res.join("\n"));
  2537. }
  2538.  
  2539.  
  2540. /**
  2541. * dugen文档下载策略
  2542. */
  2543. async function dugen() {
  2544. await ensureInPreview();
  2545. // 全局对象
  2546. window.dugenJS = {
  2547. page_counts: getPageCounts$2() // 最大页码(int)
  2548. };
  2549.  
  2550. // 创建按钮区
  2551. utils.createBtns();
  2552.  
  2553. // 绑定监听器
  2554. // 按钮1:展开文档
  2555. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2556. // 按钮2:导出图片链接
  2557. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2558. }
  2559.  
  2560. /**
  2561. * 取得文档类型
  2562. * @returns {String} 文档类型str
  2563. */
  2564. function getDocType() {
  2565. let type_elem = document.querySelector(".title .icon.icon-format");
  2566. // ["icon", "icon-format", "icon-format-doc"]
  2567. let cls_str = type_elem.classList[2];
  2568. // "icon-format-doc"
  2569. let type = cls_str.split("-")[2];
  2570. return type;
  2571. }
  2572.  
  2573.  
  2574. /**
  2575. * 判断文档类型是否为type_list其中之一
  2576. * @returns 是否为type
  2577. */
  2578. function isTypeof(type_list) {
  2579. let type = getDocType();
  2580. if (type_list.includes(type)) {
  2581. return true;
  2582. }
  2583. return false;
  2584. }
  2585.  
  2586.  
  2587. /**
  2588. * 判断文档类型是否为PPT
  2589. * @returns 是否为PPT
  2590. */
  2591. function isPPT() {
  2592. return isTypeof(["ppt", "pptx"]);
  2593. }
  2594.  
  2595.  
  2596. /**
  2597. * 判断文档类型是否为Excel
  2598. * @returns 是否为Excel
  2599. */
  2600. function isEXCEL() {
  2601. return isTypeof(["xls", "xlsm", "xlsx"]);
  2602. }
  2603.  
  2604.  
  2605. /**
  2606. * 取得最大页码
  2607. * @returns {Number} 最大页码
  2608. */
  2609. function getPageCounts$1() {
  2610. let page_counts_str = document.querySelector(".intro-list").textContent;
  2611. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2612. return page_counts;
  2613. }
  2614.  
  2615.  
  2616. /**
  2617. * 取得未加载页面的页码
  2618. * @param {Set} loaded 已加载的页码集合
  2619. * @returns {Array} not_loaded 未加载页码列表
  2620. */
  2621. function getNotLoaded(loaded) {
  2622. let not_loaded = [];
  2623. let page_counts = window.book118JS.page_counts;
  2624. for (let i = 1; i <= page_counts; i++) {
  2625. if (!loaded.has(i)) {
  2626. not_loaded.push(i);
  2627. }
  2628. }
  2629. return not_loaded;
  2630. }
  2631.  
  2632.  
  2633. /**
  2634. * 取得全部文档页的url
  2635. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2636. */
  2637. function getUrls() {
  2638. let loaded = new Set(); // 存储已加载页面的页码
  2639. let urls = []; // 存储已加载页面的图形src
  2640. // 收集已加载页面的url
  2641. document.querySelectorAll("div[data-id]").forEach((div) => {
  2642. let src = div.querySelector("img").src;
  2643. if (src) {
  2644. // "1": "https://view-cache.book118.com/..."
  2645. loaded.add(parseInt(div.getAttribute("data-id")));
  2646. urls.push(src);
  2647. }
  2648. });
  2649. // 如果所有页面加载完毕
  2650. if (loaded.size === window.book118JS.page_counts) {
  2651. return [true, urls];
  2652. }
  2653. // 否则收集未加载页面的url
  2654. return [false, getNotLoaded(loaded)];
  2655. }
  2656.  
  2657.  
  2658. /**
  2659. * 展开全文
  2660. */
  2661. function readAll() {
  2662. window.preview.jump(999);
  2663. }
  2664.  
  2665.  
  2666. /**
  2667. * btn_2: 导出图片链接
  2668. */
  2669. function wantUrls() {
  2670. let [flag, res] = getUrls();
  2671. // 页面都加载完毕,下载urls
  2672. if (flag) {
  2673. utils.saveAs("urls.csv", res.join("\n"));
  2674. return;
  2675. }
  2676. // 没有加载完,提示出未加载好的页码
  2677. let hints = [
  2678. "仍有页面没有加载",
  2679. "请浏览并加载如下页面:",
  2680. res.join(",")
  2681. ];
  2682. alert(hints.join("\n"));
  2683. }
  2684.  
  2685.  
  2686. /**
  2687. * 打开PPT预览页面
  2688. */
  2689. function openPPTpage() {
  2690. window.preview.getSrc();
  2691. let openPPT = () => {
  2692. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2693. utils.openInNewTab(ppt_src);
  2694. window.preview.close();
  2695. };
  2696. setTimeout(openPPT, 1000);
  2697. }
  2698.  
  2699.  
  2700. /**
  2701. * 原创力文档(非PPT或Excel)下载策略
  2702. */
  2703. function book118_CommonDoc() {
  2704. // 创建全局对象
  2705. window.book118JS = {
  2706. doc_type: getDocType(),
  2707. page_counts: getPageCounts$1()
  2708. };
  2709.  
  2710. // 处理非PPT文档
  2711. // 创建按钮组
  2712. utils.createBtns();
  2713. // 绑定监听器到按钮
  2714. // 按钮1:展开文档
  2715. utils.setBtnEvent(() => {
  2716. readAll();
  2717. utils.toggleBtnStatus("btn_1");
  2718. utils.toggleBtnStatus("btn_2");
  2719. }, [], "btn_1");
  2720. // 按钮2:导出图片链接
  2721. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2722. }
  2723.  
  2724.  
  2725. /**
  2726. * 取得PPT文档最大页码
  2727. * @returns PPT文档最大页码int
  2728. */
  2729. function getPageCountsPPT() {
  2730. let counts_str = document.querySelector("#PageCount").textContent;
  2731. let counts = parseInt(counts_str);
  2732. // console.log(`get page counts: ${counts}`);
  2733. return counts;
  2734. }
  2735.  
  2736.  
  2737. /**
  2738. * 取得当前的页码
  2739. * @returns {Number} this_page
  2740. */
  2741. function getThisPage() {
  2742. let this_page = document.querySelector("#PageIndex").textContent;
  2743. this_page = parseInt(this_page);
  2744. return this_page;
  2745. }
  2746.  
  2747.  
  2748. /**
  2749. * 点击下一动画直到变成下一页,再切回上一页
  2750. * @param {Number} next_page 下一页的页码
  2751. */
  2752. async function __nextFrameUntillNextPage(next_page) {
  2753. // 如果已经抵达下一页,则返回上一页
  2754. let this_page = getThisPage();
  2755.  
  2756. // 最后一页直接退出
  2757. if (next_page > getPageCountsPPT()) {
  2758. return;
  2759. }
  2760. // 不是最后一页,但完成了任务
  2761. else if (this_page === next_page) {
  2762. document.querySelector(".btmLeft").click();
  2763. await utils.sleep(500);
  2764. return;
  2765. }
  2766. // 否则递归的点击下一动画
  2767. document.querySelector(".btmRight").click();
  2768. await utils.sleep(500);
  2769. await __nextFrameUntillNextPage(next_page);
  2770. }
  2771.  
  2772.  
  2773. /**
  2774. * 确保当前页面是最后一帧动画
  2775. */
  2776. async function ensurePageLoaded() {
  2777. // 取得当前页码和下一页页码
  2778. let this_page = getThisPage();
  2779. let next_page = this_page + 1;
  2780. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2781. await __nextFrameUntillNextPage(next_page);
  2782. }
  2783.  
  2784.  
  2785. /**
  2786. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2787. */
  2788. async function docView2Canvas() {
  2789. await ensurePageLoaded();
  2790. // 取得页码
  2791. let cur_page = getThisPage();
  2792. // 取得视图元素,计数从0开始
  2793. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2794. // 转化为canvas
  2795. let canvas_promise = html2canvas(doc_view);
  2796. console.log(canvas_promise); // 打印信息以检查状况
  2797.  
  2798. await canvas_promise.then((canvas) => {
  2799. // 保存canvas到全局对象
  2800. window.book118JS.canvases.push(canvas);
  2801. // 打印日志
  2802. console.log(`wk: ${cur_page} complete`);
  2803. });
  2804.  
  2805. // 如果到最后一页
  2806. let page_counts = getPageCountsPPT();
  2807. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2808. if (cur_page === page_counts) {
  2809. // 终止递归,并且显示导出PDF按钮
  2810. utils.toggleBtnStatus("btn_2");
  2811. return;
  2812. }
  2813. // 否则下一次递归(继续捕获下一页)
  2814. document.querySelector(".pgRight").click();
  2815. await utils.sleep(500);
  2816. await docView2Canvas();
  2817. }
  2818.  
  2819.  
  2820. /**
  2821. * 将捕获的canvases合并并导出为pdf
  2822. * @returns
  2823. */
  2824. function canvases2pdf() {
  2825. // 已经捕获的页面数量
  2826. let stored_amount = window.book118JS.canvases.length;
  2827. // 总页面数量
  2828. let page_counts = window.book118JS.page_counts;
  2829. // 校验数量
  2830. let diff = page_counts - stored_amount;
  2831. if (diff > 0) {
  2832. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2833. if (!confirm("是否仍要导出PDF?")) {
  2834. // 不坚持导出PDF的情况
  2835. return;
  2836. }
  2837. }
  2838. // 导出PDF
  2839. let canvases = window.book118JS.canvases;
  2840. // 取得宽高
  2841. let model = canvases[0];
  2842. let width = model.width;
  2843. let height = model.height;
  2844. // 取得标题然后导出pdf
  2845. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2846. }
  2847.  
  2848.  
  2849. /**
  2850. * 原创力文档(PPT)下载策略
  2851. */
  2852. function book118_PPT() {
  2853. // 创建全局对象
  2854. window.book118JS = {
  2855. page_counts: getPageCountsPPT(),
  2856. canvases: [] // 存储每页文档转化的canvas
  2857. };
  2858.  
  2859. // 创建按钮区
  2860. utils.createBtns();
  2861. // 绑定监听器到按钮1
  2862. utils.setBtnEvent(() => {
  2863. let hints = [
  2864. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2865. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2866. ];
  2867. alert(hints.join("\n"));
  2868. // 隐藏按钮1
  2869. utils.toggleBtnStatus("btn_1");
  2870. // 开始捕获页面(异步)
  2871. docView2Canvas(window.book118JS.page_counts);
  2872. }, [], "btn_1", "捕获页面");
  2873. // 为按钮2绑定监听器
  2874. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2875. }
  2876.  
  2877.  
  2878. /**
  2879. * 取得当前页面的excel,返回csv string
  2880. * @returns {String} csv
  2881. */
  2882. function excel2CSV() {
  2883. let table = [];
  2884. let rows = document.querySelectorAll("tr[id]");
  2885.  
  2886. // 遍历行
  2887. for (let row of rows) {
  2888. let csv_row = [];
  2889. // 遍历列(单元格)
  2890. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2891. // 判断单元格是否存储图片
  2892. let img = cell.querySelector("img");
  2893. if (img) {
  2894. // 如果是图片,保存图片链接
  2895. csv_row.push(img.src);
  2896. } else {
  2897. // 否则保存单元格文本
  2898. csv_row.push(cell.textContent);
  2899. }
  2900. }
  2901. table.push(csv_row.join(","));
  2902. }
  2903.  
  2904. let csv = table.join("\n");
  2905. csv = csv.replace(/\n{2,}/g, "\n");
  2906. return csv;
  2907. }
  2908.  
  2909.  
  2910. /**
  2911. * 下载当前表格内容,保存为csv(utf-8编码)
  2912. */
  2913. function wantEXCEL() {
  2914. let file_name = "原创力表格_UTF-8.csv";
  2915. utils.saveAs(file_name, excel2CSV());
  2916. }
  2917.  
  2918.  
  2919. /**
  2920. * 在Excel预览页面给出操作提示
  2921. */
  2922. function help() {
  2923. let hints = [
  2924. "【导出表格到CSV】只能导出当前sheet,",
  2925. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2926. "CSV是一种简单的表格格式,可以被Excel打开,",
  2927. "并转为 xls 或 xlsx 格式存储,",
  2928. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2929. "",
  2930. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2931. "有两个办法:",
  2932. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2933. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2934. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2935. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2936. ];
  2937. alert(hints.join("\n"));
  2938. }
  2939.  
  2940.  
  2941. /**
  2942. * 原创力文档(EXCEL)下载策略
  2943. */
  2944. function book118_EXCEL() {
  2945. // 创建按钮区
  2946. utils.createBtns();
  2947. // 绑定监听器到按钮
  2948. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2949. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2950. // 显示按钮
  2951. utils.toggleBtnStatus("btn_2");
  2952. }
  2953.  
  2954.  
  2955. /**
  2956. * 打开Excel预览页面
  2957. */
  2958. function openEXCELpage() {
  2959. openPPTpage();
  2960. }
  2961.  
  2962.  
  2963. /**
  2964. * 原创力文档下载策略
  2965. */
  2966. function book118() {
  2967. let host = window.location.hostname;
  2968. if (host === 'max.book118.com') {
  2969. if (isEXCEL()) {
  2970. utils.createBtns();
  2971. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2972. } else if (isPPT()) {
  2973. utils.createBtns();
  2974. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2975. } else {
  2976. book118_CommonDoc();
  2977. }
  2978. } else if (host === "view-cache.book118.com") {
  2979. book118_PPT();
  2980. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2981. book118_EXCEL();
  2982. } else {
  2983. console.log(`wk: Unknown host: ${host}`);
  2984. }
  2985. }
  2986.  
  2987. // test url: https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=E86BBCE32DA8E67F3DA04ED98F2465DB
  2988.  
  2989.  
  2990. /**
  2991. * 绘制0x0的bmp, 作为请求失败时返回的page
  2992. * @returns {Promise<ImageBitmap>} blank_page
  2993. */
  2994. async function blankBMP() {
  2995. let canvas = document.createElement("canvas");
  2996. [canvas.width, canvas.height] = [0, 0];
  2997. return createImageBitmap(canvas);
  2998. }
  2999.  
  3000.  
  3001. /**
  3002. * resp导出bmp
  3003. * @param {string} page_url
  3004. * @param {Promise<Response> | ImageBitmap} pms_or_bmp
  3005. * @returns {Promise<ImageBitmap>} page
  3006. */
  3007. async function respToPage(page_url, pms_or_bmp) {
  3008. let center = globalThis.gb688JS;
  3009. // 此时是bmp
  3010. if (pms_or_bmp instanceof ImageBitmap) {
  3011. return pms_or_bmp;
  3012. }
  3013.  
  3014. // 第一次下载, 且无人处理
  3015. if (!center.pages_status.get(page_url)) {
  3016. // 处理中, 设为占用
  3017. center.pages_status.set(page_url, 1);
  3018.  
  3019. // 处理
  3020. let resp;
  3021. try {
  3022. resp = await pms_or_bmp;
  3023. } catch(err) {
  3024. console.log("下载页面失败");
  3025. console.error(err);
  3026. return blankBMP();
  3027. }
  3028.  
  3029. let page_blob = await resp.blob();
  3030. let page = await createImageBitmap(page_blob);
  3031. center.pages.set(page_url, page);
  3032. // 处理结束, 设为释放
  3033. center.pages_status.set(page_url, 0);
  3034. return page;
  3035. }
  3036.  
  3037. // 有人正在下载且出于处理中
  3038. while (center.pages_status.get(page_url)) {
  3039. await utils.sleep(500);
  3040. }
  3041. return center.pages.get(page_url);
  3042. }
  3043.  
  3044.  
  3045. /**
  3046. * 获得PNG页面
  3047. * @param {string} page_url
  3048. * @returns {Promise<ImageBitmap>} bmp
  3049. */
  3050. async function getPage(page_url) {
  3051. // 如果下载过, 直接返回缓存
  3052. let pages = globalThis.gb688JS.pages;
  3053. if (pages.has(page_url)) {
  3054. return respToPage(page_url, pages.get(page_url));
  3055. }
  3056.  
  3057. // 如果从未下载过, 就下载
  3058. let resp = fetch(page_url, {
  3059. "headers": {
  3060. "accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
  3061. "accept-language": "zh-CN,zh;q=0.9,en;q=0.8",
  3062. "proxy-connection": "keep-alive"
  3063. },
  3064. "referrer": location.href,
  3065. "referrerPolicy": "strict-origin-when-cross-origin",
  3066. "body": null,
  3067. "method": "GET",
  3068. "mode": "cors",
  3069. "credentials": "include"
  3070. });
  3071. pages.set(page_url, resp);
  3072. return respToPage(page_url, resp);
  3073. }
  3074.  
  3075.  
  3076. /**
  3077. * 返回文档页div的裁切和粘贴位置信息: [[cut_x, cut_y, paste_x%, paset_y%],...]
  3078. * @param {HTMLDivElement} page_div 文档页元素
  3079. * @returns {Array<Array<number>>} positions
  3080. */
  3081. function getPostions(page_div) {
  3082. let positions = [];
  3083.  
  3084. Array.from(page_div.children).forEach(span => {
  3085. // 'pdfImg-3-8' -> {left: 30%; top: 80%;}
  3086. let paste_pos = span.className.split("-").slice(1).map(
  3087. v => parseInt(v) / 10
  3088. );
  3089. // '-600px 0px' -> [600, 0]
  3090. let cut_pos = span.style.backgroundPosition.split(" ").map(
  3091. v => Math.abs(parseInt(v))
  3092. );
  3093. positions.push([...cut_pos, ...paste_pos]);
  3094. });
  3095. return positions;
  3096. }
  3097.  
  3098.  
  3099. /**
  3100. * 取得文档页的图像url
  3101. * @param {HTMLDivElement} page_div
  3102. * @returns {string} url
  3103. */
  3104. function getPageURL(page_div) {
  3105. // 拿到目标图像url
  3106. let path = location.pathname.split("/").slice(0, -1).join("/");
  3107. let prefix = location.origin + path + "/";
  3108. let url = page_div.getAttribute("bg");
  3109. if (!url) {
  3110. // 'url("viewGbImg?fileName=VS72l67k0jw5g3j0vErP8DTsnWvk5QsqnNLLxaEtX%2FM%3D")'
  3111. url = page_div.children[0].style.backgroundImage.split('"')[1];
  3112. }
  3113. return prefix + url;
  3114. }
  3115.  
  3116.  
  3117. /**
  3118. * 下载目标图像并拆解重绘, 返回canvas
  3119. * @param {number} i 第 i 页 (从0开始)
  3120. * @param {HTMLDivElement} page_div
  3121. * @returns {Promise<Array>} [页码, Canvas]
  3122. */
  3123. async function getAndDrawPage(i, page_div) {
  3124. // 拿到目标图像
  3125. let url = getPageURL(page_div);
  3126. let page = await getPage(url);
  3127.  
  3128. // 绘制空白A4纸背景
  3129. let [page_w, page_h] = [1190, 1680];
  3130. let bg = document.createElement("canvas");
  3131. bg.width = page_w; // 注意canvas作为取景框的大小
  3132. bg.height = page_h; // 如果不设置等于一个很小的取景框
  3133. let bg_ctx = bg.getContext("2d");
  3134. bg_ctx.fillStyle = "white";
  3135. bg_ctx.fillRect(0, 0, page_w, page_h);
  3136.  
  3137. // 逐个区块剪切取出并粘贴
  3138. // wk$("#viewer .page").forEach(page_div => {
  3139. getPostions(page_div).forEach(pos => {
  3140. bg_ctx.drawImage(
  3141. page, // image source
  3142. pos[0], // source x
  3143. pos[1], // source y
  3144. 120, // source width
  3145. 169, // source height
  3146. pos[2] * page_w, // destination x = left: x%
  3147. pos[3] * page_h, // destination y = top: y%
  3148. 120, // destination width
  3149. 169 // destination height
  3150. );
  3151. });
  3152. // });
  3153. return [i, bg];
  3154. }
  3155.  
  3156.  
  3157. /**
  3158. * 页面批量请求、裁剪重绘, 合成PDF并下载
  3159. */
  3160. async function turnPagesToPDF() {
  3161. // 渲染每页
  3162. let tasks = [];
  3163. wk$("#viewer .page").forEach((page_div, i) => {
  3164. tasks.push(
  3165. getAndDrawPage(i, page_div)
  3166. );
  3167. });
  3168. // 等待每页渲染完成后,排序
  3169. let results = await Promise.all(tasks);
  3170. results.sort((prev, next) => prev[0] - next[0]);
  3171. // 合并为PDF并导出
  3172. utils.saveCanvasesToPDF(
  3173. results.map(item => item[1]),
  3174. // '在线预览|GB 14023-2022'
  3175. document.title.split("|")[1]
  3176. );
  3177. }
  3178.  
  3179.  
  3180. /**
  3181. * 提示预估下载耗时,然后下载
  3182. */
  3183. function hintThenDownload$1() {
  3184. // '/93'
  3185. let page_num = parseInt(wk$("#numPages")[0].textContent.slice(1));
  3186. let estimate = Math.ceil(page_num / 3);
  3187. alert(`页数: ${page_num},预计花费: ${estimate}秒;如遇网络异常可能更久\n请勿反复点击按钮;如果无法导出请 QQ 群反馈`);
  3188. turnPagesToPDF();
  3189. }
  3190.  
  3191.  
  3192. /**
  3193. * gb688文档下载策略
  3194. */
  3195. async function gb688() {
  3196. // 创建全局对象
  3197. globalThis.gb688JS = {
  3198. pages: new Map(), // {url: bmp}
  3199. pages_status: new Map() // {url: 0或1} 0释放, 1占用
  3200. };
  3201.  
  3202. // 创建按钮区
  3203. utils.createBtns();
  3204. // 绑定监听器
  3205. // 按钮1:导出PDF
  3206. turnPagesToPDF = await utils.recTime(turnPagesToPDF);
  3207. utils.setBtnEvent(hintThenDownload$1, [], "btn_1", "导出PDF");
  3208. }
  3209.  
  3210. function getPageCounts() {
  3211. // " / 39"
  3212. let counts_str = wk$(".counts")[0].textContent.split("/")[1];
  3213. let counts = parseInt(counts_str);
  3214. return counts > 20 ? 20 : counts;
  3215. }
  3216.  
  3217.  
  3218. /**
  3219. * 返回图片基础路径
  3220. * @returns {string} base_url
  3221. */
  3222. function getImgBaseURL() {
  3223. return wk$("#dp")[0].value;
  3224. }
  3225.  
  3226.  
  3227. function* genImgURLs() {
  3228. let counts = getPageCounts();
  3229. let base_url = getImgBaseURL();
  3230. for (let i=1; i<=counts; i++) {
  3231. yield base_url + `${i}.gif`;
  3232. }
  3233. }
  3234.  
  3235.  
  3236. /**
  3237. * 下载图片,转为canvas,合并为PDF并下载
  3238. */
  3239. function fetchThenExportPDF() {
  3240. // db2092-2014-河北特种设备使用安全管理规范_安全文库网safewk.com
  3241. let title = document.title.split("_")[0];
  3242. return utils.imgUrlsToPDF(genImgURLs(), title);
  3243. }
  3244.  
  3245.  
  3246. /**
  3247. * 提示预估下载耗时,然后下载
  3248. */
  3249. async function hintThenDownload() {
  3250. let hint = [
  3251. "只能导出可预览的页面(最多20页)",
  3252. "请勿短时间反复点击按钮,导出用时大约不到 10 秒",
  3253. "点完后很久没动静请至 QQ 群反馈"
  3254. ];
  3255. alert(hint.join("\n"));
  3256. await fetchThenExportPDF();
  3257. }
  3258.  
  3259.  
  3260. /**
  3261. * safewk文档下载策略
  3262. */
  3263. async function safewk() {
  3264. // 创建按钮区
  3265. utils.createBtns();
  3266. // 绑定监听器
  3267. // 按钮1:导出PDF
  3268. hintThenDownload = await utils.recTime(hintThenDownload);
  3269. utils.setBtnEvent(hintThenDownload, [], "btn_1", "导出PDF");
  3270. }
  3271.  
  3272. /**
  3273. * 主函数:识别网站,执行对应文档下载策略
  3274. */
  3275. function main() {
  3276. // 显示当前位置
  3277. let host = window.location.host;
  3278. console.log(`当前host: ${host}`);
  3279. // 挂载工具包到全局
  3280. window.user_utils = utils;
  3281. console.log("wk: user_utils已经挂载到全局");
  3282.  
  3283. // 主任务
  3284. if (host.includes("docin.com")) {
  3285. docin();
  3286. } else if (host === "swf.ishare.down.sina.com.cn") {
  3287. ishareData();
  3288. } else if (host.includes("ishare.iask")) {
  3289. ishare();
  3290. } else if (host === "www.deliwenku.com") {
  3291. deliwenku();
  3292. } else if (host.includes("file") && host.includes("deliwenku.com")) {
  3293. deliFile();
  3294. } else if (host === "www.doc88.com") {
  3295. doc88();
  3296. } else if (host === "www.360doc.com") {
  3297. doc360();
  3298. } else if (host === "doc.mbalib.com") {
  3299. mbalib();
  3300. } else if (host === "www.dugen.com") {
  3301. dugen();
  3302. } else if (host === "c.gb688.cn") {
  3303. gb688();
  3304. } else if (host === "www.safewk.com") {
  3305. safewk();
  3306. } else if (host.includes("book118.com")) {
  3307. book118();
  3308. } else {
  3309. console.log("匹配到了无效网页");
  3310. }
  3311. }
  3312.  
  3313.  
  3314. let options = {
  3315. fast_mode: true,
  3316. activation_test: false,
  3317. show_buttons: true,
  3318. cli_mode: false
  3319. };
  3320. function loadExternalScripts() {
  3321. let urls = [
  3322. "https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js",
  3323. "https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js",
  3324. "https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js",
  3325. "https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js",
  3326. ];
  3327. for (let url of urls) {
  3328. utils.addScript2HTML(url);
  3329. let temp = url.split("/");
  3330. let n = temp.length;
  3331. let module_name = temp[n - 1];
  3332. console.log(`${module_name}模块已经加载`);
  3333. }
  3334. }
  3335. if (options.activation_test) {
  3336. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  3337. }
  3338. // 根据配置选择:是否默认显示
  3339. if (!options.show_buttons) {
  3340. utils.toggleBtnsSec();
  3341. }
  3342. if (options.cli_mode) {
  3343. loadExternalScripts();
  3344. setTimeout(main, 2000);
  3345. } else if (options.fast_mode) {
  3346. utils.manipulateElem("body", main);
  3347. } else {
  3348. window.onload = main;
  3349. }
  3350.  
  3351. })();