Wenku Doc Downloader

下载文档,导出纯图片PDF。有限地支持 ①豆丁网 ②道客巴巴 ③360doc个人图书馆 ④得力文库 ⑤MBA智库 ⑥爱问共享资料(新浪文档) ⑦原创力文档 ⑧读根网 ⑨国标网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-11-23 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.23
  5. // @description 下载文档,导出纯图片PDF。有限地支持 ①豆丁网 ②道客巴巴 ③360doc个人图书馆 ④得力文库 ⑤MBA智库 ⑥爱问共享资料(新浪文档) ⑦原创力文档 ⑧读根网 ⑨国标网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://www.deliwenku.com/p-*
  11. // @match *://www.doc88.com/p-*
  12. // @match *://www.360doc.com/content/*
  13. // @match *://wenku.baidu.com/view/*
  14. // @match *://wenku.baidu.com/tfview/*
  15. // @match *://doc.mbalib.com/view/*
  16. // @match *://www.dugen.com/p-*
  17. // @match *://max.book118.com/html/*
  18. // @match *://view-cache.book118.com/pptView.html?*
  19. // @match *://*.book118.com/?readpage=*
  20. // @match *://c.gb688.cn/bzgk/gb/showGb?*
  21. // @match https://swf.ishare.down.sina.com.cn
  22. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  23. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  24. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  25. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  26. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  27. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  28. // @grant none
  29. // @license GPL-3.0-only
  30. // @create 2021-11-22
  31. // @note 1. 微调了图片合并为PDF的函数
  32. // ==/UserScript==
  33.  
  34.  
  35. (function () {
  36. 'use strict';
  37.  
  38. /**
  39. * 多元素选择器
  40. * @param {string | HTMLElement} selector 选择器或元素
  41. * @returns {NodeListOf<HTMLElement>} elements 元素列表
  42. */
  43. let _wk$ = function(selector) {
  44. if (selector instanceof Node) {
  45. return [selector];
  46. }
  47. let that = this;
  48. if (!(that instanceof HTMLElement)) {
  49. that = document;
  50. }
  51. return that.querySelectorAll(selector);
  52. };
  53.  
  54. globalThis.wk$ = _wk$;
  55.  
  56.  
  57. let utils = {
  58. /**
  59. * 使用过时的execCommand复制文字
  60. * @param {string} text
  61. */
  62. _oldCopy: function(text) {
  63. let input = document.createElement("input");
  64. input.value = text;
  65. document.body.appendChild(input);
  66. input.select();
  67. document.execCommand("copy");
  68. input.remove();
  69. },
  70.  
  71. /**
  72. * 复制text到剪贴板
  73. * @param {string} text
  74. * @returns
  75. */
  76. copy: function(text) {
  77. // 输出到控制台和剪贴板
  78. console.log(text);
  79. if (!navigator.clipboard) {
  80. this._oldCopy(text);
  81. return;
  82. }
  83. navigator.clipboard.writeText(text)
  84. .catch(err => {
  85. this._oldCopy(text);
  86. });
  87. },
  88.  
  89. /**
  90. * 装饰器, 用于打印函数执行耗时
  91. * @param {Function} func 需要计时的函数
  92. * @returns 装饰的func => func的返回值
  93. */
  94. recTime: async function(func) {
  95. async function inner() {
  96. let begin = Date.now();
  97. let res = await func();
  98. let cost = ((Date.now() - begin) / 1000).toFixed(1);
  99. console.log(`Function <${func.name}> costed ${cost} seconds.`);
  100. return res;
  101. }
  102. return inner;
  103. },
  104.  
  105. /**
  106. * 创建并下载文件
  107. * @param {String} file_name 文件名
  108. * @param {String | Blob} content 文本或blob
  109. */
  110. createAndDownloadFile: function(file_name, content) {
  111. let aTag = document.createElement('a');
  112. let blob;
  113. if (typeof content != Blob) {
  114. blob = new Blob([content]);
  115. }
  116. aTag.download = file_name;
  117. aTag.href = URL.createObjectURL(blob);
  118. aTag.click();
  119. URL.revokeObjectURL(blob);
  120. },
  121.  
  122. /**
  123. * 创建并下载URL资源
  124. * @param {String} file_name
  125. * @param {String} src
  126. */
  127. downloadUrlFile: function(file_name, src) {
  128. let aTag = document.createElement('a');
  129. aTag.download = file_name;
  130. aTag.href = src;
  131. aTag.click();
  132. },
  133.  
  134. /**
  135. * canvas转为PNG格式的blob
  136. * @param {HTMLCanvasElement} canvas
  137. * @returns {Promise<Blob>} blob
  138. */
  139. canvasToBlob: async function(canvas) {
  140. return new Promise(res => canvas.toBlob(res));
  141. },
  142.  
  143. /**
  144. * 添加外部js到当前页面
  145. * @param {String} url
  146. */
  147. addScript2HTML: function(url) {
  148. let script = document.createElement("script");
  149. script.src = url;
  150. document.head.appendChild(script);
  151. },
  152.  
  153. /**
  154. * 显示/隐藏按钮区.
  155. * @param {Function} func
  156. */
  157. toggleBtnsSec: function() {
  158. let sec = wk$(".wk-box")[0];
  159. if (sec.style.display === "none") {
  160. sec.style.display = "block";
  161. return;
  162. }
  163. sec.style.display = "none";
  164. },
  165.  
  166. /**
  167. * 睡眠 delay 毫秒
  168. * @param {Number} delay
  169. */
  170. sleep: function(delay) {
  171. let start = (new Date()).getTime();
  172. while ((new Date()).getTime() - start < delay) {
  173. continue;
  174. }
  175. },
  176.  
  177. /**
  178. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  179. * @param {Number} delay
  180. * @returns {Promise} nextTask
  181. */
  182. sleepAsync: function(delay) {
  183. return new Promise((resolve) => setTimeout(resolve, delay));
  184. },
  185.  
  186. /**
  187. * 允许打印页面
  188. */
  189. allowPrint: function() {
  190. let style = document.createElement("style");
  191. style.innerHTML = `
  192. @media print {
  193. body{
  194. display:block;
  195. }
  196. }
  197. `;
  198. document.head.appendChild(style);
  199. },
  200.  
  201. /**
  202. * 取得get参数key对应的value
  203. * @param {String} key
  204. * @returns {String} value
  205. */
  206. getUrlParam: function(key) {
  207. let params = (new URL(window.location)).searchParams;
  208. return params.get(key);
  209. },
  210.  
  211. /**
  212. * 在指定节点后面插入节点
  213. * @param {HTMLElement} new_element
  214. * @param {HTMLElement} target_element
  215. */
  216. insertAfter: function(new_element, target_element) {
  217. let parent = target_element.parentNode;
  218. if (parent.lastChild === target_element) {
  219. parent.appendChild(new_element);
  220. } else {
  221. parent.insertBefore(new_element, target_element.nextElementSibling);
  222. }
  223. },
  224.  
  225. /**
  226. * 求main_set去除cut_set后的set
  227. * @param {Set} main_set
  228. * @param {Set} cut_set
  229. * @returns 差集
  230. */
  231. difference: function(main_set, cut_set) {
  232. let _diff = new Set(main_set);
  233. for (let elem of cut_set) {
  234. _diff.delete(elem);
  235. }
  236. return _diff;
  237. },
  238.  
  239. /**
  240. * 抛出set中的第一个元素
  241. * @param {Set} set
  242. * @returns 一个元素
  243. */
  244. setPop: function(set) {
  245. for (let item of set) {
  246. set.delete(item);
  247. return item;
  248. }
  249. },
  250.  
  251. /**
  252. * 绑定事件到指定按钮,返回按钮引用
  253. * @param {Function} event click事件
  254. * @param {Array} args 事件的参数列表
  255. * @param {String} aim_btn 按钮的变量名
  256. * @param {String} new_text 按钮的新文本,为null则不替换
  257. * @returns 按钮元素的引用
  258. */
  259. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  260. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  261. // 如果需要,替换按钮内文本
  262. if (new_text) {
  263. btn.textContent = new_text;
  264. }
  265. // 绑定事件,添加到页面上
  266. btn.onclick = () => {
  267. this.enhanceBtnClickReaction(aim_btn);
  268. if (args.length) {
  269. event(...args);
  270. } else {
  271. event();
  272. }
  273. };
  274. return btn;
  275. },
  276.  
  277. /**
  278. * 强制隐藏元素
  279. * @param {String} selector
  280. */
  281. forceHide: function(selector) {
  282. let style_cls = "force-hide";
  283. document.querySelectorAll(selector).forEach((elem) => {
  284. elem.className += ` ${style_cls}`;
  285. });
  286. // 判断css样式是否已经存在
  287. let style;
  288. style = document.querySelector(`style.${style_cls}`);
  289. // 如果已经存在,则无须重复创建
  290. if (style) {
  291. return;
  292. }
  293. // 否则创建
  294. style = document.createElement("style");
  295. style.innerHTML = `style.${style_cls} {
  296. visibility: hidden !important;
  297. }`;
  298. document.head.appendChild(style);
  299. },
  300.  
  301. /**
  302. * 当元素可见时,操作目标元素(异步)。最多为不可见元素等待5秒。
  303. * @param {string} s 单个元素选择器
  304. * @param {Function} callback (elem) => {...} 元素操作函数
  305. */
  306. manipulateElem: async function(s, callback) {
  307. let isVisiable = () => {
  308. let res = getComputedStyle($(s)[0]).display !== "none";
  309. // console.log(`${s} visibility: ${res}`);
  310. return res;
  311. };
  312.  
  313. let max = 5 * 5; // 最多等待5秒
  314. let i = 0;
  315.  
  316. // 如果不可见就等待0.2秒/轮
  317. while (!isVisiable() && i <= max) {
  318. i++;
  319. await utils.sleepAsync(200);
  320. }
  321.  
  322. callback($(s)[0]);
  323. },
  324.  
  325. /**
  326. * 隐藏按钮,打印页面,显示按钮
  327. */
  328. hideBtnThenPrint: function() {
  329. // 隐藏按钮,然后打印页面
  330. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  331. btns.forEach((elem) => {
  332. elem.style.display = "none";
  333. });
  334. window.print();
  335.  
  336. // 打印结束,显示按钮
  337. btns.forEach((elem) => {
  338. elem.style.display = "block";
  339. });
  340. },
  341.  
  342. /**
  343. * 返回times个倍数连接的str
  344. * @param {String} str
  345. * @param {Number} times
  346. * @returns multiplied_str
  347. */
  348. multiplyStr: function(str, times) {
  349. let str_list = [];
  350. for (let i = 0; i < times; i++) {
  351. str_list.push(str);
  352. }
  353. return str_list.join("");
  354. },
  355.  
  356. /**
  357. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  358. * @param {String} custom_btn 按钮变量名
  359. */
  360. enhanceBtnClickReaction: function(custom_btn = null) {
  361. let aim_btn;
  362. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  363. if (!custom_btn || custom_btn === "btn_1") {
  364. aim_btn = document.querySelector(".btn-1");
  365. } else {
  366. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  367. }
  368.  
  369. let old_color = aim_btn.style.color; // 保存旧的颜色
  370. let old_text = aim_btn.textContent; // 保存旧的文字内容
  371. // 变黑缩小
  372. aim_btn.style.color = "black";
  373. aim_btn.style.fontWeight = "normal";
  374. aim_btn.textContent = `->${old_text}<-`;
  375. // 复原加粗
  376. let changeColorBack = function() {
  377. aim_btn.style.color = old_color;
  378. aim_btn.style.fontWeight = "bold";
  379. aim_btn.textContent = old_text;
  380. };
  381. setTimeout(changeColorBack, 1250);
  382. },
  383.  
  384. /**
  385. * 切换按钮显示/隐藏状态
  386. * @param {String} aim_btn 按钮变量名
  387. * @returns 按钮元素的引用
  388. */
  389. toggleBtnStatus: function(aim_btn) {
  390. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  391. let display = getComputedStyle(btn).display;
  392. // return;
  393. if (display === "none") {
  394. btn.style.display = "block";
  395. } else {
  396. btn.style.display = "none";
  397. }
  398. return btn;
  399. },
  400.  
  401. /**
  402. * 根据canvas元素数量返回quality值
  403. * @param {Number} canvas_amount
  404. * @returns quality: Number
  405. */
  406. getQualityByCanvasAmount: function(canvas_amount) {
  407. // 如果有全局参数,优先用全局的
  408. if (window.img_quality !== undefined) {
  409. console.log(`image quality: ${window.img_quality * 100}%`);
  410. return window.img_quality;
  411. }
  412. // 否则用默认的
  413. let quality;
  414. if (canvas_amount <= 25) {
  415. quality = 1.0;
  416. } else if (25 < canvas_amount <= 50) {
  417. quality = 0.9;
  418. } else {
  419. quality = 0.8;
  420. }
  421. console.log(`image quality: ${quality * 100}%`);
  422. return quality;
  423. },
  424.  
  425. /**
  426. * 挂载func到全局
  427. * @param {Function} func
  428. */
  429. globalFunc: function(func) {
  430. globalThis[func.name] = func;
  431. },
  432.  
  433. /**
  434. * 用input框跳转到对应页码
  435. * @param {Element} cur_page 当前页码
  436. * @param {string | Number} aim_page 目标页码
  437. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  438. */
  439. jump2pageNo: function(cur_page, aim_page, event_type) {
  440. // 设置跳转页码为目标页码
  441. cur_page.value = (aim_page).toString();
  442. // 模拟回车事件来跳转
  443. let keyboard_event_enter = new KeyboardEvent(event_type, {
  444. bubbles: true,
  445. cancelable: true,
  446. keyCode: 13
  447. });
  448. cur_page.dispatchEvent(keyboard_event_enter);
  449. },
  450.  
  451. /**
  452. * 在新标签页打开链接
  453. * @param {String} href
  454. */
  455. openInNewTab: function(href) {
  456. let link = document.createElement("a");
  457. link.href = href;
  458. link.target = "_blank";
  459. link.click();
  460. },
  461.  
  462. /**
  463. * 滚动到页面底部
  464. */
  465. scrollToBottom: function() {
  466. window.scrollTo({
  467. top: document.body.scrollHeight,
  468. behavior: "smooth"
  469. });
  470. },
  471.  
  472. /**
  473. * 用try移除元素
  474. * @param {Element} element 要移除的元素
  475. */
  476. tryToRemoveElement: function(element) {
  477. try {
  478. element.remove();
  479. } catch (e) {
  480. }
  481. },
  482.  
  483. /**
  484. * 用try移除若干元素
  485. * @param {Element[]} elements 要移除的元素列表
  486. */
  487. tryToRemoveElements: function(elements) {
  488. elements.forEach((elem) => {
  489. this.tryToRemoveElement(elem);
  490. });
  491. },
  492.  
  493. /**
  494. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  495. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  496. */
  497. tryToRemoveSameElem: function(elem_list_box) {
  498. for (let elem_list of elem_list_box) {
  499. if (!elem_list) {
  500. continue;
  501. }
  502. for (let elem of elem_list) {
  503. try {
  504. elem.remove();
  505. } catch (e) {
  506. console.log();
  507. }
  508. }
  509. }
  510. },
  511.  
  512. /**
  513. * 使文档在页面上居中
  514. * @param {String} selector 文档容器的css选择器
  515. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  516. * @returns 偏移值是否合法
  517. */
  518. centerDoc: function(selector, default_offset) {
  519. let doc_main = document.querySelector(selector);
  520. let offset = window.prompt("请输入偏移百分位:", default_offset);
  521. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  522. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  523. doc_main.style.marginLeft = offset + "%";
  524. return true;
  525. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  526. doc_main.style.marginLeft = offset + "%";
  527. return true
  528. } else {
  529. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  530. return false;
  531. }
  532. },
  533.  
  534. /**
  535. * 调整按钮内文本
  536. * @param {String} aim_btn 按钮变量名
  537. * @param {String} new_text 新的文本,null则保留旧文本
  538. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  539. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  540. */
  541. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  542. // 提示文档已经展开
  543. if (use_hint) {
  544. let hint = "文档已经完全展开,可以导出";
  545. alert(hint);
  546. }
  547. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  548. // 要替换的文本
  549. if (new_text) {
  550. btn.textContent = new_text;
  551. }
  552. // 推荐按钮
  553. if (recommend_btn) {
  554. btn.textContent += "(推荐)";
  555. }
  556. },
  557.  
  558. html2Canvases: async function(elem_list) {
  559. // 如果是空元素列表,返回null并终止函数
  560. if (elem_list.length === 0) {
  561. console.log("html2canvases was called, but no element is avaiable.");
  562. return null;
  563. }
  564. let tasks = []; // 存放异步任务
  565. let contents = []; // 存放canvas元素
  566. for (let elem of elem_list) {
  567. let task = html2canvas(elem).then((canvas) => {
  568. contents.push(canvas);
  569. });
  570. tasks.push(task);
  571. }
  572. // 等待全部page转化完成
  573. await Promise.all(tasks);
  574. return contents;
  575. },
  576.  
  577. /**
  578. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  579. * @param {Array} elem_list html元素列表
  580. * @param {String} title 文档标题
  581. */
  582. html2PDF: async function(elem_list, title = "文档") {
  583. // 如果是空元素列表,终止函数
  584. let _contents = this.html2Canvases(elem_list);
  585. if (_contents === null) {
  586. return;
  587. }
  588. _contents.then((contents) => {
  589. // 控制台检查结果
  590. console.log("生成的canvas元素如下:");
  591. console.log(contents);
  592.  
  593. // 拿到canvas宽、高
  594. let model = elem_list[0];
  595. let width, height;
  596. width = model.offsetWidth;
  597. height = model.offsetHeight;
  598. // 打包为pdf
  599. this.saveCanvasesToPDF(contents, title, width, height);
  600. });
  601. },
  602.  
  603. /**
  604. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  605. * @param {string} selector 图形元素的父级元素
  606. */
  607. savePicUrls: function(selector) {
  608. let pages = document.querySelectorAll(selector);
  609. let pic_urls = [];
  610.  
  611. for (let elem of pages) {
  612. let pic_obj = elem.children[0];
  613. let url = pic_obj.src;
  614. pic_urls.push(url);
  615. }
  616. let content = pic_urls.join("\n");
  617. // 启动下载
  618. this.createAndDownloadFile("urls.csv", content);
  619. },
  620.  
  621. /**
  622. * 存储所有canvas图形为png到一个压缩包
  623. * @param {Array} node_list canvas元素列表
  624. * @param {String} title 文档标题
  625. */
  626. saveCanvasesToZip: function(node_list, title) {
  627. // canvas元素转为png图像
  628. // 所有png合并为一个zip压缩包
  629. let zip = new JSZip();
  630. let n = node_list.length;
  631.  
  632. for (let i = 0; i < n; i++) {
  633. let canvas = node_list[i];
  634. let data_base64 = canvas.toDataURL();
  635. let blob = atob(data_base64.split(",")[1]);
  636. zip.file(`page-${i + 1}.png`, blob, { binary: true });
  637. }
  638.  
  639. // 导出zip
  640. // promise.then(onCompleted, onRejected);
  641. zip.generateAsync({ type: "blob" }).then(function(content) {
  642. // see filesaver.js
  643. console.log(content);
  644. saveAs(content, `${title}.zip`);
  645. });
  646. },
  647.  
  648. /**
  649. * 将canvas转为jpeg,然后导出PDF
  650. * @param {Array} node_list canvas元素列表
  651. * @param {string} title 文档标题
  652. */
  653. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  654. // 如果没有手动指定canvas的长宽,则自动检测
  655. if (!width && !height) {
  656. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  657. let first_canvas = node_list[0];
  658.  
  659. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  660. [width, height] = [first_canvas.width, first_canvas.height];
  661. } else {
  662. let [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  663. [width, height] = [parseInt(width_str), parseInt(height_str)];
  664. }
  665. }
  666.  
  667. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  668. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  669. let orientation = width > height ? 'l' : 'p';
  670. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  671. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  672.  
  673. // 保存每一页文档到每一页pdf
  674. let last_canvas = node_list.pop();
  675. node_list.forEach(canvas => {
  676. pdf.addImage(canvas, 'png', 0, 0, width, height);
  677. pdf.addPage();
  678. });
  679. // 添加尾页
  680. pdf.addImage(last_canvas, 'png', 0, 0, width, height);
  681. // 导出文件
  682. pdf.save(`${title}.pdf`);
  683.  
  684. // node_list.forEach(function(canvas, index) {
  685. // pdf.addImage(canvas.toDataURL("image/jpeg", 1), 'JPEG', 0, 0, width, height);
  686. // // 如果当前不是文档最后一页,则需要添加下一个空白页
  687. // if (index !== node_list.length - 1) {
  688. // pdf.addPage();
  689. // }
  690. // });
  691. },
  692.  
  693. /**
  694. * Image元素列表合并到一个PDF中
  695. * @param {NodeList} imgs Image元素列表
  696. * @param {String} title 文档名
  697. */
  698. imgs2pdf: function(imgs, title) {
  699. // 取得宽高
  700. let model = imgs[0];
  701. let width = model.offsetWidth;
  702. let height = model.offsetHeight;
  703.  
  704. // 创建pdf
  705. let orientation = width > height ? 'l' : 'p';
  706. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  707.  
  708. // 添加图像到pdf
  709. imgs.forEach((img, index) => {
  710. pdf.addImage(img, 'PNG', 0, 0, width, height);
  711. // 如果当前不是文档最后一页,则需要添加下一个空白页
  712. if (index !== imgs.length - 1) {
  713. pdf.addPage();
  714. }
  715. });
  716.  
  717. // 导出文件
  718. pdf.save(`${title}.pdf`);
  719. },
  720.  
  721. /**
  722. * 取得elem的class为class_name的父级元素
  723. * @param {String} class_name
  724. * @param {Element} elem 起点元素
  725. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  726. * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  727. * @returns {null | Element} parent_element
  728. */
  729. getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
  730. let parent = elem.parentElement;
  731. let iterator_count = JSobj.iterator_count;
  732. let now_name;
  733.  
  734. try {
  735. now_name = parent.className;
  736. } catch (e) {
  737. JSobj.iterator_count = 0;
  738. // 没有父级元素了
  739. return "no parent node";
  740. }
  741.  
  742. // 如果不忽略递归次数计数器
  743. if (!ignore) {
  744. if (iterator_count > 9) {
  745. // 超过最大迭代次数,认为不存在,返回null
  746. JSobj.iterator_count = 0;
  747. return "over max iterator counts limit";
  748. } else {
  749. JSobj.iterator_count += 1;
  750. }
  751. }
  752. // 如果类名匹配,返回该节点
  753. if (now_name.split(" ").includes(class_name)) {
  754. iterator_count = 0;
  755. return parent;
  756. }
  757. return this.getParentByClassName(class_name, parent, JSobj);
  758. },
  759.  
  760. /**
  761. * 将func绑定到window.onscroll,并设置触发频率
  762. * @param {Function} func scroll的监听函数
  763. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  764. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  765. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  766. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  767. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  768. */
  769. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  770. if (JSobj.scroll_count === undefined) {
  771. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  772. return;
  773. }
  774.  
  775. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  776. JSobj.scroll_count += 1;
  777. if (JSobj.scroll_count < useful_range) {
  778. func();
  779. console.log(hint);
  780. } else if (JSobj.scroll_count > wait_range) {
  781. JSobj.scroll_count = 0;
  782. }
  783. };
  784. // 如果没有指定的window对象,则使用默认的window
  785. if (!inner_window) {
  786. window.onscroll = () => {
  787. new_func(func, JSobj, useful_range, wait_range, hint);
  788. };
  789. return;
  790. }
  791. // 特定的window对象,一般用于iframe,追加scroll监听器
  792. let scrollFunc = () => {
  793. new_func(func, JSobj, useful_range, wait_range, hint);
  794. };
  795. JSobj.scrollFunc = scrollFunc;
  796. inner_window.addEventListener("scroll", scrollFunc, false);
  797. },
  798.  
  799. /**
  800. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  801. */
  802. createBtns: function() {
  803. // 创建大容器
  804. let box = document.createElement("div");
  805. box.className = "wk-box";
  806. document.body.appendChild(box);
  807.  
  808. // 创建按钮组
  809. let section = document.createElement("section");
  810. section.className = "btns_section";
  811. section.innerHTML = `
  812. <p class="logo_tit">Wenku Doc Downloader</p>
  813. <button class="btn-1">展开文档 😈</button>
  814. <button class="btn-2">未设定2</button>
  815. <button class="btn-3">未设定3</button>
  816. <button class="btn-4">未设定4</button>
  817. <button class="btn-5">未设定5</button>
  818. `;
  819. box.appendChild(section);
  820.  
  821. // 添加隐藏/展示按钮
  822. // 隐藏【🙈】,展开【🐵】
  823. let hide_btn = document.createElement("p");
  824. hide_btn.className = "hide_btn_wk";
  825. hide_btn.textContent = "🐵";
  826. hide_btn.onclick = () => {
  827. // 显示 -> 隐藏
  828. if (getComputedStyle(section).display === "block") {
  829. section.style.display = "none";
  830. hide_btn.style.left = "20px";
  831. hide_btn.textContent = "🙈";
  832. // 隐藏 -> 显示
  833. } else {
  834. section.style.display = "block";
  835. hide_btn.style.left = "155px";
  836. hide_btn.textContent = "🐵";
  837. }
  838. };
  839. box.appendChild(hide_btn);
  840.  
  841. // 设定样式
  842. let style = document.createElement("style");
  843. style.innerHTML = `
  844. .hide_btn_wk {
  845. position: fixed;
  846. left: 155px;
  847. top: 36%;
  848. user-select: none;
  849. font-size: large;
  850. z-index: 5001;
  851. }
  852. .btns_section{
  853. position: fixed;
  854. width: 154px;
  855. left: 10px;
  856. top: 32%;
  857. background: #E7F1FF;
  858. border: 2px solid #1676FF;
  859. padding: 0px 0px 10px 0px;
  860. font-weight: 600;
  861. border-radius: 2px;
  862. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  863. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  864. 'Segoe UI Emoji', 'Segoe UI Symbol';
  865. z-index: 5000;
  866. }
  867. .logo_tit{
  868. width: 100%;
  869. background: #1676FF;
  870. text-align: center;
  871. font-size:12px ;
  872. color: #E7F1FF;
  873. line-height: 40px;
  874. height: 40px;
  875. margin: 0 0 16px 0;
  876. }
  877.  
  878. .btn-1{
  879. display: block;
  880. width: 128px;
  881. height: 28px;
  882. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  883. border-radius: 4px;
  884. color: #fff;
  885. font-size: 12px;
  886. border: none;
  887. outline: none;
  888. margin: 8px auto;
  889. font-weight: bold;
  890. cursor: pointer;
  891. opacity: .9;
  892. }
  893. .btn-2{
  894. display: none;
  895. width: 128px;
  896. height: 28px;
  897. background: #07C160;
  898. border-radius: 4px;
  899. color: #fff;
  900. font-size: 12px;
  901. border: none;
  902. outline: none;
  903. margin: 8px auto;
  904. font-weight: bold;
  905. cursor: pointer;
  906. opacity: .9;
  907. }
  908. .btn-3{
  909. display: none;
  910. width: 128px;
  911. height: 28px;
  912. background:#FA5151;
  913. border-radius: 4px;
  914. color: #fff;
  915. font-size: 12px;
  916. border: none;
  917. outline: none;
  918. margin: 8px auto;
  919. font-weight: bold;
  920. cursor: pointer;
  921. opacity: .9;
  922. }
  923. .btn-4{
  924. display: none;
  925. width: 128px;
  926. height: 28px;
  927. background: #1676FF;
  928. border-radius: 4px;
  929. color: #fff;
  930. font-size: 12px;
  931. border: none;
  932. outline: none;
  933. margin: 8px auto;
  934. font-weight: bold;
  935. cursor: pointer;
  936. opacity: .9;
  937. }
  938. .btn-5{
  939. display: none;
  940. width: 128px;
  941. height: 28px;
  942. background: #ff6600;
  943. border-radius: 4px;
  944. color: #fff;
  945. font-size: 12px;
  946. border: none;
  947. outline: none;
  948. margin: 8px auto;
  949. font-weight: bold;
  950. cursor: pointer;
  951. opacity: .9;
  952. }
  953. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  954. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  955. document.head.appendChild(style);
  956.  
  957. // 根据配置选择:是否默认显示
  958. if (!globalThis._wk_on) {
  959. hide_btn.click();
  960. }
  961. }
  962. };
  963.  
  964. /**
  965. * 清理百度文库页面的无关元素
  966. */
  967. function clearPage_Baidu() {
  968. let selectors = [
  969. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  970. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  971. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  972. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  973. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  974. ".hx-recom-wrapper, .reader-topbar, #page-footer, .copyright-wrap",
  975. ".bg-theme-wap"
  976. ];
  977. let elem_list = document.querySelectorAll(selectors.join(", "));
  978. for (let elem of elem_list) {
  979. utils.tryToRemoveElement(elem);
  980. }
  981. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  982. utils.forceHide(nut_selector);
  983.  
  984. // 页边距调整
  985. // 顶部距离改为0
  986. let rc = document.querySelector("#reader-container");
  987. rc.style.paddingTop = "0";
  988. let cw = document.querySelector(".content-wrapper");
  989. cw.style.paddingTop = "0";
  990. // 底部距离改为0
  991. let foot = document.querySelector(".try-end-fold-page");
  992. foot.style.paddingBottom = "0";
  993. foot.style.height = "0";
  994. }
  995.  
  996.  
  997. /**
  998. * 调整页间距为 width px
  999. */
  1000. function adjustPageGap() {
  1001. let old_gap = window.baiduJS.page_gap;
  1002. let hints = [
  1003. `旧的页间距为 ${old_gap} px`,
  1004. "请输入新的页间距(0-500的整数):\n"
  1005. ];
  1006. let new_gap = prompt(hints.join("\n"));
  1007. new_gap = parseInt(new_gap);
  1008.  
  1009. // 创建空白段落节点充当间隔
  1010. let div = document.createElement("div");
  1011. // 取得实心填充物
  1012. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  1013. block.style.height = `${new_gap}px`;
  1014. // 创建间隔
  1015. div.style.background = "rgb(255, 255, 255)"; // 页间距设置为白色
  1016. div.appendChild(block);
  1017. div.className = "page-gap";
  1018.  
  1019. // 调整页间距
  1020. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  1021. let next_elem = elem.nextElementSibling;
  1022.  
  1023. if (next_elem === null) {
  1024. return; // 最后一个节点后面无需间隔
  1025. }
  1026.  
  1027. let cls = next_elem.className;
  1028. if (cls === "page-gap") {
  1029. next_elem.style.height = `${new_gap}px`;
  1030. } else {
  1031. utils.insertAfter(div.cloneNode(true), elem);
  1032. }
  1033. });
  1034. window.baiduJS.page_gap = new_gap;
  1035. console.log(`页间距已经调整为:${new_gap} px`);
  1036. }
  1037.  
  1038.  
  1039. /**
  1040. * 判断是否所有可预览页面都冻结了
  1041. * @returns {Boolean}
  1042. */
  1043. function areAllFrozen() {
  1044. let frozen = 0;
  1045. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1046. if (canvas.getAttribute("width") !== "0") {
  1047. frozen += 1;
  1048. }
  1049. });
  1050. if (frozen < window.free_page) {
  1051. return false;
  1052. }
  1053. return true;
  1054. }
  1055.  
  1056.  
  1057. /**
  1058. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  1059. */
  1060. function freezeDocView() {
  1061. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1062. if (canvas.getAttribute("width") !== "0") {
  1063. canvas.id = "";
  1064. }
  1065. });
  1066.  
  1067. if (areAllFrozen()) {
  1068. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  1069. console.log("wk: 文档页: 全部冻结完毕");
  1070. window.baiduJS.finished = true;
  1071. window.onscroll = () => { };
  1072. }
  1073. }
  1074.  
  1075.  
  1076. /**
  1077. * 优化阅读体验的零碎任务
  1078. */
  1079. function better() {
  1080. /**
  1081. * 内部主函数,便于捕获异常
  1082. * 代码改自 https://greasyfork.org/zh-CN/scripts/438420
  1083. */
  1084. let _better = function() {
  1085. let pageData = window.pageData;
  1086. // 改为本地 VIP
  1087. pageData.vipInfo.global_svip_status = 1;
  1088. pageData.vipInfo.global_vip_status = 1;
  1089. pageData.vipInfo.isVip = 1;
  1090. pageData.vipInfo.isWenkuVip = 1;
  1091.  
  1092. // 手机版优化
  1093. if (pageData.appUniv) {
  1094. // 取消百度文库对谷歌、搜狗浏览器 referrer 的屏蔽
  1095. pageData.appUniv.blackBrowser = [];
  1096. // 隐藏 APP 下载按钮
  1097. pageData.viewBiz.docInfo.needHideDownload = true;
  1098. }
  1099.  
  1100. // 强制改变背景为中灰色
  1101. document.querySelector("#app")
  1102. .style.backgroundColor = "rgb(95, 99, 104)";
  1103. };
  1104.  
  1105. try {
  1106. console.log("wk: 优化");
  1107. _better();
  1108. } catch (error) {
  1109. console.log("wk: baiduWenku: better: main:");
  1110. console.error(error);
  1111. }
  1112. }
  1113.  
  1114.  
  1115. /**
  1116. * 展开文档
  1117. */
  1118. function readAllOld() {
  1119. better();
  1120. let btn = document.querySelector(".read-all");
  1121. if (!btn) {
  1122. // 显示按钮
  1123. utils.toggleBtnStatus("btn_1");
  1124. utils.toggleBtnStatus("btn_2");
  1125. utils.toggleBtnStatus("btn_3");
  1126. // utils.toggleBtnStatus("btn_4");
  1127. } else {
  1128. btn.click();
  1129. }
  1130. }
  1131.  
  1132.  
  1133. function getTips() {
  1134. let hints = [
  1135. `一共 ${window.all_page} 页, 免费预览 ${window.free_page} 页,`,
  1136. "请优先尝试【导出图片链接】,如果不行再【打印页面到PDF】。",
  1137. "!!由于百度改版,图片链接可能是假的,如若发生请尝试其他办法!!",
  1138. "",
  1139. "如果<免费预览页数>等于<总页数>,",
  1140. "但点击展开文档, 却跳转到vip付费,",
  1141. "请尝试:",
  1142. "1. 清除全部cookies,刷新页面并登录账号",
  1143. "2. 复制以下链接,并在【新标签页】中打开,然后尝试展开文档。",
  1144. "如果还不行就没办法了。",
  1145. "",
  1146. "如果出现空白页,请浏览对应页面使其加载,然后再打印页面。",
  1147. "页数超过20页时,打印预览明显缓慢,请耐心等待,真的只是很慢。",
  1148. "",
  1149. "页面间距通过按钮调整。",
  1150. "页面宽度通过打印时缩放比调整。",
  1151. "推荐缩放比: 114%",
  1152. "",
  1153. "打印时设置:",
  1154. "更多设置 -> 缩放 -> 自定义",
  1155. "选项 -> ☑ 背景图形",
  1156. ];
  1157. let url_no_params = window.location.href.replace(/[?].*/, "");
  1158. prompt(hints.join("\n"), url_no_params);
  1159. alert(
  1160. [
  1161. "只能导出可以【免费预览】的页面。",
  1162. "脚本的能力是有限的,烦请谅解。",
  1163. "",
  1164. "百度文库会记住你打开文档的操作路径,如:",
  1165. "百度搜索 -> 文档,或 文库搜索 -> 百度文档,",
  1166. "百度会让通过特定路径打开免费文档的人必须付费,",
  1167. "所以解决办法是复制刚才弹窗中的链接,",
  1168. "新建标签页,粘贴链接,然后回车打开,这样的操作是零路径。",
  1169. "",
  1170. "此外,发现此脚本与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  1171. "应该是此脚本删去文档页id所导致的,",
  1172. "暂无解决方案, 如需复制文字请禁用此脚本。"
  1173. ].join("\n")
  1174. );
  1175. }
  1176.  
  1177.  
  1178. /**
  1179. * 清理页面,然后打印页面
  1180. */
  1181. function clearThenPrint() {
  1182. // 清理页面
  1183. clearPage_Baidu();
  1184. // 调整文档内容的定位
  1185. let content = document.querySelector(".left-wrapper");
  1186. content.style.marginLeft = "0";
  1187. // 打印页面
  1188. utils.hideBtnThenPrint();
  1189. }
  1190.  
  1191.  
  1192. /**
  1193. * 取得pageData接口中的urls并下载
  1194. * @returns {Boolean} 是否成功下载(是否存在图片元素)
  1195. */
  1196. function downloadPicUrls() {
  1197. let warn = () => {
  1198. let hints = [
  1199. "当前文档非ppt或pdf, 无法使用该功能。",
  1200. "请在展开文档后使用【打印页面到PDF】"
  1201. ];
  1202. alert(hints.join("\n"));
  1203. };
  1204.  
  1205. let html_urls = window.pageData.readerInfo.htmlUrls;
  1206. if (!html_urls) {
  1207. warn();
  1208. return false;
  1209. }
  1210.  
  1211. // pdf
  1212. if (html_urls.png && html_urls.png.length > 0) {
  1213. let urls = [];
  1214. let pngs = html_urls.png;
  1215. pngs.forEach((png) => {
  1216. urls.push(png.pageLoadUrl);
  1217. });
  1218. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  1219. return true;
  1220. }
  1221. // 非图形
  1222. if (html_urls.length === undefined) {
  1223. warn();
  1224. return false;
  1225. }
  1226. // ppt
  1227. utils.createAndDownloadFile("urls.csv", html_urls.join("\n"));
  1228. return true;
  1229. }
  1230.  
  1231.  
  1232. /**
  1233. * 百度文档下载策略
  1234. */
  1235. function baiduWenkuOld() {
  1236. // 允许打印页面
  1237. utils.allowPrint();
  1238. better();
  1239.  
  1240. // 绑定监听器给滚动。在滚动时冻结文档页面
  1241. let log = "wk: 文档页: 冻结";
  1242. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  1243.  
  1244. // 创建按钮
  1245. utils.createBtns();
  1246. // 按钮1: 展开预览
  1247. utils.setBtnEvent(readAllOld, [], "btn_1");
  1248. // 按钮2: 清理页面元素,打印页面
  1249. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  1250. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  1251. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  1252. // 按钮4: 导出图片链接(如果文档是ppt或pdf)
  1253. utils.setBtnEvent(downloadPicUrls, [], "btn_4", "导出图片链接");
  1254. utils.toggleBtnStatus("btn_4");
  1255. // 按钮5: 提示说明
  1256. utils.setBtnEvent(getTips, [], "btn_5", "有问题点我");
  1257. utils.toggleBtnStatus("btn_5");
  1258. }
  1259.  
  1260.  
  1261. /**
  1262. * 居中百度文库文档
  1263. */
  1264. function centerDoc() {
  1265. // 居中文档
  1266. $(".content-wrapper")[0].style = `
  1267. display: flex;
  1268. flex-direction: row;
  1269. justify-content: space-around;
  1270. `.replace(/\s/g, "");
  1271.  
  1272. $(".left-wrapper")[0].style = "margin: 0;";
  1273.  
  1274. let academic = $(".doc-info-wrapper")[0];
  1275. if (academic) {academic.style = "display: none;";}}
  1276.  
  1277.  
  1278. function readAll$1() {
  1279. let vip_read = $(".page-text")[0];
  1280. if (!vip_read) {return;}
  1281.  
  1282. let read_all = $(".read-all")[0];
  1283. // read_all.style = "color: red; font-weight: bold;";
  1284. read_all.textContent += "*";
  1285. read_all.parentElement.onclick = () => {
  1286. location.href = location.origin + location.pathname;
  1287. };
  1288. }
  1289.  
  1290.  
  1291. function baiduWenku() {
  1292. // 取得页码,创建全局对象
  1293. window.free_page = window.pageData.readerInfo.freePage;
  1294. window.all_page = window.pageData.readerInfo.page;
  1295. window.baiduJS = {
  1296. finished: false, // 文档页是否全部冻结
  1297. free_page: window.free_page, // 免费页数
  1298. all_page: window.all_page, // 全部页数
  1299. scroll_count: 0, // 滚动事件触发次数
  1300. page_gap: 0, // 页间距
  1301. oldTech: baiduWenkuOld // 旧版主函数入口
  1302. };
  1303.  
  1304. // 便捷选择器
  1305. window.$ = (s) => {
  1306. return document.querySelectorAll(s);
  1307. };
  1308. // 允许打印页面
  1309. utils.allowPrint();
  1310. better();
  1311.  
  1312. // 居中文档
  1313. centerDoc();
  1314.  
  1315. // 增加预览功能
  1316. setTimeout(readAll$1, 500);
  1317. }
  1318.  
  1319. /**
  1320. * 多元素选择器
  1321. * @param {string} s
  1322. * @returns {NodeListOf<Element>} elements
  1323. */
  1324. let $$1 = (s) => {
  1325. return document.querySelectorAll(s);
  1326. };
  1327.  
  1328.  
  1329. // 全局对象
  1330. globalThis.doc88JS = {
  1331. last_copy_time: 0 // 上一次 ctrl + c 的时间戳(毫秒)
  1332. };
  1333.  
  1334.  
  1335. /**
  1336. * 展开道客巴巴的文档
  1337. */
  1338. function readAllDoc88() {
  1339. // 获取“继续阅读”按钮
  1340. let continue_btn = document.querySelector("#continueButton");
  1341. // 如果存在“继续阅读”按钮
  1342. if (continue_btn) {
  1343. // 跳转到文末(等同于展开全文)
  1344. let cur_page = document.querySelector("#pageNumInput");
  1345. // 取得最大页码
  1346. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1347. // 跳转到尾页
  1348. utils.jump2pageNo(cur_page, page_max, "keypress");
  1349. // 返回顶部
  1350. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1351. }
  1352. // 文档展开后,显示按钮2、3
  1353. else {
  1354. // 隐藏按钮
  1355. utils.toggleBtnStatus("btn_1");
  1356. // 显示按钮
  1357. utils.toggleBtnStatus("btn_2");
  1358. utils.toggleBtnStatus("btn_3");
  1359. utils.toggleBtnStatus("btn_4");
  1360. }
  1361. }
  1362.  
  1363.  
  1364. /**
  1365. * 隐藏搜索框
  1366. */
  1367. async function hideSearchBox() {
  1368. let s = "#min-search-result";
  1369. let hide = (elem) => {
  1370. elem.style.display = "none";
  1371. };
  1372. utils.manipulateElem(s, hide);
  1373. }
  1374.  
  1375.  
  1376. /**
  1377. * 移除vip复制弹窗
  1378. */
  1379. async function removeCopyPopup() {
  1380. let s = "#ym-window";
  1381. let remove = (elem) => {
  1382. let popup = elem.parentElement;
  1383. utils.tryToRemoveElement(popup);
  1384. };
  1385. utils.manipulateElem(s, remove);
  1386. }
  1387.  
  1388.  
  1389. /**
  1390. * 隐藏选择文字的弹窗
  1391. */
  1392. async function hideSelectPopup() {
  1393. let s = "#left-menu";
  1394. let hide = (elem) => {
  1395. elem.style.zIndex = -1;
  1396. };
  1397. utils.manipulateElem(s, hide);
  1398. }
  1399.  
  1400.  
  1401. /**
  1402. * 只会执行一次的初始化任务
  1403. */
  1404. async function lazyService() {
  1405. // 只允许执行一次
  1406. let counter = Symbol.for("counter");
  1407. if (globalThis[counter]) {
  1408. return;
  1409. }
  1410. globalThis[counter] = true;
  1411.  
  1412. // 初始化
  1413. console.log("正在执行初始化任务");
  1414. // 1. 隐藏选中文字的提示框
  1415. hideSelectPopup();
  1416. // 2. 隐藏搜索框
  1417. hideSearchBox();
  1418. // 3. 移除vip复制弹窗
  1419. removeCopyPopup();
  1420. }
  1421.  
  1422.  
  1423. /**
  1424. * 使用过时的execCommand复制文字
  1425. * @param {string} text
  1426. */
  1427. function textToClipBoardOldTech(text) {
  1428. let input = document.createElement("input");
  1429. input.value = text;
  1430. document.body.appendChild(input);
  1431. input.select();
  1432. document.execCommand("copy");
  1433. input.remove();
  1434. }
  1435.  
  1436.  
  1437. /**
  1438. * 复制选中的文字
  1439. * @returns
  1440. */
  1441. function copySelected() {
  1442. // 执行一次初始化任务
  1443. lazyService();
  1444.  
  1445. // 尚未选中文字
  1446. if (getComputedStyle($$1("#left-menu")[0]).display === "none") {
  1447. console.log("尚未选中文字");
  1448. return;
  1449. }
  1450. // 选中文字
  1451. // 搜索文字,弹出搜索框
  1452. let search = $$1("#lmenu_search")[0];
  1453. search.click();
  1454. // 取得input内容
  1455. let input = $$1(".min-text input")[0];
  1456. let text = input.value;
  1457. // 输出到控制台和剪贴板
  1458. console.log(text);
  1459. if (!navigator.clipboard) {
  1460. textToClipBoardOldTech(text);
  1461. return;
  1462. } navigator.clipboard.writeText(text).catch(textToClipBoardOldTech);
  1463. // 清空input
  1464. input.value = "";
  1465. }
  1466.  
  1467.  
  1468. /**
  1469. * 捕获 ctrl + c 并关闭弹窗
  1470. * @param {KeyboardEvent} keydown
  1471. * @returns
  1472. */
  1473. function catchCtrlC(keydown) {
  1474. // 判断是否为 ctrl + c
  1475. if (!(keydown.code === "KeyC" && keydown.ctrlKey === true)) {
  1476. return;
  1477. }
  1478.  
  1479. // 判断触发间隔
  1480. let now = Date.now();
  1481.  
  1482. // 距离上次小于1秒
  1483. if (now - doc88JS.last_copy_time < 1000 * 1) {
  1484. doc88JS.last_copy_time = now;
  1485. return;
  1486. }
  1487.  
  1488. // 大于1秒
  1489. // 刷新最近一次触发时间
  1490. doc88JS.last_copy_time = now;
  1491. // 复制文字
  1492. copySelected();
  1493. }
  1494.  
  1495.  
  1496. /**
  1497. * 道客巴巴文档下载策略
  1498. */
  1499. async function doc88() {
  1500. // 创建脚本启动按钮1、2
  1501. utils.createBtns();
  1502.  
  1503. // 绑定主函数
  1504. let prepare = function() {
  1505. // 获取canvas元素列表
  1506. let node_list = document.querySelectorAll(".inner_page");
  1507. // 获取文档标题
  1508. let title;
  1509. if (document.querySelector(".doctopic h1")) {
  1510. title = document.querySelector(".doctopic h1").title;
  1511. } else {
  1512. title = "文档";
  1513. }
  1514. return [node_list, title];
  1515. };
  1516.  
  1517. // btn_1: 展开文档
  1518. utils.setBtnEvent(() => {
  1519. readAllDoc88();
  1520. }, [], "btn_1");
  1521.  
  1522. // btn_2: 导出zip
  1523. utils.setBtnEvent(() => {
  1524. if (confirm("确定每页内容都加载完成了吗?")) {
  1525. utils.saveCanvasesToZip(...prepare());
  1526. }
  1527. }, [], "btn_2", "导出图片到zip");
  1528. // btn_3: 导出PDF
  1529. utils.setBtnEvent(() => {
  1530. if (confirm("确定每页内容都加载完成了吗?")) {
  1531. utils.saveCanvasesToPDF(...prepare());
  1532. }
  1533. }, [], "btn_3", "导出图片到PDF");
  1534.  
  1535. // btn_4: 复制选中文字
  1536. utils.setBtnEvent(() => {
  1537. copySelected();
  1538. utils.modifyBtnText("btn_4", "复制成功!", false, false);
  1539. }, [], "btn_4", "复制选中文字");
  1540. // 为 ctrl + c 添加响应
  1541. document.addEventListener("keydown", catchCtrlC);
  1542. }
  1543.  
  1544. // 绑定主函数
  1545. function getCanvasList() {
  1546. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1547. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1548. let node_list = [];
  1549. for (let node of parent_node_list) {
  1550. node_list.push(node.children[0]);
  1551. }
  1552. return node_list;
  1553. }
  1554.  
  1555.  
  1556. function prepare() {
  1557. // 获取canvas元素列表
  1558. let node_list = getCanvasList();
  1559. // 获取文档标题
  1560. let title;
  1561. if (document.querySelector("h1 [title=doc]")) {
  1562. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1563. } else if (document.querySelector(".doc_title")) {
  1564. title = document.querySelector(".doc_title").textContent;
  1565. } else {
  1566. title = "文档";
  1567. }
  1568. return [node_list, title];
  1569. }
  1570.  
  1571.  
  1572. // 判断是否有canvas元素
  1573. function detectCanvas() {
  1574. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1575.  
  1576. // 隐藏按钮
  1577. utils.toggleBtnStatus("btn_1");
  1578. // 显示按钮
  1579. utils.toggleBtnStatus("btn_2");
  1580.  
  1581. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1582. if (!haveCanvas) {
  1583. // btn_2: 导出图片链接
  1584. utils.setBtnEvent(() => {
  1585. if (confirm("确定每页内容都加载完成了吗?")) {
  1586. utils.savePicUrls("[id*=img_]");
  1587. }
  1588. }, [], "btn_2", "导出全部图片链接");
  1589. } else {
  1590. // 显示按钮3
  1591. utils.toggleBtnStatus("btn_3");
  1592. // btn_2: 导出zip
  1593. utils.setBtnEvent(() => {
  1594. if (confirm("确定每页内容都加载完成了吗?")) {
  1595. utils.saveCanvasesToZip(...prepare());
  1596. }
  1597. }, [], "btn_2", "导出图片到zip");
  1598. // btn_3: 导出PDF
  1599. utils.setBtnEvent(() => {
  1600. if (confirm("确定每页内容都加载完成了吗?")) {
  1601. utils.saveCanvasesToPDF(...prepare());
  1602. }
  1603. }, [], "btn_3", "导出图片到PDF");
  1604. }
  1605. }
  1606.  
  1607.  
  1608. /**
  1609. * 豆丁文档下载策略
  1610. */
  1611. function docin() {
  1612. // 创建脚本启动按钮
  1613. utils.createBtns();
  1614.  
  1615. // 隐藏底部工具栏
  1616. document.querySelector("#j_select").click(); // 选择指针
  1617. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1618. tool_bar.style.display = "none";
  1619.  
  1620. // btn_1: 判断文档类型
  1621. utils.setBtnEvent(() => {
  1622. utils.forceHide(".jz_watermark");
  1623. detectCanvas();
  1624. }, [], "btn_1", "判断文档类型");
  1625. }
  1626.  
  1627. /**
  1628. * 爱问共享资料文档下载策略
  1629. */
  1630. function ishare() {
  1631. // 创建按钮区
  1632. utils.createBtns();
  1633.  
  1634. // btn_1: 识别文档类型 -> 导出PDF
  1635. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1636. // btn_2: 不支持爱问办公
  1637. utils.setBtnEvent(() => null, [], "btn_2", "不支持爱问办公");
  1638. utils.toggleBtnStatus("btn_4");
  1639. }
  1640.  
  1641. /**
  1642. * 清理并打印得力文库的文档页
  1643. */
  1644. function printPageDeliwenku() {
  1645. // 移除页面上的无关元素
  1646. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1647. let elem_list = document.querySelectorAll(selector);
  1648. for (let elem of elem_list) {
  1649. utils.tryToRemoveElement(elem);
  1650. }
  1651. // 修改页间距
  1652. let outer_pages = document.getElementsByClassName("outer_page");
  1653. for (let page of outer_pages) {
  1654. page.style.marginBottom = "20px";
  1655. }
  1656. // 使文档居中
  1657. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1658. if (!utils.centerDoc("#boxleft", "3")) {
  1659. return; // 如果输入非法,终止函数调用
  1660. }
  1661. // 打印文档
  1662. utils.hideBtnThenPrint();
  1663. }
  1664.  
  1665.  
  1666. /**
  1667. * 点击“继续阅读”,适用性:得力文库
  1668. */
  1669. function readAllDeliwenku() {
  1670. // 点击“同意并开始预览全文”
  1671. let start_btn = document.getElementsByClassName("pre_button")[0];
  1672. let display = start_btn.parentElement.parentElement.style.display;
  1673. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1674. if (!display) {
  1675. start_btn.children[0].click();
  1676. setTimeout(() => {
  1677. scroll(0, document.body.scrollHeight);
  1678. }, 200);
  1679. return;
  1680. }
  1681. // 增强按钮点击效果
  1682. utils.enhanceBtnClickReaction();
  1683.  
  1684. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1685. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1686. // 继续阅读
  1687. if (display2 !== "none") {
  1688. // 获取input元素
  1689. let cur_page = document.querySelector("#pageNumInput");
  1690. let page_old = cur_page.value;
  1691. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1692. // 跳转到尾页
  1693. utils.jump2pageNo(cur_page, page_max, "keydown");
  1694. // 跳转回来
  1695. utils.jump2pageNo(cur_page, page_old, "keydown");
  1696.  
  1697. // 切换按钮准备导出
  1698. } else {
  1699. // 推荐导出图片链接
  1700. utils.modifyBtnText("btn_2", null, true);
  1701. // 隐藏按钮
  1702. utils.toggleBtnStatus("btn_1");
  1703. // 显示按钮
  1704. utils.toggleBtnStatus("btn_2");
  1705. utils.toggleBtnStatus("btn_3");
  1706. // btn_3 橙色按钮
  1707. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1708. }
  1709. }
  1710.  
  1711.  
  1712. /**
  1713. * 得力文库文档下载策略
  1714. */
  1715. function deliwenku() {
  1716. // 创建脚本启动按钮1、2
  1717. utils.createBtns();
  1718.  
  1719. // btn_1: 展开文档
  1720. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1721. // btn_2: 导出图片链接
  1722. utils.setBtnEvent(() => {
  1723. if (confirm("确定每页内容都加载完成了吗?")) {
  1724. utils.savePicUrls('.inner_page div');
  1725. }
  1726. }, [], "btn_2", "导出图片链接");
  1727.  
  1728. // 尝试关闭页面弹窗
  1729. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1730. // 解除打印限制
  1731. utils.allowPrint();
  1732. }
  1733.  
  1734. function readAll360Doc() {
  1735. // 展开文档
  1736. document.querySelector(".article_showall a").click();
  1737. // 隐藏按钮
  1738. utils.toggleBtnStatus("btn_1");
  1739. // 显示按钮
  1740. utils.toggleBtnStatus("btn_2");
  1741. utils.toggleBtnStatus("btn_3");
  1742. }
  1743.  
  1744.  
  1745. function saveText_360Doc() {
  1746. // 捕获图片链接
  1747. let images = document.querySelectorAll("#artContent img");
  1748. let content = [];
  1749.  
  1750. for (let i = 0; i < images.length; i++) {
  1751. let src = images[i].src;
  1752. content.push(`图${i+1},链接:${src}`);
  1753. }
  1754. // 捕获文本
  1755. let text = document.querySelector("#artContent").textContent;
  1756. content.push(text);
  1757.  
  1758. // 保存纯文本文档
  1759. let title = document.querySelector("#titiletext").textContent;
  1760. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1761. }
  1762.  
  1763.  
  1764. function printPage360Doc() {
  1765. // # 清理并打印360doc的文档页
  1766. // ## 移除页面上无关的元素
  1767. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1768. let elem_list = document.querySelectorAll(selector);
  1769. let under_doc_1, under_doc_2;
  1770. try {
  1771. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1772. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1773. } catch (e) { console.log(); }
  1774. // 执行移除
  1775. for (let elem of elem_list) {
  1776. utils.tryToRemoveElement(elem);
  1777. }
  1778. utils.tryToRemoveElement(under_doc_1);
  1779. utils.tryToRemoveElement(under_doc_2);
  1780. // 执行隐藏
  1781. document.querySelector("a[title]").style.display = "none";
  1782.  
  1783. // 使文档居中
  1784. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1785. if (!utils.centerDoc(".a_left", "20")) {
  1786. return; // 如果输入非法,终止函数调用
  1787. }
  1788. // 隐藏按钮,然后打印页面
  1789. utils.hideBtnThenPrint();
  1790. }
  1791.  
  1792.  
  1793. /**
  1794. * 360doc个人图书馆下载策略
  1795. */
  1796. function doc360() {
  1797. // 创建按钮区
  1798. utils.createBtns();
  1799. // btn_1: 展开文档
  1800. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1801. // btn_2: 导出纯文本
  1802. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1803. // btn_3: 打印页面到PDF
  1804. utils.setBtnEvent(() => {
  1805. if (confirm("确定每页内容都加载完成了吗?")) {
  1806. printPage360Doc();
  1807. }
  1808. }, [], "btn_3", "打印页面到PDF");
  1809. }
  1810.  
  1811. /**
  1812. * 查找出所有未被捕获的页码,并返回列表
  1813. * @returns 未捕获页码列表
  1814. */
  1815. function getMissedPages() {
  1816. let all = []; // 全部页码
  1817. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1818. all[i] = i + 1;
  1819. }
  1820. let missed = []; // 未捕获页码
  1821. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1822.  
  1823. // 排除并录入未捕获页码
  1824. for (let num of all) {
  1825. if (!possessed.includes(`page${num}`)) {
  1826. missed.push(num);
  1827. }
  1828. }
  1829. return missed;
  1830. }
  1831.  
  1832.  
  1833. /**
  1834. * 根据键中的id数字对map排序
  1835. * @param {Map} elems_map
  1836. * @returns sorted_map
  1837. */
  1838. function sortMapByID(elems_map) {
  1839. // id形式:page2
  1840. let elems_arr = Array.from(elems_map);
  1841. elems_arr.sort((item1, item2) => {
  1842. // 从key中取出id
  1843. let id1 = parseInt(item1[0].replace("page", ""));
  1844. let id2 = parseInt(item2[0].replace("page", ""));
  1845. // 升序排序
  1846. return id1 - id2;
  1847. });
  1848. // 返回排序好的map
  1849. return new Map(elems_arr);
  1850. }
  1851.  
  1852.  
  1853. /**
  1854. * 存储动态加载的canvas元素、textContent
  1855. */
  1856. function storeElements_MBA() {
  1857. let canvases_map = window.mbaJS.canvases_map;
  1858. let texts_map = window.mbaJS.texts_map;
  1859. let quality = window.mbaJS.quality;
  1860.  
  1861. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1862. (elem) => {
  1863. let capture = (elem) => {
  1864. // (1) 存储页面为canvas图形
  1865. let canvas, data_base64;
  1866. // 导出canvas数据防止丢失
  1867. try {
  1868. // 存储canvas
  1869. canvas = elem.querySelector("canvas[id*=page]");
  1870. if (window.mbaJS.only_text) {
  1871. data_base64 = null;
  1872. } else {
  1873. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1874. }
  1875. } catch (e) {
  1876. // utils.sleep(500);
  1877. return;
  1878. }
  1879. // 增量录入map
  1880. let id = canvas.id; // id的形式:page2
  1881. if (!canvases_map.has(id)) {
  1882. canvases_map.set(id, data_base64);
  1883. }
  1884. // 确定canvas长宽
  1885. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1886. window.mbaJS.width = parseInt(canvas.width);
  1887. window.mbaJS.height = parseInt(canvas.height);
  1888. }
  1889.  
  1890. // (2) 存储text
  1891. let text = elem.textContent;
  1892. if (!texts_map.has(id)) {
  1893. texts_map.set(id, text);
  1894. }
  1895. };
  1896. setTimeout(capture, 500, elem);
  1897. });
  1898. if (canvases_map.size === window.mbaJS.max_page) {
  1899. // 根据id排序
  1900. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  1901. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  1902. window.mbaJS.finished = true;
  1903. window.onscroll = null;
  1904. }
  1905. }
  1906.  
  1907.  
  1908. /**
  1909. * 将canvas转为jpeg,然后导出PDF
  1910. * @param {Array} base64_list canvas元素列表
  1911. * @param {String} title 文档标题
  1912. */
  1913. function saveCanvasesToPDF_MBA(base64_list, title) {
  1914. let width = window.mbaJS.width;
  1915. let height = window.mbaJS.height;
  1916.  
  1917. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1918. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1919. let orientation = width > height ? 'l' : 'p';
  1920. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1921.  
  1922. // 保存每一页文档到每一页pdf
  1923. let i = 0;
  1924. for (let base64 of base64_list) {
  1925. i += 1;
  1926. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1927. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1928. if (i < window.mbaJS.max_page) {
  1929. pdf.addPage();
  1930. }
  1931. }
  1932. // 导出文件
  1933. pdf.save(`${title}.pdf`);
  1934. }
  1935.  
  1936. /**
  1937. * 判断文档页是否收集完毕,当不行时给出提示
  1938. * @returns boolean
  1939. */
  1940. function ready2use() {
  1941. removeAds(); // 顺便清理广告
  1942. // 如果是首次点击按钮,给出提示
  1943. if (window.mbaJS.first_hint) {
  1944. let hint = [
  1945. "如果浏览速度过快,比如:",
  1946. "当前页面还没完全加载好就滚动页面去看下一页",
  1947. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1948. "由防范技术的干扰,该功能目前很不好用,见谅"
  1949. ].join("\n");
  1950. alert(hint);
  1951. window.mbaJS.first_hint = false;
  1952. }
  1953. // 如果文档页没有收集完,给出提示
  1954. if (!window.mbaJS.finished) {
  1955. let hint = [
  1956. "仍有内容未加载完,无法使用该功能",
  1957. "建议从头到尾慢速地再浏览一遍",
  1958. "以下是没有加载完成页面的页码:",
  1959. getMissedPages().join(",")
  1960. ];
  1961. alert(hint.join("\n"));
  1962. return false;
  1963. }
  1964. return true;
  1965. }
  1966.  
  1967.  
  1968. /**
  1969. * 用捕获好的canvas转jpg,生成PDF
  1970. * @returns
  1971. */
  1972. function canvas2PDF_mba() {
  1973. if (!ready2use()) {
  1974. return;
  1975. }
  1976. let canvases = window.mbaJS.canvases_map.values();
  1977. // 导出PDF
  1978. let title = document.title.split("-")[0].trim();
  1979. saveCanvasesToPDF_MBA(canvases, title);
  1980. }
  1981.  
  1982.  
  1983. /**
  1984. * 拼合捕获好的文本,保存到txt文件
  1985. * @returns
  1986. */
  1987. function saveText_mba() {
  1988. if (!ready2use()) {
  1989. return;
  1990. }
  1991. let content = Array.from(window.mbaJS.texts_map.values());
  1992. let title = document.title.split("-")[0].trim();
  1993. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1994. }
  1995.  
  1996.  
  1997. /**
  1998. * 移除广告
  1999. */
  2000. function removeAds() {
  2001. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  2002. utils.tryToRemoveElement(ad_elem);
  2003. });
  2004. }
  2005.  
  2006.  
  2007. function mbalib_() {
  2008. // 移除广告和左侧工具栏
  2009. removeAds();
  2010. let tool_bar = document.querySelector(".tool-bar");
  2011. utils.tryToRemoveElement(tool_bar);
  2012.  
  2013. // 创建按钮
  2014. utils.createBtns();
  2015. // 隐藏按钮
  2016. utils.toggleBtnStatus("btn_1");
  2017. // 显示按钮
  2018. utils.toggleBtnStatus("btn_2");
  2019. utils.toggleBtnStatus("btn_3");
  2020. utils.toggleBtnStatus("btn_4");
  2021.  
  2022. // 取得页数
  2023. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  2024. let quality = utils.getQualityByCanvasAmount(max_page);
  2025.  
  2026. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  2027. window.mbaJS = {
  2028. max_page: max_page,
  2029. texts_map: new Map(), // id: text
  2030. canvases_map: new Map(), // id: canvas_data_base64
  2031. quality: quality, // canvas转jpg的质量
  2032. width: null, // canvas宽度(px)
  2033. height: null,
  2034. finished: false, // 是否收集完了全部文档页元素
  2035. first_hint: true,
  2036. scroll_count: 0, // 用于统计累计触发scroll的次数,
  2037. only_text: false // 是否仅捕获文本
  2038. };
  2039. // 跟随浏览,动态收集页面元素
  2040. window.onscroll = () => {
  2041. storeElements_MBA();
  2042. };
  2043. // 跟随浏览,动态收集页面元素
  2044. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2045. // 绑定事件
  2046. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2047. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2048.  
  2049. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2050. let btn_text, aim_btn, hint;
  2051. if (max_page > 40) {
  2052. btn_text = "失效说明";
  2053. aim_btn = "btn_3";
  2054. hint = [
  2055. "页数超过40,脚本无效",
  2056. "只能使用导出文本功能",
  2057. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2058. ];
  2059. utils.setBtnEvent(
  2060. () => {
  2061. utils.toggleBtnsSec();
  2062. window.onscroll = null;
  2063. },
  2064. [],
  2065. "btn_4",
  2066. "临时禁用脚本"
  2067. );
  2068. } else {
  2069. btn_text = "空白页说明";
  2070. aim_btn = "btn_4";
  2071. hint = [
  2072. "导致空白页的原因如下",
  2073. "加载该页的时间超过2秒 / 明显等待",
  2074. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2075. ];
  2076. }
  2077.  
  2078. utils.setBtnEvent(() => {
  2079. alert(hint.join("\n"));
  2080. }, [], aim_btn, btn_text);
  2081. }
  2082.  
  2083.  
  2084. function mbalib() {
  2085. setTimeout(mbalib_, 2000);
  2086. }
  2087.  
  2088. /**
  2089. * 判断是否进入预览模式
  2090. * @returns Boolean
  2091. */
  2092. function isInPreview() {
  2093. let p_elem = document.querySelector("#preview_tips");
  2094. if (p_elem.style.display === "none") {
  2095. return true;
  2096. }
  2097. return false;
  2098. }
  2099.  
  2100.  
  2101. /**
  2102. * 判断是否展开了全文
  2103. * @returns Boolean
  2104. */
  2105. function isNoMorePage() {
  2106. let read_more = document.querySelector("#ntip2");
  2107. if (read_more.style.display === "none") {
  2108. return true;
  2109. }
  2110. return false;
  2111. }
  2112.  
  2113.  
  2114. /**
  2115. * 确保进入预览模式
  2116. */
  2117. function ensureInPreview() {
  2118. if (!isInPreview()) {
  2119. // 如果没有进入预览,则先进入
  2120. document.querySelector(".pre_button a").click();
  2121. utils.sleep(500);
  2122. }
  2123. }
  2124.  
  2125.  
  2126. /**
  2127. * 展开全文预览,当展开完成后再次调用时,返回true
  2128. * @returns
  2129. */
  2130. function unfoldAll() {
  2131. ensureInPreview();
  2132. if (isNoMorePage()) {
  2133. // 如果全文展开了,则切换按钮,然后退出
  2134. utils.toggleBtnStatus("btn_1");
  2135. utils.toggleBtnStatus("btn_2");
  2136. return true;
  2137. }
  2138. // 跳转到最后一页,以展开全文
  2139. let cur_page = document.querySelector("#pageNumInput");
  2140. utils.jump2pageNo(cur_page, "999", "keydown");
  2141. }
  2142.  
  2143.  
  2144. /**
  2145. * 取得最大页码(最大20)
  2146. * @returns {Number} 页码int
  2147. */
  2148. function getPageCounts$1() {
  2149. let counts_str = document.querySelector(".counts").textContent;
  2150. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2151. if (counts > 20) {
  2152. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2153. }
  2154. return parseInt(counts);
  2155. }
  2156.  
  2157.  
  2158. /**
  2159. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2160. * @returns Array | null
  2161. */
  2162. function getImgUrls() {
  2163. let pages = document.querySelectorAll("[id*=pageflash_]");
  2164. // 尚未浏览完全部页面,返回null
  2165. if (pages.length < window.dugenJS.page_counts) {
  2166. return null;
  2167. }
  2168. // 浏览完全部页面,返回urls
  2169. let urls = [];
  2170. pages.forEach((page) => {
  2171. let url = page.querySelector("img").src;
  2172. urls.push(url);
  2173. });
  2174. return urls;
  2175. }
  2176.  
  2177.  
  2178. /**
  2179. * 返回当前未加载页面的页码
  2180. * @returns not_loaded
  2181. */
  2182. function getNotloadedPages() {
  2183. // 已经取得的页码
  2184. let pages = document.querySelectorAll("[id*=pageflash_]");
  2185. let loaded = new Set();
  2186. pages.forEach((page) => {
  2187. let id = page.id.split("_")[1];
  2188. id = parseInt(id);
  2189. loaded.add(id);
  2190. });
  2191. // 未取得的页码
  2192. let not_loaded = [];
  2193. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2194. if (!loaded.has(i)) {
  2195. not_loaded.push(i);
  2196. }
  2197. }
  2198. return not_loaded;
  2199. }
  2200.  
  2201.  
  2202. function WantImgUrls() {
  2203. let res = getImgUrls();
  2204. // 页面尚未加载完
  2205. if (res === null) {
  2206. let hints = [
  2207. "尚未加载完全部页面",
  2208. "以下页面需要浏览并加载:",
  2209. getNotloadedPages().join(",")
  2210. ];
  2211. alert(hints.join("\n"));
  2212. return;
  2213. }
  2214. // 页面全部加载完
  2215. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2216. }
  2217.  
  2218.  
  2219. /**
  2220. * dugen文档下载策略
  2221. */
  2222. function dugen() {
  2223. ensureInPreview();
  2224. // 全局对象
  2225. window.dugenJS = {
  2226. page_counts: getPageCounts$1() // 最大页码(int)
  2227. };
  2228.  
  2229. // 创建按钮区
  2230. utils.createBtns();
  2231.  
  2232. // 绑定监听器
  2233. // 按钮1:展开文档
  2234. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2235. // 按钮2:导出图片链接
  2236. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2237. }
  2238.  
  2239. /**
  2240. * 取得文档类型
  2241. * @returns {String} 文档类型str
  2242. */
  2243. function getDocType() {
  2244. let type_elem = document.querySelector(".title .icon.icon-format");
  2245. // ["icon", "icon-format", "icon-format-doc"]
  2246. let cls_str = type_elem.classList[2];
  2247. // "icon-format-doc"
  2248. let type = cls_str.split("-")[2];
  2249. return type;
  2250. }
  2251.  
  2252.  
  2253. /**
  2254. * 判断文档类型是否为type_list其中之一
  2255. * @returns 是否为type
  2256. */
  2257. function isTypeof(type_list) {
  2258. let type = getDocType();
  2259. if (type_list.includes(type)) {
  2260. return true;
  2261. }
  2262. return false;
  2263. }
  2264.  
  2265.  
  2266. /**
  2267. * 判断文档类型是否为PPT
  2268. * @returns 是否为PPT
  2269. */
  2270. function isPPT() {
  2271. return isTypeof(["ppt", "pptx"]);
  2272. }
  2273.  
  2274.  
  2275. /**
  2276. * 判断文档类型是否为Excel
  2277. * @returns 是否为Excel
  2278. */
  2279. function isEXCEL() {
  2280. return isTypeof(["xls", "xlsm", "xlsx"]);
  2281. }
  2282.  
  2283.  
  2284. /**
  2285. * 取得最大页码
  2286. * @returns {Number} 最大页码
  2287. */
  2288. function getPageCounts() {
  2289. let page_counts_str = document.querySelector(".intro-list").textContent;
  2290. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2291. return page_counts;
  2292. }
  2293.  
  2294.  
  2295. /**
  2296. * 取得未加载页面的页码
  2297. * @param {Set} loaded 已加载的页码集合
  2298. * @returns {Array} not_loaded 未加载页码列表
  2299. */
  2300. function getNotLoaded(loaded) {
  2301. let not_loaded = [];
  2302. let page_counts = window.book118JS.page_counts;
  2303. for (let i = 1; i <= page_counts; i++) {
  2304. if (!loaded.has(i)) {
  2305. not_loaded.push(i);
  2306. }
  2307. }
  2308. return not_loaded;
  2309. }
  2310.  
  2311.  
  2312. /**
  2313. * 取得全部文档页的url
  2314. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2315. */
  2316. function getUrls() {
  2317. let loaded = new Set(); // 存储已加载页面的页码
  2318. let urls = []; // 存储已加载页面的图形src
  2319. // 收集已加载页面的url
  2320. document.querySelectorAll("div[data-id]").forEach((div) => {
  2321. let src = div.querySelector("img").src;
  2322. if (src) {
  2323. // "1": "https://view-cache.book118.com/..."
  2324. loaded.add(parseInt(div.getAttribute("data-id")));
  2325. urls.push(src);
  2326. }
  2327. });
  2328. // 如果所有页面加载完毕
  2329. if (loaded.size === window.book118JS.page_counts) {
  2330. return [true, urls];
  2331. }
  2332. // 否则收集未加载页面的url
  2333. return [false, getNotLoaded(loaded)];
  2334. }
  2335.  
  2336.  
  2337. /**
  2338. * 展开全文
  2339. */
  2340. function readAll() {
  2341. window.preview.jump(999);
  2342. }
  2343.  
  2344.  
  2345. /**
  2346. * btn_2: 导出图片链接
  2347. */
  2348. function wantUrls() {
  2349. let [flag, res] = getUrls();
  2350. // 页面都加载完毕,下载urls
  2351. if (flag) {
  2352. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2353. return;
  2354. }
  2355. // 没有加载完,提示出未加载好的页码
  2356. let hints = [
  2357. "仍有页面没有加载",
  2358. "请浏览并加载如下页面:",
  2359. res.join(",")
  2360. ];
  2361. alert(hints.join("\n"));
  2362. }
  2363.  
  2364.  
  2365. /**
  2366. * 打开PPT预览页面
  2367. */
  2368. function openPPTpage() {
  2369. window.preview.getSrc();
  2370. let openPPT = () => {
  2371. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2372. utils.openInNewTab(ppt_src);
  2373. window.preview.close();
  2374. };
  2375. setTimeout(openPPT, 1000);
  2376. }
  2377.  
  2378.  
  2379. /**
  2380. * 原创力文档(非PPT或Excel)下载策略
  2381. */
  2382. function book118_CommonDoc() {
  2383. // 创建全局对象
  2384. window.book118JS = {
  2385. doc_type: getDocType(),
  2386. page_counts: getPageCounts()
  2387. };
  2388.  
  2389. // 处理非PPT文档
  2390. // 创建按钮组
  2391. utils.createBtns();
  2392. // 绑定监听器到按钮
  2393. // 按钮1:展开文档
  2394. utils.setBtnEvent(() => {
  2395. readAll();
  2396. utils.toggleBtnStatus("btn_1");
  2397. utils.toggleBtnStatus("btn_2");
  2398. }, [], "btn_1");
  2399. // 按钮2:导出图片链接
  2400. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2401. }
  2402.  
  2403.  
  2404. /**
  2405. * 取得PPT文档最大页码
  2406. * @returns PPT文档最大页码int
  2407. */
  2408. function getPageCountsPPT() {
  2409. let counts_str = document.querySelector("#PageCount").textContent;
  2410. let counts = parseInt(counts_str);
  2411. // console.log(`get page counts: ${counts}`);
  2412. return counts;
  2413. }
  2414.  
  2415.  
  2416. /**
  2417. * 取得当前的页码
  2418. * @returns {Number} this_page
  2419. */
  2420. function getThisPage() {
  2421. let this_page = document.querySelector("#PageIndex").textContent;
  2422. this_page = parseInt(this_page);
  2423. return this_page;
  2424. }
  2425.  
  2426.  
  2427. /**
  2428. * 点击下一动画直到变成下一页,再切回上一页
  2429. * @param {Number} next_page 下一页的页码
  2430. */
  2431. async function __nextFrameUntillNextPage(next_page) {
  2432. // 如果已经抵达下一页,则返回上一页
  2433. let this_page = getThisPage();
  2434.  
  2435. // 最后一页直接退出
  2436. if (next_page > getPageCountsPPT()) {
  2437. return;
  2438. }
  2439. // 不是最后一页,但完成了任务
  2440. else if (this_page === next_page) {
  2441. document.querySelector(".btmLeft").click();
  2442. await utils.sleepAsync(500);
  2443. return;
  2444. }
  2445. // 否则递归的点击下一动画
  2446. document.querySelector(".btmRight").click();
  2447. await utils.sleepAsync(500);
  2448. await __nextFrameUntillNextPage(next_page);
  2449. }
  2450.  
  2451.  
  2452. /**
  2453. * 确保当前页面是最后一帧动画
  2454. */
  2455. async function ensurePageLoaded() {
  2456. // 取得当前页码和下一页页码
  2457. let this_page = getThisPage();
  2458. let next_page = this_page + 1;
  2459. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2460. await __nextFrameUntillNextPage(next_page);
  2461. }
  2462.  
  2463.  
  2464. /**
  2465. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2466. */
  2467. async function docView2Canvas() {
  2468. await ensurePageLoaded();
  2469. // 取得页码
  2470. let cur_page = getThisPage();
  2471. // 取得视图元素,计数从0开始
  2472. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2473. // 转化为canvas
  2474. let canvas_promise = html2canvas(doc_view);
  2475. console.log(canvas_promise); // 打印信息以检查状况
  2476.  
  2477. await canvas_promise.then((canvas) => {
  2478. // 保存canvas到全局对象
  2479. window.book118JS.canvases.push(canvas);
  2480. // 打印日志
  2481. console.log(`wk: ${cur_page} complete`);
  2482. });
  2483.  
  2484. // 如果到最后一页
  2485. let page_counts = getPageCountsPPT();
  2486. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2487. if (cur_page === page_counts) {
  2488. // 终止递归,并且显示导出PDF按钮
  2489. utils.toggleBtnStatus("btn_2");
  2490. return;
  2491. }
  2492. // 否则下一次递归(继续捕获下一页)
  2493. document.querySelector(".pgRight").click();
  2494. await utils.sleepAsync(500);
  2495. await docView2Canvas();
  2496. }
  2497.  
  2498.  
  2499. /**
  2500. * 将捕获的canvases合并并导出为pdf
  2501. * @returns
  2502. */
  2503. function canvases2pdf() {
  2504. // 已经捕获的页面数量
  2505. let stored_amount = window.book118JS.canvases.length;
  2506. // 总页面数量
  2507. let page_counts = window.book118JS.page_counts;
  2508. // 校验数量
  2509. let diff = page_counts - stored_amount;
  2510. if (diff > 0) {
  2511. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2512. if (!confirm("是否仍要导出PDF?")) {
  2513. // 不坚持导出PDF的情况
  2514. return;
  2515. }
  2516. }
  2517. // 导出PDF
  2518. let canvases = window.book118JS.canvases;
  2519. // 取得宽高
  2520. let model = canvases[0];
  2521. let width = model.width;
  2522. let height = model.height;
  2523. // 取得标题然后导出pdf
  2524. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2525. }
  2526.  
  2527.  
  2528. /**
  2529. * 原创力文档(PPT)下载策略
  2530. */
  2531. function book118_PPT() {
  2532. // 创建全局对象
  2533. window.book118JS = {
  2534. page_counts: getPageCountsPPT(),
  2535. canvases: [] // 存储每页文档转化的canvas
  2536. };
  2537.  
  2538. // 创建按钮区
  2539. utils.createBtns();
  2540. // 绑定监听器到按钮1
  2541. utils.setBtnEvent(() => {
  2542. let hints = [
  2543. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2544. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2545. ];
  2546. alert(hints.join("\n"));
  2547. // 隐藏按钮1
  2548. utils.toggleBtnStatus("btn_1");
  2549. // 开始捕获页面(异步)
  2550. docView2Canvas(window.book118JS.page_counts);
  2551. }, [], "btn_1", "捕获页面");
  2552. // 为按钮2绑定监听器
  2553. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2554. }
  2555.  
  2556.  
  2557. /**
  2558. * 取得当前页面的excel,返回csv string
  2559. * @returns {String} csv
  2560. */
  2561. function excel2CSV() {
  2562. let table = [];
  2563. let rows = document.querySelectorAll("tr[id]");
  2564.  
  2565. // 遍历行
  2566. for (let row of rows) {
  2567. let csv_row = [];
  2568. // 遍历列(单元格)
  2569. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2570. // 判断单元格是否存储图片
  2571. let img = cell.querySelector("img");
  2572. if (img) {
  2573. // 如果是图片,保存图片链接
  2574. csv_row.push(img.src);
  2575. } else {
  2576. // 否则保存单元格文本
  2577. csv_row.push(cell.textContent);
  2578. }
  2579. }
  2580. table.push(csv_row.join(","));
  2581. }
  2582.  
  2583. let csv = table.join("\n");
  2584. csv = csv.replace(/\n{2,}/g, "\n");
  2585. return csv;
  2586. }
  2587.  
  2588.  
  2589. /**
  2590. * 下载当前表格内容,保存为csv(utf-8编码)
  2591. */
  2592. function wantEXCEL() {
  2593. let file_name = "原创力表格_UTF-8.csv";
  2594. utils.createAndDownloadFile(file_name, excel2CSV());
  2595. }
  2596.  
  2597.  
  2598. /**
  2599. * 在Excel预览页面给出操作提示
  2600. */
  2601. function help() {
  2602. let hints = [
  2603. "【导出表格到CSV】只能导出当前sheet,",
  2604. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2605. "CSV是一种简单的表格格式,可以被Excel打开,",
  2606. "并转为 xls 或 xlsx 格式存储,",
  2607. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2608. "",
  2609. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2610. "有两个办法:",
  2611. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2612. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2613. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2614. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2615. ];
  2616. alert(hints.join("\n"));
  2617. }
  2618.  
  2619.  
  2620. /**
  2621. * 原创力文档(EXCEL)下载策略
  2622. */
  2623. function book118_EXCEL() {
  2624. // 创建按钮区
  2625. utils.createBtns();
  2626. // 绑定监听器到按钮
  2627. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2628. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2629. // 显示按钮
  2630. utils.toggleBtnStatus("btn_2");
  2631. }
  2632.  
  2633.  
  2634. /**
  2635. * 打开Excel预览页面
  2636. */
  2637. function openEXCELpage() {
  2638. openPPTpage();
  2639. }
  2640.  
  2641.  
  2642. /**
  2643. * 原创力文档下载策略
  2644. */
  2645. function book118() {
  2646. let host = window.location.hostname;
  2647. if (host === 'max.book118.com') {
  2648. if (isEXCEL()) {
  2649. utils.createBtns();
  2650. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2651. } else if (isPPT()) {
  2652. utils.createBtns();
  2653. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2654. } else {
  2655. book118_CommonDoc();
  2656. }
  2657. } else if (host === "view-cache.book118.com") {
  2658. book118_PPT();
  2659. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2660. book118_EXCEL();
  2661. } else {
  2662. console.log(`wk: Unknown host: ${host}`);
  2663. }
  2664. }
  2665.  
  2666. // test url: https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=E86BBCE32DA8E67F3DA04ED98F2465DB
  2667.  
  2668.  
  2669. /**
  2670. * 绘制0x0的bmp, 作为请求失败时返回的page
  2671. * @returns {Promise<ImageBitmap>} blank_page
  2672. */
  2673. async function blankBMP() {
  2674. let canvas = document.createElement("canvas");
  2675. [canvas.width, canvas.height] = [0, 0];
  2676. return createImageBitmap(canvas);
  2677. }
  2678.  
  2679.  
  2680. /**
  2681. * resp导出bmp
  2682. * @param {string} page_url
  2683. * @param {Promise<Response> | ImageBitmap} pms_or_bmp
  2684. * @returns {Promise<ImageBitmap>} page
  2685. */
  2686. async function respToPage(page_url, pms_or_bmp) {
  2687. let center = globalThis.gb688JS;
  2688. // 此时是bmp
  2689. if (pms_or_bmp instanceof ImageBitmap) {
  2690. return pms_or_bmp;
  2691. }
  2692.  
  2693. // 第一次下载, 且无人处理
  2694. if (!center.pages_status.get(page_url)) {
  2695. // 处理中, 设为占用
  2696. center.pages_status.set(page_url, 1);
  2697.  
  2698. // 处理
  2699. let resp;
  2700. try {
  2701. resp = await pms_or_bmp;
  2702. } catch(err) {
  2703. console.log("下载页面失败");
  2704. console.error(err);
  2705. return blankBMP();
  2706. }
  2707.  
  2708. let page_blob = await resp.blob();
  2709. let page = await createImageBitmap(page_blob);
  2710. center.pages.set(page_url, page);
  2711. // 处理结束, 设为释放
  2712. center.pages_status.set(page_url, 0);
  2713. return page;
  2714. }
  2715.  
  2716. // 有人正在下载且出于处理中
  2717. while (center.pages_status.get(page_url)) {
  2718. await utils.sleepAsync(500);
  2719. }
  2720. return center.pages.get(page_url);
  2721. }
  2722.  
  2723.  
  2724. /**
  2725. * 获得PNG页面
  2726. * @param {string} page_url
  2727. * @returns {Promise<ImageBitmap>} bmp
  2728. */
  2729. async function getPage(page_url) {
  2730. // 如果下载过, 直接返回缓存
  2731. let pages = globalThis.gb688JS.pages;
  2732. if (pages.has(page_url)) {
  2733. return respToPage(page_url, pages.get(page_url));
  2734. }
  2735.  
  2736. // 如果从未下载过, 就下载
  2737. let resp = fetch(page_url, {
  2738. "headers": {
  2739. "accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
  2740. "accept-language": "zh-CN,zh;q=0.9,en;q=0.8",
  2741. "proxy-connection": "keep-alive"
  2742. },
  2743. "referrer": location.href,
  2744. "referrerPolicy": "strict-origin-when-cross-origin",
  2745. "body": null,
  2746. "method": "GET",
  2747. "mode": "cors",
  2748. "credentials": "include"
  2749. });
  2750. pages.set(page_url, resp);
  2751. return respToPage(page_url, resp);
  2752. }
  2753.  
  2754.  
  2755. /**
  2756. * 返回文档页div的裁切和粘贴位置信息: [[cut_x, cut_y, paste_x%, paset_y%],...]
  2757. * @param {HTMLDivElement} page_div 文档页元素
  2758. * @returns {Array<Array<number>>} positions
  2759. */
  2760. function getPostions(page_div) {
  2761. let positions = [];
  2762.  
  2763. Array.from(page_div.children).forEach(span => {
  2764. // 'pdfImg-3-8' -> {left: 30%; top: 80%;}
  2765. let paste_pos = span.className.split("-").slice(1).map(
  2766. v => parseInt(v) / 10
  2767. );
  2768. // '-600px 0px' -> [600, 0]
  2769. let cut_pos = span.style.backgroundPosition.split(" ").map(
  2770. v => Math.abs(parseInt(v))
  2771. );
  2772. positions.push([...cut_pos, ...paste_pos]);
  2773. });
  2774. return positions;
  2775. }
  2776.  
  2777.  
  2778. /**
  2779. * 取得文档页的图像url
  2780. * @param {HTMLDivElement} page_div
  2781. * @returns {string} url
  2782. */
  2783. function getPageURL(page_div) {
  2784. // 拿到目标图像url
  2785. let path = location.pathname.split("/").slice(0, -1).join("/");
  2786. let prefix = location.origin + path + "/";
  2787. let url = page_div.getAttribute("bg");
  2788. if (!url) {
  2789. // 'url("viewGbImg?fileName=VS72l67k0jw5g3j0vErP8DTsnWvk5QsqnNLLxaEtX%2FM%3D")'
  2790. url = page_div.children[0].style.backgroundImage.split('"')[1];
  2791. }
  2792. return prefix + url;
  2793. }
  2794.  
  2795.  
  2796. /**
  2797. * 下载目标图像并拆解重绘, 返回canvas
  2798. * @param {number} i 第 i 页 (从0开始)
  2799. * @param {HTMLDivElement} page_div
  2800. * @returns {Promise<Array>} [页码, Canvas]
  2801. */
  2802. async function getAndDrawPage(i, page_div) {
  2803. // 拿到目标图像
  2804. let url = getPageURL(page_div);
  2805. let page = await getPage(url);
  2806.  
  2807. // 绘制空白A4纸背景
  2808. let [page_w, page_h] = [1190, 1680];
  2809. let bg = document.createElement("canvas");
  2810. bg.width = page_w; // 注意canvas作为取景框的大小
  2811. bg.height = page_h; // 如果不设置等于一个很小的取景框
  2812. let bg_ctx = bg.getContext("2d");
  2813. bg_ctx.fillStyle = "white";
  2814. bg_ctx.fillRect(0, 0, page_w, page_h);
  2815.  
  2816. // 逐个区块剪切取出并粘贴
  2817. // wk$("#viewer .page").forEach(page_div => {
  2818. getPostions(page_div).forEach(pos => {
  2819. bg_ctx.drawImage(
  2820. page, // image source
  2821. pos[0], // source x
  2822. pos[1], // source y
  2823. 120, // source width
  2824. 169, // source height
  2825. pos[2] * page_w, // destination x = left: x%
  2826. pos[3] * page_h, // destination y = top: y%
  2827. 120, // destination width
  2828. 169 // destination height
  2829. );
  2830. });
  2831. // });
  2832. return [i, bg];
  2833. }
  2834.  
  2835.  
  2836. /**
  2837. * 页面批量请求、裁剪重绘, 合成PDF并下载
  2838. */
  2839. async function turnPagesToPDF() {
  2840. // 渲染每页
  2841. let tasks = [];
  2842. wk$("#viewer .page").forEach((page_div, i) => {
  2843. tasks.push(
  2844. getAndDrawPage(i, page_div)
  2845. );
  2846. });
  2847. // 等待每页渲染完成后,排序
  2848. let results = await Promise.all(tasks);
  2849. results.sort((prev, next) => prev[0] - next[0]);
  2850. // 合并为PDF并导出
  2851. utils.saveCanvasesToPDF(
  2852. results.map(item => item[1]),
  2853. // '在线预览|GB 14023-2022'
  2854. document.title.split("|")[1]
  2855. );
  2856. }
  2857.  
  2858.  
  2859. /**
  2860. * 提示预估下载耗时,然后下载
  2861. */
  2862. function hintThenDownload() {
  2863. // '/93'
  2864. let page_num = parseInt(wk$("#numPages")[0].textContent.slice(1));
  2865. let estimate = Math.ceil(page_num / 3);
  2866. alert(`页数: ${page_num},预计花费: ${estimate}秒;如遇网络异常可能更久;请勿反复点击按钮;如果无法导出请 QQ 群反馈`);
  2867. turnPagesToPDF();
  2868. }
  2869.  
  2870.  
  2871. /**
  2872. * gb688文档下载策略
  2873. */
  2874. async function gb688() {
  2875. // 创建全局对象
  2876. globalThis.gb688JS = {
  2877. pages: new Map(), // {url: bmp}
  2878. pages_status: new Map() // {url: 0或1} 0释放, 1占用
  2879. };
  2880.  
  2881. // 创建按钮区
  2882. utils.createBtns();
  2883. // 绑定监听器
  2884. // 按钮1:导出PDF
  2885. turnPagesToPDF = await utils.recTime(turnPagesToPDF);
  2886. utils.setBtnEvent(hintThenDownload, [], "btn_1", "导出PDF");
  2887. }
  2888.  
  2889. /**
  2890. * 主函数:识别网站,执行对应文档下载策略
  2891. */
  2892. function main() {
  2893. // 显示当前位置
  2894. let host = window.location.host;
  2895. console.log(`当前host: ${host}`);
  2896. // 挂载工具包到全局
  2897. window.user_utils = utils;
  2898. console.log("wk: user_utils已经挂载到全局");
  2899.  
  2900. // 附加任务
  2901. // utils.globalFunc(HD); // 全局设置高清图片的函数
  2902.  
  2903. // 主任务
  2904. if (host.includes("docin.com")) {
  2905. docin();
  2906. } else if (host === "swf.ishare.down.sina.com.cn") {
  2907. ishareData();
  2908. } else if (host.includes("ishare.iask")) {
  2909. ishare();
  2910. } else if (host === "www.deliwenku.com") {
  2911. deliwenku();
  2912. } else if (host === "www.doc88.com") {
  2913. doc88();
  2914. } else if (host === "www.360doc.com") {
  2915. doc360();
  2916. } else if (host === "wenku.baidu.com") {
  2917. baiduWenku();
  2918. } else if (host === "doc.mbalib.com") {
  2919. mbalib();
  2920. } else if (host === "www.dugen.com") {
  2921. dugen();
  2922. } else if (host === "c.gb688.cn") {
  2923. gb688();
  2924. } else if (host.includes("book118.com")) {
  2925. book118();
  2926. } else {
  2927. console.log("匹配到了无效网页");
  2928. }
  2929. }
  2930.  
  2931. let options = {
  2932. fast_mode: false,
  2933. activation_test: false,
  2934. show_buttons: true
  2935. };
  2936. globalThis._wk_on = options.show_buttons;
  2937. if (options.cli_mode) {
  2938. (() => {
  2939. loadExternalScripts();
  2940. setTimeout(main, 2000);
  2941. return;
  2942. })();
  2943. }
  2944. if (options.activation_test) {
  2945. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  2946. }
  2947. if (options.fast_mode) {
  2948. main();
  2949. } else {
  2950. window.onload = main;
  2951. }
  2952.  
  2953. })();