Wenku Doc Downloader

下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-12-01 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.26
  5. // @description 下载文档,导出纯图片PDF。有限地支持(1)豆丁网 (2)道客巴巴 (3)360doc个人图书馆(4)得力文库 (5)MBA智库(6)爱问文库(7)原创力文档(8)读根网(9)国标网(10)食典通(11)安全文库网。在文档页面左侧中间有按钮区和小猴子图标,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author 2690874578@qq.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://swf.ishare.down.sina.com.cn/?path=*
  11. // @match *://www.deliwenku.com/p-*
  12. // @match *://www.doc88.com/p-*
  13. // @match *://www.360doc.com/content/*
  14. // @match *://wenku.baidu.com/view/*
  15. // @match *://wenku.baidu.com/tfview/*
  16. // @match *://doc.mbalib.com/view/*
  17. // @match *://www.dugen.com/p-*
  18. // @match *://max.book118.com/html/*
  19. // @match *://view-cache.book118.com/pptView.html?*
  20. // @match *://*.book118.com/?readpage=*
  21. // @match *://c.gb688.cn/bzgk/gb/showGb?*
  22. // @match *://www.safewk.com/p-*
  23. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  24. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  25. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  26. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  27. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  28. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  29. // @grant none
  30. // @license GPL-3.0-only
  31. // @create 2021-11-22
  32. // @note 1. 支持了爱问文库
  33. // ==/UserScript==
  34.  
  35.  
  36. (function () {
  37. 'use strict';
  38.  
  39. /**
  40. * 多元素选择器
  41. * @param {string | HTMLElement} selector 选择器或元素
  42. * @returns {NodeListOf<HTMLElement>} elements 元素列表
  43. */
  44. let _wk$ = function(selector) {
  45. if (selector instanceof Node) {
  46. return [selector];
  47. }
  48. let that = this;
  49. if (!(that instanceof HTMLElement)) {
  50. that = document;
  51. }
  52. return that.querySelectorAll(selector);
  53. };
  54.  
  55. globalThis.wk$ = _wk$;
  56.  
  57.  
  58. let utils = {
  59. /**
  60. * 使用过时的execCommand复制文字
  61. * @param {string} text
  62. */
  63. _oldCopy: function(text) {
  64. let input = document.createElement("input");
  65. input.value = text;
  66. document.body.appendChild(input);
  67. input.select();
  68. document.execCommand("copy");
  69. input.remove();
  70. },
  71.  
  72. /**
  73. * 复制text到剪贴板
  74. * @param {string} text
  75. * @returns
  76. */
  77. copy: function(text) {
  78. // 输出到控制台和剪贴板
  79. console.log(text);
  80. if (!navigator.clipboard) {
  81. this._oldCopy(text);
  82. return;
  83. }
  84. navigator.clipboard.writeText(text)
  85. .catch(err => {
  86. this._oldCopy(text);
  87. });
  88. },
  89.  
  90. /**
  91. * 装饰器, 用于打印函数执行耗时
  92. * @param {Function} func 需要计时的函数
  93. * @returns {Promise<Function>} 装饰的func => func的返回值
  94. */
  95. recTime: async function(func) {
  96. async function inner() {
  97. let begin = Date.now();
  98. let res = await func();
  99. let cost = ((Date.now() - begin) / 1000).toFixed(1);
  100. console.log(`Function <${func.name}> costed ${cost} seconds.`);
  101. return res;
  102. }
  103. return inner;
  104. },
  105.  
  106. /**
  107. * 创建并下载文件
  108. * @param {String} file_name 文件名
  109. * @param {String | Blob} content 文本或blob
  110. */
  111. createAndDownloadFile: function(file_name, content) {
  112. let aTag = document.createElement('a');
  113. let blob;
  114. if (typeof content != Blob) {
  115. blob = new Blob([content]);
  116. }
  117. aTag.download = file_name;
  118. aTag.href = URL.createObjectURL(blob);
  119. aTag.click();
  120. URL.revokeObjectURL(blob);
  121. },
  122.  
  123. /**
  124. * 创建并下载URL资源
  125. * @param {String} file_name
  126. * @param {String} src
  127. */
  128. downloadUrlFile: function(file_name, src) {
  129. let aTag = document.createElement('a');
  130. aTag.download = file_name;
  131. aTag.href = src;
  132. aTag.click();
  133. },
  134.  
  135. /**
  136. * canvas转为PNG格式的blob
  137. * @param {HTMLCanvasElement} canvas
  138. * @returns {Promise<Blob>} blob
  139. */
  140. canvasToBlob: async function(canvas) {
  141. return new Promise(res => canvas.toBlob(res));
  142. },
  143.  
  144. /**
  145. * 添加外部js到当前页面
  146. * @param {String} url
  147. */
  148. addScript2HTML: function(url) {
  149. let script = document.createElement("script");
  150. script.src = url;
  151. document.head.appendChild(script);
  152. },
  153.  
  154. /**
  155. * 显示/隐藏按钮区.
  156. * @param {Function} func
  157. */
  158. toggleBtnsSec: function() {
  159. let sec = wk$(".wk-box")[0];
  160. if (sec.style.display === "none") {
  161. sec.style.display = "block";
  162. return;
  163. }
  164. sec.style.display = "none";
  165. },
  166.  
  167. /**
  168. * 睡眠 delay 毫秒
  169. * @param {Number} delay
  170. */
  171. sleep: function(delay) {
  172. let start = (new Date()).getTime();
  173. while ((new Date()).getTime() - start < delay) {
  174. continue;
  175. }
  176. },
  177.  
  178. /**
  179. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  180. * @param {Number} delay
  181. * @returns {Promise} nextTask
  182. */
  183. sleepAsync: function(delay) {
  184. return new Promise((resolve) => setTimeout(resolve, delay));
  185. },
  186.  
  187. /**
  188. * 允许打印页面
  189. */
  190. allowPrint: function() {
  191. let style = document.createElement("style");
  192. style.innerHTML = `
  193. @media print {
  194. body{
  195. display:block;
  196. }
  197. }
  198. `;
  199. document.head.appendChild(style);
  200. },
  201.  
  202. /**
  203. * 取得get参数key对应的value
  204. * @param {String} key
  205. * @returns {String} value
  206. */
  207. getUrlParam: function(key) {
  208. let params = (new URL(window.location)).searchParams;
  209. return params.get(key);
  210. },
  211.  
  212. /**
  213. * 在指定节点后面插入节点
  214. * @param {HTMLElement} new_element
  215. * @param {HTMLElement} target_element
  216. */
  217. insertAfter: function(new_element, target_element) {
  218. let parent = target_element.parentNode;
  219. if (parent.lastChild === target_element) {
  220. parent.appendChild(new_element);
  221. } else {
  222. parent.insertBefore(new_element, target_element.nextElementSibling);
  223. }
  224. },
  225.  
  226. /**
  227. * 求main_set去除cut_set后的set
  228. * @param {Set} main_set
  229. * @param {Set} cut_set
  230. * @returns 差集
  231. */
  232. difference: function(main_set, cut_set) {
  233. let _diff = new Set(main_set);
  234. for (let elem of cut_set) {
  235. _diff.delete(elem);
  236. }
  237. return _diff;
  238. },
  239.  
  240. /**
  241. * 抛出set中的第一个元素
  242. * @param {Set} set
  243. * @returns 一个元素
  244. */
  245. setPop: function(set) {
  246. for (let item of set) {
  247. set.delete(item);
  248. return item;
  249. }
  250. },
  251.  
  252. /**
  253. * 绑定事件到指定按钮,返回按钮引用
  254. * @param {Function} event click事件
  255. * @param {Array} args 事件的参数列表
  256. * @param {string} aim_btn 按钮的变量名
  257. * @param {string} new_text 按钮的新文本,为null则不替换
  258. * @returns 按钮元素的引用
  259. */
  260. setBtnEvent: function(event, args=[], aim_btn="btn_3", new_text=null) {
  261. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  262. // 如果需要,替换按钮内文本
  263. if (new_text) {
  264. btn.textContent = new_text;
  265. }
  266. // 绑定事件,添加到页面上
  267. btn.onclick = () => {
  268. this.enhanceBtnClickReaction(aim_btn);
  269. if (args.length) {
  270. event(...args);
  271. } else {
  272. event();
  273. }
  274. };
  275. return btn;
  276. },
  277.  
  278. /**
  279. * 强制隐藏元素
  280. * @param {String} selector
  281. */
  282. forceHide: function(selector) {
  283. let style_cls = "force-hide";
  284. document.querySelectorAll(selector).forEach((elem) => {
  285. elem.className += ` ${style_cls}`;
  286. });
  287. // 判断css样式是否已经存在
  288. let style;
  289. style = document.querySelector(`style.${style_cls}`);
  290. // 如果已经存在,则无须重复创建
  291. if (style) {
  292. return;
  293. }
  294. // 否则创建
  295. style = document.createElement("style");
  296. style.innerHTML = `style.${style_cls} {
  297. visibility: hidden !important;
  298. }`;
  299. document.head.appendChild(style);
  300. },
  301.  
  302. /**
  303. * 当元素可见时,操作目标元素(异步)。最多为不可见元素等待5秒。
  304. * @param {string} s 单个元素选择器
  305. * @param {Function} callback (elem) => {...} 元素操作函数
  306. */
  307. manipulateElem: async function(s, callback) {
  308. let isVisiable = () => {
  309. let res = getComputedStyle($(s)[0]).display !== "none";
  310. // console.log(`${s} visibility: ${res}`);
  311. return res;
  312. };
  313.  
  314. let max = 5 * 5; // 最多等待5秒
  315. let i = 0;
  316.  
  317. // 如果不可见就等待0.2秒/轮
  318. while (!isVisiable() && i <= max) {
  319. i++;
  320. await utils.sleepAsync(200);
  321. }
  322.  
  323. callback($(s)[0]);
  324. },
  325.  
  326. /**
  327. * 隐藏按钮,打印页面,显示按钮
  328. */
  329. hideBtnThenPrint: function() {
  330. // 隐藏按钮,然后打印页面
  331. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  332. btns.forEach((elem) => {
  333. elem.style.display = "none";
  334. });
  335. window.print();
  336.  
  337. // 打印结束,显示按钮
  338. btns.forEach((elem) => {
  339. elem.style.display = "block";
  340. });
  341. },
  342.  
  343. /**
  344. * 返回times个倍数连接的str
  345. * @param {String} str
  346. * @param {Number} times
  347. * @returns multiplied_str
  348. */
  349. multiplyStr: function(str, times) {
  350. let str_list = [];
  351. for (let i = 0; i < times; i++) {
  352. str_list.push(str);
  353. }
  354. return str_list.join("");
  355. },
  356.  
  357. /**
  358. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  359. * @param {String} custom_btn 按钮变量名
  360. */
  361. enhanceBtnClickReaction: function(custom_btn = null) {
  362. let aim_btn;
  363. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  364. if (!custom_btn || custom_btn === "btn_1") {
  365. aim_btn = document.querySelector(".btn-1");
  366. } else {
  367. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  368. }
  369.  
  370. let old_color = aim_btn.style.color; // 保存旧的颜色
  371. let old_text = aim_btn.textContent; // 保存旧的文字内容
  372. // 变黑缩小
  373. aim_btn.style.color = "black";
  374. aim_btn.style.fontWeight = "normal";
  375. aim_btn.textContent = `->${old_text}<-`;
  376. // 复原加粗
  377. let changeColorBack = function() {
  378. aim_btn.style.color = old_color;
  379. aim_btn.style.fontWeight = "bold";
  380. aim_btn.textContent = old_text;
  381. };
  382. setTimeout(changeColorBack, 1250);
  383. },
  384.  
  385. /**
  386. * 切换按钮显示/隐藏状态
  387. * @param {String} aim_btn 按钮变量名
  388. * @returns 按钮元素的引用
  389. */
  390. toggleBtnStatus: function(aim_btn) {
  391. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  392. let display = getComputedStyle(btn).display;
  393. // return;
  394. if (display === "none") {
  395. btn.style.display = "block";
  396. } else {
  397. btn.style.display = "none";
  398. }
  399. return btn;
  400. },
  401.  
  402. /**
  403. * 根据canvas元素数量返回quality值
  404. * @param {Number} canvas_amount
  405. * @returns quality: Number
  406. */
  407. getQualityByCanvasAmount: function(canvas_amount) {
  408. // 如果有全局参数,优先用全局的
  409. if (window.img_quality !== undefined) {
  410. console.log(`image quality: ${window.img_quality * 100}%`);
  411. return window.img_quality;
  412. }
  413. // 否则用默认的
  414. let quality;
  415. if (canvas_amount <= 25) {
  416. quality = 1.0;
  417. } else if (25 < canvas_amount <= 50) {
  418. quality = 0.9;
  419. } else {
  420. quality = 0.8;
  421. }
  422. console.log(`image quality: ${quality * 100}%`);
  423. return quality;
  424. },
  425.  
  426. /**
  427. * 挂载func到全局
  428. * @param {Function} func
  429. */
  430. globalFunc: function(func) {
  431. globalThis[func.name] = func;
  432. },
  433.  
  434. /**
  435. * 用input框跳转到对应页码
  436. * @param {Element} cur_page 当前页码
  437. * @param {string | Number} aim_page 目标页码
  438. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  439. */
  440. jump2pageNo: function(cur_page, aim_page, event_type) {
  441. // 设置跳转页码为目标页码
  442. cur_page.value = (aim_page).toString();
  443. // 模拟回车事件来跳转
  444. let keyboard_event_enter = new KeyboardEvent(event_type, {
  445. bubbles: true,
  446. cancelable: true,
  447. keyCode: 13
  448. });
  449. cur_page.dispatchEvent(keyboard_event_enter);
  450. },
  451.  
  452. /**
  453. * 在新标签页打开链接
  454. * @param {String} href
  455. */
  456. openInNewTab: function(href) {
  457. let link = document.createElement("a");
  458. link.href = href;
  459. link.target = "_blank";
  460. link.click();
  461. },
  462.  
  463. /**
  464. * 滚动到页面底部
  465. */
  466. scrollToBottom: function() {
  467. window.scrollTo({
  468. top: document.body.scrollHeight,
  469. behavior: "smooth"
  470. });
  471. },
  472.  
  473. /**
  474. * 用try移除元素
  475. * @param {Element} element 要移除的元素
  476. */
  477. tryToRemoveElement: function(element) {
  478. try {
  479. element.remove();
  480. } catch (e) {
  481. }
  482. },
  483.  
  484. /**
  485. * 用try移除若干元素
  486. * @param {Element[]} elements 要移除的元素列表
  487. */
  488. tryToRemoveElements: function(elements) {
  489. elements.forEach((elem) => {
  490. this.tryToRemoveElement(elem);
  491. });
  492. },
  493.  
  494. /**
  495. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  496. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  497. */
  498. tryToRemoveSameElem: function(elem_list_box) {
  499. for (let elem_list of elem_list_box) {
  500. if (!elem_list) {
  501. continue;
  502. }
  503. for (let elem of elem_list) {
  504. try {
  505. elem.remove();
  506. } catch (e) {
  507. console.log();
  508. }
  509. }
  510. }
  511. },
  512.  
  513. /**
  514. * 使文档在页面上居中
  515. * @param {String} selector 文档容器的css选择器
  516. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  517. * @returns 偏移值是否合法
  518. */
  519. centerDoc: function(selector, default_offset) {
  520. let doc_main = document.querySelector(selector);
  521. let offset = window.prompt("请输入偏移百分位:", default_offset);
  522. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  523. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  524. doc_main.style.marginLeft = offset + "%";
  525. return true;
  526. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  527. doc_main.style.marginLeft = offset + "%";
  528. return true
  529. } else {
  530. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  531. return false;
  532. }
  533. },
  534.  
  535. /**
  536. * 调整按钮内文本
  537. * @param {String} aim_btn 按钮变量名
  538. * @param {String} new_text 新的文本,null则保留旧文本
  539. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  540. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  541. */
  542. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  543. // 提示文档已经展开
  544. if (use_hint) {
  545. let hint = "文档已经完全展开,可以导出";
  546. alert(hint);
  547. }
  548. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  549. // 要替换的文本
  550. if (new_text) {
  551. btn.textContent = new_text;
  552. }
  553. // 推荐按钮
  554. if (recommend_btn) {
  555. btn.textContent += "(推荐)";
  556. }
  557. },
  558.  
  559. html2Canvases: async function(elem_list) {
  560. // 如果是空元素列表,返回null并终止函数
  561. if (elem_list.length === 0) {
  562. console.log("html2canvases was called, but no element is avaiable.");
  563. return null;
  564. }
  565. let tasks = []; // 存放异步任务
  566. let contents = []; // 存放canvas元素
  567. for (let elem of elem_list) {
  568. let task = html2canvas(elem).then((canvas) => {
  569. contents.push(canvas);
  570. });
  571. tasks.push(task);
  572. }
  573. // 等待全部page转化完成
  574. await Promise.all(tasks);
  575. return contents;
  576. },
  577.  
  578. /**
  579. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  580. * @param {Array} elem_list html元素列表
  581. * @param {String} title 文档标题
  582. */
  583. html2PDF: async function(elem_list, title = "文档") {
  584. // 如果是空元素列表,终止函数
  585. let _contents = this.html2Canvases(elem_list);
  586. if (_contents === null) {
  587. return;
  588. }
  589. _contents.then((contents) => {
  590. // 控制台检查结果
  591. console.log("生成的canvas元素如下:");
  592. console.log(contents);
  593.  
  594. // 拿到canvas宽、高
  595. let model = elem_list[0];
  596. let width, height;
  597. width = model.offsetWidth;
  598. height = model.offsetHeight;
  599. // 打包为pdf
  600. this.saveCanvasesToPDF(contents, title, width, height);
  601. });
  602. },
  603.  
  604. /**
  605. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  606. * @param {string} selector 图形元素的父级元素
  607. */
  608. savePicUrls: function(selector) {
  609. let pages = document.querySelectorAll(selector);
  610. let pic_urls = [];
  611.  
  612. for (let elem of pages) {
  613. let pic_obj = elem.children[0];
  614. let url = pic_obj.src;
  615. pic_urls.push(url);
  616. }
  617. let content = pic_urls.join("\n");
  618. // 启动下载
  619. this.createAndDownloadFile("urls.csv", content);
  620. },
  621.  
  622. /**
  623. * 存储所有canvas图形为png到一个压缩包
  624. * @param {Array} node_list canvas元素列表
  625. * @param {String} title 文档标题
  626. */
  627. saveCanvasesToZip: function(node_list, title) {
  628. // canvas元素转为png图像
  629. // 所有png合并为一个zip压缩包
  630. let zip = new JSZip();
  631. let n = node_list.length;
  632.  
  633. for (let i = 0; i < n; i++) {
  634. let canvas = node_list[i];
  635. let data_base64 = canvas.toDataURL();
  636. let blob = atob(data_base64.split(",")[1]);
  637. zip.file(`page-${i + 1}.png`, blob, { binary: true });
  638. }
  639.  
  640. // 导出zip
  641. // promise.then(onCompleted, onRejected);
  642. zip.generateAsync({ type: "blob" }).then(function(content) {
  643. // see filesaver.js
  644. console.log(content);
  645. saveAs(content, `${title}.zip`);
  646. });
  647. },
  648.  
  649. /**
  650. * 将canvas转为jpeg,然后导出PDF
  651. * @param {Iterable<HTMLCanvasElement>} canvas_box canvas元素列表
  652. * @param {string} title 文档标题
  653. */
  654. saveCanvasesToPDF: function(canvas_box, title, width = 0, height = 0) {
  655. // 如果没有手动指定canvas的长宽,则自动检测
  656. if (!width && !height) {
  657. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  658. let first_canvas = canvas_box[0];
  659.  
  660. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  661. [width, height] = [first_canvas.width, first_canvas.height];
  662. } else {
  663. let [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  664. [width, height] = [parseInt(width_str), parseInt(height_str)];
  665. }
  666. }
  667.  
  668. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  669. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  670. let orientation = width > height ? 'l' : 'p';
  671. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  672. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  673.  
  674. // 保存每一页文档到每一页pdf
  675. let canvas_list = Array.from(canvas_box);
  676. let last_canvas = canvas_list.pop();
  677. canvas_list.forEach(canvas => {
  678. pdf.addImage(canvas, 'png', 0, 0, width, height);
  679. pdf.addPage();
  680. });
  681. // 添加尾页
  682. pdf.addImage(last_canvas, 'png', 0, 0, width, height);
  683. // 导出文件
  684. pdf.save(`${title}.pdf`);
  685. },
  686.  
  687. /**
  688. * Image元素列表合并到一个PDF中
  689. * @param {NodeList} imgs Image元素列表
  690. * @param {String} title 文档名
  691. */
  692. imgs2pdf: function(imgs, title) {
  693. // 取得宽高
  694. let model = imgs[0];
  695. let width = model.offsetWidth;
  696. let height = model.offsetHeight;
  697.  
  698. // 创建pdf
  699. let orientation = width > height ? 'l' : 'p';
  700. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  701.  
  702. // 添加图像到pdf
  703. imgs.forEach((img, index) => {
  704. pdf.addImage(img, 'PNG', 0, 0, width, height);
  705. // 如果当前不是文档最后一页,则需要添加下一个空白页
  706. if (index !== imgs.length - 1) {
  707. pdf.addPage();
  708. }
  709. });
  710.  
  711. // 导出文件
  712. pdf.save(`${title}.pdf`);
  713. },
  714.  
  715.  
  716. /**
  717. * imageBitMap转canvas
  718. * @param {ImageBitmap} bmp
  719. * @returns {HTMLCanvasElement} canvas
  720. */
  721. bmpToCanvas: function(bmp) {
  722. let canvas = document.createElement("canvas");
  723. canvas.height = bmp.height;
  724. canvas.width = bmp.width;
  725. let ctx = canvas.getContext("bitmaprenderer");
  726. ctx.transferFromImageBitmap(bmp);
  727. return canvas;
  728. },
  729.  
  730. /**
  731. * 下载可以简单直接请求的图片,合并到PDF并导出
  732. * @param {Iterable<string>} urls 图片链接列表
  733. * @param {string} title 文档名称
  734. */
  735. imgUrlsToPDF: async function(urls, title) {
  736. // 发起请求
  737. let tasks = new Set();
  738. Array.from(urls).forEach((url, i) => {
  739. tasks.add(
  740. (async () => {
  741. let resp = await fetch(url);
  742. return [i, await resp.blob()];
  743. })()
  744. );
  745. });
  746. // 接收响应
  747. let blob_items = await Promise.all(tasks);
  748. // 格式转换:img blob -> bmp
  749. let tasks2 = new Set();
  750. blob_items.map(
  751. (item, i) => {
  752. let blob = item[1];
  753. let bmp = createImageBitmap(blob);
  754. tasks2.add(
  755. (async () => [i, await bmp])()
  756. );
  757. }
  758. );
  759. // 等待格式转换完成
  760. let bmp_items = await Promise.all(tasks2);
  761.  
  762. // 转为canvas
  763. let canvas_box = bmp_items.sort(
  764. (prev, next) => prev[0] - next[0]
  765. ).map(item => {
  766. let bmp = item[1];
  767. return this.bmpToCanvas(bmp);
  768. });
  769.  
  770. // 导出PDF
  771. this.saveCanvasesToPDF(canvas_box, title);
  772. },
  773.  
  774. /**
  775. * 取得elem的class为class_name的父级元素
  776. * @param {String} class_name
  777. * @param {Element} elem 起点元素
  778. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  779. * @param {Boolean} miss 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  780. * @returns {null | Element} parent_element
  781. */
  782. getParentByClassName: function(class_name, elem, JSobj, miss = false) {
  783. let parent = elem.parentElement;
  784. let iterator_count = JSobj.iterator_count;
  785. let now_name;
  786.  
  787. try {
  788. now_name = parent.className;
  789. } catch (e) {
  790. JSobj.iterator_count = 0;
  791. // 没有父级元素了
  792. return "no parent node";
  793. }
  794.  
  795. // 如果不忽略递归次数计数器
  796. if (!miss) {
  797. if (iterator_count > 9) {
  798. // 超过最大迭代次数,认为不存在,返回null
  799. JSobj.iterator_count = 0;
  800. return "over max iterator counts limit";
  801. } else {
  802. JSobj.iterator_count += 1;
  803. }
  804. }
  805. // 如果类名匹配,返回该节点
  806. if (now_name.split(" ").includes(class_name)) {
  807. iterator_count = 0;
  808. return parent;
  809. }
  810. return this.getParentByClassName(class_name, parent, JSobj);
  811. },
  812.  
  813. /**
  814. * 将func绑定到window.onscroll,并设置触发频率
  815. * @param {Function} func scroll的监听函数
  816. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  817. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  818. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  819. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  820. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  821. */
  822. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  823. if (JSobj.scroll_count === undefined) {
  824. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  825. return;
  826. }
  827.  
  828. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  829. JSobj.scroll_count += 1;
  830. if (JSobj.scroll_count < useful_range) {
  831. func();
  832. console.log(hint);
  833. } else if (JSobj.scroll_count > wait_range) {
  834. JSobj.scroll_count = 0;
  835. }
  836. };
  837. // 如果没有指定的window对象,则使用默认的window
  838. if (!inner_window) {
  839. window.onscroll = () => {
  840. new_func(func, JSobj, useful_range, wait_range, hint);
  841. };
  842. return;
  843. }
  844. // 特定的window对象,一般用于iframe,追加scroll监听器
  845. let scrollFunc = () => {
  846. new_func(func, JSobj, useful_range, wait_range, hint);
  847. };
  848. JSobj.scrollFunc = scrollFunc;
  849. inner_window.addEventListener("scroll", scrollFunc, false);
  850. },
  851.  
  852. /**
  853. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  854. */
  855. createBtns: function() {
  856. // 创建大容器
  857. let box = document.createElement("div");
  858. box.className = "wk-box";
  859. document.body.appendChild(box);
  860.  
  861. // 创建按钮组
  862. let section = document.createElement("section");
  863. section.className = "btns_section";
  864. section.innerHTML = `
  865. <p class="logo_tit">Wenku Doc Downloader</p>
  866. <button class="btn-1">展开文档 😈</button>
  867. <button class="btn-2">未设定2</button>
  868. <button class="btn-3">未设定3</button>
  869. <button class="btn-4">未设定4</button>
  870. <button class="btn-5">未设定5</button>
  871. `;
  872. box.appendChild(section);
  873.  
  874. // 添加隐藏/展示按钮
  875. // 隐藏【🙈】,展开【🐵】
  876. let hide_btn = document.createElement("p");
  877. hide_btn.className = "hide_btn_wk";
  878. hide_btn.textContent = "🐵";
  879. hide_btn.onclick = () => {
  880. // 显示 -> 隐藏
  881. if (getComputedStyle(section).display === "block") {
  882. section.style.display = "none";
  883. hide_btn.style.left = "20px";
  884. hide_btn.textContent = "🙈";
  885. // 隐藏 -> 显示
  886. } else {
  887. section.style.display = "block";
  888. hide_btn.style.left = "155px";
  889. hide_btn.textContent = "🐵";
  890. }
  891. };
  892. box.appendChild(hide_btn);
  893.  
  894. // 设定样式
  895. let style = document.createElement("style");
  896. style.innerHTML = `
  897. .hide_btn_wk {
  898. position: fixed;
  899. left: 155px;
  900. top: 36%;
  901. user-select: none;
  902. font-size: large;
  903. z-index: 5001;
  904. }
  905. .btns_section{
  906. position: fixed;
  907. width: 154px;
  908. left: 10px;
  909. top: 32%;
  910. background: #E7F1FF;
  911. border: 2px solid #1676FF;
  912. padding: 0px 0px 10px 0px;
  913. font-weight: 600;
  914. border-radius: 2px;
  915. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  916. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  917. 'Segoe UI Emoji', 'Segoe UI Symbol';
  918. z-index: 5000;
  919. }
  920. .logo_tit{
  921. width: 100%;
  922. background: #1676FF;
  923. text-align: center;
  924. font-size:12px ;
  925. color: #E7F1FF;
  926. line-height: 40px;
  927. height: 40px;
  928. margin: 0 0 16px 0;
  929. }
  930.  
  931. .btn-1{
  932. display: block;
  933. width: 128px;
  934. height: 28px;
  935. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  936. border-radius: 4px;
  937. color: #fff;
  938. font-size: 12px;
  939. border: none;
  940. outline: none;
  941. margin: 8px auto;
  942. font-weight: bold;
  943. cursor: pointer;
  944. opacity: .9;
  945. }
  946. .btn-2{
  947. display: none;
  948. width: 128px;
  949. height: 28px;
  950. background: #07C160;
  951. border-radius: 4px;
  952. color: #fff;
  953. font-size: 12px;
  954. border: none;
  955. outline: none;
  956. margin: 8px auto;
  957. font-weight: bold;
  958. cursor: pointer;
  959. opacity: .9;
  960. }
  961. .btn-3{
  962. display: none;
  963. width: 128px;
  964. height: 28px;
  965. background:#FA5151;
  966. border-radius: 4px;
  967. color: #fff;
  968. font-size: 12px;
  969. border: none;
  970. outline: none;
  971. margin: 8px auto;
  972. font-weight: bold;
  973. cursor: pointer;
  974. opacity: .9;
  975. }
  976. .btn-4{
  977. display: none;
  978. width: 128px;
  979. height: 28px;
  980. background: #1676FF;
  981. border-radius: 4px;
  982. color: #fff;
  983. font-size: 12px;
  984. border: none;
  985. outline: none;
  986. margin: 8px auto;
  987. font-weight: bold;
  988. cursor: pointer;
  989. opacity: .9;
  990. }
  991. .btn-5{
  992. display: none;
  993. width: 128px;
  994. height: 28px;
  995. background: #ff6600;
  996. border-radius: 4px;
  997. color: #fff;
  998. font-size: 12px;
  999. border: none;
  1000. outline: none;
  1001. margin: 8px auto;
  1002. font-weight: bold;
  1003. cursor: pointer;
  1004. opacity: .9;
  1005. }
  1006. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  1007. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  1008. document.head.appendChild(style);
  1009.  
  1010. // 根据配置选择:是否默认显示
  1011. if (!globalThis._wk_on) {
  1012. hide_btn.click();
  1013. }
  1014. }
  1015. };
  1016.  
  1017. /**
  1018. * 清理百度文库页面的无关元素
  1019. */
  1020. function clearPage_Baidu() {
  1021. let selectors = [
  1022. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  1023. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  1024. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  1025. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  1026. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  1027. ".hx-recom-wrapper, .reader-topbar, #page-footer, .copyright-wrap",
  1028. ".bg-theme-wap"
  1029. ];
  1030. let elem_list = document.querySelectorAll(selectors.join(", "));
  1031. for (let elem of elem_list) {
  1032. utils.tryToRemoveElement(elem);
  1033. }
  1034. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  1035. utils.forceHide(nut_selector);
  1036.  
  1037. // 页边距调整
  1038. // 顶部距离改为0
  1039. let rc = document.querySelector("#reader-container");
  1040. rc.style.paddingTop = "0";
  1041. let cw = document.querySelector(".content-wrapper");
  1042. cw.style.paddingTop = "0";
  1043. // 底部距离改为0
  1044. let foot = document.querySelector(".try-end-fold-page");
  1045. foot.style.paddingBottom = "0";
  1046. foot.style.height = "0";
  1047. }
  1048.  
  1049.  
  1050. /**
  1051. * 调整页间距为 width px
  1052. */
  1053. function adjustPageGap() {
  1054. let old_gap = window.baiduJS.page_gap;
  1055. let hints = [
  1056. `旧的页间距为 ${old_gap} px`,
  1057. "请输入新的页间距(0-500的整数):\n"
  1058. ];
  1059. let new_gap = prompt(hints.join("\n"));
  1060. new_gap = parseInt(new_gap);
  1061.  
  1062. // 创建空白段落节点充当间隔
  1063. let div = document.createElement("div");
  1064. // 取得实心填充物
  1065. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  1066. block.style.height = `${new_gap}px`;
  1067. // 创建间隔
  1068. div.style.background = "rgb(255, 255, 255)"; // 页间距设置为白色
  1069. div.appendChild(block);
  1070. div.className = "page-gap";
  1071.  
  1072. // 调整页间距
  1073. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  1074. let next_elem = elem.nextElementSibling;
  1075.  
  1076. if (next_elem === null) {
  1077. return; // 最后一个节点后面无需间隔
  1078. }
  1079.  
  1080. let cls = next_elem.className;
  1081. if (cls === "page-gap") {
  1082. next_elem.style.height = `${new_gap}px`;
  1083. } else {
  1084. utils.insertAfter(div.cloneNode(true), elem);
  1085. }
  1086. });
  1087. window.baiduJS.page_gap = new_gap;
  1088. console.log(`页间距已经调整为:${new_gap} px`);
  1089. }
  1090.  
  1091.  
  1092. /**
  1093. * 判断是否所有可预览页面都冻结了
  1094. * @returns {Boolean}
  1095. */
  1096. function areAllFrozen() {
  1097. let frozen = 0;
  1098. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1099. if (canvas.getAttribute("width") !== "0") {
  1100. frozen += 1;
  1101. }
  1102. });
  1103. if (frozen < window.free_page) {
  1104. return false;
  1105. }
  1106. return true;
  1107. }
  1108.  
  1109.  
  1110. /**
  1111. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  1112. */
  1113. function freezeDocView() {
  1114. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  1115. if (canvas.getAttribute("width") !== "0") {
  1116. canvas.id = "";
  1117. }
  1118. });
  1119.  
  1120. if (areAllFrozen()) {
  1121. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  1122. console.log("wk: 文档页: 全部冻结完毕");
  1123. window.baiduJS.finished = true;
  1124. window.onscroll = () => { };
  1125. }
  1126. }
  1127.  
  1128.  
  1129. /**
  1130. * 优化阅读体验的零碎任务
  1131. */
  1132. function better() {
  1133. /**
  1134. * 内部主函数,便于捕获异常
  1135. * 代码改自 https://greasyfork.org/zh-CN/scripts/438420
  1136. */
  1137. let _better = function() {
  1138. let pageData = window.pageData;
  1139. // 改为本地 VIP
  1140. pageData.vipInfo.global_svip_status = 1;
  1141. pageData.vipInfo.global_vip_status = 1;
  1142. pageData.vipInfo.isVip = 1;
  1143. pageData.vipInfo.isWenkuVip = 1;
  1144.  
  1145. // 手机版优化
  1146. if (pageData.appUniv) {
  1147. // 取消百度文库对谷歌、搜狗浏览器 referrer 的屏蔽
  1148. pageData.appUniv.blackBrowser = [];
  1149. // 隐藏 APP 下载按钮
  1150. pageData.viewBiz.docInfo.needHideDownload = true;
  1151. }
  1152.  
  1153. // 强制改变背景为中灰色
  1154. document.querySelector("#app")
  1155. .style.backgroundColor = "rgb(95, 99, 104)";
  1156. };
  1157.  
  1158. try {
  1159. console.log("wk: 优化");
  1160. _better();
  1161. } catch (error) {
  1162. console.log("wk: baiduWenku: better: main:");
  1163. console.error(error);
  1164. }
  1165. }
  1166.  
  1167.  
  1168. /**
  1169. * 展开文档
  1170. */
  1171. function readAllOld() {
  1172. better();
  1173. let btn = document.querySelector(".read-all");
  1174. if (!btn) {
  1175. // 显示按钮
  1176. utils.toggleBtnStatus("btn_1");
  1177. utils.toggleBtnStatus("btn_2");
  1178. utils.toggleBtnStatus("btn_3");
  1179. // utils.toggleBtnStatus("btn_4");
  1180. } else {
  1181. btn.click();
  1182. }
  1183. }
  1184.  
  1185.  
  1186. function getTips() {
  1187. let hints = [
  1188. `一共 ${window.all_page} 页, 免费预览 ${window.free_page} 页,`,
  1189. "请优先尝试【导出图片链接】,如果不行再【打印页面到PDF】。",
  1190. "!!由于百度改版,图片链接可能是假的,如若发生请尝试其他办法!!",
  1191. "",
  1192. "如果<免费预览页数>等于<总页数>,",
  1193. "但点击展开文档, 却跳转到vip付费,",
  1194. "请尝试:",
  1195. "1. 清除全部cookies,刷新页面并登录账号",
  1196. "2. 复制以下链接,并在【新标签页】中打开,然后尝试展开文档。",
  1197. "如果还不行就没办法了。",
  1198. "",
  1199. "如果出现空白页,请浏览对应页面使其加载,然后再打印页面。",
  1200. "页数超过20页时,打印预览明显缓慢,请耐心等待,真的只是很慢。",
  1201. "",
  1202. "页面间距通过按钮调整。",
  1203. "页面宽度通过打印时缩放比调整。",
  1204. "推荐缩放比: 114%",
  1205. "",
  1206. "打印时设置:",
  1207. "更多设置 -> 缩放 -> 自定义",
  1208. "选项 -> ☑ 背景图形",
  1209. ];
  1210. let url_no_params = window.location.href.replace(/[?].*/, "");
  1211. prompt(hints.join("\n"), url_no_params);
  1212. alert(
  1213. [
  1214. "只能导出可以【免费预览】的页面。",
  1215. "脚本的能力是有限的,烦请谅解。",
  1216. "",
  1217. "百度文库会记住你打开文档的操作路径,如:",
  1218. "百度搜索 -> 文档,或 文库搜索 -> 百度文档,",
  1219. "百度会让通过特定路径打开免费文档的人必须付费,",
  1220. "所以解决办法是复制刚才弹窗中的链接,",
  1221. "新建标签页,粘贴链接,然后回车打开,这样的操作是零路径。",
  1222. "",
  1223. "此外,发现此脚本与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  1224. "应该是此脚本删去文档页id所导致的,",
  1225. "暂无解决方案, 如需复制文字请禁用此脚本。"
  1226. ].join("\n")
  1227. );
  1228. }
  1229.  
  1230.  
  1231. /**
  1232. * 清理页面,然后打印页面
  1233. */
  1234. function clearThenPrint() {
  1235. // 清理页面
  1236. clearPage_Baidu();
  1237. // 调整文档内容的定位
  1238. let content = document.querySelector(".left-wrapper");
  1239. content.style.marginLeft = "0";
  1240. // 打印页面
  1241. utils.hideBtnThenPrint();
  1242. }
  1243.  
  1244.  
  1245. /**
  1246. * 取得pageData接口中的urls并下载
  1247. * @returns {Boolean} 是否成功下载(是否存在图片元素)
  1248. */
  1249. function downloadPicUrls() {
  1250. let warn = () => {
  1251. let hints = [
  1252. "当前文档非ppt或pdf, 无法使用该功能。",
  1253. "请在展开文档后使用【打印页面到PDF】"
  1254. ];
  1255. alert(hints.join("\n"));
  1256. };
  1257.  
  1258. let html_urls = window.pageData.readerInfo.htmlUrls;
  1259. if (!html_urls) {
  1260. warn();
  1261. return false;
  1262. }
  1263.  
  1264. // pdf
  1265. if (html_urls.png && html_urls.png.length > 0) {
  1266. let urls = [];
  1267. let pngs = html_urls.png;
  1268. pngs.forEach((png) => {
  1269. urls.push(png.pageLoadUrl);
  1270. });
  1271. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  1272. return true;
  1273. }
  1274. // 非图形
  1275. if (html_urls.length === undefined) {
  1276. warn();
  1277. return false;
  1278. }
  1279. // ppt
  1280. utils.createAndDownloadFile("urls.csv", html_urls.join("\n"));
  1281. return true;
  1282. }
  1283.  
  1284.  
  1285. /**
  1286. * 百度文档下载策略
  1287. */
  1288. function baiduWenkuOld() {
  1289. // 允许打印页面
  1290. utils.allowPrint();
  1291. better();
  1292.  
  1293. // 绑定监听器给滚动。在滚动时冻结文档页面
  1294. let log = "wk: 文档页: 冻结";
  1295. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  1296.  
  1297. // 创建按钮
  1298. utils.createBtns();
  1299. // 按钮1: 展开预览
  1300. utils.setBtnEvent(readAllOld, [], "btn_1");
  1301. // 按钮2: 清理页面元素,打印页面
  1302. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  1303. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  1304. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  1305. // 按钮4: 导出图片链接(如果文档是ppt或pdf)
  1306. utils.setBtnEvent(downloadPicUrls, [], "btn_4", "导出图片链接");
  1307. utils.toggleBtnStatus("btn_4");
  1308. // 按钮5: 提示说明
  1309. utils.setBtnEvent(getTips, [], "btn_5", "有问题点我");
  1310. utils.toggleBtnStatus("btn_5");
  1311. }
  1312.  
  1313.  
  1314. /**
  1315. * 居中百度文库文档
  1316. */
  1317. function centerDoc() {
  1318. // 居中文档
  1319. $(".content-wrapper")[0].style = `
  1320. display: flex;
  1321. flex-direction: row;
  1322. justify-content: space-around;
  1323. `.replace(/\s/g, "");
  1324.  
  1325. $(".left-wrapper")[0].style = "margin: 0;";
  1326.  
  1327. let academic = $(".doc-info-wrapper")[0];
  1328. if (academic) {academic.style = "display: none;";}}
  1329.  
  1330.  
  1331. function readAll$1() {
  1332. let vip_read = $(".page-text")[0];
  1333. if (!vip_read) {return;}
  1334.  
  1335. let read_all = $(".read-all")[0];
  1336. // read_all.style = "color: red; font-weight: bold;";
  1337. read_all.textContent += "*";
  1338. read_all.parentElement.onclick = () => {
  1339. location.href = location.origin + location.pathname;
  1340. };
  1341. }
  1342.  
  1343.  
  1344. function baiduWenku() {
  1345. // 取得页码,创建全局对象
  1346. window.free_page = window.pageData.readerInfo.freePage;
  1347. window.all_page = window.pageData.readerInfo.page;
  1348. window.baiduJS = {
  1349. finished: false, // 文档页是否全部冻结
  1350. free_page: window.free_page, // 免费页数
  1351. all_page: window.all_page, // 全部页数
  1352. scroll_count: 0, // 滚动事件触发次数
  1353. page_gap: 0, // 页间距
  1354. oldTech: baiduWenkuOld // 旧版主函数入口
  1355. };
  1356.  
  1357. // 便捷选择器
  1358. window.$ = (s) => {
  1359. return document.querySelectorAll(s);
  1360. };
  1361. // 允许打印页面
  1362. utils.allowPrint();
  1363. better();
  1364.  
  1365. // 居中文档
  1366. centerDoc();
  1367.  
  1368. // 增加预览功能
  1369. setTimeout(readAll$1, 500);
  1370. }
  1371.  
  1372. /**
  1373. * 多元素选择器
  1374. * @param {string} s
  1375. * @returns {NodeListOf<Element>} elements
  1376. */
  1377. let $$1 = (s) => {
  1378. return document.querySelectorAll(s);
  1379. };
  1380.  
  1381.  
  1382. // 全局对象
  1383. globalThis.doc88JS = {
  1384. last_copy_time: 0 // 上一次 ctrl + c 的时间戳(毫秒)
  1385. };
  1386.  
  1387.  
  1388. /**
  1389. * 展开道客巴巴的文档
  1390. */
  1391. function readAllDoc88() {
  1392. // 获取“继续阅读”按钮
  1393. let continue_btn = document.querySelector("#continueButton");
  1394. // 如果存在“继续阅读”按钮
  1395. if (continue_btn) {
  1396. // 跳转到文末(等同于展开全文)
  1397. let cur_page = document.querySelector("#pageNumInput");
  1398. // 取得最大页码
  1399. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1400. // 跳转到尾页
  1401. utils.jump2pageNo(cur_page, page_max, "keypress");
  1402. // 返回顶部
  1403. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1404. }
  1405. // 文档展开后,显示按钮2、3
  1406. else {
  1407. // 隐藏按钮
  1408. utils.toggleBtnStatus("btn_1");
  1409. // 显示按钮
  1410. utils.toggleBtnStatus("btn_2");
  1411. utils.toggleBtnStatus("btn_3");
  1412. utils.toggleBtnStatus("btn_4");
  1413. }
  1414. }
  1415.  
  1416.  
  1417. /**
  1418. * 隐藏搜索框
  1419. */
  1420. async function hideSearchBox() {
  1421. let s = "#min-search-result";
  1422. let hide = (elem) => {
  1423. elem.style.display = "none";
  1424. };
  1425. utils.manipulateElem(s, hide);
  1426. }
  1427.  
  1428.  
  1429. /**
  1430. * 移除vip复制弹窗
  1431. */
  1432. async function removeCopyPopup() {
  1433. let s = "#ym-window";
  1434. let remove = (elem) => {
  1435. let popup = elem.parentElement;
  1436. utils.tryToRemoveElement(popup);
  1437. };
  1438. utils.manipulateElem(s, remove);
  1439. }
  1440.  
  1441.  
  1442. /**
  1443. * 隐藏选择文字的弹窗
  1444. */
  1445. async function hideSelectPopup() {
  1446. let s = "#left-menu";
  1447. let hide = (elem) => {
  1448. elem.style.zIndex = -1;
  1449. };
  1450. utils.manipulateElem(s, hide);
  1451. }
  1452.  
  1453.  
  1454. /**
  1455. * 只会执行一次的初始化任务
  1456. */
  1457. async function lazyService() {
  1458. // 只允许执行一次
  1459. let counter = Symbol.for("counter");
  1460. if (globalThis[counter]) {
  1461. return;
  1462. }
  1463. globalThis[counter] = true;
  1464.  
  1465. // 初始化
  1466. console.log("正在执行初始化任务");
  1467. // 1. 隐藏选中文字的提示框
  1468. hideSelectPopup();
  1469. // 2. 隐藏搜索框
  1470. hideSearchBox();
  1471. // 3. 移除vip复制弹窗
  1472. removeCopyPopup();
  1473. }
  1474.  
  1475.  
  1476. /**
  1477. * 使用过时的execCommand复制文字
  1478. * @param {string} text
  1479. */
  1480. function textToClipBoardOldTech(text) {
  1481. let input = document.createElement("input");
  1482. input.value = text;
  1483. document.body.appendChild(input);
  1484. input.select();
  1485. document.execCommand("copy");
  1486. input.remove();
  1487. }
  1488.  
  1489.  
  1490. /**
  1491. * 复制选中的文字
  1492. * @returns
  1493. */
  1494. function copySelected() {
  1495. // 执行一次初始化任务
  1496. lazyService();
  1497.  
  1498. // 尚未选中文字
  1499. if (getComputedStyle($$1("#left-menu")[0]).display === "none") {
  1500. console.log("尚未选中文字");
  1501. return;
  1502. }
  1503. // 选中文字
  1504. // 搜索文字,弹出搜索框
  1505. let search = $$1("#lmenu_search")[0];
  1506. search.click();
  1507. // 取得input内容
  1508. let input = $$1(".min-text input")[0];
  1509. let text = input.value;
  1510. // 输出到控制台和剪贴板
  1511. console.log(text);
  1512. if (!navigator.clipboard) {
  1513. textToClipBoardOldTech(text);
  1514. return;
  1515. } navigator.clipboard.writeText(text).catch(textToClipBoardOldTech);
  1516. // 清空input
  1517. input.value = "";
  1518. }
  1519.  
  1520.  
  1521. /**
  1522. * 捕获 ctrl + c 并关闭弹窗
  1523. * @param {KeyboardEvent} keydown
  1524. * @returns
  1525. */
  1526. function catchCtrlC(keydown) {
  1527. // 判断是否为 ctrl + c
  1528. if (!(keydown.code === "KeyC" && keydown.ctrlKey === true)) {
  1529. return;
  1530. }
  1531.  
  1532. // 判断触发间隔
  1533. let now = Date.now();
  1534.  
  1535. // 距离上次小于1秒
  1536. if (now - doc88JS.last_copy_time < 1000 * 1) {
  1537. doc88JS.last_copy_time = now;
  1538. return;
  1539. }
  1540.  
  1541. // 大于1秒
  1542. // 刷新最近一次触发时间
  1543. doc88JS.last_copy_time = now;
  1544. // 复制文字
  1545. copySelected();
  1546. }
  1547.  
  1548.  
  1549. /**
  1550. * 道客巴巴文档下载策略
  1551. */
  1552. async function doc88() {
  1553. // 创建脚本启动按钮1、2
  1554. utils.createBtns();
  1555.  
  1556. // 绑定主函数
  1557. let prepare = function() {
  1558. // 获取canvas元素列表
  1559. let node_list = document.querySelectorAll(".inner_page");
  1560. // 获取文档标题
  1561. let title;
  1562. if (document.querySelector(".doctopic h1")) {
  1563. title = document.querySelector(".doctopic h1").title;
  1564. } else {
  1565. title = "文档";
  1566. }
  1567. return [node_list, title];
  1568. };
  1569.  
  1570. // btn_1: 展开文档
  1571. utils.setBtnEvent(() => {
  1572. readAllDoc88();
  1573. }, [], "btn_1");
  1574.  
  1575. // btn_2: 导出zip
  1576. utils.setBtnEvent(() => {
  1577. if (confirm("确定每页内容都加载完成了吗?")) {
  1578. utils.saveCanvasesToZip(...prepare());
  1579. }
  1580. }, [], "btn_2", "导出图片到zip");
  1581. // btn_3: 导出PDF
  1582. utils.setBtnEvent(() => {
  1583. if (confirm("确定每页内容都加载完成了吗?")) {
  1584. utils.saveCanvasesToPDF(...prepare());
  1585. }
  1586. }, [], "btn_3", "导出图片到PDF");
  1587.  
  1588. // btn_4: 复制选中文字
  1589. utils.setBtnEvent(() => {
  1590. copySelected();
  1591. utils.modifyBtnText("btn_4", "复制成功!", false, false);
  1592. }, [], "btn_4", "复制选中文字");
  1593. // 为 ctrl + c 添加响应
  1594. document.addEventListener("keydown", catchCtrlC);
  1595. }
  1596.  
  1597. // 绑定主函数
  1598. function getCanvasList() {
  1599. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1600. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1601. let node_list = [];
  1602. for (let node of parent_node_list) {
  1603. node_list.push(node.children[0]);
  1604. }
  1605. return node_list;
  1606. }
  1607.  
  1608.  
  1609. function prepare() {
  1610. // 获取canvas元素列表
  1611. let node_list = getCanvasList();
  1612. // 获取文档标题
  1613. let title;
  1614. if (document.querySelector("h1 [title=doc]")) {
  1615. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1616. } else if (document.querySelector(".doc_title")) {
  1617. title = document.querySelector(".doc_title").textContent;
  1618. } else {
  1619. title = "文档";
  1620. }
  1621. return [node_list, title];
  1622. }
  1623.  
  1624.  
  1625. // 判断是否有canvas元素
  1626. function detectCanvas() {
  1627. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1628.  
  1629. // 隐藏按钮
  1630. utils.toggleBtnStatus("btn_1");
  1631. // 显示按钮
  1632. utils.toggleBtnStatus("btn_2");
  1633.  
  1634. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1635. if (!haveCanvas) {
  1636. // btn_2: 导出图片链接
  1637. utils.setBtnEvent(() => {
  1638. if (confirm("确定每页内容都加载完成了吗?")) {
  1639. utils.savePicUrls("[id*=img_]");
  1640. }
  1641. }, [], "btn_2", "导出全部图片链接");
  1642. } else {
  1643. // 显示按钮3
  1644. utils.toggleBtnStatus("btn_3");
  1645. // btn_2: 导出zip
  1646. utils.setBtnEvent(() => {
  1647. if (confirm("确定每页内容都加载完成了吗?")) {
  1648. utils.saveCanvasesToZip(...prepare());
  1649. }
  1650. }, [], "btn_2", "导出图片到zip");
  1651. // btn_3: 导出PDF
  1652. utils.setBtnEvent(() => {
  1653. if (confirm("确定每页内容都加载完成了吗?")) {
  1654. utils.saveCanvasesToPDF(...prepare());
  1655. }
  1656. }, [], "btn_3", "导出图片到PDF");
  1657. }
  1658. }
  1659.  
  1660.  
  1661. /**
  1662. * 豆丁文档下载策略
  1663. */
  1664. function docin() {
  1665. // 创建脚本启动按钮
  1666. utils.createBtns();
  1667.  
  1668. // 隐藏底部工具栏
  1669. document.querySelector("#j_select").click(); // 选择指针
  1670. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1671. tool_bar.style.display = "none";
  1672.  
  1673. // btn_1: 判断文档类型
  1674. utils.setBtnEvent(() => {
  1675. utils.forceHide(".jz_watermark");
  1676. detectCanvas();
  1677. }, [], "btn_1", "判断文档类型");
  1678. }
  1679.  
  1680. async function jumpToHost() {
  1681. // https://swf.ishare.down.sina.com.cn/1DrH4Qt2cvKd.jpg?ssig=DUf5x%2BXnKU&Expires=1673867307&KID=sina,ishare&range={}-{}
  1682. let url = wk$(".data-detail img")[0].src;
  1683. let url_obj = new URL(url);
  1684. let path = url_obj.pathname.slice(1);
  1685. let query = url_obj.search.slice(1).split("&range")[0];
  1686. let title = document.title.split(" - ")[0];
  1687. let target = `${url_obj.protocol}//${url_obj.host}?path=${path}&fname=${title}&${query}`;
  1688. // https://swf.ishare.down.sina.com.cn/
  1689. globalThis.open(target, "hostage");
  1690. // TODO: 在跳板页面发起对图片的请求
  1691. // 然后根据 magic number 拆分二进制对象
  1692. // 每个blob -> imgbitmap -> canvas
  1693. // 汇总排序 -> 用 utils.imgs2pdf
  1694. // 因为 jspdf.addimage 只要 canvas/img element
  1695. }
  1696.  
  1697.  
  1698. /**
  1699. * 爱问文库下载跳转策略
  1700. */
  1701. function ishare() {
  1702. // 创建按钮区
  1703. utils.createBtns();
  1704.  
  1705. // btn_1: 识别文档类型 -> 导出PDF
  1706. utils.setBtnEvent(jumpToHost, [], "btn_1", "到下载页面");
  1707. // btn_2: 不支持爱问办公
  1708. utils.setBtnEvent(() => null, [], "btn_2", "不支持爱问办公");
  1709. // utils.toggleBtnStatus("btn_4");
  1710. }
  1711.  
  1712. // import { jsPDF } from "../../sitepackages/jspdf.umd";
  1713.  
  1714.  
  1715. function getFname() {
  1716. return utils.getUrlParam("fname");
  1717. }
  1718.  
  1719.  
  1720. /**
  1721. * 取得图片下载地址
  1722. * @param {string} fname
  1723. * @returns
  1724. */
  1725. function getImgUrl(fname) {
  1726. if (!fname) {
  1727. throw new Error("URL Param `fname` does not exist.");
  1728. }
  1729. return location.href
  1730. .replace(/[?].+?&ssig/, "?ssig")
  1731. .replace("?", utils.getUrlParam("path") + "?");
  1732. }
  1733.  
  1734.  
  1735. /**
  1736. * 下载整个图片包
  1737. * @param {string} img_url
  1738. * @returns
  1739. */
  1740. async function getData(img_url) {
  1741. let resp = await fetch(img_url);
  1742. let buffer = await resp.arrayBuffer();
  1743. return new Uint8Array(buffer);
  1744. }
  1745.  
  1746.  
  1747. /**
  1748. * 分切图片包为若干图片
  1749. * @param {Uint8Array} data 多张图片合集数据包
  1750. * @returns {Array<Uint8Array>} 图片列表
  1751. */
  1752. function parseData(data) {
  1753. // 判断图像类型
  1754. let head = data.slice(0, 10);
  1755. // let type = getImgType(head);
  1756. let sep = head.join() + ",";
  1757. // 切断,重组,格式转换
  1758. return data.join().split(sep).slice(1).map(val => {
  1759. return new Uint8Array((sep + val).split(","));
  1760. });
  1761. }
  1762.  
  1763.  
  1764. /**
  1765. * 图像Uint8数组列表合并然后导出PDF
  1766. * @param {string} fname
  1767. * @param {Array<Uint8Array>} img_data_list
  1768. */
  1769. async function imgDataArrsToPDF(fname, img_data_list) {
  1770. let cover_blob = new Blob([img_data_list[0]]);
  1771. let cover = await createImageBitmap(cover_blob);
  1772.  
  1773. utils.saveCanvasesToPDF(
  1774. img_data_list,
  1775. fname,
  1776. cover.width,
  1777. cover.height
  1778. );
  1779. }
  1780.  
  1781.  
  1782. async function exportPDF() {
  1783. let fname = getFname();
  1784. let img_url = getImgUrl(fname);
  1785. let data = await getData(img_url);
  1786. let img_data_list = parseData(data);
  1787. await imgDataArrsToPDF(fname, img_data_list);
  1788. }
  1789.  
  1790.  
  1791. function showHints() {
  1792. wk$("h1")[0].textContent = "wk 温馨提示";
  1793. wk$("p")[0].innerHTML = [
  1794. "下载 270 页的 PPT (70 MB) 需要约 30 秒",
  1795. "请耐心等待,无需反复点击按钮",
  1796. "如果很久没反应,请加 QQ 群反馈问题"
  1797. ].join("<br>");
  1798. wk$("hr")[0].nextSibling.textContent = "404 Page Hostaged By Wenku Doc Downloader";
  1799. }
  1800.  
  1801.  
  1802. /**
  1803. * 爱问文库下载策略
  1804. */
  1805. async function ishareData() {
  1806. // 显示提示
  1807. showHints();
  1808.  
  1809. // 创建按钮区
  1810. utils.createBtns();
  1811.  
  1812. // btn_1: 识别文档类型 -> 导出PDF
  1813. exportPDF = await utils.recTime(exportPDF);
  1814. utils.setBtnEvent(exportPDF, [], "btn_1", "下载并导出PDF");
  1815. }
  1816.  
  1817. /**
  1818. * 清理并打印得力文库的文档页
  1819. */
  1820. function printPageDeliwenku() {
  1821. // 移除页面上的无关元素
  1822. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1823. let elem_list = document.querySelectorAll(selector);
  1824. for (let elem of elem_list) {
  1825. utils.tryToRemoveElement(elem);
  1826. }
  1827. // 修改页间距
  1828. let outer_pages = document.getElementsByClassName("outer_page");
  1829. for (let page of outer_pages) {
  1830. page.style.marginBottom = "20px";
  1831. }
  1832. // 使文档居中
  1833. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1834. if (!utils.centerDoc("#boxleft", "3")) {
  1835. return; // 如果输入非法,终止函数调用
  1836. }
  1837. // 打印文档
  1838. utils.hideBtnThenPrint();
  1839. }
  1840.  
  1841.  
  1842. /**
  1843. * 点击“继续阅读”,适用性:得力文库
  1844. */
  1845. function readAllDeliwenku() {
  1846. // 点击“同意并开始预览全文”
  1847. let start_btn = document.getElementsByClassName("pre_button")[0];
  1848. let display = start_btn.parentElement.parentElement.style.display;
  1849. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1850. if (!display) {
  1851. start_btn.children[0].click();
  1852. setTimeout(() => {
  1853. scroll(0, document.body.scrollHeight);
  1854. }, 200);
  1855. return;
  1856. }
  1857. // 增强按钮点击效果
  1858. utils.enhanceBtnClickReaction();
  1859.  
  1860. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1861. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1862. // 继续阅读
  1863. if (display2 !== "none") {
  1864. // 获取input元素
  1865. let cur_page = document.querySelector("#pageNumInput");
  1866. let page_old = cur_page.value;
  1867. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1868. // 跳转到尾页
  1869. utils.jump2pageNo(cur_page, page_max, "keydown");
  1870. // 跳转回来
  1871. utils.jump2pageNo(cur_page, page_old, "keydown");
  1872.  
  1873. // 切换按钮准备导出
  1874. } else {
  1875. // 推荐导出图片链接
  1876. utils.modifyBtnText("btn_2", null, true);
  1877. // 隐藏按钮
  1878. utils.toggleBtnStatus("btn_1");
  1879. // 显示按钮
  1880. utils.toggleBtnStatus("btn_2");
  1881. utils.toggleBtnStatus("btn_3");
  1882. // btn_3 橙色按钮
  1883. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1884. }
  1885. }
  1886.  
  1887.  
  1888. /**
  1889. * 得力文库文档下载策略
  1890. */
  1891. function deliwenku() {
  1892. // 创建脚本启动按钮1、2
  1893. utils.createBtns();
  1894.  
  1895. // btn_1: 展开文档
  1896. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1897. // btn_2: 导出图片链接
  1898. utils.setBtnEvent(() => {
  1899. if (confirm("确定每页内容都加载完成了吗?")) {
  1900. utils.savePicUrls('.inner_page div');
  1901. }
  1902. }, [], "btn_2", "导出图片链接");
  1903.  
  1904. // 尝试关闭页面弹窗
  1905. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1906. // 解除打印限制
  1907. utils.allowPrint();
  1908. }
  1909.  
  1910. function readAll360Doc() {
  1911. // 展开文档
  1912. document.querySelector(".article_showall a").click();
  1913. // 隐藏按钮
  1914. utils.toggleBtnStatus("btn_1");
  1915. // 显示按钮
  1916. utils.toggleBtnStatus("btn_2");
  1917. utils.toggleBtnStatus("btn_3");
  1918. }
  1919.  
  1920.  
  1921. function saveText_360Doc() {
  1922. // 捕获图片链接
  1923. let images = document.querySelectorAll("#artContent img");
  1924. let content = [];
  1925.  
  1926. for (let i = 0; i < images.length; i++) {
  1927. let src = images[i].src;
  1928. content.push(`图${i+1},链接:${src}`);
  1929. }
  1930. // 捕获文本
  1931. let text = document.querySelector("#artContent").textContent;
  1932. content.push(text);
  1933.  
  1934. // 保存纯文本文档
  1935. let title = document.querySelector("#titiletext").textContent;
  1936. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1937. }
  1938.  
  1939.  
  1940. function printPage360Doc() {
  1941. // # 清理并打印360doc的文档页
  1942. // ## 移除页面上无关的元素
  1943. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1944. let elem_list = document.querySelectorAll(selector);
  1945. let under_doc_1, under_doc_2;
  1946. try {
  1947. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1948. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1949. } catch (e) { console.log(); }
  1950. // 执行移除
  1951. for (let elem of elem_list) {
  1952. utils.tryToRemoveElement(elem);
  1953. }
  1954. utils.tryToRemoveElement(under_doc_1);
  1955. utils.tryToRemoveElement(under_doc_2);
  1956. // 执行隐藏
  1957. document.querySelector("a[title]").style.display = "none";
  1958.  
  1959. // 使文档居中
  1960. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1961. if (!utils.centerDoc(".a_left", "20")) {
  1962. return; // 如果输入非法,终止函数调用
  1963. }
  1964. // 隐藏按钮,然后打印页面
  1965. utils.hideBtnThenPrint();
  1966. }
  1967.  
  1968.  
  1969. /**
  1970. * 360doc个人图书馆下载策略
  1971. */
  1972. function doc360() {
  1973. // 创建按钮区
  1974. utils.createBtns();
  1975. // btn_1: 展开文档
  1976. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1977. // btn_2: 导出纯文本
  1978. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1979. // btn_3: 打印页面到PDF
  1980. utils.setBtnEvent(() => {
  1981. if (confirm("确定每页内容都加载完成了吗?")) {
  1982. printPage360Doc();
  1983. }
  1984. }, [], "btn_3", "打印页面到PDF");
  1985. }
  1986.  
  1987. /**
  1988. * 查找出所有未被捕获的页码,并返回列表
  1989. * @returns 未捕获页码列表
  1990. */
  1991. function getMissedPages() {
  1992. let all = []; // 全部页码
  1993. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1994. all[i] = i + 1;
  1995. }
  1996. let missed = []; // 未捕获页码
  1997. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1998.  
  1999. // 排除并录入未捕获页码
  2000. for (let num of all) {
  2001. if (!possessed.includes(`page${num}`)) {
  2002. missed.push(num);
  2003. }
  2004. }
  2005. return missed;
  2006. }
  2007.  
  2008.  
  2009. /**
  2010. * 根据键中的id数字对map排序
  2011. * @param {Map} elems_map
  2012. * @returns sorted_map
  2013. */
  2014. function sortMapByID(elems_map) {
  2015. // id形式:page2
  2016. let elems_arr = Array.from(elems_map);
  2017. elems_arr.sort((item1, item2) => {
  2018. // 从key中取出id
  2019. let id1 = parseInt(item1[0].replace("page", ""));
  2020. let id2 = parseInt(item2[0].replace("page", ""));
  2021. // 升序排序
  2022. return id1 - id2;
  2023. });
  2024. // 返回排序好的map
  2025. return new Map(elems_arr);
  2026. }
  2027.  
  2028.  
  2029. /**
  2030. * 存储动态加载的canvas元素、textContent
  2031. */
  2032. function storeElements_MBA() {
  2033. let canvases_map = window.mbaJS.canvases_map;
  2034. let texts_map = window.mbaJS.texts_map;
  2035. let quality = window.mbaJS.quality;
  2036.  
  2037. document.querySelectorAll(".page[data-loaded=true]").forEach(
  2038. (elem) => {
  2039. let capture = (elem) => {
  2040. // (1) 存储页面为canvas图形
  2041. let canvas, data_base64;
  2042. // 导出canvas数据防止丢失
  2043. try {
  2044. // 存储canvas
  2045. canvas = elem.querySelector("canvas[id*=page]");
  2046. if (window.mbaJS.only_text) {
  2047. data_base64 = null;
  2048. } else {
  2049. data_base64 = canvas.toDataURL("image/jpeg", quality);
  2050. }
  2051. } catch (e) {
  2052. // utils.sleep(500);
  2053. return;
  2054. }
  2055. // 增量录入map
  2056. let id = canvas.id; // id的形式:page2
  2057. if (!canvases_map.has(id)) {
  2058. canvases_map.set(id, data_base64);
  2059. }
  2060. // 确定canvas长宽
  2061. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  2062. window.mbaJS.width = parseInt(canvas.width);
  2063. window.mbaJS.height = parseInt(canvas.height);
  2064. }
  2065.  
  2066. // (2) 存储text
  2067. let text = elem.textContent;
  2068. if (!texts_map.has(id)) {
  2069. texts_map.set(id, text);
  2070. }
  2071. };
  2072. setTimeout(capture, 500, elem);
  2073. });
  2074. if (canvases_map.size === window.mbaJS.max_page) {
  2075. // 根据id排序
  2076. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  2077. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  2078. window.mbaJS.finished = true;
  2079. window.onscroll = null;
  2080. }
  2081. }
  2082.  
  2083.  
  2084. /**
  2085. * 将canvas转为jpeg,然后导出PDF
  2086. * @param {Array} base64_list canvas元素列表
  2087. * @param {String} title 文档标题
  2088. */
  2089. function saveCanvasesToPDF_MBA(base64_list, title) {
  2090. let width = window.mbaJS.width;
  2091. let height = window.mbaJS.height;
  2092.  
  2093. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  2094. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  2095. let orientation = width > height ? 'l' : 'p';
  2096. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  2097.  
  2098. // 保存每一页文档到每一页pdf
  2099. let i = 0;
  2100. for (let base64 of base64_list) {
  2101. i += 1;
  2102. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  2103. // 如果当前不是文档最后一页,则需要添加下一个空白页
  2104. if (i < window.mbaJS.max_page) {
  2105. pdf.addPage();
  2106. }
  2107. }
  2108. // 导出文件
  2109. pdf.save(`${title}.pdf`);
  2110. }
  2111.  
  2112. /**
  2113. * 判断文档页是否收集完毕,当不行时给出提示
  2114. * @returns boolean
  2115. */
  2116. function ready2use() {
  2117. removeAds(); // 顺便清理广告
  2118. // 如果是首次点击按钮,给出提示
  2119. if (window.mbaJS.first_hint) {
  2120. let hint = [
  2121. "如果浏览速度过快,比如:",
  2122. "当前页面还没完全加载好就滚动页面去看下一页",
  2123. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  2124. "由防范技术的干扰,该功能目前很不好用,见谅"
  2125. ].join("\n");
  2126. alert(hint);
  2127. window.mbaJS.first_hint = false;
  2128. }
  2129. // 如果文档页没有收集完,给出提示
  2130. if (!window.mbaJS.finished) {
  2131. let hint = [
  2132. "仍有内容未加载完,无法使用该功能",
  2133. "建议从头到尾慢速地再浏览一遍",
  2134. "以下是没有加载完成页面的页码:",
  2135. getMissedPages().join(",")
  2136. ];
  2137. alert(hint.join("\n"));
  2138. return false;
  2139. }
  2140. return true;
  2141. }
  2142.  
  2143.  
  2144. /**
  2145. * 用捕获好的canvas转jpg,生成PDF
  2146. * @returns
  2147. */
  2148. function canvas2PDF_mba() {
  2149. if (!ready2use()) {
  2150. return;
  2151. }
  2152. let canvases = window.mbaJS.canvases_map.values();
  2153. // 导出PDF
  2154. let title = document.title.split("-")[0].trim();
  2155. saveCanvasesToPDF_MBA(canvases, title);
  2156. }
  2157.  
  2158.  
  2159. /**
  2160. * 拼合捕获好的文本,保存到txt文件
  2161. * @returns
  2162. */
  2163. function saveText_mba() {
  2164. if (!ready2use()) {
  2165. return;
  2166. }
  2167. let content = Array.from(window.mbaJS.texts_map.values());
  2168. let title = document.title.split("-")[0].trim();
  2169. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  2170. }
  2171.  
  2172.  
  2173. /**
  2174. * 移除广告
  2175. */
  2176. function removeAds() {
  2177. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  2178. utils.tryToRemoveElement(ad_elem);
  2179. });
  2180. }
  2181.  
  2182.  
  2183. function mbalib_() {
  2184. // 移除广告和左侧工具栏
  2185. removeAds();
  2186. let tool_bar = document.querySelector(".tool-bar");
  2187. utils.tryToRemoveElement(tool_bar);
  2188.  
  2189. // 创建按钮
  2190. utils.createBtns();
  2191. // 隐藏按钮
  2192. utils.toggleBtnStatus("btn_1");
  2193. // 显示按钮
  2194. utils.toggleBtnStatus("btn_2");
  2195. utils.toggleBtnStatus("btn_3");
  2196. utils.toggleBtnStatus("btn_4");
  2197.  
  2198. // 取得页数
  2199. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  2200. let quality = utils.getQualityByCanvasAmount(max_page);
  2201.  
  2202. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  2203. window.mbaJS = {
  2204. max_page: max_page,
  2205. texts_map: new Map(), // id: text
  2206. canvases_map: new Map(), // id: canvas_data_base64
  2207. quality: quality, // canvas转jpg的质量
  2208. width: null, // canvas宽度(px)
  2209. height: null,
  2210. finished: false, // 是否收集完了全部文档页元素
  2211. first_hint: true,
  2212. scroll_count: 0, // 用于统计累计触发scroll的次数,
  2213. only_text: false // 是否仅捕获文本
  2214. };
  2215. // 跟随浏览,动态收集页面元素
  2216. window.onscroll = () => {
  2217. storeElements_MBA();
  2218. };
  2219. // 跟随浏览,动态收集页面元素
  2220. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2221. // 绑定事件
  2222. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2223. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2224.  
  2225. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2226. let btn_text, aim_btn, hint;
  2227. if (max_page > 40) {
  2228. btn_text = "失效说明";
  2229. aim_btn = "btn_3";
  2230. hint = [
  2231. "页数超过40,脚本无效",
  2232. "只能使用导出文本功能",
  2233. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2234. ];
  2235. utils.setBtnEvent(
  2236. () => {
  2237. utils.toggleBtnsSec();
  2238. window.onscroll = null;
  2239. },
  2240. [],
  2241. "btn_4",
  2242. "临时禁用脚本"
  2243. );
  2244. } else {
  2245. btn_text = "空白页说明";
  2246. aim_btn = "btn_4";
  2247. hint = [
  2248. "导致空白页的原因如下",
  2249. "加载该页的时间超过2秒 / 明显等待",
  2250. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2251. ];
  2252. }
  2253.  
  2254. utils.setBtnEvent(() => {
  2255. alert(hint.join("\n"));
  2256. }, [], aim_btn, btn_text);
  2257. }
  2258.  
  2259.  
  2260. function mbalib() {
  2261. setTimeout(mbalib_, 2000);
  2262. }
  2263.  
  2264. /**
  2265. * 判断是否进入预览模式
  2266. * @returns Boolean
  2267. */
  2268. function isInPreview() {
  2269. let p_elem = document.querySelector("#preview_tips");
  2270. if (p_elem.style.display === "none") {
  2271. return true;
  2272. }
  2273. return false;
  2274. }
  2275.  
  2276.  
  2277. /**
  2278. * 判断是否展开了全文
  2279. * @returns Boolean
  2280. */
  2281. function isNoMorePage() {
  2282. let read_more = document.querySelector("#ntip2");
  2283. if (read_more.style.display === "none") {
  2284. return true;
  2285. }
  2286. return false;
  2287. }
  2288.  
  2289.  
  2290. /**
  2291. * 确保进入预览模式
  2292. */
  2293. function ensureInPreview() {
  2294. if (!isInPreview()) {
  2295. // 如果没有进入预览,则先进入
  2296. document.querySelector(".pre_button a").click();
  2297. utils.sleep(500);
  2298. }
  2299. }
  2300.  
  2301.  
  2302. /**
  2303. * 展开全文预览,当展开完成后再次调用时,返回true
  2304. * @returns
  2305. */
  2306. function unfoldAll() {
  2307. ensureInPreview();
  2308. if (isNoMorePage()) {
  2309. // 如果全文展开了,则切换按钮,然后退出
  2310. utils.toggleBtnStatus("btn_1");
  2311. utils.toggleBtnStatus("btn_2");
  2312. return true;
  2313. }
  2314. // 跳转到最后一页,以展开全文
  2315. let cur_page = document.querySelector("#pageNumInput");
  2316. utils.jump2pageNo(cur_page, "999", "keydown");
  2317. }
  2318.  
  2319.  
  2320. /**
  2321. * 取得最大页码(最大20)
  2322. * @returns {Number} 页码int
  2323. */
  2324. function getPageCounts$2() {
  2325. let counts_str = document.querySelector(".counts").textContent;
  2326. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2327. if (counts > 20) {
  2328. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2329. }
  2330. return parseInt(counts);
  2331. }
  2332.  
  2333.  
  2334. /**
  2335. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2336. * @returns Array | null
  2337. */
  2338. function getImgUrls() {
  2339. let pages = document.querySelectorAll("[id*=pageflash_]");
  2340. // 尚未浏览完全部页面,返回null
  2341. if (pages.length < window.dugenJS.page_counts) {
  2342. return null;
  2343. }
  2344. // 浏览完全部页面,返回urls
  2345. let urls = [];
  2346. pages.forEach((page) => {
  2347. let url = page.querySelector("img").src;
  2348. urls.push(url);
  2349. });
  2350. return urls;
  2351. }
  2352.  
  2353.  
  2354. /**
  2355. * 返回当前未加载页面的页码
  2356. * @returns not_loaded
  2357. */
  2358. function getNotloadedPages() {
  2359. // 已经取得的页码
  2360. let pages = document.querySelectorAll("[id*=pageflash_]");
  2361. let loaded = new Set();
  2362. pages.forEach((page) => {
  2363. let id = page.id.split("_")[1];
  2364. id = parseInt(id);
  2365. loaded.add(id);
  2366. });
  2367. // 未取得的页码
  2368. let not_loaded = [];
  2369. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2370. if (!loaded.has(i)) {
  2371. not_loaded.push(i);
  2372. }
  2373. }
  2374. return not_loaded;
  2375. }
  2376.  
  2377.  
  2378. function WantImgUrls() {
  2379. let res = getImgUrls();
  2380. // 页面尚未加载完
  2381. if (res === null) {
  2382. let hints = [
  2383. "尚未加载完全部页面",
  2384. "以下页面需要浏览并加载:",
  2385. getNotloadedPages().join(",")
  2386. ];
  2387. alert(hints.join("\n"));
  2388. return;
  2389. }
  2390. // 页面全部加载完
  2391. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2392. }
  2393.  
  2394.  
  2395. /**
  2396. * dugen文档下载策略
  2397. */
  2398. function dugen() {
  2399. ensureInPreview();
  2400. // 全局对象
  2401. window.dugenJS = {
  2402. page_counts: getPageCounts$2() // 最大页码(int)
  2403. };
  2404.  
  2405. // 创建按钮区
  2406. utils.createBtns();
  2407.  
  2408. // 绑定监听器
  2409. // 按钮1:展开文档
  2410. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2411. // 按钮2:导出图片链接
  2412. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2413. }
  2414.  
  2415. /**
  2416. * 取得文档类型
  2417. * @returns {String} 文档类型str
  2418. */
  2419. function getDocType() {
  2420. let type_elem = document.querySelector(".title .icon.icon-format");
  2421. // ["icon", "icon-format", "icon-format-doc"]
  2422. let cls_str = type_elem.classList[2];
  2423. // "icon-format-doc"
  2424. let type = cls_str.split("-")[2];
  2425. return type;
  2426. }
  2427.  
  2428.  
  2429. /**
  2430. * 判断文档类型是否为type_list其中之一
  2431. * @returns 是否为type
  2432. */
  2433. function isTypeof(type_list) {
  2434. let type = getDocType();
  2435. if (type_list.includes(type)) {
  2436. return true;
  2437. }
  2438. return false;
  2439. }
  2440.  
  2441.  
  2442. /**
  2443. * 判断文档类型是否为PPT
  2444. * @returns 是否为PPT
  2445. */
  2446. function isPPT() {
  2447. return isTypeof(["ppt", "pptx"]);
  2448. }
  2449.  
  2450.  
  2451. /**
  2452. * 判断文档类型是否为Excel
  2453. * @returns 是否为Excel
  2454. */
  2455. function isEXCEL() {
  2456. return isTypeof(["xls", "xlsm", "xlsx"]);
  2457. }
  2458.  
  2459.  
  2460. /**
  2461. * 取得最大页码
  2462. * @returns {Number} 最大页码
  2463. */
  2464. function getPageCounts$1() {
  2465. let page_counts_str = document.querySelector(".intro-list").textContent;
  2466. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2467. return page_counts;
  2468. }
  2469.  
  2470.  
  2471. /**
  2472. * 取得未加载页面的页码
  2473. * @param {Set} loaded 已加载的页码集合
  2474. * @returns {Array} not_loaded 未加载页码列表
  2475. */
  2476. function getNotLoaded(loaded) {
  2477. let not_loaded = [];
  2478. let page_counts = window.book118JS.page_counts;
  2479. for (let i = 1; i <= page_counts; i++) {
  2480. if (!loaded.has(i)) {
  2481. not_loaded.push(i);
  2482. }
  2483. }
  2484. return not_loaded;
  2485. }
  2486.  
  2487.  
  2488. /**
  2489. * 取得全部文档页的url
  2490. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2491. */
  2492. function getUrls() {
  2493. let loaded = new Set(); // 存储已加载页面的页码
  2494. let urls = []; // 存储已加载页面的图形src
  2495. // 收集已加载页面的url
  2496. document.querySelectorAll("div[data-id]").forEach((div) => {
  2497. let src = div.querySelector("img").src;
  2498. if (src) {
  2499. // "1": "https://view-cache.book118.com/..."
  2500. loaded.add(parseInt(div.getAttribute("data-id")));
  2501. urls.push(src);
  2502. }
  2503. });
  2504. // 如果所有页面加载完毕
  2505. if (loaded.size === window.book118JS.page_counts) {
  2506. return [true, urls];
  2507. }
  2508. // 否则收集未加载页面的url
  2509. return [false, getNotLoaded(loaded)];
  2510. }
  2511.  
  2512.  
  2513. /**
  2514. * 展开全文
  2515. */
  2516. function readAll() {
  2517. window.preview.jump(999);
  2518. }
  2519.  
  2520.  
  2521. /**
  2522. * btn_2: 导出图片链接
  2523. */
  2524. function wantUrls() {
  2525. let [flag, res] = getUrls();
  2526. // 页面都加载完毕,下载urls
  2527. if (flag) {
  2528. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2529. return;
  2530. }
  2531. // 没有加载完,提示出未加载好的页码
  2532. let hints = [
  2533. "仍有页面没有加载",
  2534. "请浏览并加载如下页面:",
  2535. res.join(",")
  2536. ];
  2537. alert(hints.join("\n"));
  2538. }
  2539.  
  2540.  
  2541. /**
  2542. * 打开PPT预览页面
  2543. */
  2544. function openPPTpage() {
  2545. window.preview.getSrc();
  2546. let openPPT = () => {
  2547. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2548. utils.openInNewTab(ppt_src);
  2549. window.preview.close();
  2550. };
  2551. setTimeout(openPPT, 1000);
  2552. }
  2553.  
  2554.  
  2555. /**
  2556. * 原创力文档(非PPT或Excel)下载策略
  2557. */
  2558. function book118_CommonDoc() {
  2559. // 创建全局对象
  2560. window.book118JS = {
  2561. doc_type: getDocType(),
  2562. page_counts: getPageCounts$1()
  2563. };
  2564.  
  2565. // 处理非PPT文档
  2566. // 创建按钮组
  2567. utils.createBtns();
  2568. // 绑定监听器到按钮
  2569. // 按钮1:展开文档
  2570. utils.setBtnEvent(() => {
  2571. readAll();
  2572. utils.toggleBtnStatus("btn_1");
  2573. utils.toggleBtnStatus("btn_2");
  2574. }, [], "btn_1");
  2575. // 按钮2:导出图片链接
  2576. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2577. }
  2578.  
  2579.  
  2580. /**
  2581. * 取得PPT文档最大页码
  2582. * @returns PPT文档最大页码int
  2583. */
  2584. function getPageCountsPPT() {
  2585. let counts_str = document.querySelector("#PageCount").textContent;
  2586. let counts = parseInt(counts_str);
  2587. // console.log(`get page counts: ${counts}`);
  2588. return counts;
  2589. }
  2590.  
  2591.  
  2592. /**
  2593. * 取得当前的页码
  2594. * @returns {Number} this_page
  2595. */
  2596. function getThisPage() {
  2597. let this_page = document.querySelector("#PageIndex").textContent;
  2598. this_page = parseInt(this_page);
  2599. return this_page;
  2600. }
  2601.  
  2602.  
  2603. /**
  2604. * 点击下一动画直到变成下一页,再切回上一页
  2605. * @param {Number} next_page 下一页的页码
  2606. */
  2607. async function __nextFrameUntillNextPage(next_page) {
  2608. // 如果已经抵达下一页,则返回上一页
  2609. let this_page = getThisPage();
  2610.  
  2611. // 最后一页直接退出
  2612. if (next_page > getPageCountsPPT()) {
  2613. return;
  2614. }
  2615. // 不是最后一页,但完成了任务
  2616. else if (this_page === next_page) {
  2617. document.querySelector(".btmLeft").click();
  2618. await utils.sleepAsync(500);
  2619. return;
  2620. }
  2621. // 否则递归的点击下一动画
  2622. document.querySelector(".btmRight").click();
  2623. await utils.sleepAsync(500);
  2624. await __nextFrameUntillNextPage(next_page);
  2625. }
  2626.  
  2627.  
  2628. /**
  2629. * 确保当前页面是最后一帧动画
  2630. */
  2631. async function ensurePageLoaded() {
  2632. // 取得当前页码和下一页页码
  2633. let this_page = getThisPage();
  2634. let next_page = this_page + 1;
  2635. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2636. await __nextFrameUntillNextPage(next_page);
  2637. }
  2638.  
  2639.  
  2640. /**
  2641. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2642. */
  2643. async function docView2Canvas() {
  2644. await ensurePageLoaded();
  2645. // 取得页码
  2646. let cur_page = getThisPage();
  2647. // 取得视图元素,计数从0开始
  2648. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2649. // 转化为canvas
  2650. let canvas_promise = html2canvas(doc_view);
  2651. console.log(canvas_promise); // 打印信息以检查状况
  2652.  
  2653. await canvas_promise.then((canvas) => {
  2654. // 保存canvas到全局对象
  2655. window.book118JS.canvases.push(canvas);
  2656. // 打印日志
  2657. console.log(`wk: ${cur_page} complete`);
  2658. });
  2659.  
  2660. // 如果到最后一页
  2661. let page_counts = getPageCountsPPT();
  2662. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2663. if (cur_page === page_counts) {
  2664. // 终止递归,并且显示导出PDF按钮
  2665. utils.toggleBtnStatus("btn_2");
  2666. return;
  2667. }
  2668. // 否则下一次递归(继续捕获下一页)
  2669. document.querySelector(".pgRight").click();
  2670. await utils.sleepAsync(500);
  2671. await docView2Canvas();
  2672. }
  2673.  
  2674.  
  2675. /**
  2676. * 将捕获的canvases合并并导出为pdf
  2677. * @returns
  2678. */
  2679. function canvases2pdf() {
  2680. // 已经捕获的页面数量
  2681. let stored_amount = window.book118JS.canvases.length;
  2682. // 总页面数量
  2683. let page_counts = window.book118JS.page_counts;
  2684. // 校验数量
  2685. let diff = page_counts - stored_amount;
  2686. if (diff > 0) {
  2687. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2688. if (!confirm("是否仍要导出PDF?")) {
  2689. // 不坚持导出PDF的情况
  2690. return;
  2691. }
  2692. }
  2693. // 导出PDF
  2694. let canvases = window.book118JS.canvases;
  2695. // 取得宽高
  2696. let model = canvases[0];
  2697. let width = model.width;
  2698. let height = model.height;
  2699. // 取得标题然后导出pdf
  2700. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2701. }
  2702.  
  2703.  
  2704. /**
  2705. * 原创力文档(PPT)下载策略
  2706. */
  2707. function book118_PPT() {
  2708. // 创建全局对象
  2709. window.book118JS = {
  2710. page_counts: getPageCountsPPT(),
  2711. canvases: [] // 存储每页文档转化的canvas
  2712. };
  2713.  
  2714. // 创建按钮区
  2715. utils.createBtns();
  2716. // 绑定监听器到按钮1
  2717. utils.setBtnEvent(() => {
  2718. let hints = [
  2719. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2720. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2721. ];
  2722. alert(hints.join("\n"));
  2723. // 隐藏按钮1
  2724. utils.toggleBtnStatus("btn_1");
  2725. // 开始捕获页面(异步)
  2726. docView2Canvas(window.book118JS.page_counts);
  2727. }, [], "btn_1", "捕获页面");
  2728. // 为按钮2绑定监听器
  2729. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2730. }
  2731.  
  2732.  
  2733. /**
  2734. * 取得当前页面的excel,返回csv string
  2735. * @returns {String} csv
  2736. */
  2737. function excel2CSV() {
  2738. let table = [];
  2739. let rows = document.querySelectorAll("tr[id]");
  2740.  
  2741. // 遍历行
  2742. for (let row of rows) {
  2743. let csv_row = [];
  2744. // 遍历列(单元格)
  2745. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2746. // 判断单元格是否存储图片
  2747. let img = cell.querySelector("img");
  2748. if (img) {
  2749. // 如果是图片,保存图片链接
  2750. csv_row.push(img.src);
  2751. } else {
  2752. // 否则保存单元格文本
  2753. csv_row.push(cell.textContent);
  2754. }
  2755. }
  2756. table.push(csv_row.join(","));
  2757. }
  2758.  
  2759. let csv = table.join("\n");
  2760. csv = csv.replace(/\n{2,}/g, "\n");
  2761. return csv;
  2762. }
  2763.  
  2764.  
  2765. /**
  2766. * 下载当前表格内容,保存为csv(utf-8编码)
  2767. */
  2768. function wantEXCEL() {
  2769. let file_name = "原创力表格_UTF-8.csv";
  2770. utils.createAndDownloadFile(file_name, excel2CSV());
  2771. }
  2772.  
  2773.  
  2774. /**
  2775. * 在Excel预览页面给出操作提示
  2776. */
  2777. function help() {
  2778. let hints = [
  2779. "【导出表格到CSV】只能导出当前sheet,",
  2780. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2781. "CSV是一种简单的表格格式,可以被Excel打开,",
  2782. "并转为 xls 或 xlsx 格式存储,",
  2783. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2784. "",
  2785. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2786. "有两个办法:",
  2787. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2788. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2789. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2790. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2791. ];
  2792. alert(hints.join("\n"));
  2793. }
  2794.  
  2795.  
  2796. /**
  2797. * 原创力文档(EXCEL)下载策略
  2798. */
  2799. function book118_EXCEL() {
  2800. // 创建按钮区
  2801. utils.createBtns();
  2802. // 绑定监听器到按钮
  2803. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2804. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2805. // 显示按钮
  2806. utils.toggleBtnStatus("btn_2");
  2807. }
  2808.  
  2809.  
  2810. /**
  2811. * 打开Excel预览页面
  2812. */
  2813. function openEXCELpage() {
  2814. openPPTpage();
  2815. }
  2816.  
  2817.  
  2818. /**
  2819. * 原创力文档下载策略
  2820. */
  2821. function book118() {
  2822. let host = window.location.hostname;
  2823. if (host === 'max.book118.com') {
  2824. if (isEXCEL()) {
  2825. utils.createBtns();
  2826. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2827. } else if (isPPT()) {
  2828. utils.createBtns();
  2829. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2830. } else {
  2831. book118_CommonDoc();
  2832. }
  2833. } else if (host === "view-cache.book118.com") {
  2834. book118_PPT();
  2835. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2836. book118_EXCEL();
  2837. } else {
  2838. console.log(`wk: Unknown host: ${host}`);
  2839. }
  2840. }
  2841.  
  2842. // test url: https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=E86BBCE32DA8E67F3DA04ED98F2465DB
  2843.  
  2844.  
  2845. /**
  2846. * 绘制0x0的bmp, 作为请求失败时返回的page
  2847. * @returns {Promise<ImageBitmap>} blank_page
  2848. */
  2849. async function blankBMP() {
  2850. let canvas = document.createElement("canvas");
  2851. [canvas.width, canvas.height] = [0, 0];
  2852. return createImageBitmap(canvas);
  2853. }
  2854.  
  2855.  
  2856. /**
  2857. * resp导出bmp
  2858. * @param {string} page_url
  2859. * @param {Promise<Response> | ImageBitmap} pms_or_bmp
  2860. * @returns {Promise<ImageBitmap>} page
  2861. */
  2862. async function respToPage(page_url, pms_or_bmp) {
  2863. let center = globalThis.gb688JS;
  2864. // 此时是bmp
  2865. if (pms_or_bmp instanceof ImageBitmap) {
  2866. return pms_or_bmp;
  2867. }
  2868.  
  2869. // 第一次下载, 且无人处理
  2870. if (!center.pages_status.get(page_url)) {
  2871. // 处理中, 设为占用
  2872. center.pages_status.set(page_url, 1);
  2873.  
  2874. // 处理
  2875. let resp;
  2876. try {
  2877. resp = await pms_or_bmp;
  2878. } catch(err) {
  2879. console.log("下载页面失败");
  2880. console.error(err);
  2881. return blankBMP();
  2882. }
  2883.  
  2884. let page_blob = await resp.blob();
  2885. let page = await createImageBitmap(page_blob);
  2886. center.pages.set(page_url, page);
  2887. // 处理结束, 设为释放
  2888. center.pages_status.set(page_url, 0);
  2889. return page;
  2890. }
  2891.  
  2892. // 有人正在下载且出于处理中
  2893. while (center.pages_status.get(page_url)) {
  2894. await utils.sleepAsync(500);
  2895. }
  2896. return center.pages.get(page_url);
  2897. }
  2898.  
  2899.  
  2900. /**
  2901. * 获得PNG页面
  2902. * @param {string} page_url
  2903. * @returns {Promise<ImageBitmap>} bmp
  2904. */
  2905. async function getPage(page_url) {
  2906. // 如果下载过, 直接返回缓存
  2907. let pages = globalThis.gb688JS.pages;
  2908. if (pages.has(page_url)) {
  2909. return respToPage(page_url, pages.get(page_url));
  2910. }
  2911.  
  2912. // 如果从未下载过, 就下载
  2913. let resp = fetch(page_url, {
  2914. "headers": {
  2915. "accept": "image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8",
  2916. "accept-language": "zh-CN,zh;q=0.9,en;q=0.8",
  2917. "proxy-connection": "keep-alive"
  2918. },
  2919. "referrer": location.href,
  2920. "referrerPolicy": "strict-origin-when-cross-origin",
  2921. "body": null,
  2922. "method": "GET",
  2923. "mode": "cors",
  2924. "credentials": "include"
  2925. });
  2926. pages.set(page_url, resp);
  2927. return respToPage(page_url, resp);
  2928. }
  2929.  
  2930.  
  2931. /**
  2932. * 返回文档页div的裁切和粘贴位置信息: [[cut_x, cut_y, paste_x%, paset_y%],...]
  2933. * @param {HTMLDivElement} page_div 文档页元素
  2934. * @returns {Array<Array<number>>} positions
  2935. */
  2936. function getPostions(page_div) {
  2937. let positions = [];
  2938.  
  2939. Array.from(page_div.children).forEach(span => {
  2940. // 'pdfImg-3-8' -> {left: 30%; top: 80%;}
  2941. let paste_pos = span.className.split("-").slice(1).map(
  2942. v => parseInt(v) / 10
  2943. );
  2944. // '-600px 0px' -> [600, 0]
  2945. let cut_pos = span.style.backgroundPosition.split(" ").map(
  2946. v => Math.abs(parseInt(v))
  2947. );
  2948. positions.push([...cut_pos, ...paste_pos]);
  2949. });
  2950. return positions;
  2951. }
  2952.  
  2953.  
  2954. /**
  2955. * 取得文档页的图像url
  2956. * @param {HTMLDivElement} page_div
  2957. * @returns {string} url
  2958. */
  2959. function getPageURL(page_div) {
  2960. // 拿到目标图像url
  2961. let path = location.pathname.split("/").slice(0, -1).join("/");
  2962. let prefix = location.origin + path + "/";
  2963. let url = page_div.getAttribute("bg");
  2964. if (!url) {
  2965. // 'url("viewGbImg?fileName=VS72l67k0jw5g3j0vErP8DTsnWvk5QsqnNLLxaEtX%2FM%3D")'
  2966. url = page_div.children[0].style.backgroundImage.split('"')[1];
  2967. }
  2968. return prefix + url;
  2969. }
  2970.  
  2971.  
  2972. /**
  2973. * 下载目标图像并拆解重绘, 返回canvas
  2974. * @param {number} i 第 i 页 (从0开始)
  2975. * @param {HTMLDivElement} page_div
  2976. * @returns {Promise<Array>} [页码, Canvas]
  2977. */
  2978. async function getAndDrawPage(i, page_div) {
  2979. // 拿到目标图像
  2980. let url = getPageURL(page_div);
  2981. let page = await getPage(url);
  2982.  
  2983. // 绘制空白A4纸背景
  2984. let [page_w, page_h] = [1190, 1680];
  2985. let bg = document.createElement("canvas");
  2986. bg.width = page_w; // 注意canvas作为取景框的大小
  2987. bg.height = page_h; // 如果不设置等于一个很小的取景框
  2988. let bg_ctx = bg.getContext("2d");
  2989. bg_ctx.fillStyle = "white";
  2990. bg_ctx.fillRect(0, 0, page_w, page_h);
  2991.  
  2992. // 逐个区块剪切取出并粘贴
  2993. // wk$("#viewer .page").forEach(page_div => {
  2994. getPostions(page_div).forEach(pos => {
  2995. bg_ctx.drawImage(
  2996. page, // image source
  2997. pos[0], // source x
  2998. pos[1], // source y
  2999. 120, // source width
  3000. 169, // source height
  3001. pos[2] * page_w, // destination x = left: x%
  3002. pos[3] * page_h, // destination y = top: y%
  3003. 120, // destination width
  3004. 169 // destination height
  3005. );
  3006. });
  3007. // });
  3008. return [i, bg];
  3009. }
  3010.  
  3011.  
  3012. /**
  3013. * 页面批量请求、裁剪重绘, 合成PDF并下载
  3014. */
  3015. async function turnPagesToPDF() {
  3016. // 渲染每页
  3017. let tasks = [];
  3018. wk$("#viewer .page").forEach((page_div, i) => {
  3019. tasks.push(
  3020. getAndDrawPage(i, page_div)
  3021. );
  3022. });
  3023. // 等待每页渲染完成后,排序
  3024. let results = await Promise.all(tasks);
  3025. results.sort((prev, next) => prev[0] - next[0]);
  3026. // 合并为PDF并导出
  3027. utils.saveCanvasesToPDF(
  3028. results.map(item => item[1]),
  3029. // '在线预览|GB 14023-2022'
  3030. document.title.split("|")[1]
  3031. );
  3032. }
  3033.  
  3034.  
  3035. /**
  3036. * 提示预估下载耗时,然后下载
  3037. */
  3038. function hintThenDownload$1() {
  3039. // '/93'
  3040. let page_num = parseInt(wk$("#numPages")[0].textContent.slice(1));
  3041. let estimate = Math.ceil(page_num / 3);
  3042. alert(`页数: ${page_num},预计花费: ${estimate}秒;如遇网络异常可能更久\n请勿反复点击按钮;如果无法导出请 QQ 群反馈`);
  3043. turnPagesToPDF();
  3044. }
  3045.  
  3046.  
  3047. /**
  3048. * gb688文档下载策略
  3049. */
  3050. async function gb688() {
  3051. // 创建全局对象
  3052. globalThis.gb688JS = {
  3053. pages: new Map(), // {url: bmp}
  3054. pages_status: new Map() // {url: 0或1} 0释放, 1占用
  3055. };
  3056.  
  3057. // 创建按钮区
  3058. utils.createBtns();
  3059. // 绑定监听器
  3060. // 按钮1:导出PDF
  3061. turnPagesToPDF = await utils.recTime(turnPagesToPDF);
  3062. utils.setBtnEvent(hintThenDownload$1, [], "btn_1", "导出PDF");
  3063. }
  3064.  
  3065. function getPageCounts() {
  3066. // " / 39"
  3067. let counts_str = wk$(".counts")[0].textContent.split("/")[1];
  3068. let counts = parseInt(counts_str);
  3069. return counts > 20 ? 20 : counts;
  3070. }
  3071.  
  3072.  
  3073. /**
  3074. * 返回图片基础路径
  3075. * @returns {string} base_url
  3076. */
  3077. function getImgBaseURL() {
  3078. return wk$("#dp")[0].value;
  3079. }
  3080.  
  3081.  
  3082. function* genImgURLs() {
  3083. let counts = getPageCounts();
  3084. let base_url = getImgBaseURL();
  3085. for (let i=1; i<=counts; i++) {
  3086. yield base_url + `${i}.gif`;
  3087. }
  3088. }
  3089.  
  3090.  
  3091. /**
  3092. * 下载图片,转为canvas,合并为PDF并下载
  3093. */
  3094. function fetchThenExportPDF() {
  3095. let url_vendor = genImgURLs();
  3096. // db2092-2014-河北特种设备使用安全管理规范_安全文库网safewk.com
  3097. let title = document.title.split("_")[0];
  3098. return utils.imgUrlsToPDF(url_vendor, title);
  3099. }
  3100.  
  3101.  
  3102. /**
  3103. * 提示预估下载耗时,然后下载
  3104. */
  3105. async function hintThenDownload() {
  3106. let hint = [
  3107. "只能导出可预览的页面(最多20页)",
  3108. "请勿短时间反复点击按钮,导出用时大约不到 10 秒",
  3109. "点完后很久没动静请至 QQ 群反馈"
  3110. ];
  3111. alert(hint.join("\n"));
  3112. await fetchThenExportPDF();
  3113. }
  3114.  
  3115.  
  3116. /**
  3117. * safewk文档下载策略
  3118. */
  3119. async function safewk() {
  3120. // 创建按钮区
  3121. utils.createBtns();
  3122. // 绑定监听器
  3123. // 按钮1:导出PDF
  3124. hintThenDownload = await utils.recTime(hintThenDownload);
  3125. utils.setBtnEvent(hintThenDownload, [], "btn_1", "导出PDF");
  3126. }
  3127.  
  3128. /**
  3129. * 主函数:识别网站,执行对应文档下载策略
  3130. */
  3131. function main() {
  3132. // 显示当前位置
  3133. let host = window.location.host;
  3134. console.log(`当前host: ${host}`);
  3135. // 挂载工具包到全局
  3136. window.user_utils = utils;
  3137. console.log("wk: user_utils已经挂载到全局");
  3138.  
  3139. // 附加任务
  3140. // utils.globalFunc(HD); // 全局设置高清图片的函数
  3141.  
  3142. // 主任务
  3143. if (host.includes("docin.com")) {
  3144. docin();
  3145. } else if (host === "swf.ishare.down.sina.com.cn") {
  3146. ishareData();
  3147. } else if (host.includes("ishare.iask")) {
  3148. ishare();
  3149. } else if (host === "www.deliwenku.com") {
  3150. deliwenku();
  3151. } else if (host === "www.doc88.com") {
  3152. doc88();
  3153. } else if (host === "www.360doc.com") {
  3154. doc360();
  3155. } else if (host === "wenku.baidu.com") {
  3156. baiduWenku();
  3157. } else if (host === "doc.mbalib.com") {
  3158. mbalib();
  3159. } else if (host === "www.dugen.com") {
  3160. dugen();
  3161. } else if (host === "c.gb688.cn") {
  3162. gb688();
  3163. } else if (host === "www.safewk.com") {
  3164. safewk();
  3165. } else if (host.includes("book118.com")) {
  3166. book118();
  3167. } else {
  3168. console.log("匹配到了无效网页");
  3169. }
  3170. }
  3171.  
  3172. let options = {
  3173. fast_mode: false,
  3174. activation_test: false,
  3175. show_buttons: true
  3176. };
  3177. globalThis._wk_on = options.show_buttons;
  3178. if (options.cli_mode) {
  3179. (() => {
  3180. loadExternalScripts();
  3181. setTimeout(main, 2000);
  3182. return;
  3183. })();
  3184. }
  3185. if (options.activation_test) {
  3186. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  3187. }
  3188. if (options.fast_mode) {
  3189. main();
  3190. } else {
  3191. window.onload = main;
  3192. }
  3193.  
  3194. })();