Wenku Doc Downloader

下载文档,导出PDF。有限地支持 ①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档 ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-04-05 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.11
  5. // @description 下载文档,导出PDF。有限地支持 ①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档 ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/view/*
  13. // @match *://wenku.baidu.com/tfview/*
  14. // @match *://doc.mbalib.com/view/*
  15. // @match *://www.dugen.com/p-*
  16. // @match *://max.book118.com/html/*
  17. // @match *://view-cache.book118.com/pptView.html?*
  18. // @match *://*.book118.com/?readpage=*
  19. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  20. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  21. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  22. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  23. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  24. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  25. // @grant none
  26. // @license GPL-3.0-only
  27. // @create 2021-11-22
  28. // @note 1. 移除了对帮帮文库的支持
  29. // @note 2. 修复了百度文库PPT无法导出图片链接的bug
  30. // ==/UserScript==
  31.  
  32.  
  33. (function () {
  34. 'use strict';
  35.  
  36. let utils = {
  37. ver: (() => {
  38. // 显示版本号
  39. let _ver = "wk-utils: ver-1.5.11";
  40. console.log(_ver);
  41. return _ver;
  42. })(),
  43.  
  44. /**
  45. * 创建并下载文件
  46. * @param {String} file_name 文件名
  47. * @param {String | Blob} content 文本或blob
  48. */
  49. createAndDownloadFile: function(file_name, content) {
  50. let aTag = document.createElement('a');
  51. let blob;
  52. if (typeof(content) === "string") {
  53. blob = new Blob([content]);
  54. }
  55. aTag.download = file_name;
  56. aTag.href = URL.createObjectURL(blob);
  57. aTag.click();
  58. URL.revokeObjectURL(blob);
  59. },
  60.  
  61. /**
  62. * 创建并下载链接资源
  63. * @param {String} file_name
  64. * @param {String} src
  65. */
  66. downloadUrlFile: function(file_name, src) {
  67. let aTag = document.createElement('a');
  68. aTag.download = file_name;
  69. aTag.href = src;
  70. aTag.click();
  71. },
  72.  
  73. /**
  74. * 添加外部js到当前页面
  75. * @param {String} url
  76. */
  77. addScripts2HTML: function(url) {
  78. let script = document.createElement("script");
  79. script.src = url;
  80. document.head.appendChild(script);
  81. },
  82.  
  83. /**
  84. * 临时禁用脚本,执行func后移除btns_section。
  85. * @param {Function} func
  86. */
  87. banSelf: function(func = () => 0) {
  88. func();
  89. document.querySelector(".btns_section").remove();
  90. },
  91.  
  92. /**
  93. * 睡眠 delay 毫秒
  94. * @param {Number} delay
  95. */
  96. sleep: function(delay) {
  97. let start = (new Date()).getTime();
  98. while ((new Date()).getTime() - start < delay) {
  99. continue;
  100. }
  101. },
  102.  
  103. /**
  104. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  105. * @param {Number} delay
  106. * @returns {Promise} nextTask
  107. */
  108. sleepAsync: function(delay) {
  109. return new Promise((resolve) => setTimeout(resolve, delay));
  110. },
  111.  
  112. /**
  113. * 允许打印页面
  114. */
  115. allowPrint: function() {
  116. let style = document.createElement("style");
  117. style.innerHTML = `
  118. @media print {
  119. body{
  120. display:block;
  121. }
  122. }
  123. `;
  124. document.head.appendChild(style);
  125. },
  126.  
  127. /**
  128. * 取得get参数key对应的value
  129. * @param {String} key
  130. * @returns {String} value
  131. */
  132. getUrlParam: function(key) {
  133. let params = (new URL(window.location)).searchParams;
  134. return params.get(key);
  135. },
  136.  
  137. /**
  138. * 在指定节点后面插入节点
  139. * @param {Element} new_element
  140. * @param {Element} target_element
  141. */
  142. insertAfter: function(new_element, target_element) {
  143. let parent = target_element.parentNode;
  144. if (parent.lastChild === target_element) {
  145. parent.appendChild(new_element);
  146. } else {
  147. parent.insertBefore(new_element, target_element.nextElementSibling);
  148. }
  149. },
  150.  
  151. /**
  152. * 求main_set去除cut_set后的set
  153. * @param {Set} main_set
  154. * @param {Set} cut_set
  155. * @returns 差集
  156. */
  157. difference: function(main_set, cut_set) {
  158. let _diff = new Set(main_set);
  159. for (let elem of cut_set) {
  160. _diff.delete(elem);
  161. }
  162. return _diff;
  163. },
  164.  
  165. /**
  166. * 抛出set中的第一个元素
  167. * @param {Set} set
  168. * @returns 一个元素
  169. */
  170. setPop: function(set) {
  171. for (let item of set) {
  172. set.delete(item);
  173. return item;
  174. }
  175. },
  176.  
  177. /**
  178. * 绑定事件到指定按钮,返回按钮引用
  179. * @param {Function} event click事件
  180. * @param {Array} args 事件的参数列表
  181. * @param {String} aim_btn 按钮的变量名
  182. * @param {String} new_text 按钮的新文本,为null则不替换
  183. * @returns 按钮元素的引用
  184. */
  185. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  186. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  187. // 如果需要,替换按钮内文本
  188. if (new_text) {
  189. btn.textContent = new_text;
  190. }
  191. // 绑定事件,添加到页面上
  192. btn.onclick = () => {
  193. this.enhanceBtnClickReaction(aim_btn);
  194. if (args.length) {
  195. event(...args);
  196. } else {
  197. event();
  198. }
  199. };
  200. return btn;
  201. },
  202.  
  203. /**
  204. * 强制隐藏元素
  205. * @param {String} selector
  206. */
  207. forceHide: function(selector) {
  208. let style_cls = "force-hide";
  209. document.querySelectorAll(selector).forEach((elem) => {
  210. elem.className += ` ${style_cls}`;
  211. });
  212. // 判断css样式是否已经存在
  213. let style;
  214. style = document.querySelector(`style.${style_cls}`);
  215. // 如果已经存在,则无须重复创建
  216. if (style) {
  217. return;
  218. }
  219. // 否则创建
  220. style = document.createElement("style");
  221. style.innerHTML = `style.${style_cls} {
  222. visibility: hidden !important;
  223. }`;
  224. document.head.appendChild(style);
  225. },
  226.  
  227. /**
  228. * 隐藏按钮,打印页面,显示按钮
  229. */
  230. hideBtnThenPrint: function() {
  231. // 隐藏按钮,然后打印页面
  232. let section = document.getElementsByClassName("btns_section")[0];
  233. section.style.display = "none";
  234. window.print();
  235. // 打印结束,显示按钮
  236. section.style.removeProperty("display");
  237. },
  238.  
  239. /**
  240. * 返回times个倍数连接的str
  241. * @param {String} str
  242. * @param {Number} times
  243. * @returns multiplied_str
  244. */
  245. multiplyStr: function(str, times) {
  246. let str_list = [];
  247. for (let i = 0; i < times; i++) {
  248. str_list.push(str);
  249. }
  250. return str_list.join("");
  251. },
  252.  
  253. /**
  254. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  255. * @param {String} custom_btn 按钮变量名
  256. */
  257. enhanceBtnClickReaction: function(custom_btn = null) {
  258. let aim_btn;
  259. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  260. if (!custom_btn || custom_btn === "btn_1") {
  261. aim_btn = document.querySelector(".btn-1");
  262. } else {
  263. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  264. }
  265.  
  266. let old_color = aim_btn.style.color; // 保存旧的颜色
  267. let old_text = aim_btn.textContent; // 保存旧的文字内容
  268. // 变黑缩小
  269. aim_btn.style.color = "black";
  270. aim_btn.style.fontWeight = "normal";
  271. aim_btn.textContent = `->${old_text}<-`;
  272. // 复原加粗
  273. let changeColorBack = function() {
  274. aim_btn.style.color = old_color;
  275. aim_btn.style.fontWeight = "bold";
  276. aim_btn.textContent = old_text;
  277. };
  278. setTimeout(changeColorBack, 1250);
  279. },
  280.  
  281. /**
  282. * 切换按钮显示/隐藏状态
  283. * @param {String} aim_btn 按钮变量名
  284. * @returns 按钮元素的引用
  285. */
  286. toggleBtnStatus: function(aim_btn) {
  287. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  288. let display = getComputedStyle(btn).display;
  289. // return;
  290. if (display === "none") {
  291. btn.style.display = "block";
  292. } else {
  293. btn.style.display = "none";
  294. }
  295. return btn;
  296. },
  297.  
  298. /**
  299. * 根据canvas元素数量返回quality值
  300. * @param {Number} canvas_amount
  301. * @returns quality: Number
  302. */
  303. getQualityByCanvasAmount: function(canvas_amount) {
  304. // 如果有全局参数,优先用全局的
  305. if (window.img_quality !== undefined) {
  306. console.log(`image quality: ${window.img_quality*100}%`);
  307. return window.img_quality;
  308. }
  309. // 否则用默认的
  310. let quality;
  311. if (canvas_amount <= 25) {
  312. quality = 1.0;
  313. } else if (25 < canvas_amount <= 50) {
  314. quality = 0.9;
  315. } else {
  316. quality = 0.8;
  317. }
  318. console.log(`image quality: ${quality*100}%`);
  319. return quality;
  320. },
  321.  
  322. /**
  323. * 挂载func到全局
  324. * @param {Function} func
  325. */
  326. globalFunc: function(func) {
  327. globalThis[func.name] = func;
  328. },
  329.  
  330. /**
  331. * 用input框跳转到对应页码
  332. * @param {Element} cur_page 当前页码
  333. * @param {string} aim_page 目标页码
  334. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  335. */
  336. jump2pageNo: function(cur_page, aim_page, event_type) {
  337. // 设置跳转页码为目标页码
  338. cur_page.value = aim_page;
  339. // 模拟回车事件来跳转
  340. let keyboard_event_enter = new KeyboardEvent(event_type, {
  341. bubbles: true,
  342. cancelable: true,
  343. keyCode: 13
  344. });
  345. cur_page.dispatchEvent(keyboard_event_enter);
  346. },
  347.  
  348. /**
  349. * 在新标签页打开链接
  350. * @param {String} href
  351. */
  352. openInNewTab: function(href) {
  353. let link = document.createElement("a");
  354. link.href = href;
  355. link.target = "_blank";
  356. link.click();
  357. },
  358.  
  359. /**
  360. * 滚动到页面底部
  361. */
  362. scrollToBottom: function() {
  363. window.scrollTo({
  364. top: document.body.scrollHeight,
  365. behavior: "smooth"
  366. });
  367. },
  368.  
  369. /**
  370. * 用try移除元素
  371. * @param {Element} element 要移除的元素
  372. */
  373. tryToRemoveElement: function(element) {
  374. try {
  375. element.remove();
  376. } catch (e) {
  377. }
  378. },
  379. /**
  380. * 用try移除若干元素
  381. * @param {Element[]} elements 要移除的元素列表
  382. */
  383. tryToRemoveElements: function(elements) {
  384. elements.forEach((elem) => {
  385. this.tryToRemoveElement(elem);
  386. });
  387. },
  388.  
  389. /**
  390. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  391. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  392. */
  393. tryToRemoveSameElem: function(elem_list_box) {
  394. for (let elem_list of elem_list_box) {
  395. if (!elem_list) {
  396. continue;
  397. }
  398. for (let elem of elem_list) {
  399. try {
  400. elem.remove();
  401. } catch (e) {
  402. console.log();
  403. }
  404. }
  405. }
  406. },
  407.  
  408. /**
  409. * 使文档在页面上居中
  410. * @param {String} selector 文档容器的css选择器
  411. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  412. * @returns 偏移值是否合法
  413. */
  414. centerDoc: function(selector, default_offset) {
  415. let doc_main = document.querySelector(selector);
  416. let offset = window.prompt("请输入偏移百分位:", default_offset);
  417. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  418. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  419. doc_main.style.marginLeft = offset + "%";
  420. return true;
  421. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  422. doc_main.style.marginLeft = offset + "%";
  423. return true
  424. } else {
  425. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  426. return false;
  427. }
  428. },
  429.  
  430. /**
  431. * 调整按钮内文本
  432. * @param {String} aim_btn 按钮变量名
  433. * @param {String} new_text 新的文本,null则保留旧文本
  434. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  435. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  436. */
  437. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  438. // 提示文档已经展开
  439. if (use_hint) {
  440. let hint = "文档已经完全展开,可以导出";
  441. alert(hint);
  442. }
  443. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  444. // 要替换的文本
  445. if (new_text) {
  446. btn.textContent = new_text;
  447. }
  448. // 推荐按钮
  449. if (recommend_btn) {
  450. btn.textContent += "(推荐)";
  451. }
  452. },
  453.  
  454. html2Canvases: async function(elem_list) {
  455. // 如果是空元素列表,返回null并终止函数
  456. if (elem_list.length === 0) {
  457. console.log("html2canvases was called, but no element is avaiable.");
  458. return null;
  459. }
  460. let tasks = []; // 存放异步任务
  461. let contents = []; // 存放canvas元素
  462. for (let elem of elem_list) {
  463. let task = html2canvas(elem).then((canvas) => {
  464. contents.push(canvas);
  465. });
  466. tasks.push(task);
  467. }
  468. // 等待全部page转化完成
  469. await Promise.all(tasks);
  470. return contents;
  471. },
  472.  
  473. /**
  474. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  475. * @param {Array} elem_list html元素列表
  476. * @param {String} title 文档标题
  477. */
  478. html2PDF: async function(elem_list, title = "文档") {
  479. // 如果是空元素列表,终止函数
  480. let _contents = this.html2Canvases(elem_list);
  481. if (_contents === null) {
  482. return;
  483. }
  484. _contents.then((contents) => {
  485. // 控制台检查结果
  486. console.log("生成的canvas元素如下:");
  487. console.log(contents);
  488.  
  489. // 拿到canvas宽、高
  490. let model = elem_list[0];
  491. let width, height;
  492. width = model.offsetWidth;
  493. height = model.offsetHeight;
  494. // 打包为pdf
  495. this.saveCanvasesToPDF(contents, title, width, height);
  496. });
  497. },
  498.  
  499. /**
  500. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  501. * @param {string} selector 图形元素的父级元素
  502. */
  503. savePicUrls: function(selector) {
  504. let pages = document.querySelectorAll(selector);
  505. let pic_urls = [];
  506.  
  507. for (let elem of pages) {
  508. let pic_obj = elem.children[0];
  509. let url = pic_obj.src;
  510. pic_urls.push(url);
  511. }
  512. let content = pic_urls.join("\n");
  513. // 启动下载
  514. this.createAndDownloadFile("urls.csv", content);
  515. },
  516.  
  517. /**
  518. * 存储所有canvas图形为png到一个压缩包
  519. * @param {Array} node_list canvas元素列表
  520. * @param {String} title 文档标题
  521. */
  522. saveCanvasesToZip: function(node_list, title) {
  523. // canvas元素转为png图像
  524. // 所有png合并为一个zip压缩包
  525. let zip = new JSZip();
  526. let n = node_list.length;
  527.  
  528. for (let i = 0; i < n; i++) {
  529. let canvas = node_list[i];
  530. let data_base64 = canvas.toDataURL();
  531. let blob = atob(data_base64.split(",")[1]);
  532. zip.file(`page-${i+1}.png`, blob, { binary: true });
  533. }
  534.  
  535. // 导出zip
  536. // promise.then(onCompleted, onRejected);
  537. zip.generateAsync({ type: "blob" }).then(function(content) {
  538. // see filesaver.js
  539. console.log(content);
  540. saveAs(content, `${title}.zip`);
  541. });
  542. },
  543.  
  544. /**
  545. * 将canvas转为jpeg,然后导出PDF
  546. * @param {Array} node_list canvas元素列表
  547. * @param {String} title 文档标题
  548. */
  549. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  550. // 如果没有手动指定canvas的长宽,则自动检测
  551. if (!width && !height) {
  552. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  553. let first_canvas = node_list[0];
  554. // 如果style的长宽不存在,则直接用canvas的元素长宽
  555. let width_str, height_str;
  556. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  557. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  558. } else {
  559. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  560. }
  561. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  562. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  563. }
  564. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  565. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  566. let orientation = width > height ? 'l' : 'p';
  567. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  568.  
  569. // 根据canvas数量确定quality
  570. let quality = this.getQualityByCanvasAmount(node_list.length);
  571.  
  572. // 保存每一页文档到每一页pdf
  573. node_list.forEach(function(canvas, index) {
  574. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  575. // 如果当前不是文档最后一页,则需要添加下一个空白页
  576. if (index !== node_list.length - 1) {
  577. pdf.addPage();
  578. }
  579. });
  580.  
  581. // 导出文件
  582. pdf.save(`${title}.pdf`);
  583. },
  584.  
  585. /**
  586. * Image元素列表合并到一个PDF中
  587. * @param {NodeList} imgs Image元素列表
  588. * @param {String} title 文档名
  589. */
  590. imgs2pdf: function(imgs, title) {
  591. // 取得宽高
  592. let model = imgs[0];
  593. let width = model.offsetWidth;
  594. let height = model.offsetHeight;
  595.  
  596. // 创建pdf
  597. let orientation = width > height ? 'l' : 'p';
  598. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  599.  
  600. // 添加图像到pdf
  601. imgs.forEach((img, index) => {
  602. pdf.addImage(img, 'PNG', 0, 0, width, height);
  603. // 如果当前不是文档最后一页,则需要添加下一个空白页
  604. if (index !== imgs.length - 1) {
  605. pdf.addPage();
  606. }
  607. });
  608.  
  609. // 导出文件
  610. pdf.save(`${title}.pdf`);
  611. },
  612.  
  613. /**
  614. * 取得elem的class为class_name的父级元素
  615. * @param {String} class_name
  616. * @param {Element} elem 起点元素
  617. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  618. * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  619. * @returns {null | Element} parent_element
  620. */
  621. getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
  622. let parent = elem.parentElement;
  623. let iterator_count = JSobj.iterator_count;
  624. let now_name;
  625.  
  626. try {
  627. now_name = parent.className;
  628. } catch (e) {
  629. JSobj.iterator_count = 0;
  630. // 没有父级元素了
  631. return "no parent node";
  632. }
  633.  
  634. // 如果不忽略递归次数计数器
  635. if (!ignore) {
  636. if (iterator_count > 9) {
  637. // 超过最大迭代次数,认为不存在,返回null
  638. JSobj.iterator_count = 0;
  639. return "over max iterator counts limit";
  640. } else {
  641. JSobj.iterator_count += 1;
  642. }
  643. }
  644. // 如果类名匹配,返回该节点
  645. if (now_name.split(" ").includes(class_name)) {
  646. iterator_count = 0;
  647. return parent;
  648. }
  649. return this.getParentByClassName(class_name, parent, JSobj);
  650. },
  651.  
  652. /**
  653. * 将func绑定到window.onscroll,并设置触发频率
  654. * @param {Function} func scroll的监听函数
  655. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  656. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  657. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  658. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  659. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  660. */
  661. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  662. if (JSobj.scroll_count === undefined) {
  663. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  664. return;
  665. }
  666.  
  667. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  668. JSobj.scroll_count += 1;
  669. if (JSobj.scroll_count < useful_range) {
  670. func();
  671. console.log(hint);
  672. } else if (JSobj.scroll_count > wait_range) {
  673. JSobj.scroll_count = 0;
  674. }
  675. };
  676. // 如果没有指定的window对象,则使用默认的window
  677. if (!inner_window) {
  678. window.onscroll = () => {
  679. new_func(func, JSobj, useful_range, wait_range, hint);
  680. };
  681. return;
  682. }
  683. // 特定的window对象,一般用于iframe,追加scroll监听器
  684. let scrollFunc = () => {
  685. new_func(func, JSobj, useful_range, wait_range, hint);
  686. };
  687. JSobj.scrollFunc = scrollFunc;
  688. inner_window.addEventListener("scroll", scrollFunc, false);
  689. },
  690.  
  691. /**
  692. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  693. */
  694. createBtns: function() {
  695. // 创建按钮组
  696. let section = document.createElement("section");
  697. section.className = "btns_section";
  698. section.innerHTML = `
  699. <p class="logo_tit">Wenku Doc Downloader</p>
  700. <button class="btn-1" title="请先使内容加载完,防止出现空白页">展开文档 😈</button>
  701. <button class="btn-2">未设定2</button>
  702. <button class="btn-3">未设定3</button>
  703. <button class="btn-4">未设定4</button>
  704. <button class="btn-5">未设定5</button>`;
  705. document.body.appendChild(section);
  706.  
  707. // 设定样式
  708. let style = document.createElement("style");
  709. style.innerHTML = `
  710. .btns_section{
  711. position: fixed;
  712. width: 154px;
  713. left: 10px;
  714. top: 32%;
  715. background: #E7F1FF;
  716. border: 2px solid #1676FF;
  717. padding: 0px 0px 10px 0px;
  718. font-weight: 600;
  719. border-radius: 2px;
  720. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  721. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  722. 'Segoe UI Emoji', 'Segoe UI Symbol';
  723. z-index: 5000;
  724. }
  725. .logo_tit{
  726. width: 100%;
  727. background: #1676FF;
  728. text-align: center;
  729. font-size:12px ;
  730. color: #E7F1FF;
  731. line-height: 40px;
  732. height: 40px;
  733. margin: 0 0 16px 0;
  734. }
  735.  
  736. .btn-1{
  737. display: block;
  738. width: 128px;
  739. height: 28px;
  740. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  741. border-radius: 4px;
  742. color: #fff;
  743. font-size: 12px;
  744. border: none;
  745. outline: none;
  746. margin: 8px auto;
  747. font-weight: bold;
  748. cursor: pointer;
  749. opacity: .9;
  750. }
  751. .btn-2{
  752. display: none;
  753. width: 128px;
  754. height: 28px;
  755. background: #07C160;
  756. border-radius: 4px;
  757. color: #fff;
  758. font-size: 12px;
  759. border: none;
  760. outline: none;
  761. margin: 8px auto;
  762. font-weight: bold;
  763. cursor: pointer;
  764. opacity: .9;
  765. }
  766. .btn-3{
  767. display: none;
  768. width: 128px;
  769. height: 28px;
  770. background:#FA5151;
  771. border-radius: 4px;
  772. color: #fff;
  773. font-size: 12px;
  774. border: none;
  775. outline: none;
  776. margin: 8px auto;
  777. font-weight: bold;
  778. cursor: pointer;
  779. opacity: .9;
  780. }
  781. .btn-4{
  782. display: none;
  783. width: 128px;
  784. height: 28px;
  785. background: #1676FF;
  786. border-radius: 4px;
  787. color: #fff;
  788. font-size: 12px;
  789. border: none;
  790. outline: none;
  791. margin: 8px auto;
  792. font-weight: bold;
  793. cursor: pointer;
  794. opacity: .9;
  795. }
  796. .btn-5{
  797. display: none;
  798. width: 128px;
  799. height: 28px;
  800. background: #ff6600;
  801. border-radius: 4px;
  802. color: #fff;
  803. font-size: 12px;
  804. border: none;
  805. outline: none;
  806. margin: 8px auto;
  807. font-weight: bold;
  808. cursor: pointer;
  809. opacity: .9;
  810. }
  811. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  812. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  813. document.head.appendChild(style);
  814. }
  815. };
  816.  
  817. /**
  818. * 清理百度文库页面的无关元素
  819. */
  820. function clearPage_Baidu() {
  821. let selectors = [
  822. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  823. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  824. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  825. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  826. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  827. ".hx-recom-wrapper, .reader-topbar"
  828. ];
  829. let elem_list = document.querySelectorAll(selectors.join(", "));
  830. for (let elem of elem_list) {
  831. utils.tryToRemoveElement(elem);
  832. }
  833. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  834. utils.forceHide(nut_selector);
  835.  
  836. // 页边距调整
  837. // 顶部距离改为0
  838. let rc = document.querySelector("#reader-container");
  839. rc.style.paddingTop = "0";
  840. let cw = document.querySelector(".content-wrapper");
  841. cw.style.paddingTop = "0";
  842. // 底部距离改为0
  843. let foot = document.querySelector(".try-end-fold-page");
  844. foot.style.paddingBottom = "0";
  845. foot.style.height = "0";
  846. }
  847.  
  848.  
  849. /**
  850. * 调整页间距为 width px
  851. */
  852. function adjustPageGap() {
  853. let old_gap = window.baiduJS.page_gap;
  854. let hints = [
  855. `旧的页间距为 ${old_gap} px`,
  856. "请输入新的页间距(0-500的整数):\n"
  857. ];
  858. let new_gap = prompt(hints.join("\n"));
  859. new_gap = parseInt(new_gap);
  860.  
  861. // 创建空白段落节点充当间隔
  862. let div = document.createElement("div");
  863. // 取得实心填充物
  864. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  865. block.style.height = `${new_gap}px`;
  866. // 创建间隔
  867. div.style.background = "rgb(244, 244, 244)";
  868. div.appendChild(block);
  869. div.className = "page-gap";
  870.  
  871. // 调整页间距
  872. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  873. let next_elem = elem.nextElementSibling;
  874.  
  875. if (next_elem === null) {
  876. return; // 最后一个节点后面无需间隔
  877. }
  878.  
  879. let cls = next_elem.className;
  880. if (cls === "page-gap") {
  881. next_elem.style.height = `${new_gap}px`;
  882. } else {
  883. utils.insertAfter(div.cloneNode(true), elem);
  884. }
  885. });
  886. window.baiduJS.page_gap = new_gap;
  887. console.log(`页间距已经调整为:${new_gap} px`);
  888. }
  889.  
  890.  
  891. /**
  892. * 判断是否所有可预览页面都冻结了
  893. * @returns {Boolean}
  894. */
  895. function areAllFrozen() {
  896. let frozen = 0;
  897. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  898. if (canvas.getAttribute("width") !== "0") {
  899. frozen += 1;
  900. }
  901. });
  902. if (frozen < window.free_page) {
  903. return false;
  904. }
  905. return true;
  906. }
  907.  
  908.  
  909. /**
  910. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  911. */
  912. function freezeDocView() {
  913. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  914. if (canvas.getAttribute("width") !== "0") {
  915. canvas.id = "";
  916. }
  917. });
  918.  
  919. if (areAllFrozen()) {
  920. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  921. console.log("wk: 文档页: 全部冻结完毕");
  922. window.baiduJS.finished = true;
  923. window.onscroll = () => { };
  924. }
  925. }
  926.  
  927.  
  928. /**
  929. * 优化阅读体验的零碎任务
  930. */
  931. function better() {
  932. /**
  933. * 内部主函数,便于捕获异常
  934. * 代码改自 https://greasyfork.org/zh-CN/scripts/438420
  935. */
  936. let _better = function() {
  937. let pageData = window.pageData;
  938. // 改为本地 VIP
  939. pageData.vipInfo.global_svip_status = 1;
  940. pageData.vipInfo.global_vip_status = 1;
  941. pageData.vipInfo.isVip = 1;
  942. pageData.vipInfo.isWenkuVip = 1;
  943.  
  944. // 手机版优化
  945. if (pageData.appUniv) {
  946. // 取消百度文库对谷歌、搜狗浏览器 referrer 的屏蔽
  947. pageData.appUniv.blackBrowser = [];
  948. // 隐藏 APP 下载按钮
  949. pageData.viewBiz.docInfo.needHideDownload = true;
  950. }
  951. };
  952.  
  953. try {
  954. console.log("wk: 优化");
  955. _better();
  956. } catch (error) {
  957. console.log("wk: baiduWenku: better: main:");
  958. console.error(error);
  959. }
  960. }
  961.  
  962.  
  963. /**
  964. * 展开文档
  965. */
  966. function readAll$1() {
  967. better();
  968. let btn = document.querySelector(".read-all");
  969. if (!btn) {
  970. // 显示按钮
  971. utils.toggleBtnStatus("btn_1");
  972. utils.toggleBtnStatus("btn_2");
  973. utils.toggleBtnStatus("btn_3");
  974. // utils.toggleBtnStatus("btn_4");
  975. } else {
  976. btn.click();
  977. }
  978. }
  979.  
  980.  
  981. function getTips() {
  982. let hints = [
  983. `一共 ${window.all_page} 页, 免费预览 ${window.free_page} 页,`,
  984. "请优先尝试【导出图片链接】,如果不行再【打印页面到PDF】。",
  985. "",
  986. "如果<免费预览页数>等于<总页数>,",
  987. "但点击展开文档, 却跳转到vip付费,",
  988. "请尝试:",
  989. "1. 清除全部cookies,刷新页面并登录账号",
  990. "2. 复制以下链接,并在【新标签页】中打开,然后尝试展开文档。",
  991. "如果还不行就没办法了。",
  992. "",
  993. "如果出现空白页,请浏览对应页面使其加载,然后再打印页面。",
  994. "页数超过20页时,打印预览明显缓慢,请耐心等待,真的只是很慢。",
  995. "",
  996. "页面间距通过按钮调整。",
  997. "页面宽度通过打印时缩放比调整。",
  998. "推荐缩放比: 114%",
  999. "",
  1000. "打印时设置:",
  1001. "更多设置 -> 缩放 -> 自定义",
  1002. "选项 -> ☑ 背景图形",
  1003. ];
  1004. let url_no_params = window.location.href.replace(/[?].*/, "");
  1005. prompt(hints.join("\n"), url_no_params);
  1006. alert(
  1007. [
  1008. "只能导出可以【免费预览】的页面。",
  1009. "脚本的能力是有限的,烦请谅解。",
  1010. "",
  1011. "百度文库会记住你打开文档的操作路径,如:",
  1012. "百度搜索 -> 文档,或 文库搜索 -> 百度文档,",
  1013. "百度会让通过特定路径打开免费文档的人必须付费,",
  1014. "所以解决办法是复制刚才弹窗中的链接,",
  1015. "新建标签页,粘贴链接,然后回车打开,这样的操作是零路径。",
  1016. "",
  1017. "此外,发现此脚本与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  1018. "应该是此脚本删去文档页id所导致的,",
  1019. "暂无解决方案, 如需复制文字请禁用此脚本。"
  1020. ].join("\n")
  1021. );
  1022. }
  1023.  
  1024.  
  1025. /**
  1026. * 清理页面,然后打印页面
  1027. */
  1028. function clearThenPrint() {
  1029. // 清理页面
  1030. clearPage_Baidu();
  1031. // 调整文档内容的定位
  1032. let content = document.querySelector(".left-wrapper");
  1033. content.style.marginLeft = "0";
  1034. // 打印页面
  1035. utils.hideBtnThenPrint();
  1036. }
  1037.  
  1038.  
  1039. /**
  1040. * 取得pageData接口中的urls并下载
  1041. * @returns {Boolean} 是否成功下载(是否存在图片元素)
  1042. */
  1043. function downloadPicUrls() {
  1044. let warn = () => {
  1045. let hints = [
  1046. "当前文档非ppt或pdf, 无法使用该功能。",
  1047. "请在展开文档后使用【打印页面到PDF】"
  1048. ];
  1049. alert(hints.join("\n"));
  1050. };
  1051.  
  1052. let html_urls = window.pageData.readerInfo.htmlUrls;
  1053. if (!html_urls) {
  1054. warn();
  1055. return false;
  1056. }
  1057.  
  1058. // pdf
  1059. if (html_urls.png && html_urls.png.length > 0) {
  1060. let urls = [];
  1061. let pngs = html_urls.png;
  1062. pngs.forEach((png) => {
  1063. urls.push(png.pageLoadUrl);
  1064. });
  1065. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  1066. return true;
  1067. }
  1068. // 非图形
  1069. if (html_urls.length === undefined) {
  1070. warn();
  1071. return false;
  1072. }
  1073. // ppt
  1074. utils.createAndDownloadFile("urls.csv", html_urls.join("\n"));
  1075. return true;
  1076. }
  1077.  
  1078.  
  1079. /**
  1080. * 百度文档下载策略
  1081. */
  1082. function baiduWenku() {
  1083. // 允许打印页面
  1084. utils.allowPrint();
  1085. better();
  1086.  
  1087. // 取得页码,创建全局对象
  1088. window.free_page = window.pageData.readerInfo.freePage;
  1089. window.all_page = window.pageData.readerInfo.page;
  1090. window.baiduJS = {
  1091. finished: false, // 文档页是否全部冻结
  1092. free_page: window.free_page, // 免费页数
  1093. all_page: window.all_page, // 全部页数
  1094. scroll_count: 0, // 滚动事件触发次数
  1095. page_gap: 0 // 页间距
  1096. };
  1097.  
  1098. // 绑定监听器给滚动。在滚动时冻结文档页面
  1099. let log = "wk: 文档页: 冻结";
  1100. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  1101. // window.onscroll = freezeDocView;
  1102.  
  1103. // 创建按钮
  1104. utils.createBtns();
  1105. // 按钮1: 展开预览
  1106. utils.setBtnEvent(readAll$1, [], "btn_1");
  1107. // 按钮2: 清理页面元素,打印页面
  1108. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  1109. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  1110. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  1111. // 按钮4: 导出图片链接(如果文档是ppt或pdf)
  1112. utils.setBtnEvent(downloadPicUrls, [], "btn_4", "导出图片链接");
  1113. utils.toggleBtnStatus("btn_4");
  1114. // 按钮5: 提示说明
  1115. utils.setBtnEvent(getTips, [], "btn_5", "有问题点我");
  1116. utils.toggleBtnStatus("btn_5");
  1117. }
  1118.  
  1119. /**
  1120. * 展开道客巴巴的文档
  1121. */
  1122. function readAllDoc88() {
  1123. // 获取“继续阅读”按钮
  1124. let continue_btn = document.querySelector("#continueButton");
  1125. // 如果存在“继续阅读”按钮
  1126. if (continue_btn) {
  1127. // 跳转到文末(等同于展开全文)
  1128. let cur_page = document.querySelector("#pageNumInput");
  1129. // 取得最大页码
  1130. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1131. // 跳转到尾页
  1132. utils.jump2pageNo(cur_page, page_max, "keypress");
  1133. // 返回顶部
  1134. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1135. }
  1136. // 文档展开后,显示按钮2、3
  1137. else {
  1138. // 隐藏按钮
  1139. utils.toggleBtnStatus("btn_1");
  1140. // 显示按钮
  1141. utils.toggleBtnStatus("btn_2");
  1142. utils.toggleBtnStatus("btn_3");
  1143. }
  1144. }
  1145.  
  1146. /**
  1147. * 道客巴巴文档下载策略
  1148. */
  1149. function doc88() {
  1150. // 创建脚本启动按钮1、2
  1151. utils.createBtns();
  1152.  
  1153. // 绑定主函数
  1154. let prepare = function() {
  1155. // 获取canvas元素列表
  1156. let node_list = document.querySelectorAll(".inner_page");
  1157. // 获取文档标题
  1158. let title;
  1159. if (document.querySelector(".doctopic h1")) {
  1160. title = document.querySelector(".doctopic h1").title;
  1161. } else {
  1162. title = "文档";
  1163. }
  1164. return [node_list, title];
  1165. };
  1166.  
  1167. // btn_1: 展开文档
  1168. utils.setBtnEvent(() => {
  1169. readAllDoc88();
  1170. }, [], "btn_1");
  1171. // btn_2: 导出zip
  1172. utils.setBtnEvent(() => {
  1173. if (confirm("确定每页内容都加载完成了吗?")) {
  1174. utils.saveCanvasesToZip(...prepare());
  1175. }
  1176. }, [], "btn_2", "导出图片到zip");
  1177. // btn_3: 导出PDF
  1178. utils.setBtnEvent(() => {
  1179. if (confirm("确定每页内容都加载完成了吗?")) {
  1180. utils.saveCanvasesToPDF(...prepare());
  1181. }
  1182. }, [], "btn_3", "导出图片到PDF");
  1183. }
  1184.  
  1185. // 绑定主函数
  1186. function getCanvasList() {
  1187. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1188. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1189. let node_list = [];
  1190. for (let node of parent_node_list) {
  1191. node_list.push(node.children[0]);
  1192. }
  1193. return node_list;
  1194. }
  1195.  
  1196.  
  1197. function prepare() {
  1198. // 获取canvas元素列表
  1199. let node_list = getCanvasList();
  1200. // 获取文档标题
  1201. let title;
  1202. if (document.querySelector("h1 [title=doc]")) {
  1203. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1204. } else if (document.querySelector(".doc_title")) {
  1205. title = document.querySelector(".doc_title").textContent;
  1206. } else {
  1207. title = "文档";
  1208. }
  1209. return [node_list, title];
  1210. }
  1211.  
  1212.  
  1213. // 判断是否有canvas元素
  1214. function detectCanvas() {
  1215. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1216.  
  1217. // 隐藏按钮
  1218. utils.toggleBtnStatus("btn_1");
  1219. // 显示按钮
  1220. utils.toggleBtnStatus("btn_2");
  1221.  
  1222. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1223. if (!haveCanvas) {
  1224. // btn_2: 导出图片链接
  1225. utils.setBtnEvent(() => {
  1226. if (confirm("确定每页内容都加载完成了吗?")) {
  1227. utils.savePicUrls("[id*=img_]");
  1228. }
  1229. }, [], "btn_2", "导出全部图片链接");
  1230. } else {
  1231. // 显示按钮3
  1232. utils.toggleBtnStatus("btn_3");
  1233. // btn_2: 导出zip
  1234. utils.setBtnEvent(() => {
  1235. if (confirm("确定每页内容都加载完成了吗?")) {
  1236. utils.saveCanvasesToZip(...prepare());
  1237. }
  1238. }, [], "btn_2", "导出图片到zip");
  1239. // btn_3: 导出PDF
  1240. utils.setBtnEvent(() => {
  1241. if (confirm("确定每页内容都加载完成了吗?")) {
  1242. utils.saveCanvasesToPDF(...prepare());
  1243. }
  1244. }, [], "btn_3", "导出图片到PDF");
  1245. }
  1246. }
  1247.  
  1248.  
  1249. /**
  1250. * 豆丁文档下载策略
  1251. */
  1252. function docin() {
  1253. // 创建脚本启动按钮
  1254. utils.createBtns();
  1255.  
  1256. // 隐藏底部工具栏
  1257. document.querySelector("#j_select").click(); // 选择指针
  1258. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1259. tool_bar.style.display = "none";
  1260.  
  1261. // btn_1: 判断文档类型
  1262. utils.setBtnEvent(() => {
  1263. utils.forceHide(".jz_watermark");
  1264. detectCanvas();
  1265. }, [], "btn_1", "判断文档类型");
  1266. }
  1267.  
  1268. /**
  1269. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1270. */
  1271. function readAlliShare() {
  1272. // 获取“继续阅读”元素
  1273. let red_btn = document.getElementsByClassName("red-color")[0];
  1274. let red_text = red_btn.textContent;
  1275. // 如果可以展开,则展开
  1276. if (red_text.search("点击可继续阅读") !== -1) {
  1277. red_btn.click();
  1278. setTimeout(readAlliShare, 1000);
  1279. }
  1280. // 否则启动按钮2,准备清理页面然后打印为PDF
  1281. else {
  1282. // 隐藏按钮
  1283. utils.toggleBtnStatus("btn_1");
  1284. // 显示按钮
  1285. utils.toggleBtnStatus("btn_2");
  1286. utils.toggleBtnStatus("btn_3");
  1287.  
  1288. // 显示svg图片的链接
  1289. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1290. if (!page1) {
  1291. // 如果不存在svg图形,终止后续代码
  1292. console.log("当前页面不存在svg图形");
  1293. return;
  1294. }
  1295. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1296. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1297. svg1_src_div.innerHTML = `<div id="src-1"
  1298. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1299. 访问以下链接以复制文字:<br>${page1.src}
  1300. </div>`;
  1301. svg2_src_div.innerHTML = `<div id="src-1"
  1302. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1303. 访问以下链接以复制文字:<br>${page2.src}
  1304. </div>`;
  1305. // 添加到页面上
  1306. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1307. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1308. }
  1309. }
  1310.  
  1311.  
  1312. /**
  1313. * 清理并打印爱问共享资料的文档页
  1314. * @returns 如果输入偏移量非法,返回空值以终止函数
  1315. */
  1316. function printPageiShare() {
  1317. // # 清理并打印爱问共享资料的文档页
  1318. // ## 移除页面上无关的元素
  1319. // ### 移除单个元素
  1320. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1321. let header = document.getElementsByClassName("new-detail-header")[0];
  1322. let fixright = document.getElementById("fix-right");
  1323. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1324. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1325. let footer = document.getElementsByClassName("website-footer")[0];
  1326. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1327. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1328. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1329. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1330. let crumb_arrow;
  1331. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1332. let copyright = document.getElementsByClassName("copyright-container")[0];
  1333. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1334. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1335. // ### 执行移除
  1336. let elem_list = [
  1337. topbanner,
  1338. header,
  1339. fixright,
  1340. redpacket,
  1341. fixedrightfull,
  1342. footer,
  1343. guess,
  1344. detailtopbox,
  1345. fullscreen,
  1346. endhint,
  1347. crumb_arrow,
  1348. copyright,
  1349. state_btn,
  1350. comments
  1351. ];
  1352. for (let elem of elem_list) {
  1353. utils.tryToRemoveElement(elem);
  1354. }
  1355. // ### 移除全部同类元素
  1356. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1357. for (let elem_2 of elem_list_2) {
  1358. utils.tryToRemoveElement(elem_2);
  1359. }
  1360. // 使文档居中
  1361. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1362. if (!utils.centerDoc("doc-main", "18")) {
  1363. return; // 如果输入非法,终止函数调用
  1364. }
  1365. // 隐藏按钮,然后打印页面
  1366. utils.hideBtnThenPrint();
  1367. }
  1368.  
  1369.  
  1370. /**
  1371. * 爱问共享资料文档下载策略
  1372. */
  1373. function ishare() {
  1374. // 创建脚本启动按钮1、2
  1375. utils.createBtns();
  1376.  
  1377. // btn_1: 展开文档
  1378. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1379. // btn_2: 导出图片链接
  1380. utils.setBtnEvent(() => {
  1381. utils.savePicUrls(".data-detail");
  1382. }, [], "btn_2", "导出图片链接(推荐)");
  1383. // btn_3: 打印页面到PDF
  1384. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1385.  
  1386. // 移除底部下载条
  1387. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1388. utils.tryToRemoveElement(detailfixed);
  1389. }
  1390.  
  1391. /**
  1392. * 清理并打印得力文库的文档页
  1393. */
  1394. function printPageDeliwenku() {
  1395. // 移除页面上的无关元素
  1396. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1397. let elem_list = document.querySelectorAll(selector);
  1398. for (let elem of elem_list) {
  1399. utils.tryToRemoveElement(elem);
  1400. }
  1401. // 修改页间距
  1402. let outer_pages = document.getElementsByClassName("outer_page");
  1403. for (let page of outer_pages) {
  1404. page.style.marginBottom = "20px";
  1405. }
  1406. // 使文档居中
  1407. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1408. if (!utils.centerDoc("#boxleft", "3")) {
  1409. return; // 如果输入非法,终止函数调用
  1410. }
  1411. // 打印文档
  1412. utils.hideBtnThenPrint();
  1413. }
  1414.  
  1415.  
  1416. /**
  1417. * 点击“继续阅读”,适用性:得力文库
  1418. */
  1419. function readAllDeliwenku() {
  1420. // 点击“同意并开始预览全文”
  1421. let start_btn = document.getElementsByClassName("pre_button")[0];
  1422. let display = start_btn.parentElement.parentElement.style.display;
  1423. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1424. if (!display) {
  1425. start_btn.children[0].click();
  1426. setTimeout(() => {
  1427. scroll(0, document.body.scrollHeight);
  1428. }, 200);
  1429. return;
  1430. }
  1431. // 增强按钮点击效果
  1432. utils.enhanceBtnClickReaction();
  1433.  
  1434. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1435. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1436. // 继续阅读
  1437. if (display2 !== "none") {
  1438. // 获取input元素
  1439. let cur_page = document.querySelector("#pageNumInput");
  1440. let page_old = cur_page.value;
  1441. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1442. // 跳转到尾页
  1443. utils.jump2pageNo(cur_page, page_max, "keydown");
  1444. // 跳转回来
  1445. utils.jump2pageNo(cur_page, page_old, "keydown");
  1446.  
  1447. // 切换按钮准备导出
  1448. } else {
  1449. // 推荐导出图片链接
  1450. utils.modifyBtnText("btn_2", null, true);
  1451. // 隐藏按钮
  1452. utils.toggleBtnStatus("btn_1");
  1453. // 显示按钮
  1454. utils.toggleBtnStatus("btn_2");
  1455. utils.toggleBtnStatus("btn_3");
  1456. // btn_3 橙色按钮
  1457. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1458. }
  1459. }
  1460.  
  1461.  
  1462. /**
  1463. * 得力文库文档下载策略
  1464. */
  1465. function deliwenku() {
  1466. // 创建脚本启动按钮1、2
  1467. utils.createBtns();
  1468.  
  1469. // btn_1: 展开文档
  1470. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1471. // btn_2: 导出图片链接
  1472. utils.setBtnEvent(() => {
  1473. if (confirm("确定每页内容都加载完成了吗?")) {
  1474. utils.savePicUrls('.inner_page div');
  1475. }
  1476. }, [], "btn_2", "导出图片链接");
  1477.  
  1478. // 尝试关闭页面弹窗
  1479. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1480. // 解除打印限制
  1481. utils.allowPrint();
  1482. }
  1483.  
  1484. function readAll360Doc() {
  1485. // 展开文档
  1486. document.querySelector(".article_showall a").click();
  1487. // 隐藏按钮
  1488. utils.toggleBtnStatus("btn_1");
  1489. // 显示按钮
  1490. utils.toggleBtnStatus("btn_2");
  1491. utils.toggleBtnStatus("btn_3");
  1492. }
  1493.  
  1494.  
  1495. function saveText_360Doc() {
  1496. // 捕获图片链接
  1497. let images = document.querySelectorAll("#artContent img");
  1498. let content = [];
  1499.  
  1500. for (let i = 0; i < images.length; i++) {
  1501. let src = images[i].src;
  1502. content.push(`图${i+1},链接:${src}`);
  1503. }
  1504. // 捕获文本
  1505. let text = document.querySelector("#artContent").textContent;
  1506. content.push(text);
  1507.  
  1508. // 保存纯文本文档
  1509. let title = document.querySelector("#titiletext").textContent;
  1510. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1511. }
  1512.  
  1513.  
  1514. function printPage360Doc() {
  1515. // # 清理并打印360doc的文档页
  1516. // ## 移除页面上无关的元素
  1517. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1518. let elem_list = document.querySelectorAll(selector);
  1519. let under_doc_1, under_doc_2;
  1520. try {
  1521. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1522. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1523. } catch (e) { console.log(); }
  1524. // 执行移除
  1525. for (let elem of elem_list) {
  1526. utils.tryToRemoveElement(elem);
  1527. }
  1528. utils.tryToRemoveElement(under_doc_1);
  1529. utils.tryToRemoveElement(under_doc_2);
  1530. // 执行隐藏
  1531. document.querySelector("a[title]").style.display = "none";
  1532.  
  1533. // 使文档居中
  1534. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1535. if (!utils.centerDoc(".a_left", "20")) {
  1536. return; // 如果输入非法,终止函数调用
  1537. }
  1538. // 隐藏按钮,然后打印页面
  1539. utils.hideBtnThenPrint();
  1540. }
  1541.  
  1542.  
  1543. /**
  1544. * 360doc个人图书馆下载策略
  1545. */
  1546. function doc360() {
  1547. // 创建按钮区
  1548. utils.createBtns();
  1549. // btn_1: 展开文档
  1550. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1551. // btn_2: 导出纯文本
  1552. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1553. // btn_3: 打印页面到PDF
  1554. utils.setBtnEvent(() => {
  1555. if (confirm("确定每页内容都加载完成了吗?")) {
  1556. printPage360Doc();
  1557. }
  1558. }, [], "btn_3", "打印页面到PDF");
  1559. }
  1560.  
  1561. /**
  1562. * 查找出所有未被捕获的页码,并返回列表
  1563. * @returns 未捕获页码列表
  1564. */
  1565. function getMissedPages() {
  1566. let all = []; // 全部页码
  1567. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1568. all[i] = i + 1;
  1569. }
  1570. let missed = []; // 未捕获页码
  1571. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1572.  
  1573. // 排除并录入未捕获页码
  1574. for (let num of all) {
  1575. if (!possessed.includes(`page${num}`)) {
  1576. missed.push(num);
  1577. }
  1578. }
  1579. return missed;
  1580. }
  1581.  
  1582.  
  1583. /**
  1584. * 根据键中的id数字对map排序
  1585. * @param {Map} elems_map
  1586. * @returns sorted_map
  1587. */
  1588. function sortMapByID(elems_map) {
  1589. // id形式:page2
  1590. let elems_arr = Array.from(elems_map);
  1591. elems_arr.sort((item1, item2) => {
  1592. // 从key中取出id
  1593. let id1 = parseInt(item1[0].replace("page", ""));
  1594. let id2 = parseInt(item2[0].replace("page", ""));
  1595. // 升序排序
  1596. return id1 - id2;
  1597. });
  1598. // 返回排序好的map
  1599. return new Map(elems_arr);
  1600. }
  1601.  
  1602.  
  1603. /**
  1604. * 存储动态加载的canvas元素、textContent
  1605. */
  1606. function storeElements_MBA() {
  1607. let canvases_map = window.mbaJS.canvases_map;
  1608. let texts_map = window.mbaJS.texts_map;
  1609. let quality = window.mbaJS.quality;
  1610.  
  1611. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1612. (elem) => {
  1613. let capture = (elem) => {
  1614. // (1) 存储页面为canvas图形
  1615. let canvas, data_base64;
  1616. // 导出canvas数据防止丢失
  1617. try {
  1618. // 存储canvas
  1619. canvas = elem.querySelector("canvas[id*=page]");
  1620. if (window.mbaJS.only_text) {
  1621. data_base64 = null;
  1622. } else {
  1623. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1624. }
  1625. } catch (e) {
  1626. // utils.sleep(500);
  1627. return;
  1628. }
  1629. // 增量录入map
  1630. let id = canvas.id; // id的形式:page2
  1631. if (!canvases_map.has(id)) {
  1632. canvases_map.set(id, data_base64);
  1633. }
  1634. // 确定canvas长宽
  1635. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1636. window.mbaJS.width = parseInt(canvas.width);
  1637. window.mbaJS.height = parseInt(canvas.height);
  1638. }
  1639.  
  1640. // (2) 存储text
  1641. let text = elem.textContent;
  1642. if (!texts_map.has(id)) {
  1643. texts_map.set(id, text);
  1644. }
  1645. };
  1646. setTimeout(capture, 500, elem);
  1647. });
  1648. if (canvases_map.size === window.mbaJS.max_page) {
  1649. // 根据id排序
  1650. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  1651. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  1652. window.mbaJS.finished = true;
  1653. window.onscroll = null;
  1654. }
  1655. }
  1656.  
  1657.  
  1658. /**
  1659. * 将canvas转为jpeg,然后导出PDF
  1660. * @param {Array} base64_list canvas元素列表
  1661. * @param {String} title 文档标题
  1662. */
  1663. function saveCanvasesToPDF_MBA(base64_list, title) {
  1664. let width = window.mbaJS.width;
  1665. let height = window.mbaJS.height;
  1666.  
  1667. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1668. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1669. let orientation = width > height ? 'l' : 'p';
  1670. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1671.  
  1672. // 保存每一页文档到每一页pdf
  1673. let i = 0;
  1674. for (let base64 of base64_list) {
  1675. i += 1;
  1676. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1677. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1678. if (i < window.mbaJS.max_page) {
  1679. pdf.addPage();
  1680. }
  1681. }
  1682. // 导出文件
  1683. pdf.save(`${title}.pdf`);
  1684. }
  1685.  
  1686. /**
  1687. * 判断文档页是否收集完毕,当不行时给出提示
  1688. * @returns boolean
  1689. */
  1690. function ready2use() {
  1691. removeAds(); // 顺便清理广告
  1692. // 如果是首次点击按钮,给出提示
  1693. if (window.mbaJS.first_hint) {
  1694. let hint = [
  1695. "如果浏览速度过快,比如:",
  1696. "当前页面还没完全加载好就滚动页面去看下一页",
  1697. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1698. "由防范技术的干扰,该功能目前很不好用,见谅"
  1699. ].join("\n");
  1700. alert(hint);
  1701. window.mbaJS.first_hint = false;
  1702. }
  1703. // 如果文档页没有收集完,给出提示
  1704. if (!window.mbaJS.finished) {
  1705. let hint = [
  1706. "仍有内容未加载完,无法使用该功能",
  1707. "建议从头到尾慢速地再浏览一遍",
  1708. "以下是没有加载完成页面的页码:",
  1709. getMissedPages().join(",")
  1710. ];
  1711. alert(hint.join("\n"));
  1712. return false;
  1713. }
  1714. return true;
  1715. }
  1716.  
  1717.  
  1718. /**
  1719. * 用捕获好的canvas转jpg,生成PDF
  1720. * @returns
  1721. */
  1722. function canvas2PDF_mba() {
  1723. if (!ready2use()) {
  1724. return;
  1725. }
  1726. let canvases = window.mbaJS.canvases_map.values();
  1727. // 导出PDF
  1728. let title = document.title.split("-")[0].trim();
  1729. saveCanvasesToPDF_MBA(canvases, title);
  1730. }
  1731.  
  1732.  
  1733. /**
  1734. * 拼合捕获好的文本,保存到txt文件
  1735. * @returns
  1736. */
  1737. function saveText_mba() {
  1738. if (!ready2use()) {
  1739. return;
  1740. }
  1741. let content = Array.from(window.mbaJS.texts_map.values());
  1742. let title = document.title.split("-")[0].trim();
  1743. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1744. }
  1745.  
  1746.  
  1747. /**
  1748. * 移除广告
  1749. */
  1750. function removeAds() {
  1751. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1752. utils.tryToRemoveElement(ad_elem);
  1753. });
  1754. }
  1755.  
  1756.  
  1757. function mbalib_() {
  1758. // 移除广告和左侧工具栏
  1759. removeAds();
  1760. let tool_bar = document.querySelector(".tool-bar");
  1761. utils.tryToRemoveElement(tool_bar);
  1762.  
  1763. // 创建按钮
  1764. utils.createBtns();
  1765. // 隐藏按钮
  1766. utils.toggleBtnStatus("btn_1");
  1767. // 显示按钮
  1768. utils.toggleBtnStatus("btn_2");
  1769. utils.toggleBtnStatus("btn_3");
  1770. utils.toggleBtnStatus("btn_4");
  1771.  
  1772. // 取得页数
  1773. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1774. let quality = utils.getQualityByCanvasAmount(max_page);
  1775.  
  1776. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1777. window.mbaJS = {
  1778. max_page: max_page,
  1779. texts_map: new Map(), // id: text
  1780. canvases_map: new Map(), // id: canvas_data_base64
  1781. quality: quality, // canvas转jpg的质量
  1782. width: null, // canvas宽度(px)
  1783. height: null,
  1784. finished: false, // 是否收集完了全部文档页元素
  1785. first_hint: true,
  1786. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1787. only_text: false // 是否仅捕获文本
  1788. };
  1789. // 跟随浏览,动态收集页面元素
  1790. window.onscroll = () => {
  1791. storeElements_MBA();
  1792. };
  1793. // 跟随浏览,动态收集页面元素
  1794. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  1795. // 绑定事件
  1796. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  1797. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  1798.  
  1799. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  1800. let btn_text, aim_btn, hint;
  1801. if (max_page > 40) {
  1802. btn_text = "失效说明";
  1803. aim_btn = "btn_3";
  1804. hint = [
  1805. "页数超过40,脚本无效",
  1806. "只能使用导出文本功能",
  1807. "而此脚本会使页面内容加载明显变慢,建议禁用"
  1808. ];
  1809. utils.setBtnEvent(utils.banSelf, [
  1810. () => { window.onscroll = null; }
  1811. ], "btn_4", "临时禁用脚本");
  1812. } else {
  1813. btn_text = "空白页说明";
  1814. aim_btn = "btn_4";
  1815. hint = [
  1816. "导致空白页的原因如下",
  1817. "加载该页的时间超过2秒 / 明显等待",
  1818. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  1819. ];
  1820. }
  1821.  
  1822. utils.setBtnEvent(() => {
  1823. alert(hint.join("\n"));
  1824. }, [], aim_btn, btn_text);
  1825. }
  1826.  
  1827.  
  1828. function mbalib() {
  1829. setTimeout(mbalib_, 2000);
  1830. }
  1831.  
  1832. /**
  1833. * 判断是否进入预览模式
  1834. * @returns Boolean
  1835. */
  1836. function isInPreview() {
  1837. let p_elem = document.querySelector("#preview_tips");
  1838. if (p_elem.style.display === "none") {
  1839. return true;
  1840. }
  1841. return false;
  1842. }
  1843.  
  1844.  
  1845. /**
  1846. * 判断是否展开了全文
  1847. * @returns Boolean
  1848. */
  1849. function isNoMorePage() {
  1850. let read_more = document.querySelector("#ntip2");
  1851. if (read_more.style.display === "none") {
  1852. return true;
  1853. }
  1854. return false;
  1855. }
  1856.  
  1857.  
  1858. /**
  1859. * 确保进入预览模式
  1860. */
  1861. function ensureInPreview() {
  1862. if (!isInPreview()) {
  1863. // 如果没有进入预览,则先进入
  1864. document.querySelector(".pre_button a").click();
  1865. utils.sleep(500);
  1866. }
  1867. }
  1868.  
  1869.  
  1870. /**
  1871. * 展开全文预览,当展开完成后再次调用时,返回true
  1872. * @returns
  1873. */
  1874. function unfoldAll() {
  1875. ensureInPreview();
  1876. if (isNoMorePage()) {
  1877. // 如果全文展开了,则切换按钮,然后退出
  1878. utils.toggleBtnStatus("btn_1");
  1879. utils.toggleBtnStatus("btn_2");
  1880. return true;
  1881. }
  1882. // 跳转到最后一页,以展开全文
  1883. let cur_page = document.querySelector("#pageNumInput");
  1884. utils.jump2pageNo(cur_page, "999", "keydown");
  1885. }
  1886.  
  1887.  
  1888. /**
  1889. * 取得最大页码(最大20)
  1890. * @returns {Number} 页码int
  1891. */
  1892. function getPageCounts$1() {
  1893. let counts_str = document.querySelector(".counts").textContent;
  1894. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  1895. if (counts > 20) {
  1896. counts = 20; // 最多免费预览20页,所以设置最大页码20
  1897. }
  1898. return parseInt(counts);
  1899. }
  1900.  
  1901.  
  1902. /**
  1903. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  1904. * @returns Array | null
  1905. */
  1906. function getImgUrls() {
  1907. let pages = document.querySelectorAll("[id*=pageflash_]");
  1908. // 尚未浏览完全部页面,返回null
  1909. if (pages.length < window.dugenJS.page_counts) {
  1910. return null;
  1911. }
  1912. // 浏览完全部页面,返回urls
  1913. let urls = [];
  1914. pages.forEach((page) => {
  1915. let url = page.querySelector("img").src;
  1916. urls.push(url);
  1917. });
  1918. return urls;
  1919. }
  1920.  
  1921.  
  1922. /**
  1923. * 返回当前未加载页面的页码
  1924. * @returns not_loaded
  1925. */
  1926. function getNotloadedPages() {
  1927. // 已经取得的页码
  1928. let pages = document.querySelectorAll("[id*=pageflash_]");
  1929. let loaded = new Set();
  1930. pages.forEach((page) => {
  1931. let id = page.id.split("_")[1];
  1932. id = parseInt(id);
  1933. loaded.add(id);
  1934. });
  1935. // 未取得的页码
  1936. let not_loaded = [];
  1937. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  1938. if (!loaded.has(i)) {
  1939. not_loaded.push(i);
  1940. }
  1941. }
  1942. return not_loaded;
  1943. }
  1944.  
  1945.  
  1946. function WantImgUrls() {
  1947. let res = getImgUrls();
  1948. // 页面尚未加载完
  1949. if (res === null) {
  1950. let hints = [
  1951. "尚未加载完全部页面",
  1952. "以下页面需要浏览并加载:",
  1953. getNotloadedPages().join(",")
  1954. ];
  1955. alert(hints.join("\n"));
  1956. return;
  1957. }
  1958. // 页面全部加载完
  1959. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  1960. }
  1961.  
  1962.  
  1963. /**
  1964. * dugen文档下载策略
  1965. */
  1966. function dugen() {
  1967. ensureInPreview();
  1968. // 全局对象
  1969. window.dugenJS = {
  1970. page_counts: getPageCounts$1() // 最大页码(int)
  1971. };
  1972.  
  1973. // 创建按钮区
  1974. utils.createBtns();
  1975.  
  1976. // 绑定监听器
  1977. // 按钮1:展开文档
  1978. utils.setBtnEvent(unfoldAll, [], "btn_1");
  1979. // 按钮2:导出图片链接
  1980. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  1981. }
  1982.  
  1983. /**
  1984. * 取得文档类型
  1985. * @returns {String} 文档类型str
  1986. */
  1987. function getDocType() {
  1988. let type_elem = document.querySelector(".title .icon.icon-format");
  1989. // ["icon", "icon-format", "icon-format-doc"]
  1990. let cls_str = type_elem.classList[2];
  1991. // "icon-format-doc"
  1992. let type = cls_str.split("-")[2];
  1993. return type;
  1994. }
  1995.  
  1996.  
  1997. /**
  1998. * 判断文档类型是否为type_list其中之一
  1999. * @returns 是否为type
  2000. */
  2001. function isTypeof(type_list) {
  2002. let type = getDocType();
  2003. if (type_list.includes(type)) {
  2004. return true;
  2005. }
  2006. return false;
  2007. }
  2008.  
  2009.  
  2010. /**
  2011. * 判断文档类型是否为PPT
  2012. * @returns 是否为PPT
  2013. */
  2014. function isPPT() {
  2015. return isTypeof(["ppt", "pptx"]);
  2016. }
  2017.  
  2018.  
  2019. /**
  2020. * 判断文档类型是否为Excel
  2021. * @returns 是否为Excel
  2022. */
  2023. function isEXCEL() {
  2024. return isTypeof(["xls", "xlsm", "xlsx"]);
  2025. }
  2026.  
  2027.  
  2028. /**
  2029. * 取得最大页码
  2030. * @returns 最大页码int
  2031. */
  2032. function getPageCounts() {
  2033. let page_counts_str = document.querySelector(".intro-list").children[3].textContent;
  2034. let page_counts = parseInt(page_counts_str.match(/[0-9]{1,3}(?=页)/)[0]);
  2035. return page_counts;
  2036. }
  2037.  
  2038.  
  2039. /**
  2040. * 取得未加载页面的页码
  2041. * @param {Set} loaded 已加载的页码集合
  2042. * @returns {Array} not_loaded 未加载页码列表
  2043. */
  2044. function getNotLoaded(loaded) {
  2045. let not_loaded = [];
  2046. let page_counts = window.book118JS.page_counts;
  2047. for (let i = 1; i <= page_counts; i++) {
  2048. if (!loaded.has(i)) {
  2049. not_loaded.push(i);
  2050. }
  2051. }
  2052. return not_loaded;
  2053. }
  2054.  
  2055.  
  2056. /**
  2057. * 取得全部文档页的url
  2058. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2059. */
  2060. function getUrls() {
  2061. let loaded = new Set(); // 存储已加载页面的页码
  2062. let urls = []; // 存储已加载页面的图形src
  2063. // 收集已加载页面的url
  2064. document.querySelectorAll("div[data-id]").forEach((div) => {
  2065. let src = div.querySelector("img").src;
  2066. if (src) {
  2067. // "1": "https://view-cache.book118.com/..."
  2068. loaded.add(parseInt(div.getAttribute("data-id")));
  2069. urls.push(src);
  2070. }
  2071. });
  2072. // 如果所有页面加载完毕
  2073. if (loaded.size === window.book118JS.page_counts) {
  2074. return [true, urls];
  2075. }
  2076. // 否则收集未加载页面的url
  2077. return [false, getNotLoaded(loaded)];
  2078. }
  2079.  
  2080.  
  2081. /**
  2082. * 展开全文
  2083. */
  2084. function readAll() {
  2085. window.preview.jump(999);
  2086. }
  2087.  
  2088.  
  2089. /**
  2090. * btn_2: 导出图片链接
  2091. */
  2092. function wantUrls() {
  2093. let [flag, res] = getUrls();
  2094. // 页面都加载完毕,下载urls
  2095. if (flag) {
  2096. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2097. return;
  2098. }
  2099. // 没有加载完,提示出未加载好的页码
  2100. let hints = [
  2101. "仍有页面没有加载",
  2102. "请浏览并加载如下页面:",
  2103. res.join(",")
  2104. ];
  2105. alert(hints.join("\n"));
  2106. }
  2107.  
  2108.  
  2109. /**
  2110. * 打开PPT预览页面
  2111. */
  2112. function openPPTpage() {
  2113. window.preview.getSrc();
  2114. let openPPT = () => {
  2115. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2116. utils.openInNewTab(ppt_src);
  2117. window.preview.close();
  2118. };
  2119. setTimeout(openPPT, 1000);
  2120. }
  2121.  
  2122.  
  2123. /**
  2124. * 原创力文档(非PPT或Excel)下载策略
  2125. */
  2126. function book118_CommonDoc() {
  2127. // 创建全局对象
  2128. window.book118JS = {
  2129. doc_type: getDocType(),
  2130. page_counts: getPageCounts()
  2131. };
  2132.  
  2133. // 处理非PPT文档
  2134. // 创建按钮组
  2135. utils.createBtns();
  2136. // 绑定监听器到按钮
  2137. // 按钮1:展开文档
  2138. utils.setBtnEvent(() => {
  2139. readAll();
  2140. utils.toggleBtnStatus("btn_1");
  2141. utils.toggleBtnStatus("btn_2");
  2142. }, [], "btn_1");
  2143. // 按钮2:导出图片链接
  2144. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2145. }
  2146.  
  2147.  
  2148. /**
  2149. * 取得PPT文档最大页码
  2150. * @returns PPT文档最大页码int
  2151. */
  2152. function getPageCountsPPT() {
  2153. let counts_str = document.querySelector("#PageCount").textContent;
  2154. let counts = parseInt(counts_str);
  2155. // console.log(`get page counts: ${counts}`);
  2156. return counts;
  2157. }
  2158.  
  2159.  
  2160. /**
  2161. * 取得当前的页码
  2162. * @returns {Number} this_page
  2163. */
  2164. function getThisPage() {
  2165. let this_page = document.querySelector("#PageIndex").textContent;
  2166. this_page = parseInt(this_page);
  2167. return this_page;
  2168. }
  2169.  
  2170.  
  2171. /**
  2172. * 点击下一动画直到变成下一页,再切回上一页
  2173. * @param {Number} next_page 下一页的页码
  2174. */
  2175. async function __nextFrameUntillNextPage(next_page) {
  2176. // 如果已经抵达下一页,则返回上一页
  2177. let this_page = getThisPage();
  2178.  
  2179. // 最后一页直接退出
  2180. if (next_page > getPageCountsPPT()) {
  2181. return;
  2182. }
  2183. // 不是最后一页,但完成了任务
  2184. else if (this_page === next_page) {
  2185. document.querySelector(".btmLeft").click();
  2186. await utils.sleepAsync(500);
  2187. return;
  2188. }
  2189. // 否则递归的点击下一动画
  2190. document.querySelector(".btmRight").click();
  2191. await utils.sleepAsync(500);
  2192. await __nextFrameUntillNextPage(next_page);
  2193. }
  2194.  
  2195.  
  2196. /**
  2197. * 确保当前页面是最后一帧动画
  2198. */
  2199. async function ensurePageLoaded() {
  2200. // 取得当前页码和下一页页码
  2201. let this_page = getThisPage();
  2202. let next_page = this_page + 1;
  2203. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2204. await __nextFrameUntillNextPage(next_page);
  2205. }
  2206.  
  2207.  
  2208. /**
  2209. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2210. */
  2211. async function docView2Canvas() {
  2212. await ensurePageLoaded();
  2213. // 取得页码
  2214. let cur_page = getThisPage();
  2215. // 取得视图元素,计数从0开始
  2216. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2217. // 转化为canvas
  2218. let canvas_promise = html2canvas(doc_view);
  2219. console.log(canvas_promise); // 打印信息以检查状况
  2220.  
  2221. await canvas_promise.then((canvas) => {
  2222. // 保存canvas到全局对象
  2223. window.book118JS.canvases.push(canvas);
  2224. // 打印日志
  2225. console.log(`wk: ${cur_page} complete`);
  2226. });
  2227.  
  2228. // 如果到最后一页
  2229. let page_counts = getPageCountsPPT();
  2230. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2231. if (cur_page === page_counts) {
  2232. // 终止递归,并且显示导出PDF按钮
  2233. utils.toggleBtnStatus("btn_2");
  2234. return;
  2235. }
  2236. // 否则下一次递归(继续捕获下一页)
  2237. document.querySelector(".pgRight").click();
  2238. await utils.sleepAsync(500);
  2239. await docView2Canvas();
  2240. }
  2241.  
  2242.  
  2243. /**
  2244. * 将捕获的canvases合并并导出为pdf
  2245. * @returns
  2246. */
  2247. function canvases2pdf() {
  2248. // 已经捕获的页面数量
  2249. let stored_amount = window.book118JS.canvases.length;
  2250. // 总页面数量
  2251. let page_counts = window.book118JS.page_counts;
  2252. // 校验数量
  2253. let diff = page_counts - stored_amount;
  2254. if (diff > 0) {
  2255. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2256. if (!confirm("是否仍要导出PDF?")) {
  2257. // 不坚持导出PDF的情况
  2258. return;
  2259. }
  2260. }
  2261. // 导出PDF
  2262. let canvases = window.book118JS.canvases;
  2263. // 取得宽高
  2264. let model = canvases[0];
  2265. let width = model.width;
  2266. let height = model.height;
  2267. // 取得标题然后导出pdf
  2268. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2269. }
  2270.  
  2271.  
  2272. /**
  2273. * 原创力文档(PPT)下载策略
  2274. */
  2275. function book118_PPT() {
  2276. // 创建全局对象
  2277. window.book118JS = {
  2278. page_counts: getPageCountsPPT(),
  2279. canvases: [] // 存储每页文档转化的canvas
  2280. };
  2281.  
  2282. // 创建按钮区
  2283. utils.createBtns();
  2284. // 绑定监听器到按钮1
  2285. utils.setBtnEvent(() => {
  2286. let hints = [
  2287. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2288. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2289. ];
  2290. alert(hints.join("\n"));
  2291. // 隐藏按钮1
  2292. utils.toggleBtnStatus("btn_1");
  2293. // 开始捕获页面(异步)
  2294. docView2Canvas(window.book118JS.page_counts);
  2295. }, [], "btn_1", "捕获页面");
  2296. // 为按钮2绑定监听器
  2297. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2298. }
  2299.  
  2300.  
  2301. /**
  2302. * 取得当前页面的excel,返回csv string
  2303. * @returns {String} csv
  2304. */
  2305. function excel2CSV() {
  2306. let table = [];
  2307. let rows = document.querySelectorAll("tr[id]");
  2308.  
  2309. // 遍历行
  2310. for (let row of rows) {
  2311. let csv_row = [];
  2312. // 遍历列(单元格)
  2313. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2314. // 判断单元格是否存储图片
  2315. let img = cell.querySelector("img");
  2316. if (img) {
  2317. // 如果是图片,保存图片链接
  2318. csv_row.push(img.src);
  2319. } else {
  2320. // 否则保存单元格文本
  2321. csv_row.push(cell.textContent);
  2322. }
  2323. }
  2324. table.push(csv_row.join(","));
  2325. }
  2326.  
  2327. let csv = table.join("\n");
  2328. csv = csv.replace(/\n{2,}/g, "\n");
  2329. return csv;
  2330. }
  2331.  
  2332.  
  2333. /**
  2334. * 下载当前表格内容,保存为csv(utf-8编码)
  2335. */
  2336. function wantEXCEL() {
  2337. let file_name = "原创力表格_UTF-8.csv";
  2338. utils.createAndDownloadFile(file_name, excel2CSV());
  2339. }
  2340.  
  2341.  
  2342. /**
  2343. * 在Excel预览页面给出操作提示
  2344. */
  2345. function help() {
  2346. let hints = [
  2347. "【导出表格到CSV】只能导出当前sheet,",
  2348. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2349. "CSV是一种简单的表格格式,可以被Excel打开,",
  2350. "并转为 xls 或 xlsx 格式存储,",
  2351. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2352. "",
  2353. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2354. "有两个办法:",
  2355. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2356. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2357. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2358. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2359. ];
  2360. alert(hints.join("\n"));
  2361. }
  2362.  
  2363.  
  2364. /**
  2365. * 原创力文档(EXCEL)下载策略
  2366. */
  2367. function book118_EXCEL() {
  2368. // 创建按钮区
  2369. utils.createBtns();
  2370. // 绑定监听器到按钮
  2371. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2372. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2373. // 显示按钮
  2374. utils.toggleBtnStatus("btn_2");
  2375. }
  2376.  
  2377.  
  2378. /**
  2379. * 打开Excel预览页面
  2380. */
  2381. function openEXCELpage() {
  2382. openPPTpage();
  2383. }
  2384.  
  2385.  
  2386. /**
  2387. * 原创力文档下载策略
  2388. */
  2389. function book118() {
  2390. let host = window.location.hostname;
  2391. if (host === 'max.book118.com') {
  2392. if (isEXCEL()) {
  2393. utils.createBtns();
  2394. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2395. } else if (isPPT()) {
  2396. utils.createBtns();
  2397. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2398. } else {
  2399. book118_CommonDoc();
  2400. }
  2401. } else if (host === "view-cache.book118.com") {
  2402. book118_PPT();
  2403. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2404. book118_EXCEL();
  2405. } else {
  2406. console.log(`wk: Unknown host: ${host}`);
  2407. }
  2408. }
  2409.  
  2410. /**
  2411. * 设置图像质量为100
  2412. */
  2413. function HD() {
  2414. window.img_quality = 1;
  2415. console.log("图像质量已经设置为100%");
  2416. console.log("如果刷新页面或跳转页面则需要再次使用该命令");
  2417. }
  2418.  
  2419. /**
  2420. * 主函数:识别网站,执行对应文档下载策略
  2421. */
  2422. function main() {
  2423. // 显示当前位置
  2424. let host = window.location.host;
  2425. console.log(`当前host: ${host}`);
  2426. // 挂载工具包到全局
  2427. window.user_utils = utils;
  2428. console.log("wk: user_utils已经挂载到全局");
  2429.  
  2430. // 附加任务
  2431. utils.globalFunc(HD); // 全局设置高清图片的函数
  2432.  
  2433. // 主任务
  2434. if (host.includes("docin.com")) {
  2435. docin();
  2436. } else if (host === "ishare.iask.sina.com.cn") {
  2437. ishare();
  2438. } else if (host === "www.deliwenku.com") {
  2439. deliwenku();
  2440. } else if (host === "www.doc88.com") {
  2441. doc88();
  2442. } else if (host === "www.360doc.com") {
  2443. doc360();
  2444. } else if (host === "wenku.baidu.com") {
  2445. baiduWenku();
  2446. } else if (host === "doc.mbalib.com") {
  2447. mbalib();
  2448. } else if (host === "www.dugen.com") {
  2449. dugen();
  2450. } else if (host.includes("book118.com")) {
  2451. book118();
  2452. } else {
  2453. console.log("匹配到了无效网页");
  2454. }
  2455. }
  2456.  
  2457. let options = {
  2458. fast_mode: false,
  2459. activation_test: false
  2460. };
  2461. if (options.cli_mode) {
  2462. (() => {
  2463. loadExternalScripts();
  2464. setTimeout(main, 2000);
  2465. return;
  2466. })();
  2467. }
  2468. if (options.activation_test) {
  2469. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  2470. }
  2471. if (options.fast_mode) {
  2472. main();
  2473. } else {
  2474. window.onload = main;
  2475. }
  2476.  
  2477. })();