Wenku Doc Downloader

下载文档,导出PDF。支持①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档(前20页) ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。

目前为 2022-03-15 提交的版本。查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.2
  5. // @description 下载文档,导出PDF。支持①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档(前20页) ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/*/*
  13. // @match *://doc.mbalib.com/view/*
  14. // @match *://www.woc88.com/so-*
  15. // @match *://www.dugen.com/p-*
  16. // @match *://max.book118.com/html/*
  17. // @match *://view-cache.book118.com/pptView.html?*
  18. // @match *://*.book118.com/?readpage=*
  19. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  20. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  21. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  22. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  23. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  24. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  25. // @grant none
  26. // @license GPL-3.0-only
  27. // @create 2021-11-22
  28. // @note 1. 修复了百度文库 /tfview/ 路径不可用的问题
  29. // @note 2. 修复了360doc 极个别情况下文档展开按钮失效的问题
  30. // @note 3. 修复了脚本在手机端打印页面时按钮区隐藏失效的问题
  31. // ==/UserScript==
  32.  
  33.  
  34. (function () {
  35. 'use strict';
  36.  
  37. // import "./lib/jspdf.umd.min";
  38. // import "./lib/html2canvas.min";
  39. // import "./lib/jszip.min";
  40. // import "./lib/FileSaver.min";
  41.  
  42.  
  43. let utils = {
  44. ver: (() => {
  45. // 显示版本号
  46. let _ver = "wk-utils: ver-1.5.2";
  47. console.log(_ver);
  48. return _ver;
  49. })(),
  50.  
  51. /**
  52. * 创建并下载文件
  53. * @param {String} file_name 文件名
  54. * @param {String | Blob} content 文本或blob
  55. */
  56. createAndDownloadFile: function(file_name, content) {
  57. let aTag = document.createElement('a');
  58. let blob;
  59. if (typeof(content) === "string") {
  60. blob = new Blob([content]);
  61. }
  62. aTag.download = file_name;
  63. aTag.href = URL.createObjectURL(blob);
  64. aTag.click();
  65. URL.revokeObjectURL(blob);
  66. },
  67.  
  68. /**
  69. * 创建并下载链接资源
  70. * @param {String} file_name
  71. * @param {String} src
  72. */
  73. downloadUrlFile: function(file_name, src) {
  74. let aTag = document.createElement('a');
  75. aTag.download = file_name;
  76. aTag.href = src;
  77. aTag.click();
  78. },
  79.  
  80. /**
  81. * 添加外部js到当前页面
  82. * @param {String} url
  83. */
  84. addScripts2HTML: function(url) {
  85. let script = document.createElement("script");
  86. script.src = url;
  87. document.head.appendChild(script);
  88. },
  89.  
  90. /**
  91. * 临时禁用脚本,执行func后移除btns_section。
  92. * @param {Function} func
  93. */
  94. banSelf: function(func = () => { }) {
  95. func();
  96. document.querySelector(".btns_section").remove();
  97. },
  98.  
  99. /**
  100. * 睡眠 delay 毫秒
  101. * @param {Number} delay
  102. */
  103. sleep: function(delay) {
  104. let start = (new Date()).getTime();
  105. while ((new Date()).getTime() - start < delay) {
  106. continue;
  107. }
  108. },
  109.  
  110. /**
  111. * 允许打印页面
  112. */
  113. allowPrint: function() {
  114. let style = document.createElement("style");
  115. style.innerHTML = `
  116. @media print {
  117. body{
  118. display:block;
  119. }
  120. }
  121. `;
  122. document.head.appendChild(style);
  123. },
  124.  
  125. /**
  126. * 求main_set去除cut_set后的set
  127. * @param {Set} main_set
  128. * @param {Set} cut_set
  129. * @returns 差集
  130. */
  131. difference: function(main_set, cut_set) {
  132. let _diff = new Set(main_set);
  133. for (let elem of cut_set) {
  134. _diff.delete(elem);
  135. }
  136. return _diff;
  137. },
  138.  
  139. /**
  140. * 抛出set中的第一个元素
  141. * @param {Set} set
  142. * @returns 一个元素
  143. */
  144. setPop: function(set) {
  145. for (let item of set) {
  146. set.delete(item);
  147. return item;
  148. }
  149. },
  150.  
  151. /**
  152. * 绑定事件到指定按钮,返回按钮引用
  153. * @param {Function} event click事件
  154. * @param {Array} args 事件的参数列表
  155. * @param {String} aim_btn 按钮的变量名
  156. * @param {String} new_text 按钮的新文本,为null则不替换
  157. * @returns 按钮元素的引用
  158. */
  159. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  160. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  161. // 如果需要,替换按钮内文本
  162. if (new_text) {
  163. btn.textContent = new_text;
  164. }
  165. // 绑定事件,添加到页面上
  166. btn.onclick = () => {
  167. this.enhanceBtnClickReaction(aim_btn);
  168. if (args.length) {
  169. event(...args);
  170. } else {
  171. event();
  172. }
  173. };
  174. return btn;
  175. },
  176.  
  177. /**
  178. * 强制隐藏元素
  179. * @param {String} selector
  180. */
  181. forceHide: function(selector) {
  182. let style_cls = "force-hide";
  183. document.querySelectorAll(selector).forEach((elem) => {
  184. elem.className += ` ${style_cls}`;
  185. });
  186. // 判断css样式是否已经存在
  187. let style;
  188. style = document.querySelector(`style.${style_cls}`);
  189. // 如果已经存在,则无须重复创建
  190. if (style) {
  191. return;
  192. }
  193. // 否则创建
  194. style = document.createElement("style");
  195. style.innerHTML = `style.${style_cls} {
  196. visibility: hidden !important;
  197. }`;
  198. document.head.appendChild(style);
  199. },
  200.  
  201. /**
  202. * 隐藏按钮,打印页面,显示按钮
  203. */
  204. hideBtnThenPrint: function() {
  205. // 隐藏按钮,然后打印页面
  206. let section = document.getElementsByClassName("btns_section")[0];
  207. section.style.display = "none";
  208. this.sleep(500);
  209. window.print();
  210. // 打印结束,显示按钮
  211. section.style.removeProperty("display");
  212. },
  213.  
  214. /**
  215. * 返回times个倍数连接的str
  216. * @param {String} str
  217. * @param {Number} times
  218. * @returns multiplied_str
  219. */
  220. multiplyStr: function(str, times) {
  221. let str_list = [];
  222. for (let i = 0; i < times; i++) {
  223. str_list.push(str);
  224. }
  225. return str_list.join("");
  226. },
  227.  
  228. /**
  229. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  230. * @param {String} custom_btn 按钮变量名
  231. */
  232. enhanceBtnClickReaction: function(custom_btn = null) {
  233. let aim_btn;
  234. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  235. if (!custom_btn || custom_btn === "btn_1") {
  236. aim_btn = document.querySelector(".btn-1");
  237. } else {
  238. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  239. }
  240.  
  241. let old_color = aim_btn.style.color; // 保存旧的颜色
  242. let old_text = aim_btn.textContent; // 保存旧的文字内容
  243. // 变黑缩小
  244. aim_btn.style.color = "black";
  245. aim_btn.style.fontWeight = "normal";
  246. aim_btn.textContent = `->${old_text}<-`;
  247. // 复原加粗
  248. let changeColorBack = function() {
  249. aim_btn.style.color = old_color;
  250. aim_btn.style.fontWeight = "bold";
  251. aim_btn.textContent = old_text;
  252. };
  253. setTimeout(changeColorBack, 1250);
  254. },
  255.  
  256. /**
  257. * 切换按钮显示/隐藏状态
  258. * @param {String} aim_btn 按钮变量名
  259. * @returns 按钮元素的引用
  260. */
  261. toggleBtnStatus: function(aim_btn) {
  262. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  263. let display = getComputedStyle(btn).display;
  264. // return;
  265. if (display === "none") {
  266. btn.style.display = "block";
  267. } else {
  268. btn.style.display = "none";
  269. }
  270. return btn;
  271. },
  272.  
  273. /**
  274. * 根据canvas元素数量返回quality值
  275. * @param {Number} canvas_amount
  276. * @returns quality: Number
  277. */
  278. getQualityByCanvasAmount: function(canvas_amount) {
  279. // 如果有全局参数,优先用全局的
  280. if (window.img_quality !== undefined) {
  281. console.log(`image quality: ${window.img_quality*100}%`);
  282. return window.img_quality;
  283. }
  284. // 否则用默认的
  285. let quality;
  286. if (canvas_amount <= 25) {
  287. quality = 1.0;
  288. } else if (25 < canvas_amount <= 50) {
  289. quality = 0.9;
  290. } else {
  291. quality = 0.8;
  292. }
  293. console.log(`image quality: ${quality*100}%`);
  294. return quality;
  295. },
  296.  
  297. /**
  298. * 挂载func到全局
  299. * @param {Function} func
  300. */
  301. globalFunc: function(func) {
  302. globalThis[func.name] = func;
  303. },
  304.  
  305. /**
  306. * 用input框跳转到对应页码
  307. * @param {Element} cur_page 当前页码
  308. * @param {string} aim_page 目标页码
  309. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  310. */
  311. jump2pageNo: function(cur_page, aim_page, event_type) {
  312. // 设置跳转页码为目标页码
  313. cur_page.value = aim_page;
  314. // 模拟回车事件来跳转
  315. let keyboard_event_enter = new KeyboardEvent(event_type, {
  316. bubbles: true,
  317. cancelable: true,
  318. keyCode: 13
  319. });
  320. cur_page.dispatchEvent(keyboard_event_enter);
  321. },
  322.  
  323. /**
  324. * 在新标签页打开链接
  325. * @param {String} href
  326. */
  327. openInNewTab: function(href) {
  328. let link = document.createElement("a");
  329. link.href = href;
  330. link.target = "_blank";
  331. link.click();
  332. },
  333.  
  334. /**
  335. * 滚动到页面底部
  336. */
  337. scrollToBottom: function() {
  338. window.scrollTo({
  339. top: document.body.scrollHeight,
  340. behavior: "smooth"
  341. });
  342. },
  343.  
  344. /**
  345. * 用try移除元素
  346. * @param {Element} element 要移除的元素
  347. */
  348. tryToRemoveElement: function(element) {
  349. try {
  350. element.remove();
  351. } catch (e) {
  352. }
  353. },
  354.  
  355. /**
  356. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  357. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  358. */
  359. tryToRemoveSameElem: function(elem_list_box) {
  360. for (let elem_list of elem_list_box) {
  361. if (!elem_list) {
  362. continue;
  363. }
  364. for (let elem of elem_list) {
  365. try {
  366. elem.remove();
  367. } catch (e) {
  368. console.log();
  369. }
  370. }
  371. }
  372. },
  373.  
  374. /**
  375. * 使文档在页面上居中
  376. * @param {String} selector 文档容器的css选择器
  377. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  378. * @returns 偏移值是否合法
  379. */
  380. centerDoc: function(selector, default_offset) {
  381. let doc_main = document.querySelector(selector);
  382. let offset = window.prompt("请输入偏移百分位:", default_offset);
  383. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  384. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  385. doc_main.style.marginLeft = offset + "%";
  386. return true;
  387. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  388. doc_main.style.marginLeft = offset + "%";
  389. return true
  390. } else {
  391. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  392. return false;
  393. }
  394. },
  395.  
  396. /**
  397. * 调整按钮内文本
  398. * @param {String} aim_btn 按钮变量名
  399. * @param {String} new_text 新的文本,null则保留旧文本
  400. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  401. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  402. */
  403. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  404. // 提示文档已经展开
  405. if (use_hint) {
  406. let hint = "文档已经完全展开,可以导出";
  407. alert(hint);
  408. }
  409. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  410. // 要替换的文本
  411. if (new_text) {
  412. btn.textContent = new_text;
  413. }
  414. // 推荐按钮
  415. if (recommend_btn) {
  416. btn.textContent += "(推荐)";
  417. }
  418. },
  419.  
  420. html2Canvases: async function(elem_list) {
  421. // 如果是空元素列表,返回null并终止函数
  422. if (elem_list.length === 0) {
  423. console.log("html2canvases was called, but no element is avaiable.");
  424. return null;
  425. }
  426. let tasks = []; // 存放异步任务
  427. let contents = []; // 存放canvas元素
  428. for (let elem of elem_list) {
  429. let task = html2canvas(elem).then((canvas) => {
  430. contents.push(canvas);
  431. });
  432. tasks.push(task);
  433. }
  434. // 等待全部page转化完成
  435. await Promise.all(tasks);
  436. return contents;
  437. },
  438.  
  439. /**
  440. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  441. * @param {Array} elem_list html元素列表
  442. * @param {String} title 文档标题
  443. */
  444. html2PDF: async function(elem_list, title = "文档") {
  445. // 如果是空元素列表,终止函数
  446. let _contents = this.html2Canvases(elem_list);
  447. if (_contents === null) {
  448. return;
  449. }
  450. _contents.then((contents) => {
  451. // 控制台检查结果
  452. console.log("生成的canvas元素如下:");
  453. console.log(contents);
  454.  
  455. // 拿到canvas宽、高
  456. let model = elem_list[0];
  457. let width, height;
  458. width = model.offsetWidth;
  459. height = model.offsetHeight;
  460. // 打包为pdf
  461. this.saveCanvasesToPDF(contents, title, width, height);
  462. });
  463. },
  464.  
  465. /**
  466. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  467. * @param {string} selector 图形元素的父级元素
  468. */
  469. savePicUrls: function(selector) {
  470. let pages = document.querySelectorAll(selector);
  471. let pic_urls = [];
  472.  
  473. for (let elem of pages) {
  474. let pic_obj = elem.children[0];
  475. let url = pic_obj.src;
  476. pic_urls.push(url);
  477. }
  478. let content = pic_urls.join("\n");
  479. // 启动下载
  480. this.createAndDownloadFile("urls.csv", content);
  481. },
  482.  
  483. /**
  484. * 存储所有canvas图形为png到一个压缩包
  485. * @param {Array} node_list canvas元素列表
  486. * @param {String} title 文档标题
  487. */
  488. saveCanvasesToZip: function(node_list, title) {
  489. // canvas元素转为png图像
  490. // 所有png合并为一个zip压缩包
  491. let zip = new JSZip();
  492. let n = node_list.length;
  493.  
  494. for (let i = 0; i < n; i++) {
  495. let canvas = node_list[i];
  496. let data_base64 = canvas.toDataURL();
  497. let blob = atob(data_base64.split(",")[1]);
  498. zip.file(`page-${i+1}.png`, blob, { binary: true });
  499. }
  500.  
  501. // 导出zip
  502. // promise.then(onCompleted, onRejected);
  503. zip.generateAsync({ type: "blob" }).then(function(content) {
  504. // see filesaver.js
  505. console.log(content);
  506. saveAs(content, `${title}.zip`);
  507. });
  508. },
  509.  
  510. /**
  511. * 将canvas转为jpeg,然后导出PDF
  512. * @param {Array} node_list canvas元素列表
  513. * @param {String} title 文档标题
  514. */
  515. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  516. // 如果没有手动指定canvas的长宽,则自动检测
  517. if (!width && !height) {
  518. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  519. let first_canvas = node_list[0];
  520. // 如果style的长宽不存在,则直接用canvas的元素长宽
  521. let width_str, height_str;
  522. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  523. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  524. } else {
  525. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  526. }
  527. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  528. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  529. }
  530. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  531. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  532. let orientation = width > height ? 'l' : 'p';
  533. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  534.  
  535. // 根据canvas数量确定quality
  536. let quality = this.getQualityByCanvasAmount(node_list.length);
  537.  
  538. // 保存每一页文档到每一页pdf
  539. node_list.forEach(function(canvas, index) {
  540. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  541. // 如果当前不是文档最后一页,则需要添加下一个空白页
  542. if (index !== node_list.length - 1) {
  543. pdf.addPage();
  544. }
  545. });
  546.  
  547. // 导出文件
  548. pdf.save(`${title}.pdf`);
  549. },
  550.  
  551. /**
  552. * Image元素列表合并到一个PDF中
  553. * @param {NodeList} imgs Image元素列表
  554. * @param {String} title 文档名
  555. */
  556. imgs2pdf: function(imgs, title) {
  557. // 取得宽高
  558. let model = imgs[0];
  559. let width = model.offsetWidth;
  560. let height = model.offsetHeight;
  561.  
  562. // 创建pdf
  563. let orientation = width > height ? 'l' : 'p';
  564. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  565.  
  566. // 添加图像到pdf
  567. imgs.forEach((img, index) => {
  568. pdf.addImage(img, 'PNG', 0, 0, width, height);
  569. // 如果当前不是文档最后一页,则需要添加下一个空白页
  570. if (index !== imgs.length - 1) {
  571. pdf.addPage();
  572. }
  573. });
  574.  
  575. // 导出文件
  576. pdf.save(`${title}.pdf`);
  577. },
  578.  
  579. /**
  580. * 取得elem的class为class_name的父级元素
  581. * @param {String} class_name
  582. * @param {Element} elem 起点元素
  583. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  584. * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  585. * @returns {null | Element} parent_element
  586. */
  587. getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
  588. let parent = elem.parentElement;
  589. let iterator_count = JSobj.iterator_count;
  590. let now_name;
  591.  
  592. try {
  593. now_name = parent.className;
  594. } catch (e) {
  595. JSobj.iterator_count = 0;
  596. // 没有父级元素了
  597. return "no parent node";
  598. }
  599.  
  600. // 如果不忽略递归次数计数器
  601. if (!ignore) {
  602. if (iterator_count > 9) {
  603. // 超过最大迭代次数,认为不存在,返回null
  604. JSobj.iterator_count = 0;
  605. return "over max iterator counts limit";
  606. } else {
  607. JSobj.iterator_count += 1;
  608. }
  609. }
  610. // 如果类名匹配,返回该节点
  611. if (now_name.split(" ").includes(class_name)) {
  612. iterator_count = 0;
  613. return parent;
  614. }
  615. return this.getParentByClassName(class_name, parent, JSobj);
  616. },
  617.  
  618. /**
  619. * 将func绑定到window.onscroll,并设置触发频率
  620. * @param {Function} func scroll的监听函数
  621. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  622. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  623. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  624. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  625. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  626. */
  627. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  628. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  629. JSobj.scroll_count += 1;
  630.  
  631. if (JSobj.scroll_count < useful_range) {
  632. func();
  633. console.log(hint);
  634. } else if (JSobj.scroll_count > wait_range) {
  635. JSobj.scroll_count = 0;
  636. }
  637. };
  638. // 如果没有指定的window对象,则使用默认的window
  639. if (!inner_window) {
  640. window.onscroll = () => {
  641. new_func(func, JSobj, useful_range, wait_range, hint);
  642. };
  643. return;
  644. }
  645. // 特定的window对象,一般用于iframe,追加scroll监听器
  646. let scrollFunc = () => {
  647. new_func(func, JSobj, useful_range, wait_range, hint);
  648. };
  649. JSobj.scrollFunc = scrollFunc;
  650. inner_window.addEventListener("scroll", scrollFunc, false);
  651. },
  652.  
  653. /**
  654. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  655. */
  656. createBtns: function() {
  657. // 创建按钮组
  658. let section = document.createElement("section");
  659. section.className = "btns_section";
  660. section.innerHTML = `
  661. <p class="logo_tit">Wenku Doc Downloader</p>
  662. <button class="btn-1" title="请先使内容加载完,防止出现空白页">展开文档 😈</button>
  663. <button class="btn-2">未设定2</button>
  664. <button class="btn-3">未设定3</button>
  665. <button class="btn-4">未设定4</button>
  666. <button class="btn-5">未设定5</button>`;
  667. document.body.appendChild(section);
  668.  
  669. // 设定样式
  670. let style = document.createElement("style");
  671. style.innerHTML = `
  672. .btns_section{
  673. position: fixed;
  674. width: 154px;
  675. left: 10px;
  676. top: 32%;
  677. background: #E7F1FF;
  678. border: 2px solid #1676FF;
  679. padding: 0px 0px 10px 0px;
  680. font-weight: 600;
  681. border-radius: 2px;
  682. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  683. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  684. 'Segoe UI Emoji', 'Segoe UI Symbol';
  685. z-index: 5000;
  686. }
  687. .logo_tit{
  688. width: 100%;
  689. background: #1676FF;
  690. text-align: center;
  691. font-size:12px ;
  692. color: #E7F1FF;
  693. line-height: 40px;
  694. height: 40px;
  695. margin: 0 0 16px 0;
  696. }
  697.  
  698. .btn-1{
  699. display: block;
  700. width: 128px;
  701. height: 28px;
  702. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  703. border-radius: 4px;
  704. color: #fff;
  705. font-size: 12px;
  706. border: none;
  707. outline: none;
  708. margin: 8px auto;
  709. font-weight: bold;
  710. cursor: pointer;
  711. opacity: .9;
  712. }
  713. .btn-2{
  714. display: none;
  715. width: 128px;
  716. height: 28px;
  717. background: #07C160;
  718. border-radius: 4px;
  719. color: #fff;
  720. font-size: 12px;
  721. border: none;
  722. outline: none;
  723. margin: 8px auto;
  724. font-weight: bold;
  725. cursor: pointer;
  726. opacity: .9;
  727. }
  728. .btn-3{
  729. display: none;
  730. width: 128px;
  731. height: 28px;
  732. background:#FA5151;
  733. border-radius: 4px;
  734. color: #fff;
  735. font-size: 12px;
  736. border: none;
  737. outline: none;
  738. margin: 8px auto;
  739. font-weight: bold;
  740. cursor: pointer;
  741. opacity: .9;
  742. }
  743. .btn-4{
  744. display: none;
  745. width: 128px;
  746. height: 28px;
  747. background: #1676FF;
  748. border-radius: 4px;
  749. color: #fff;
  750. font-size: 12px;
  751. border: none;
  752. outline: none;
  753. margin: 8px auto;
  754. font-weight: bold;
  755. cursor: pointer;
  756. opacity: .9;
  757. }
  758. .btn-5{
  759. display: none;
  760. width: 128px;
  761. height: 28px;
  762. background: #ff6600;
  763. border-radius: 4px;
  764. color: #fff;
  765. font-size: 12px;
  766. border: none;
  767. outline: none;
  768. margin: 8px auto;
  769. font-weight: bold;
  770. cursor: pointer;
  771. opacity: .9;
  772. }
  773. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  774. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  775. document.head.appendChild(style);
  776. }
  777. };
  778.  
  779. /**
  780. * 清理百度文库页面的无关元素
  781. */
  782. function clearPage_Baidu() {
  783. let selectors = [
  784. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  785. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  786. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  787. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap"
  788. ];
  789. let elem_list = document.querySelectorAll(selectors.join(", "));
  790. for (let elem of elem_list) {
  791. utils.tryToRemoveElement(elem);
  792. }
  793. let nut_selector = ".fix-searchbar-wrap, #hd";
  794. utils.forceHide(nut_selector);
  795. // 去除页面顶部空白
  796. document.querySelector("#doc").style.paddingTop = "0";
  797. }
  798.  
  799.  
  800. /**
  801. * 判断是否收集完元素,如果没有,则给出提醒
  802. * @param {Array} msg_list 附加提示信息列表
  803. * @returns bool 是否完成元素收集/冻结
  804. */
  805. function isFinished(msg_list = []) {
  806. if (!window.baiduJS.finished) {
  807. let hint = [
  808. "仍有内容未加载完,无法使用该功能",
  809. "建议从头到尾慢速地再浏览一遍",
  810. ...msg_list
  811. ];
  812. alert(hint.join("\n"));
  813. return false;
  814. }
  815. return true;
  816. }
  817.  
  818.  
  819. /**
  820. * 提取文字,导出txt。适用于百度文库
  821. */
  822. function saveText_Baidu() {
  823. // 判断是否存在文字元素
  824. let elems = document.querySelectorAll(".reader-txt-layer");
  825. if (!elems.length) {
  826. alert("当前页面没有文字元素\n如果你看到了文字说明它的原文档就是图片,所以提取不到文字");
  827. return;
  828. }
  829. // 判断页面是否加载完成
  830. if (!isFinished()) {
  831. return;
  832. }
  833. let title = document.title.split("-")[0].trim(); // 取得文档标题
  834. let page_texts = [];
  835. for (let elem of window.baiduJS.elems_map.values()) {
  836. // 取得该页文档下的全部文字
  837. let text = elem.textContent;
  838. page_texts.push(text);
  839. }
  840. utils.createAndDownloadFile(`${title}.txt`, page_texts.join("\n"));
  841. }
  842.  
  843.  
  844. /**
  845. * 存储ppt格式的ppt图形
  846. * @param {NodeList} elems ppt元素列表
  847. */
  848. function savePPTurls_1(elems) {
  849. let urls = [];
  850. elems.forEach((elem) => {
  851. if (elem.hasAttribute("src")) {
  852. urls.push(elem.src);
  853. } else {
  854. urls.push(elem.getAttribute("data-src"));
  855. }
  856. });
  857. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  858. }
  859.  
  860.  
  861. /**
  862. * 取得未捕获pdf格式ppt元素的页码的列表
  863. * @returns {Array} not_loaded
  864. */
  865. function getNotLoaded_pdf_PPT() {
  866. if (window.baiduJS.finished) {
  867. return [];
  868. }
  869.  
  870. //取得loaded
  871. let elems_map = window.baiduJS.elems_map;
  872. elems_map = sortMapByID$2(elems_map); // id形式:"pageNo-1"
  873.  
  874. // 找出not loaded
  875. let not_loaded = [];
  876. for (let i = 1; i <= window.baiduJS.max_page; i++) {
  877. if (!elems_map.has(`pageNo-${i}`)) {
  878. not_loaded.push(i);
  879. }
  880. }
  881. return not_loaded;
  882. }
  883.  
  884.  
  885. /**
  886. * 存储pdf格式的ppt元素
  887. */
  888. function storePPTurls() {
  889. let imgs = document.querySelectorAll("img.reader-pptstyle");
  890. for (let img of imgs) {
  891. let page = utils.getParentByClassName("bd", img, window.baiduJS, true);
  892. let src = img.src;
  893. let id = page.id;
  894.  
  895. if (id === undefined) {
  896. continue;
  897. }
  898.  
  899. // 如果不存在则录入
  900. if (!window.baiduJS.elems_map.has(id)) {
  901. window.baiduJS.elems_map.set(id, src);
  902. }
  903. }
  904. // 如果全部捕获,则解绑
  905. if (window.baiduJS.elems_map.size === window.baiduJS.max_page) {
  906. window.onscroll = () => { };
  907. window.baiduJS.elems_map = sortMapByID$2(window.baiduJS.elems_map);
  908. window.baiduJS.finished = true;
  909. }
  910. }
  911.  
  912.  
  913. function savePPTurls_2() {
  914. let not_loaded = getNotLoaded_pdf_PPT();
  915. let hints = [
  916. "以下页面需要浏览并再次加载:",
  917. not_loaded.join(",")
  918. ];
  919. if (!isFinished(hints)) {
  920. return;
  921. }
  922. // 页面都加载完毕
  923. let elems_map = window.baiduJS.elems_map;
  924. let urls = Array.from(elems_map.values());
  925. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  926. }
  927.  
  928.  
  929. /**
  930. * 动态存储".ppt-image-wrap img"图形,并导出urls
  931. * @returns
  932. */
  933. function savePicUrls_Baidu() {
  934. // 尝试取得ppt元素
  935. let elems = document.querySelectorAll(".ppt-image-wrap img"); // 真正的ppt
  936. let elems_2 = document.querySelectorAll("img.reader-pptstyle"); // pdf格式的ppt
  937.  
  938. // 根据试探情况(ppt元素存在情况)做出相应决策
  939. if (!elems.length && !elems_2.length) {
  940. alert("当前页面没有PPT图形");
  941. return;
  942. } else if (elems.length && !elems_2.length) {
  943. // 真正的ppt
  944. savePPTurls_1(elems);
  945. } else if (!elems.length && elems_2.length) {
  946. // pdf格式的ppt
  947. utils.scrollFunc(storePPTurls, window.baiduJS, 10, 50, "baidu元素(ppt Ⅱ型): 收集");
  948. savePPTurls_2();
  949. } else {
  950. // 未知情况
  951. utils.banSelf();
  952. utils.createBtns();
  953. utils.setBtnEvent(() => { }, [], "btn_1", "未知情况");
  954. }
  955.  
  956. }
  957.  
  958.  
  959. /**
  960. * 动态存储".reader-pic-item"图形,并导出urls
  961. * @returns
  962. */
  963. function savePicUrls_BaiduNonPPT() {
  964. // 判断是否存在非PPT图形元素
  965. let elems = document.querySelectorAll(".reader-pic-item");
  966. if (!elems.length) {
  967. alert("当前页面没有非PPT图形");
  968. return;
  969. }
  970. // 判断是否页面都加载完成
  971. if (!isFinished()) {
  972. return;
  973. }
  974. // 找到img元素,导出urls
  975. let img_urls = [];
  976. for (let elem of window.baiduJS.elems_map.values()) {
  977. // 取得img元素
  978. elem.querySelectorAll(".reader-pic-item").forEach((img) => {
  979. // 取得img链接
  980. let url = img.style.backgroundImage.split('"')[1];
  981. img_urls.push(url);
  982. });
  983. }
  984. utils.createAndDownloadFile("urls.csv", img_urls.join("\n"));
  985. }
  986.  
  987.  
  988. /**
  989. * 找出没有收录的id,需求的id列表形如:["pageNo-4", "pageNo-5", ...]
  990. * @returns 未收录的id_list: [1, 2, 3, ...]
  991. */
  992. function getUnfrozen() {
  993. // 获取已经冻结的文档元素
  994. let _frozen_ids = new Set(window.baiduJS.elems);
  995. let frozen_ids = new Set();
  996. _frozen_ids.forEach((full_id) => {
  997. // full_id: pageNo-1
  998. let id = parseInt(full_id.split("-")[1]);
  999. frozen_ids.add(id);
  1000. });
  1001.  
  1002. if (!frozen_ids.size) {
  1003. return ["all pages"];
  1004. }
  1005.  
  1006. // 取得基础页码
  1007. let a_id = utils.setPop(frozen_ids);
  1008. let basis = parseInt(a_id / 50) * 50;
  1009. // 获取全部文档元素
  1010. let all_ids = new Set();
  1011. let all_elems = document.querySelectorAll(".mod.reader-page.complex[class*=reader-page]");
  1012. all_elems.forEach((elem) => {
  1013. // ['mod', 'reader-page', 'complex', 'hidden-doc-banner', 'reader-page-1'] -> "1" -> 1
  1014. let id = parseInt(elem.className.split(" ").slice(-1)[0].split("-")[2]);
  1015. all_ids.add(basis + id);
  1016. });
  1017.  
  1018. // 求差集,取得未冻结的
  1019. let unfrozen_set = utils.difference(all_ids, frozen_ids);
  1020. let unfrozen_list = Array.from(unfrozen_set);
  1021. unfrozen_list.sort((prev, next) => { return prev - next; });
  1022. // 打印日志
  1023. console.log([
  1024. `all_ids: ${Array.from(all_ids)}`,
  1025. `frozen_ids: ${Array.from(frozen_ids)}`,
  1026. `unfrozen_list: ${unfrozen_list}`
  1027. ].join("\n"));
  1028. return unfrozen_list;
  1029. }
  1030.  
  1031.  
  1032. /**
  1033. * 适用于【*不*带有api=1】get参数的页面。可以打印页面。
  1034. * @returns
  1035. */
  1036. function printPage_BaiduNoArgs() {
  1037. // 判断是否页面都加载完成
  1038. let msg_list = [
  1039. "未加载的页面如下:",
  1040. getUnfrozen().join(", ")
  1041. ];
  1042. if (!isFinished(msg_list)) {
  1043. return;
  1044. }
  1045. // 清理页面
  1046. clearPage_Baidu();
  1047. // 隐藏上下页按钮
  1048. document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
  1049. elem.setAttribute("style", "display: none !important;");
  1050. });
  1051. // 打印
  1052. utils.hideBtnThenPrint();
  1053. // 显示上下页按钮
  1054. document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
  1055. elem.style.display = "block";
  1056. });
  1057. }
  1058.  
  1059.  
  1060. /**
  1061. * 调整页间距为 width px
  1062. * @param {Number} width 页间距
  1063. */
  1064. function adjustSpace(width) {
  1065. // 调整页间距
  1066. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  1067. document.querySelectorAll(space_selector).forEach((space) => {
  1068. space.style.margin = `0 0 ${width}px`;
  1069. });
  1070. console.log(`页间距已经调整为:${width}px`);
  1071. }
  1072.  
  1073.  
  1074. function userAdjustSpace() {
  1075. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  1076. let space = document.querySelector(space_selector);
  1077. let old_width = getComputedStyle(space).marginBottom;
  1078. let width_str = prompt(`当前页间距为:${old_width}\n请输入调整后的页间距(0-500的整数):`);
  1079. let width = parseInt(width_str);
  1080. width = Number.isInteger(width) && (0 <= width <= 500) ? width : parseInt(old_width);
  1081. adjustSpace(width);
  1082. console.log(`调整后的页间距为:${width}px`);
  1083. }
  1084.  
  1085.  
  1086. /**
  1087. * 根据键中的id数字对map排序
  1088. * @param {Map} elems_map
  1089. * @returns sorted_map
  1090. */
  1091. function sortMapByID$2(elems_map) {
  1092. // id形式:pageNo-10
  1093. let elems_arr = Array.from(elems_map);
  1094. elems_arr.sort((item1, item2) => {
  1095. // 从key中取出id
  1096. let id1 = parseInt(item1[0].split("-")[1]);
  1097. let id2 = parseInt(item2[0].split("-")[1]);
  1098. // 升序排序
  1099. return id1 - id2;
  1100. });
  1101. // 返回排序好的map
  1102. return new Map(elems_arr);
  1103. }
  1104.  
  1105.  
  1106. /**
  1107. * 存储html元素。适用于百度文库的文字型文档
  1108. */
  1109. function storeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  1110. let elems_map = window.baiduJS.elems_map;
  1111. document.querySelectorAll(selector).forEach(
  1112. (elem) => {
  1113. let origin_page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  1114. if (typeof(origin_page_elem) === "string") {
  1115. return;
  1116. }
  1117. // 复制元素防止丢失
  1118. let page_elem = origin_page_elem.cloneNode(true);
  1119. // 移除data标签,切断vue对数据的渲染控制
  1120. page_elem.removeAttribute("data-page-no");
  1121. let id = page_elem.id; // id的形式:pageNo-10
  1122. if (!elems_map.has(id)) {
  1123. elems_map.set(id, page_elem);
  1124. }
  1125. });
  1126. if (elems_map.size === window.baiduJS.max_page) {
  1127. // 根据id排序,保证导出的图片链接不是乱序的
  1128. window.baiduJS.elems_map = sortMapByID$2(window.baiduJS.elems_map);
  1129. // 已经保存完全部文档页元素,移除滚动事件的绑定函数
  1130. window.baiduJS.finished = true;
  1131. window.onscroll = () => { };
  1132. }
  1133. }
  1134.  
  1135.  
  1136. /**
  1137. * 移除html元素上的data标签,切断vue的数据渲染控制。适用于百度文库的文字型文档
  1138. * @param {String} selector 要移除 data-page-no属性 的元素选择器
  1139. */
  1140. function freezeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  1141. let elems = window.baiduJS.elems;
  1142. document.querySelectorAll(selector).forEach(
  1143. (elem) => {
  1144. let page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  1145. if (typeof(page_elem) === "string") {
  1146. return;
  1147. }
  1148. // 移除data标签,切断vue对数据的渲染控制
  1149. page_elem.removeAttribute("data-page-no");
  1150. // 存储已经冻结的元素id
  1151. let id = page_elem.id; // id的形式:pageNo-10
  1152. if (!elems.includes(id)) {
  1153. elems.push(id);
  1154. }
  1155. });
  1156. if (elems.length === window.baiduJS.max_page) {
  1157. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  1158. window.baiduJS.finished = true;
  1159. window.onscroll = () => { };
  1160. }
  1161. }
  1162.  
  1163.  
  1164. /**
  1165. * 递归的展开百度文档,适用于旧版页面。
  1166. * @param {Function} extra_task 在文档展开完成后执行的追加函数
  1167. * @returns
  1168. */
  1169. function readMoreRecursively(extra_task = () => { }) {
  1170. let go_more = document.querySelector("#html-reader-go-more");
  1171. if (!go_more || go_more.style.display === "none") {
  1172. // 如果不存在继续阅读按钮,或隐藏显示,则认为完成了展开
  1173. console.log("wk: 文档展开完成");
  1174. extra_task();
  1175. return;
  1176. }
  1177. let read_more = go_more.querySelector(".moreBtn.goBtn");
  1178. read_more.click();
  1179. console.log("wk: 展开文档");
  1180. setTimeout(readMoreRecursively, 500);
  1181. }
  1182.  
  1183.  
  1184. /**
  1185. * 统计文档页的数量
  1186. * @param {String} selector 文档页元素选择器
  1187. * @returns 文档页的数量
  1188. */
  1189. function countPages$1(selector = ".mod.reader-page.complex[class*=reader-page]") {
  1190. let all_elems = document.querySelectorAll(selector);
  1191. return all_elems.length;
  1192. }
  1193.  
  1194.  
  1195. /**
  1196. * 取得当前行高
  1197. * @returns 行高,例如 192px
  1198. */
  1199. function getLineHeight() {
  1200. let line = document.querySelector("p.reader-word-layer");
  1201. if (!line) {
  1202. // 对于没有文字的文档,返回null即可
  1203. return null;
  1204. }
  1205. let height = getComputedStyle(line).lineHeight;
  1206. console.log(`get line-height: ${height}`);
  1207. return height;
  1208. }
  1209.  
  1210.  
  1211. /**
  1212. * 增大行间距到1500px,用于解决文字重叠
  1213. */
  1214. function changeLineHeight() {
  1215. let lines = document.querySelectorAll("p.reader-word-layer");
  1216. let aim_height, aim_hint;
  1217.  
  1218. if (getComputedStyle(lines[0]).lineHeight !== window.baiduJS.origin_line_height) {
  1219. // 切换回旧的行高
  1220. aim_height = window.baiduJS.origin_line_height;
  1221. aim_hint = "解决文字重叠";
  1222. console.log(`changed to original line height`);
  1223. } else {
  1224. // 切换到增大的行高
  1225. aim_height = "1500px";
  1226. aim_hint = "切回旧行高";
  1227. console.log(`changed to new line height: 1500px`);
  1228. }
  1229. // 应用新的行高
  1230. for (let line of lines) {
  1231. line.style.lineHeight = aim_height;
  1232. }
  1233. // 应用新的按钮文本
  1234. setTimeout(() => {
  1235. utils.modifyBtnText("btn_5", aim_hint, false, false);
  1236. }, 2000);
  1237. }
  1238.  
  1239.  
  1240. function baiduWenku_OldVer() {
  1241. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1242. let real_max_page;
  1243. try {
  1244. real_max_page = parseInt(document.querySelector(".page-count").textContent.replace("/", ""));
  1245. } catch (e) {
  1246. real_max_page = countPages$1();
  1247. }
  1248.  
  1249. window.baiduJS = {
  1250. max_page: countPages$1(), // 当前文档页面数量
  1251. real_max_page: real_max_page, // 当前文档的总页数
  1252. iterator_count: 0, // getParentByClassName的最大迭代次数为9
  1253. finished: false, // 是否收集完了全部文档页元素
  1254. scroll_count: 0, // 用于统计累计触发scroll的次数
  1255. elems: [], // 存储已经冻结的元素id
  1256. elems_map: new Map(), // id: element
  1257. origin_line_height: getLineHeight() // 原始行高
  1258. };
  1259.  
  1260. if (location.href.includes("\u002f\u0073\u0068\u0061\u0072\u0065\u002f")) {
  1261. // old version for fetch doc elements
  1262. // 跟随浏览,动态收集页面元素
  1263. utils.scrollFunc(storeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 收集");
  1264.  
  1265. // 隐藏按钮
  1266. utils.toggleBtnStatus("btn_1");
  1267. // 显示按钮
  1268. utils.toggleBtnStatus("btn_2");
  1269. utils.toggleBtnStatus("btn_3");
  1270. utils.toggleBtnStatus("btn_4");
  1271. utils.toggleBtnStatus("btn_5");
  1272. // 绑定事件到按钮
  1273. utils.setBtnEvent(saveText_Baidu, [], "btn_3", "导出纯文本");
  1274. utils.setBtnEvent(savePicUrls_Baidu, [], "btn_4", "导出图片链接(仅PPT)");
  1275. utils.setBtnEvent(savePicUrls_BaiduNonPPT, [], "btn_5", "导出图片链接(除PPT)");
  1276. // btn_2
  1277. utils.setBtnEvent(() => {
  1278. let hints = [
  1279. "最好是excel和word文档,是否继续?",
  1280. "其他类型如ppt、pdf也可,但是不推荐。",
  1281. "其他类型建议【导出图片链接】。"
  1282. ];
  1283. if (confirm(hints.join("\n"))) {
  1284. // 在无参数的旧版页面处理超过50页的文档
  1285. // 跟随浏览,动态冻结页面元素
  1286. window.baiduJS.finished = false;
  1287. utils.scrollFunc(freezeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 冻结");
  1288. // 重新绑定按钮监听器
  1289. utils.setBtnEvent(userAdjustSpace, [], "btn_4", "调整页间距");
  1290. utils.setBtnEvent(printPage_BaiduNoArgs, [], "btn_3", "打印页面到PDF◈");
  1291. alert("正在截获文档内容,请上下浏览页面后再次点击该按钮");
  1292. utils.setBtnEvent(changeLineHeight, [], "btn_5", "解决文字重叠");
  1293.  
  1294. // 隐藏按钮
  1295. utils.toggleBtnStatus("btn_2");
  1296. }
  1297. }, [], "btn_2", "打印页面到PDF");
  1298. } else {
  1299. console.log(`无法识别的页面:${location.href}`);
  1300. }
  1301. }
  1302.  
  1303.  
  1304. /**
  1305. * 百度文档下载策略
  1306. */
  1307. function baiduWenku() {
  1308. // 允许打印页面
  1309. utils.allowPrint();
  1310. // 重定向到旧版框架
  1311. let href = window.location.href;
  1312. if (href.includes("/view/") || href.includes("/tfview/")) {
  1313. utils.createBtns();
  1314. let jump2sharePage_Baidu = function() {
  1315. location.href = `https://${location.host}${location.pathname.replace("\u0076\u0069\u0065\u0077", "\u0073\u0068\u0061\u0072\u0065")}`;
  1316. };
  1317. utils.setBtnEvent(jump2sharePage_Baidu, [], "btn_1");
  1318. } else {
  1319. // 在完全展开文档后启用旧版页面处理函数
  1320. // 创建按钮组
  1321. console.log("\n\nwk: 进入旧版页面\n\n\n");
  1322. utils.createBtns();
  1323. utils.setBtnEvent(readMoreRecursively, [baiduWenku_OldVer], "btn_1");
  1324. }
  1325. }
  1326.  
  1327. /**
  1328. * 展开道客巴巴的文档
  1329. */
  1330. function readAllDoc88() {
  1331. // 获取“继续阅读”按钮
  1332. let continue_btn = document.querySelector("#continueButton");
  1333. // 如果存在“继续阅读”按钮
  1334. if (continue_btn) {
  1335. // 跳转到文末(等同于展开全文)
  1336. let cur_page = document.querySelector("#pageNumInput");
  1337. // 取得最大页码
  1338. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1339. // 跳转到尾页
  1340. utils.jump2pageNo(cur_page, page_max, "keypress");
  1341. // 返回顶部
  1342. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1343. }
  1344. // 文档展开后,显示按钮2、3
  1345. else {
  1346. // 隐藏按钮
  1347. utils.toggleBtnStatus("btn_1");
  1348. // 显示按钮
  1349. utils.toggleBtnStatus("btn_2");
  1350. utils.toggleBtnStatus("btn_3");
  1351. }
  1352. }
  1353.  
  1354. /**
  1355. * 道客巴巴文档下载策略
  1356. */
  1357. function doc88() {
  1358. // 创建脚本启动按钮1、2
  1359. utils.createBtns();
  1360.  
  1361. // 绑定主函数
  1362. let prepare = function() {
  1363. // 获取canvas元素列表
  1364. let node_list = document.querySelectorAll(".inner_page");
  1365. // 获取文档标题
  1366. let title;
  1367. if (document.querySelector(".doctopic h1")) {
  1368. title = document.querySelector(".doctopic h1").title;
  1369. } else {
  1370. title = "文档";
  1371. }
  1372. return [node_list, title];
  1373. };
  1374.  
  1375. // btn_1: 展开文档
  1376. utils.setBtnEvent(() => {
  1377. readAllDoc88();
  1378. }, [], "btn_1");
  1379. // btn_2: 导出zip
  1380. utils.setBtnEvent(() => {
  1381. if (confirm("确定每页内容都加载完成了吗?")) {
  1382. utils.saveCanvasesToZip(...prepare());
  1383. }
  1384. }, [], "btn_2", "导出图片到zip");
  1385. // btn_3: 导出PDF
  1386. utils.setBtnEvent(() => {
  1387. if (confirm("确定每页内容都加载完成了吗?")) {
  1388. utils.saveCanvasesToPDF(...prepare());
  1389. }
  1390. }, [], "btn_3", "导出图片到PDF");
  1391. }
  1392.  
  1393. // 绑定主函数
  1394. function getCanvasList() {
  1395. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1396. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1397. let node_list = [];
  1398. for (let node of parent_node_list) {
  1399. node_list.push(node.children[0]);
  1400. }
  1401. return node_list;
  1402. }
  1403.  
  1404.  
  1405. function prepare() {
  1406. // 获取canvas元素列表
  1407. let node_list = getCanvasList();
  1408. // 获取文档标题
  1409. let title;
  1410. if (document.querySelector("h1 [title=doc]")) {
  1411. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1412. } else if (document.querySelector(".doc_title")) {
  1413. title = document.querySelector(".doc_title").textContent;
  1414. } else {
  1415. title = "文档";
  1416. }
  1417. return [node_list, title];
  1418. }
  1419.  
  1420.  
  1421. // 判断是否有canvas元素
  1422. function detectCanvas() {
  1423. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1424.  
  1425. // 隐藏按钮
  1426. utils.toggleBtnStatus("btn_1");
  1427. // 显示按钮
  1428. utils.toggleBtnStatus("btn_2");
  1429.  
  1430. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1431. if (!haveCanvas) {
  1432. // btn_2: 导出图片链接
  1433. utils.setBtnEvent(() => {
  1434. if (confirm("确定每页内容都加载完成了吗?")) {
  1435. utils.savePicUrls("[id*=img_]");
  1436. }
  1437. }, [], "btn_2", "导出全部图片链接");
  1438. } else {
  1439. // 显示按钮3
  1440. utils.toggleBtnStatus("btn_3");
  1441. // btn_2: 导出zip
  1442. utils.setBtnEvent(() => {
  1443. if (confirm("确定每页内容都加载完成了吗?")) {
  1444. utils.saveCanvasesToZip(...prepare());
  1445. }
  1446. }, [], "btn_2", "导出图片到zip");
  1447. // btn_3: 导出PDF
  1448. utils.setBtnEvent(() => {
  1449. if (confirm("确定每页内容都加载完成了吗?")) {
  1450. utils.saveCanvasesToPDF(...prepare());
  1451. }
  1452. }, [], "btn_3", "导出图片到PDF");
  1453. }
  1454. }
  1455.  
  1456.  
  1457. /**
  1458. * 豆丁文档下载策略
  1459. */
  1460. function docin() {
  1461. // 创建脚本启动按钮
  1462. utils.createBtns();
  1463.  
  1464. // 隐藏底部工具栏
  1465. document.querySelector("#j_select").click(); // 选择指针
  1466. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1467. tool_bar.style.display = "none";
  1468.  
  1469. // btn_1: 判断文档类型
  1470. utils.setBtnEvent(() => {
  1471. utils.forceHide(".jz_watermark");
  1472. detectCanvas();
  1473. }, [], "btn_1", "判断文档类型");
  1474. }
  1475.  
  1476. /**
  1477. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1478. */
  1479. function readAlliShare() {
  1480. // 获取“继续阅读”元素
  1481. let red_btn = document.getElementsByClassName("red-color")[0];
  1482. let red_text = red_btn.textContent;
  1483. // 如果可以展开,则展开
  1484. if (red_text.search("点击可继续阅读") !== -1) {
  1485. red_btn.click();
  1486. setTimeout(readAlliShare, 1000);
  1487. }
  1488. // 否则启动按钮2,准备清理页面然后打印为PDF
  1489. else {
  1490. // 隐藏按钮
  1491. utils.toggleBtnStatus("btn_1");
  1492. // 显示按钮
  1493. utils.toggleBtnStatus("btn_2");
  1494. utils.toggleBtnStatus("btn_3");
  1495.  
  1496. // 显示svg图片的链接
  1497. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1498. if (!page1) {
  1499. // 如果不存在svg图形,终止后续代码
  1500. console.log("当前页面不存在svg图形");
  1501. return;
  1502. }
  1503. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1504. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1505. svg1_src_div.innerHTML = `<div id="src-1"
  1506. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1507. 访问以下链接以复制文字:<br>${page1.src}
  1508. </div>`;
  1509. svg2_src_div.innerHTML = `<div id="src-1"
  1510. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1511. 访问以下链接以复制文字:<br>${page2.src}
  1512. </div>`;
  1513. // 添加到页面上
  1514. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1515. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1516. }
  1517. }
  1518.  
  1519.  
  1520. /**
  1521. * 清理并打印爱问共享资料的文档页
  1522. * @returns 如果输入偏移量非法,返回空值以终止函数
  1523. */
  1524. function printPageiShare() {
  1525. // # 清理并打印爱问共享资料的文档页
  1526. // ## 移除页面上无关的元素
  1527. // ### 移除单个元素
  1528. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1529. let header = document.getElementsByClassName("new-detail-header")[0];
  1530. let fixright = document.getElementById("fix-right");
  1531. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1532. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1533. let footer = document.getElementsByClassName("website-footer")[0];
  1534. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1535. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1536. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1537. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1538. let crumb_arrow;
  1539. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1540. let copyright = document.getElementsByClassName("copyright-container")[0];
  1541. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1542. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1543. // ### 执行移除
  1544. let elem_list = [
  1545. topbanner,
  1546. header,
  1547. fixright,
  1548. redpacket,
  1549. fixedrightfull,
  1550. footer,
  1551. guess,
  1552. detailtopbox,
  1553. fullscreen,
  1554. endhint,
  1555. crumb_arrow,
  1556. copyright,
  1557. state_btn,
  1558. comments
  1559. ];
  1560. for (let elem of elem_list) {
  1561. utils.tryToRemoveElement(elem);
  1562. }
  1563. // ### 移除全部同类元素
  1564. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1565. for (let elem_2 of elem_list_2) {
  1566. utils.tryToRemoveElement(elem_2);
  1567. }
  1568. // 使文档居中
  1569. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1570. if (!utils.centerDoc("doc-main", "18")) {
  1571. return; // 如果输入非法,终止函数调用
  1572. }
  1573. // 隐藏按钮,然后打印页面
  1574. utils.hideBtnThenPrint();
  1575. }
  1576.  
  1577.  
  1578. /**
  1579. * 爱问共享资料文档下载策略
  1580. */
  1581. function ishare() {
  1582. // 创建脚本启动按钮1、2
  1583. utils.createBtns();
  1584.  
  1585. // btn_1: 展开文档
  1586. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1587. // btn_2: 导出图片链接
  1588. utils.setBtnEvent(() => {
  1589. utils.savePicUrls(".data-detail");
  1590. }, [], "btn_2", "导出图片链接(推荐)");
  1591. // btn_3: 打印页面到PDF
  1592. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1593.  
  1594. // 移除底部下载条
  1595. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1596. utils.tryToRemoveElement(detailfixed);
  1597. }
  1598.  
  1599. /**
  1600. * 清理并打印得力文库的文档页
  1601. */
  1602. function printPageDeliwenku() {
  1603. // 移除页面上的无关元素
  1604. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1605. let elem_list = document.querySelectorAll(selector);
  1606. for (let elem of elem_list) {
  1607. utils.tryToRemoveElement(elem);
  1608. }
  1609. // 修改页间距
  1610. let outer_pages = document.getElementsByClassName("outer_page");
  1611. for (let page of outer_pages) {
  1612. page.style.marginBottom = "20px";
  1613. }
  1614. // 使文档居中
  1615. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1616. if (!utils.centerDoc("#boxleft", "3")) {
  1617. return; // 如果输入非法,终止函数调用
  1618. }
  1619. // 打印文档
  1620. utils.hideBtnThenPrint();
  1621. }
  1622.  
  1623.  
  1624. /**
  1625. * 点击“继续阅读”,适用性:得力文库
  1626. */
  1627. function readAllDeliwenku() {
  1628. // 点击“同意并开始预览全文”
  1629. let start_btn = document.getElementsByClassName("pre_button")[0];
  1630. let display = start_btn.parentElement.parentElement.style.display;
  1631. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1632. if (!display) {
  1633. start_btn.children[0].click();
  1634. setTimeout(() => {
  1635. scroll(0, document.body.scrollHeight);
  1636. }, 200);
  1637. return;
  1638. }
  1639. // 增强按钮点击效果
  1640. utils.enhanceBtnClickReaction();
  1641.  
  1642. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1643. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1644. // 继续阅读
  1645. if (display2 !== "none") {
  1646. // 获取input元素
  1647. let cur_page = document.querySelector("#pageNumInput");
  1648. let page_old = cur_page.value;
  1649. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1650. // 跳转到尾页
  1651. utils.jump2pageNo(cur_page, page_max, "keydown");
  1652. // 跳转回来
  1653. utils.jump2pageNo(cur_page, page_old, "keydown");
  1654.  
  1655. // 切换按钮准备导出
  1656. } else {
  1657. // 推荐导出图片链接
  1658. utils.modifyBtnText("btn_2", null, true);
  1659. // 隐藏按钮
  1660. utils.toggleBtnStatus("btn_1");
  1661. // 显示按钮
  1662. utils.toggleBtnStatus("btn_2");
  1663. utils.toggleBtnStatus("btn_3");
  1664. // btn_3 橙色按钮
  1665. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1666. }
  1667. }
  1668.  
  1669.  
  1670. /**
  1671. * 得力文库文档下载策略
  1672. */
  1673. function deliwenku() {
  1674. // 创建脚本启动按钮1、2
  1675. utils.createBtns();
  1676.  
  1677. // btn_1: 展开文档
  1678. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1679. // btn_2: 导出图片链接
  1680. utils.setBtnEvent(() => {
  1681. if (confirm("确定每页内容都加载完成了吗?")) {
  1682. utils.savePicUrls('.inner_page div');
  1683. }
  1684. }, [], "btn_2", "导出图片链接");
  1685.  
  1686. // 尝试关闭页面弹窗
  1687. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1688. // 解除打印限制
  1689. utils.allowPrint();
  1690. }
  1691.  
  1692. function readAll360Doc() {
  1693. // 展开文档
  1694. document.querySelector(".article_showall a").click();
  1695. // 隐藏按钮
  1696. utils.toggleBtnStatus("btn_1");
  1697. // 显示按钮
  1698. utils.toggleBtnStatus("btn_2");
  1699. utils.toggleBtnStatus("btn_3");
  1700. }
  1701.  
  1702.  
  1703. function saveText_360Doc() {
  1704. // 捕获图片链接
  1705. let images = document.querySelectorAll("#artContent img");
  1706. let content = [];
  1707.  
  1708. for (let i = 0; i < images.length; i++) {
  1709. let src = images[i].src;
  1710. content.push(`图${i+1},链接:${src}`);
  1711. }
  1712. // 捕获文本
  1713. let text = document.querySelector("#artContent").textContent;
  1714. content.push(text);
  1715.  
  1716. // 保存纯文本文档
  1717. let title = document.querySelector("#titiletext").textContent;
  1718. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1719. }
  1720.  
  1721.  
  1722. function printPage360Doc() {
  1723. // # 清理并打印360doc的文档页
  1724. // ## 移除页面上无关的元素
  1725. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1726. let elem_list = document.querySelectorAll(selector);
  1727. let under_doc_1, under_doc_2;
  1728. try {
  1729. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1730. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1731. } catch (e) { console.log(); }
  1732. // 执行移除
  1733. for (let elem of elem_list) {
  1734. utils.tryToRemoveElement(elem);
  1735. }
  1736. utils.tryToRemoveElement(under_doc_1);
  1737. utils.tryToRemoveElement(under_doc_2);
  1738. // 执行隐藏
  1739. document.querySelector("a[title]").style.display = "none";
  1740.  
  1741. // 使文档居中
  1742. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1743. if (!utils.centerDoc(".a_left", "20")) {
  1744. return; // 如果输入非法,终止函数调用
  1745. }
  1746. // 隐藏按钮,然后打印页面
  1747. utils.hideBtnThenPrint();
  1748. }
  1749.  
  1750.  
  1751. /**
  1752. * 360doc个人图书馆下载策略
  1753. */
  1754. function doc360() {
  1755. // 创建按钮区
  1756. utils.createBtns();
  1757. // btn_1: 展开文档
  1758. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1759. // btn_2: 导出纯文本
  1760. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1761. // btn_3: 打印页面到PDF
  1762. utils.setBtnEvent(() => {
  1763. if (confirm("确定每页内容都加载完成了吗?")) {
  1764. printPage360Doc();
  1765. }
  1766. }, [], "btn_3", "打印页面到PDF");
  1767. }
  1768.  
  1769. /**
  1770. * 查找出所有未被捕获的页码,并返回列表
  1771. * @returns 未捕获页码列表
  1772. */
  1773. function getMissedPages() {
  1774. let all = []; // 全部页码
  1775. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1776. all[i] = i + 1;
  1777. }
  1778. let missed = []; // 未捕获页码
  1779. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1780.  
  1781. // 排除并录入未捕获页码
  1782. for (let num of all) {
  1783. if (!possessed.includes(`page${num}`)) {
  1784. missed.push(num);
  1785. }
  1786. }
  1787. return missed;
  1788. }
  1789.  
  1790.  
  1791. /**
  1792. * 根据键中的id数字对map排序
  1793. * @param {Map} elems_map
  1794. * @returns sorted_map
  1795. */
  1796. function sortMapByID$1(elems_map) {
  1797. // id形式:page2
  1798. let elems_arr = Array.from(elems_map);
  1799. elems_arr.sort((item1, item2) => {
  1800. // 从key中取出id
  1801. let id1 = parseInt(item1[0].replace("page", ""));
  1802. let id2 = parseInt(item2[0].replace("page", ""));
  1803. // 升序排序
  1804. return id1 - id2;
  1805. });
  1806. // 返回排序好的map
  1807. return new Map(elems_arr);
  1808. }
  1809.  
  1810.  
  1811. /**
  1812. * 存储动态加载的canvas元素、textContent
  1813. */
  1814. function storeElements_MBA() {
  1815. let canvases_map = window.mbaJS.canvases_map;
  1816. let texts_map = window.mbaJS.texts_map;
  1817. let quality = window.mbaJS.quality;
  1818.  
  1819. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1820. (elem) => {
  1821. let capture = (elem) => {
  1822. // (1) 存储页面为canvas图形
  1823. let canvas, data_base64;
  1824. // 导出canvas数据防止丢失
  1825. try {
  1826. // 存储canvas
  1827. canvas = elem.querySelector("canvas[id*=page]");
  1828. if (window.mbaJS.only_text) {
  1829. data_base64 = null;
  1830. } else {
  1831. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1832. }
  1833. } catch (e) {
  1834. // utils.sleep(500);
  1835. return;
  1836. }
  1837. // 增量录入map
  1838. let id = canvas.id; // id的形式:page2
  1839. if (!canvases_map.has(id)) {
  1840. canvases_map.set(id, data_base64);
  1841. }
  1842. // 确定canvas长宽
  1843. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1844. window.mbaJS.width = parseInt(canvas.width);
  1845. window.mbaJS.height = parseInt(canvas.height);
  1846. }
  1847.  
  1848. // (2) 存储text
  1849. let text = elem.textContent;
  1850. if (!texts_map.has(id)) {
  1851. texts_map.set(id, text);
  1852. }
  1853. };
  1854. setTimeout(capture, 500, elem);
  1855. });
  1856. if (canvases_map.size === window.mbaJS.max_page) {
  1857. // 根据id排序
  1858. window.mbaJS.canvases_map = sortMapByID$1(window.mbaJS.canvases_map);
  1859. window.mbaJS.texts_map = sortMapByID$1(window.mbaJS.texts_map);
  1860. window.mbaJS.finished = true;
  1861. window.onscroll = null;
  1862. }
  1863. }
  1864.  
  1865.  
  1866. /**
  1867. * 将canvas转为jpeg,然后导出PDF
  1868. * @param {Array} base64_list canvas元素列表
  1869. * @param {String} title 文档标题
  1870. */
  1871. function saveCanvasesToPDF_MBA(base64_list, title) {
  1872. let width = window.mbaJS.width;
  1873. let height = window.mbaJS.height;
  1874.  
  1875. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1876. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1877. let orientation = width > height ? 'l' : 'p';
  1878. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1879.  
  1880. // 保存每一页文档到每一页pdf
  1881. let i = 0;
  1882. for (let base64 of base64_list) {
  1883. i += 1;
  1884. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1885. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1886. if (i < window.mbaJS.max_page) {
  1887. pdf.addPage();
  1888. }
  1889. }
  1890. // 导出文件
  1891. pdf.save(`${title}.pdf`);
  1892. }
  1893.  
  1894. /**
  1895. * 判断文档页是否收集完毕,当不行时给出提示
  1896. * @returns boolean
  1897. */
  1898. function ready2use() {
  1899. removeAds(); // 顺便清理广告
  1900. // 如果是首次点击按钮,给出提示
  1901. if (window.mbaJS.first_hint) {
  1902. let hint = [
  1903. "如果浏览速度过快,比如:",
  1904. "当前页面还没完全加载好就滚动页面去看下一页",
  1905. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1906. "由防范技术的干扰,该功能目前很不好用,见谅"
  1907. ].join("\n");
  1908. alert(hint);
  1909. window.mbaJS.first_hint = false;
  1910. }
  1911. // 如果文档页没有收集完,给出提示
  1912. if (!window.mbaJS.finished) {
  1913. let hint = [
  1914. "仍有内容未加载完,无法使用该功能",
  1915. "建议从头到尾慢速地再浏览一遍",
  1916. "以下是没有加载完成页面的页码:",
  1917. getMissedPages().join(",")
  1918. ];
  1919. alert(hint.join("\n"));
  1920. return false;
  1921. }
  1922. return true;
  1923. }
  1924.  
  1925.  
  1926. /**
  1927. * 用捕获好的canvas转jpg,生成PDF
  1928. * @returns
  1929. */
  1930. function canvas2PDF_mba() {
  1931. if (!ready2use()) {
  1932. return;
  1933. }
  1934. let canvases = window.mbaJS.canvases_map.values();
  1935. // 导出PDF
  1936. let title = document.title.split("-")[0].trim();
  1937. saveCanvasesToPDF_MBA(canvases, title);
  1938. }
  1939.  
  1940.  
  1941. /**
  1942. * 拼合捕获好的文本,保存到txt文件
  1943. * @returns
  1944. */
  1945. function saveText_mba() {
  1946. if (!ready2use()) {
  1947. return;
  1948. }
  1949. let content = Array.from(window.mbaJS.texts_map.values());
  1950. let title = document.title.split("-")[0].trim();
  1951. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1952. }
  1953.  
  1954.  
  1955. /**
  1956. * 移除广告
  1957. */
  1958. function removeAds() {
  1959. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1960. utils.tryToRemoveElement(ad_elem);
  1961. });
  1962. }
  1963.  
  1964.  
  1965. function mbalib_() {
  1966. // 移除广告和左侧工具栏
  1967. removeAds();
  1968. let tool_bar = document.querySelector(".tool-bar");
  1969. utils.tryToRemoveElement(tool_bar);
  1970.  
  1971. // 创建按钮
  1972. utils.createBtns();
  1973. // 隐藏按钮
  1974. utils.toggleBtnStatus("btn_1");
  1975. // 显示按钮
  1976. utils.toggleBtnStatus("btn_2");
  1977. utils.toggleBtnStatus("btn_3");
  1978. utils.toggleBtnStatus("btn_4");
  1979.  
  1980. // 取得页数
  1981. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1982. let quality = utils.getQualityByCanvasAmount(max_page);
  1983.  
  1984. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1985. window.mbaJS = {
  1986. max_page: max_page,
  1987. texts_map: new Map(), // id: text
  1988. canvases_map: new Map(), // id: canvas_data_base64
  1989. quality: quality, // canvas转jpg的质量
  1990. width: null, // canvas宽度(px)
  1991. height: null,
  1992. finished: false, // 是否收集完了全部文档页元素
  1993. first_hint: true,
  1994. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1995. only_text: false // 是否仅捕获文本
  1996. };
  1997. // 跟随浏览,动态收集页面元素
  1998. window.onscroll = () => {
  1999. storeElements_MBA();
  2000. };
  2001. // 跟随浏览,动态收集页面元素
  2002. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  2003. // 绑定事件
  2004. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  2005. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  2006.  
  2007. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  2008. let btn_text, aim_btn, hint;
  2009. if (max_page > 40) {
  2010. btn_text = "失效说明";
  2011. aim_btn = "btn_3";
  2012. hint = [
  2013. "页数超过40,脚本无效",
  2014. "只能使用导出文本功能",
  2015. "而此脚本会使页面内容加载明显变慢,建议禁用"
  2016. ];
  2017. utils.setBtnEvent(utils.banSelf, [
  2018. () => { window.onscroll = null; }
  2019. ], "btn_4", "临时禁用脚本");
  2020. } else {
  2021. btn_text = "空白页说明";
  2022. aim_btn = "btn_4";
  2023. hint = [
  2024. "导致空白页的原因如下",
  2025. "加载该页的时间超过2秒 / 明显等待",
  2026. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  2027. ];
  2028. }
  2029.  
  2030. utils.setBtnEvent(() => {
  2031. alert(hint.join("\n"));
  2032. }, [], aim_btn, btn_text);
  2033. }
  2034.  
  2035.  
  2036. function mbalib() {
  2037. setTimeout(mbalib_, 2000);
  2038. }
  2039.  
  2040. // 拼接swf: https://pan.baidu.com/s/1PTM6watxNlqs-jvvX6XKzg?pwd=abe9 中的 JoinSWFFiles_setup.exe
  2041. // swf转pdf: https://youfiles.herokuapp.com/swftopdf/
  2042.  
  2043.  
  2044. /**
  2045. * 统计文档页的数量
  2046. * @param {String} inner_selector 【信息摘要】元素选择器
  2047. * @returns 文档页的数量
  2048. */
  2049. function countPages(inner_selector = ".container div[style=' margin:20px; ']") {
  2050. let abstract = inner_window.document.querySelector(inner_selector).textContent;
  2051. let page_amount_pattern = /文档页数:共 ([1-9]|[1-9][0-9]|[1-9][0-9][0-9]) 页/;
  2052. // 捕获到: ["文档页数:共 xx 页", "xx"]
  2053. let max_page = parseInt(abstract.match(page_amount_pattern)[1]);
  2054. return max_page;
  2055. }
  2056.  
  2057.  
  2058. /**
  2059. * 判断当前帮帮文档是否为高清版页面
  2060. * @returns 是否为高清
  2061. */
  2062. function isHD() {
  2063. // 取得页面左侧【高清版】切换功能区
  2064. let hd_bar = inner_window.document.querySelector("#gaoging");
  2065. // 取得功能区内提示文字
  2066. let hint = hd_bar.querySelector("#gqts").textContent;
  2067. // 如果存在如下文字,认为当前页面是模糊版,否则是高清版
  2068. if (hint.includes("点此阅读高清版")) {
  2069. return false;
  2070. }
  2071. return true;
  2072. }
  2073.  
  2074.  
  2075. /**
  2076. * 开启收集swf链接任务,隐藏按钮1,显示按钮2、3
  2077. */
  2078. function main$1() {
  2079. // 已经是高清版
  2080. // 跟随浏览,动态冻结页面元素
  2081. utils.scrollFunc(storeSWFLinks_Woc88, window.woc88JS, 10, 30, "woc88元素: 收集", inner_window);
  2082.  
  2083. // 绑定按钮的触发函数
  2084. utils.setBtnEvent(btn2SaveSwfUrls, [], "btn_2", "导出swf链接");
  2085. utils.setBtnEvent(() => {
  2086. let hints = [
  2087. "本脚本无需【flash】。",
  2088. "你的电脑上无需安装任何flash player也可以使用。",
  2089. "导出 media-urls.csv 后,",
  2090. "需要使用【资源下载器】来取得swf文档资源。",
  2091. "详细用法请访问脚本主页: ",
  2092. "https://greasyfork.org/zh-CN/scripts/435884-wenku-doc-downloader"
  2093. ];
  2094. alert(hints.join("\n"));
  2095. }, [], "btn_3", "友情提示");
  2096.  
  2097. // 隐藏按钮
  2098. utils.toggleBtnStatus("btn_1");
  2099. // 显示按钮
  2100. utils.toggleBtnStatus("btn_2");
  2101. utils.toggleBtnStatus("btn_3");
  2102. }
  2103.  
  2104.  
  2105. function switch2HD() {
  2106. // 取得页面左侧【高清版】切换功能区
  2107. let hd_bar = inner_window.document.querySelector("#gaoging");
  2108. // 取得功能区内【切换高清版】按钮
  2109. let hd_button = hd_bar.querySelector("#gqts span[onclick]");
  2110. hd_button.click();
  2111. // 开启主任务
  2112. setTimeout(main$1, 1000);
  2113. }
  2114.  
  2115.  
  2116. /**
  2117. * 根据键中的id数字对map排序
  2118. * @param {Map} elems_map
  2119. * @returns sorted_map
  2120. */
  2121. function sortMapByID(elems_map) {
  2122. // id形式:5, 类型: int
  2123. let elems_arr = Array.from(elems_map);
  2124. elems_arr.sort((id1, id2) => {
  2125. // 升序排序
  2126. return id1 - id2;
  2127. });
  2128. // 返回排序好的map
  2129. return new Map(elems_arr);
  2130. }
  2131.  
  2132.  
  2133. /**
  2134. * 存储swf链接。适用于帮帮文库。
  2135. * @param {String} inner_selector iframe#test 框架下的【swf链接所在元素】选择器
  2136. */
  2137. function storeSWFLinks_Woc88(inner_selector = "div[id*=imgcount] > div > object") {
  2138. let elems_map = window.woc88JS.elems_map;
  2139. inner_window.document.querySelectorAll(inner_selector).forEach(
  2140. (elem) => {
  2141. // 复制链接防止丢失
  2142. // 拿到id
  2143. let id_elem = elem.parentElement.parentElement.id;
  2144. let id = parseInt(id_elem.replace("imgcount", ""));
  2145. // 拿到link
  2146. let link = elem.data;
  2147. // 储存id: link
  2148. elems_map.set(id, link);
  2149. });
  2150. if (elems_map.size === window.woc88JS.max_page) {
  2151. // 根据id排序,保证导出的图片链接不是乱序的
  2152. window.woc88JS.elems_map = sortMapByID(window.woc88JS.elems_map);
  2153. // 已经保存完全部文档页元素,移除滚动事件的绑定函数
  2154. window.woc88JS.finished = true;
  2155. inner_window.removeEventListener("scroll", window.woc88JS.scrollFunc, false);
  2156. }
  2157. }
  2158.  
  2159.  
  2160. /**
  2161. * 导出swf链接到csv文件。需要配合【资源下载器】使用。
  2162. */
  2163. function saveSwfUrls_Woc88() {
  2164. let urls = [];
  2165. window.woc88JS.elems_map.forEach((url) => {
  2166. // 遍历map就是遍历value
  2167. urls.push(url);
  2168. });
  2169. utils.createAndDownloadFile("media-urls.csv", urls.join("\n"));
  2170. }
  2171.  
  2172.  
  2173. /**
  2174. * 返回一个列表,包含所有未捕获的页码
  2175. * @returns 未捕获页码列表
  2176. */
  2177. function getNotStored() {
  2178. // 取得全部页码
  2179. let max_page = window.woc88JS.max_page;
  2180. // 取得未捕获页码
  2181. let stored = new Set(window.woc88JS.elems_map.keys());
  2182. let not_stored = [];
  2183. for (let i = 1; i <= max_page; i++) {
  2184. // 如果当前页码未被捕获,则录入not_stored
  2185. if (!stored.has(i)) {
  2186. not_stored.push(i);
  2187. }
  2188. }
  2189. return not_stored;
  2190. }
  2191.  
  2192.  
  2193. function btn2SaveSwfUrls() {
  2194. if (!window.woc88JS.finished) {
  2195. let hints = [
  2196. "仍有内容未加载完,无法使用该功能",
  2197. "请再次浏览未加载出的页面,未加载的页码如下",
  2198. getNotStored().join(",")
  2199. ];
  2200. alert(hints.join("\n"));
  2201. return;
  2202. }
  2203. saveSwfUrls_Woc88();
  2204. }
  2205.  
  2206.  
  2207. /**
  2208. * 帮帮文库下载策略
  2209. */
  2210. function woc88() {
  2211. // 1 初始环境配置
  2212. // 取得iframe的window
  2213. window.inner_window = document.querySelector("#test").contentWindow;
  2214. // 设置全局变量
  2215. window.woc88JS = {
  2216. max_page: countPages(), // 当前文档页面数量
  2217. finished: false, // 是否收集完了全部文档页元素
  2218. scroll_count: 0, // 用于统计累计触发scroll的次数
  2219. elems_map: new Map(), // 存储已经捕获的元素: {id: element}
  2220. scrollFunc: null
  2221. };
  2222.  
  2223. // 2 主任务
  2224. // 创建按钮组
  2225. utils.createBtns();
  2226. // 如果不是高清版,先切换至高清版
  2227. if (!isHD()) {
  2228. utils.setBtnEvent(switch2HD, [], "btn_1", "高清版");
  2229. return;
  2230. }
  2231. main$1();
  2232. }
  2233.  
  2234. /**
  2235. * 判断是否进入预览模式
  2236. * @returns Boolean
  2237. */
  2238. function isInPreview() {
  2239. let p_elem = document.querySelector("#preview_tips");
  2240. if (p_elem.style.display === "none") {
  2241. return true;
  2242. }
  2243. return false;
  2244. }
  2245.  
  2246.  
  2247. /**
  2248. * 判断是否展开了全文
  2249. * @returns Boolean
  2250. */
  2251. function isNoMorePage() {
  2252. let read_more = document.querySelector("#ntip2");
  2253. if (read_more.style.display === "none") {
  2254. return true;
  2255. }
  2256. return false;
  2257. }
  2258.  
  2259.  
  2260. /**
  2261. * 确保进入预览模式
  2262. */
  2263. function ensureInPreview() {
  2264. if (!isInPreview()) {
  2265. // 如果没有进入预览,则先进入
  2266. document.querySelector(".pre_button a").click();
  2267. utils.sleep(500);
  2268. }
  2269. }
  2270.  
  2271.  
  2272. /**
  2273. * 展开全文预览,当展开完成后再次调用时,返回true
  2274. * @returns
  2275. */
  2276. function unfoldAll() {
  2277. ensureInPreview();
  2278. if (isNoMorePage()) {
  2279. // 如果全文展开了,则切换按钮,然后退出
  2280. utils.toggleBtnStatus("btn_1");
  2281. utils.toggleBtnStatus("btn_2");
  2282. return true;
  2283. }
  2284. // 跳转到最后一页,以展开全文
  2285. let cur_page = document.querySelector("#pageNumInput");
  2286. utils.jump2pageNo(cur_page, "999", "keydown");
  2287. }
  2288.  
  2289.  
  2290. /**
  2291. * 取得最大页码(最大20)
  2292. * @returns {Number} 页码int
  2293. */
  2294. function getPageCounts$1() {
  2295. let counts_str = document.querySelector(".counts").textContent;
  2296. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  2297. if (counts > 20) {
  2298. counts = 20; // 最多免费预览20页,所以设置最大页码20
  2299. }
  2300. return parseInt(counts);
  2301. }
  2302.  
  2303.  
  2304. /**
  2305. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  2306. * @returns Array | null
  2307. */
  2308. function getImgUrls() {
  2309. let pages = document.querySelectorAll("[id*=pageflash_]");
  2310. // 尚未浏览完全部页面,返回null
  2311. if (pages.length < window.dugenJS.page_counts) {
  2312. return null;
  2313. }
  2314. // 浏览完全部页面,返回urls
  2315. let urls = [];
  2316. pages.forEach((page) => {
  2317. let url = page.querySelector("img").src;
  2318. urls.push(url);
  2319. });
  2320. return urls;
  2321. }
  2322.  
  2323.  
  2324. /**
  2325. * 返回当前未加载页面的页码
  2326. * @returns not_loaded
  2327. */
  2328. function getNotloadedPages() {
  2329. // 已经取得的页码
  2330. let pages = document.querySelectorAll("[id*=pageflash_]");
  2331. let loaded = new Set();
  2332. pages.forEach((page) => {
  2333. let id = page.id.split("_")[1];
  2334. id = parseInt(id);
  2335. loaded.add(id);
  2336. });
  2337. // 未取得的页码
  2338. let not_loaded = [];
  2339. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2340. if (!loaded.has(i)) {
  2341. not_loaded.push(i);
  2342. }
  2343. }
  2344. return not_loaded;
  2345. }
  2346.  
  2347.  
  2348. function WantImgUrls() {
  2349. let res = getImgUrls();
  2350. // 页面尚未加载完
  2351. if (res === null) {
  2352. let hints = [
  2353. "尚未加载完全部页面",
  2354. "以下页面需要浏览并加载:",
  2355. getNotloadedPages().join(",")
  2356. ];
  2357. alert(hints.join("\n"));
  2358. return;
  2359. }
  2360. // 页面全部加载完
  2361. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2362. }
  2363.  
  2364.  
  2365. /**
  2366. * dugen文档下载策略
  2367. */
  2368. function dugen() {
  2369. ensureInPreview();
  2370. // 全局对象
  2371. window.dugenJS = {
  2372. page_counts: getPageCounts$1() // 最大页码(int)
  2373. };
  2374.  
  2375. // 创建按钮区
  2376. utils.createBtns();
  2377.  
  2378. // 绑定监听器
  2379. // 按钮1:展开文档
  2380. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2381. // 按钮2:导出图片链接
  2382. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2383. }
  2384.  
  2385. /**
  2386. * 取得文档类型
  2387. * @returns {String} 文档类型str
  2388. */
  2389. function getDocType() {
  2390. let type_elem = document.querySelector(".title .icon.icon-format");
  2391. // ["icon", "icon-format", "icon-format-doc"]
  2392. let cls_str = type_elem.classList[2];
  2393. // "icon-format-doc"
  2394. let type = cls_str.split("-")[2];
  2395. return type;
  2396. }
  2397.  
  2398.  
  2399. /**
  2400. * 判断文档类型是否为type_list其中之一
  2401. * @returns 是否为type
  2402. */
  2403. function isTypeof(type_list) {
  2404. let type = getDocType();
  2405. if (type_list.includes(type)) {
  2406. return true;
  2407. }
  2408. return false;
  2409. }
  2410.  
  2411.  
  2412. /**
  2413. * 判断文档类型是否为PPT
  2414. * @returns 是否为PPT
  2415. */
  2416. function isPPT() {
  2417. return isTypeof(["ppt", "pptx"]);
  2418. }
  2419.  
  2420.  
  2421. /**
  2422. * 判断文档类型是否为Excel
  2423. * @returns 是否为Excel
  2424. */
  2425. function isEXCEL() {
  2426. return isTypeof(["xls", "xlsm", "xlsx"]);
  2427. }
  2428.  
  2429.  
  2430. /**
  2431. * 取得最大页码
  2432. * @returns 最大页码int
  2433. */
  2434. function getPageCounts() {
  2435. let page_counts_str = document.querySelector(".intro-list").children[3].textContent;
  2436. let page_counts = parseInt(page_counts_str.match(/[0-9]{1,3}(?=页)/)[0]);
  2437. return page_counts;
  2438. }
  2439.  
  2440.  
  2441. /**
  2442. * 取得未加载页面的页码
  2443. * @param {Set} loaded 已加载的页码集合
  2444. * @returns {Array} not_loaded 未加载页码列表
  2445. */
  2446. function getNotLoaded(loaded) {
  2447. let not_loaded = [];
  2448. let page_counts = window.book118JS.page_counts;
  2449. for (let i = 1; i <= page_counts; i++) {
  2450. if (!loaded.has(i)) {
  2451. not_loaded.push(i);
  2452. }
  2453. }
  2454. return not_loaded;
  2455. }
  2456.  
  2457.  
  2458. /**
  2459. * 取得全部文档页的url
  2460. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2461. */
  2462. function getUrls() {
  2463. let loaded = new Set(); // 存储已加载页面的页码
  2464. let urls = []; // 存储已加载页面的图形src
  2465. // 收集已加载页面的url
  2466. document.querySelectorAll("div[data-id]").forEach((div) => {
  2467. let src = div.querySelector("img").src;
  2468. if (src) {
  2469. // "1": "https://view-cache.book118.com/..."
  2470. loaded.add(parseInt(div.getAttribute("data-id")));
  2471. urls.push(src);
  2472. }
  2473. });
  2474. // 如果所有页面加载完毕
  2475. if (loaded.size === window.book118JS.page_counts) {
  2476. return [true, urls];
  2477. }
  2478. // 否则收集未加载页面的url
  2479. return [false, getNotLoaded(loaded)];
  2480. }
  2481.  
  2482.  
  2483. /**
  2484. * 展开全文
  2485. */
  2486. function readAll() {
  2487. window.preview.jump(999);
  2488. }
  2489.  
  2490.  
  2491. /**
  2492. * btn_2: 导出图片链接
  2493. */
  2494. function wantUrls() {
  2495. let [flag, res] = getUrls();
  2496. // 页面都加载完毕,下载urls
  2497. if (flag) {
  2498. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2499. return;
  2500. }
  2501. // 没有加载完,提示出未加载好的页码
  2502. let hints = [
  2503. "仍有页面没有加载",
  2504. "请浏览并加载如下页面:",
  2505. res.join(",")
  2506. ];
  2507. alert(hints.join("\n"));
  2508. }
  2509.  
  2510.  
  2511. /**
  2512. * 打开PPT预览页面
  2513. */
  2514. function openPPTpage() {
  2515. window.preview.getSrc();
  2516. let openPPT = () => {
  2517. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2518. utils.openInNewTab(ppt_src);
  2519. window.preview.close();
  2520. };
  2521. setTimeout(openPPT, 1000);
  2522. }
  2523.  
  2524.  
  2525. /**
  2526. * 原创力文档(非PPT或Excel)下载策略
  2527. */
  2528. function book118_CommonDoc() {
  2529. // 创建全局对象
  2530. window.book118JS = {
  2531. doc_type: getDocType(),
  2532. page_counts: getPageCounts()
  2533. };
  2534.  
  2535. // 处理非PPT文档
  2536. // 创建按钮组
  2537. utils.createBtns();
  2538. // 绑定监听器到按钮
  2539. // 按钮1:展开文档
  2540. utils.setBtnEvent(() => {
  2541. readAll();
  2542. utils.toggleBtnStatus("btn_1");
  2543. utils.toggleBtnStatus("btn_2");
  2544. }, [], "btn_1");
  2545. // 按钮2:导出图片链接
  2546. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2547. }
  2548.  
  2549.  
  2550. /**
  2551. * 取得PPT文档最大页码
  2552. * @returns PPT文档最大页码int
  2553. */
  2554. function getPageCountsPPT() {
  2555. let counts_str = document.querySelector("#PageCount").textContent;
  2556. let counts = parseInt(counts_str);
  2557. console.log(`get page counts: ${counts}`);
  2558. return counts;
  2559. }
  2560.  
  2561.  
  2562. /**
  2563. * 转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2564. * @param {Number} max 转换执行次数,或者说,页面数量
  2565. */
  2566. function docView2Canvas(max, i = 0) {
  2567. // 取得页码
  2568. let cur_page = document.querySelector("#PageIndex").textContent;
  2569. cur_page = parseInt(cur_page);
  2570. // 取得视图元素,计数从0开始
  2571. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2572. // 转化为canvas
  2573. let canvas_promise = html2canvas(doc_view);
  2574. console.log(canvas_promise); // 打印信息以检查状况
  2575. canvas_promise.then((canvas) => {
  2576. // 保存canvas到全局对象
  2577. window.book118JS.canvases.push(canvas);
  2578. // 打印日志
  2579. i += 1;
  2580. console.log(`wk: ${cur_page} complete`);
  2581.  
  2582. // 下一页
  2583. document.querySelector(".btmRight").click();
  2584. utils.sleep(500); // 等待页面加载
  2585. // 如果递归未达到最大次数
  2586. if (i < max) {
  2587. // 则下一次递归
  2588. docView2Canvas(max, i);
  2589. } else {
  2590. // 否则终止递归,并且显示导出PDF按钮
  2591. utils.toggleBtnStatus("btn_2");
  2592. }
  2593. });
  2594. }
  2595.  
  2596.  
  2597. /**
  2598. * 将捕获的canvases合并并导出为pdf
  2599. * @returns
  2600. */
  2601. function canvases2pdf() {
  2602. // 已经捕获的页面数量
  2603. let stored_amount = window.book118JS.canvases.length;
  2604. // 总页面数量
  2605. let page_counts = window.book118JS.page_counts;
  2606. // 校验数量
  2607. let diff = page_counts - stored_amount;
  2608. if (diff > 0) {
  2609. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2610. if (!confirm("是否仍要导出PDF?")) {
  2611. // 不坚持导出PDF的情况
  2612. return;
  2613. }
  2614. }
  2615. // 导出PDF
  2616. let canvases = window.book118JS.canvases;
  2617. // 取得宽高
  2618. let model = canvases[0];
  2619. let width = model.width;
  2620. let height = model.height;
  2621. // 取得标题然后导出pdf
  2622. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2623. }
  2624.  
  2625.  
  2626. /**
  2627. * 原创力文档(PPT)下载策略
  2628. */
  2629. function book118_PPT() {
  2630. // 创建全局对象
  2631. window.book118JS = {
  2632. page_counts: getPageCountsPPT(),
  2633. canvases: [] // 存储每页文档转化的canvas
  2634. };
  2635.  
  2636. // 创建按钮区
  2637. utils.createBtns();
  2638. // 绑定监听器到按钮1
  2639. utils.setBtnEvent(() => {
  2640. let hints = [
  2641. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2642. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2643. ];
  2644. alert(hints.join("\n"));
  2645. // 隐藏按钮1
  2646. utils.toggleBtnStatus("btn_1");
  2647. // 开始捕获页面
  2648. docView2Canvas(window.book118JS.page_counts);
  2649. }, [], "btn_1", "捕获页面");
  2650. // 为按钮2绑定监听器
  2651. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2652. }
  2653.  
  2654.  
  2655. /**
  2656. * 取得当前页面的excel,返回csv string
  2657. * @returns {String} csv
  2658. */
  2659. function excel2CSV() {
  2660. let table = [];
  2661. let rows = document.querySelectorAll("tr[id]");
  2662.  
  2663. // 遍历行
  2664. for (let row of rows) {
  2665. let csv_row = [];
  2666. // 遍历列(单元格)
  2667. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2668. // 判断单元格是否存储图片
  2669. let img = cell.querySelector("img");
  2670. if (img) {
  2671. // 如果是图片,保存图片链接
  2672. csv_row.push(img.src);
  2673. } else {
  2674. // 否则保存单元格文本
  2675. csv_row.push(cell.textContent);
  2676. }
  2677. }
  2678. table.push(csv_row.join(","));
  2679. }
  2680.  
  2681. let csv = table.join("\n");
  2682. csv = csv.replace(/\n{2,}/g, "\n");
  2683. return csv;
  2684. }
  2685.  
  2686.  
  2687. /**
  2688. * 下载当前表格内容,保存为csv(utf-8编码)
  2689. */
  2690. function wantEXCEL() {
  2691. let file_name = "原创力表格_UTF-8.csv";
  2692. utils.createAndDownloadFile(file_name, excel2CSV());
  2693. }
  2694.  
  2695.  
  2696. /**
  2697. * 在Excel预览页面给出操作提示
  2698. */
  2699. function help() {
  2700. let hints = [
  2701. "【导出表格到CSV】只能导出当前sheet,",
  2702. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2703. "CSV是一种简单的表格格式,可以被Excel打开,",
  2704. "并转为 xls 或 xlsx 格式存储,",
  2705. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2706. "",
  2707. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2708. "有两个办法:",
  2709. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2710. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2711. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2712. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2713. ];
  2714. alert(hints.join("\n"));
  2715. }
  2716.  
  2717.  
  2718. /**
  2719. * 原创力文档(EXCEL)下载策略
  2720. */
  2721. function book118_EXCEL() {
  2722. // 创建按钮区
  2723. utils.createBtns();
  2724. // 绑定监听器到按钮
  2725. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2726. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2727. // 显示按钮
  2728. utils.toggleBtnStatus("btn_2");
  2729. }
  2730.  
  2731.  
  2732. /**
  2733. * 打开Excel预览页面
  2734. */
  2735. function openEXCELpage() {
  2736. openPPTpage();
  2737. }
  2738.  
  2739.  
  2740. /**
  2741. * 原创力文档下载策略
  2742. */
  2743. function book118() {
  2744. let host = window.location.hostname;
  2745. if (host === 'max.book118.com') {
  2746. if (isEXCEL()) {
  2747. utils.createBtns();
  2748. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2749. } else if (isPPT()) {
  2750. utils.createBtns();
  2751. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2752. } else {
  2753. book118_CommonDoc();
  2754. }
  2755. } else if (host === "view-cache.book118.com") {
  2756. book118_PPT();
  2757. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2758. book118_EXCEL();
  2759. } else {
  2760. console.log(`wk: Unknown host: ${host}`);
  2761. }
  2762. }
  2763.  
  2764. /**
  2765. * 设置图像质量为100
  2766. */
  2767. function HD() {
  2768. window.img_quality = 1;
  2769. console.log("图像质量已经设置为100%");
  2770. console.log("如果刷新页面或跳转页面则需要再次使用该命令");
  2771. }
  2772.  
  2773. /**
  2774. * 主函数:识别网站,执行对应文档下载策略
  2775. */
  2776. function main() {
  2777. // 显示当前位置
  2778. let host = window.location.host;
  2779. console.log(`当前host: ${host}`);
  2780. // 挂载工具包到全局
  2781. window.user_utils = utils;
  2782. console.log("wk: user_utils已经挂载到全局");
  2783.  
  2784. // 附加任务
  2785. utils.globalFunc(HD); // 全局设置高清图片的函数
  2786.  
  2787. // 主任务
  2788. if (host.includes("docin.com")) {
  2789. docin();
  2790. } else if (host === "ishare.iask.sina.com.cn") {
  2791. ishare();
  2792. } else if (host === "www.deliwenku.com") {
  2793. deliwenku();
  2794. } else if (host === "www.doc88.com") {
  2795. doc88();
  2796. } else if (host === "www.360doc.com") {
  2797. doc360();
  2798. } else if (host === "wenku.baidu.com") {
  2799. baiduWenku();
  2800. } else if (host === "doc.mbalib.com") {
  2801. mbalib();
  2802. } else if (host === "www.woc88.com") {
  2803. woc88();
  2804. } else if (host === "www.dugen.com") {
  2805. dugen();
  2806. } else if (host.includes("book118.com")) {
  2807. book118();
  2808. } else {
  2809. console.log("匹配到了无效网页");
  2810. }
  2811. }
  2812.  
  2813. let options = {
  2814. fast_mode: false,
  2815. activation_test: false
  2816. };
  2817. if (options.cli_mode) {
  2818. (() => {
  2819. loadExternalScripts();
  2820. setTimeout(main, 2000);
  2821. return;
  2822. })();
  2823. }
  2824. if (options.activation_test) {
  2825. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  2826. }
  2827. if (options.fast_mode) {
  2828. main();
  2829. } else {
  2830. window.onload = main;
  2831. }
  2832.  
  2833. })();