Wenku Doc Downloader

【不看反馈】下载文档,导出纯图片PDF。有限地支持 ①豆丁网 ②道客巴巴 ③360doc个人图书馆 ④得力文库 ⑤MBA智库 ⑥爱问共享资料(新浪文档) ⑦原创力文档 ⑧读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-05-19 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.16
  5. // @description 【不看反馈】下载文档,导出纯图片PDF。有限地支持 ①豆丁网 ②道客巴巴 ③360doc个人图书馆 ④得力文库 ⑤MBA智库 ⑥爱问共享资料(新浪文档) ⑦原创力文档 ⑧读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://ishare.iask.com/f/*
  10. // @match *://www.deliwenku.com/p-*
  11. // @match *://www.doc88.com/p-*
  12. // @match *://www.360doc.com/content/*
  13. // @match *://wenku.baidu.com/view/*
  14. // @match *://wenku.baidu.com/tfview/*
  15. // @match *://doc.mbalib.com/view/*
  16. // @match *://www.dugen.com/p-*
  17. // @match *://max.book118.com/html/*
  18. // @match *://view-cache.book118.com/pptView.html?*
  19. // @match *://*.book118.com/?readpage=*
  20. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  21. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  22. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  23. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  24. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  25. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  26. // @grant none
  27. // @license GPL-3.0-only
  28. // @create 2021-11-22
  29. // @note 1. 百度文库展开文档太难搞,暂时放弃
  30. // @note 2. 修了一些小bug
  31. // @note 3. 百度文库页面加载慢和脚本关系不大,就算什么脚本都不开也慢
  32. // ==/UserScript==
  33.  
  34.  
  35. (function () {
  36. 'use strict';
  37.  
  38. let utils = {
  39. ver: (() => {
  40. // 显示版本号
  41. let _ver = "wk-utils: ver-1.5.16";
  42. console.log(_ver);
  43. return _ver;
  44. })(),
  45.  
  46. /**
  47. * 创建并下载文件
  48. * @param {String} file_name 文件名
  49. * @param {String | Blob} content 文本或blob
  50. */
  51. createAndDownloadFile: function(file_name, content) {
  52. let aTag = document.createElement('a');
  53. let blob;
  54. if ((typeof content) === "string") {
  55. blob = new Blob([content]);
  56. }
  57. aTag.download = file_name;
  58. aTag.href = URL.createObjectURL(blob);
  59. aTag.click();
  60. URL.revokeObjectURL(blob);
  61. },
  62.  
  63. /**
  64. * 创建并下载链接资源
  65. * @param {String} file_name
  66. * @param {String} src
  67. */
  68. downloadUrlFile: function(file_name, src) {
  69. let aTag = document.createElement('a');
  70. aTag.download = file_name;
  71. aTag.href = src;
  72. aTag.click();
  73. },
  74.  
  75. /**
  76. * 添加外部js到当前页面
  77. * @param {String} url
  78. */
  79. addScripts2HTML: function(url) {
  80. let script = document.createElement("script");
  81. script.src = url;
  82. document.head.appendChild(script);
  83. },
  84.  
  85. /**
  86. * 临时禁用脚本,执行func后移除btns_section。
  87. * @param {Function} func
  88. */
  89. banSelf: function(func = () => 0) {
  90. func();
  91. document.querySelector(".btns_section").remove();
  92. },
  93.  
  94. /**
  95. * 睡眠 delay 毫秒
  96. * @param {Number} delay
  97. */
  98. sleep: function(delay) {
  99. let start = (new Date()).getTime();
  100. while ((new Date()).getTime() - start < delay) {
  101. continue;
  102. }
  103. },
  104.  
  105. /**
  106. * 异步地睡眠 delay 毫秒,返回promise用于后续任务
  107. * @param {Number} delay
  108. * @returns {Promise} nextTask
  109. */
  110. sleepAsync: function(delay) {
  111. return new Promise((resolve) => setTimeout(resolve, delay));
  112. },
  113.  
  114. /**
  115. * 允许打印页面
  116. */
  117. allowPrint: function() {
  118. let style = document.createElement("style");
  119. style.innerHTML = `
  120. @media print {
  121. body{
  122. display:block;
  123. }
  124. }
  125. `;
  126. document.head.appendChild(style);
  127. },
  128.  
  129. /**
  130. * 取得get参数key对应的value
  131. * @param {String} key
  132. * @returns {String} value
  133. */
  134. getUrlParam: function(key) {
  135. let params = (new URL(window.location)).searchParams;
  136. return params.get(key);
  137. },
  138.  
  139. /**
  140. * 在指定节点后面插入节点
  141. * @param {HTMLElement} new_element
  142. * @param {HTMLElement} target_element
  143. */
  144. insertAfter: function(new_element, target_element) {
  145. let parent = target_element.parentNode;
  146. if (parent.lastChild === target_element) {
  147. parent.appendChild(new_element);
  148. } else {
  149. parent.insertBefore(new_element, target_element.nextElementSibling);
  150. }
  151. },
  152.  
  153. /**
  154. * 求main_set去除cut_set后的set
  155. * @param {Set} main_set
  156. * @param {Set} cut_set
  157. * @returns 差集
  158. */
  159. difference: function(main_set, cut_set) {
  160. let _diff = new Set(main_set);
  161. for (let elem of cut_set) {
  162. _diff.delete(elem);
  163. }
  164. return _diff;
  165. },
  166.  
  167. /**
  168. * 抛出set中的第一个元素
  169. * @param {Set} set
  170. * @returns 一个元素
  171. */
  172. setPop: function(set) {
  173. for (let item of set) {
  174. set.delete(item);
  175. return item;
  176. }
  177. },
  178.  
  179. /**
  180. * 绑定事件到指定按钮,返回按钮引用
  181. * @param {Function} event click事件
  182. * @param {Array} args 事件的参数列表
  183. * @param {String} aim_btn 按钮的变量名
  184. * @param {String} new_text 按钮的新文本,为null则不替换
  185. * @returns 按钮元素的引用
  186. */
  187. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  188. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  189. // 如果需要,替换按钮内文本
  190. if (new_text) {
  191. btn.textContent = new_text;
  192. }
  193. // 绑定事件,添加到页面上
  194. btn.onclick = () => {
  195. this.enhanceBtnClickReaction(aim_btn);
  196. if (args.length) {
  197. event(...args);
  198. } else {
  199. event();
  200. }
  201. };
  202. return btn;
  203. },
  204.  
  205. /**
  206. * 强制隐藏元素
  207. * @param {String} selector
  208. */
  209. forceHide: function(selector) {
  210. let style_cls = "force-hide";
  211. document.querySelectorAll(selector).forEach((elem) => {
  212. elem.className += ` ${style_cls}`;
  213. });
  214. // 判断css样式是否已经存在
  215. let style;
  216. style = document.querySelector(`style.${style_cls}`);
  217. // 如果已经存在,则无须重复创建
  218. if (style) {
  219. return;
  220. }
  221. // 否则创建
  222. style = document.createElement("style");
  223. style.innerHTML = `style.${style_cls} {
  224. visibility: hidden !important;
  225. }`;
  226. document.head.appendChild(style);
  227. },
  228.  
  229. /**
  230. * 隐藏按钮,打印页面,显示按钮
  231. */
  232. hideBtnThenPrint: function() {
  233. // 隐藏按钮,然后打印页面
  234. let btns = document.querySelectorAll(".btns_section, .hide_btn_wk");
  235. btns.forEach((elem) => {
  236. elem.style.display = "none";
  237. });
  238. window.print();
  239. // 打印结束,显示按钮
  240. btns.forEach((elem) => {
  241. elem.style.display = "block";
  242. });
  243. },
  244.  
  245. /**
  246. * 返回times个倍数连接的str
  247. * @param {String} str
  248. * @param {Number} times
  249. * @returns multiplied_str
  250. */
  251. multiplyStr: function(str, times) {
  252. let str_list = [];
  253. for (let i = 0; i < times; i++) {
  254. str_list.push(str);
  255. }
  256. return str_list.join("");
  257. },
  258.  
  259. /**
  260. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  261. * @param {String} custom_btn 按钮变量名
  262. */
  263. enhanceBtnClickReaction: function(custom_btn = null) {
  264. let aim_btn;
  265. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  266. if (!custom_btn || custom_btn === "btn_1") {
  267. aim_btn = document.querySelector(".btn-1");
  268. } else {
  269. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  270. }
  271.  
  272. let old_color = aim_btn.style.color; // 保存旧的颜色
  273. let old_text = aim_btn.textContent; // 保存旧的文字内容
  274. // 变黑缩小
  275. aim_btn.style.color = "black";
  276. aim_btn.style.fontWeight = "normal";
  277. aim_btn.textContent = `->${old_text}<-`;
  278. // 复原加粗
  279. let changeColorBack = function() {
  280. aim_btn.style.color = old_color;
  281. aim_btn.style.fontWeight = "bold";
  282. aim_btn.textContent = old_text;
  283. };
  284. setTimeout(changeColorBack, 1250);
  285. },
  286.  
  287. /**
  288. * 切换按钮显示/隐藏状态
  289. * @param {String} aim_btn 按钮变量名
  290. * @returns 按钮元素的引用
  291. */
  292. toggleBtnStatus: function(aim_btn) {
  293. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  294. let display = getComputedStyle(btn).display;
  295. // return;
  296. if (display === "none") {
  297. btn.style.display = "block";
  298. } else {
  299. btn.style.display = "none";
  300. }
  301. return btn;
  302. },
  303.  
  304. /**
  305. * 根据canvas元素数量返回quality值
  306. * @param {Number} canvas_amount
  307. * @returns quality: Number
  308. */
  309. getQualityByCanvasAmount: function(canvas_amount) {
  310. // 如果有全局参数,优先用全局的
  311. if (window.img_quality !== undefined) {
  312. console.log(`image quality: ${window.img_quality*100}%`);
  313. return window.img_quality;
  314. }
  315. // 否则用默认的
  316. let quality;
  317. if (canvas_amount <= 25) {
  318. quality = 1.0;
  319. } else if (25 < canvas_amount <= 50) {
  320. quality = 0.9;
  321. } else {
  322. quality = 0.8;
  323. }
  324. console.log(`image quality: ${quality*100}%`);
  325. return quality;
  326. },
  327.  
  328. /**
  329. * 挂载func到全局
  330. * @param {Function} func
  331. */
  332. globalFunc: function(func) {
  333. globalThis[func.name] = func;
  334. },
  335.  
  336. /**
  337. * 用input框跳转到对应页码
  338. * @param {Element} cur_page 当前页码
  339. * @param {string | Number} aim_page 目标页码
  340. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  341. */
  342. jump2pageNo: function(cur_page, aim_page, event_type) {
  343. // 设置跳转页码为目标页码
  344. cur_page.value = (aim_page).toString();
  345. // 模拟回车事件来跳转
  346. let keyboard_event_enter = new KeyboardEvent(event_type, {
  347. bubbles: true,
  348. cancelable: true,
  349. keyCode: 13
  350. });
  351. cur_page.dispatchEvent(keyboard_event_enter);
  352. },
  353.  
  354. /**
  355. * 在新标签页打开链接
  356. * @param {String} href
  357. */
  358. openInNewTab: function(href) {
  359. let link = document.createElement("a");
  360. link.href = href;
  361. link.target = "_blank";
  362. link.click();
  363. },
  364.  
  365. /**
  366. * 滚动到页面底部
  367. */
  368. scrollToBottom: function() {
  369. window.scrollTo({
  370. top: document.body.scrollHeight,
  371. behavior: "smooth"
  372. });
  373. },
  374.  
  375. /**
  376. * 用try移除元素
  377. * @param {Element} element 要移除的元素
  378. */
  379. tryToRemoveElement: function(element) {
  380. try {
  381. element.remove();
  382. } catch (e) {
  383. }
  384. },
  385. /**
  386. * 用try移除若干元素
  387. * @param {Element[]} elements 要移除的元素列表
  388. */
  389. tryToRemoveElements: function(elements) {
  390. elements.forEach((elem) => {
  391. this.tryToRemoveElement(elem);
  392. });
  393. },
  394.  
  395. /**
  396. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  397. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  398. */
  399. tryToRemoveSameElem: function(elem_list_box) {
  400. for (let elem_list of elem_list_box) {
  401. if (!elem_list) {
  402. continue;
  403. }
  404. for (let elem of elem_list) {
  405. try {
  406. elem.remove();
  407. } catch (e) {
  408. console.log();
  409. }
  410. }
  411. }
  412. },
  413.  
  414. /**
  415. * 使文档在页面上居中
  416. * @param {String} selector 文档容器的css选择器
  417. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  418. * @returns 偏移值是否合法
  419. */
  420. centerDoc: function(selector, default_offset) {
  421. let doc_main = document.querySelector(selector);
  422. let offset = window.prompt("请输入偏移百分位:", default_offset);
  423. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  424. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  425. doc_main.style.marginLeft = offset + "%";
  426. return true;
  427. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  428. doc_main.style.marginLeft = offset + "%";
  429. return true
  430. } else {
  431. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  432. return false;
  433. }
  434. },
  435.  
  436. /**
  437. * 调整按钮内文本
  438. * @param {String} aim_btn 按钮变量名
  439. * @param {String} new_text 新的文本,null则保留旧文本
  440. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  441. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  442. */
  443. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  444. // 提示文档已经展开
  445. if (use_hint) {
  446. let hint = "文档已经完全展开,可以导出";
  447. alert(hint);
  448. }
  449. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  450. // 要替换的文本
  451. if (new_text) {
  452. btn.textContent = new_text;
  453. }
  454. // 推荐按钮
  455. if (recommend_btn) {
  456. btn.textContent += "(推荐)";
  457. }
  458. },
  459.  
  460. html2Canvases: async function(elem_list) {
  461. // 如果是空元素列表,返回null并终止函数
  462. if (elem_list.length === 0) {
  463. console.log("html2canvases was called, but no element is avaiable.");
  464. return null;
  465. }
  466. let tasks = []; // 存放异步任务
  467. let contents = []; // 存放canvas元素
  468. for (let elem of elem_list) {
  469. let task = html2canvas(elem).then((canvas) => {
  470. contents.push(canvas);
  471. });
  472. tasks.push(task);
  473. }
  474. // 等待全部page转化完成
  475. await Promise.all(tasks);
  476. return contents;
  477. },
  478.  
  479. /**
  480. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  481. * @param {Array} elem_list html元素列表
  482. * @param {String} title 文档标题
  483. */
  484. html2PDF: async function(elem_list, title = "文档") {
  485. // 如果是空元素列表,终止函数
  486. let _contents = this.html2Canvases(elem_list);
  487. if (_contents === null) {
  488. return;
  489. }
  490. _contents.then((contents) => {
  491. // 控制台检查结果
  492. console.log("生成的canvas元素如下:");
  493. console.log(contents);
  494.  
  495. // 拿到canvas宽、高
  496. let model = elem_list[0];
  497. let width, height;
  498. width = model.offsetWidth;
  499. height = model.offsetHeight;
  500. // 打包为pdf
  501. this.saveCanvasesToPDF(contents, title, width, height);
  502. });
  503. },
  504.  
  505. /**
  506. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  507. * @param {string} selector 图形元素的父级元素
  508. */
  509. savePicUrls: function(selector) {
  510. let pages = document.querySelectorAll(selector);
  511. let pic_urls = [];
  512.  
  513. for (let elem of pages) {
  514. let pic_obj = elem.children[0];
  515. let url = pic_obj.src;
  516. pic_urls.push(url);
  517. }
  518. let content = pic_urls.join("\n");
  519. // 启动下载
  520. this.createAndDownloadFile("urls.csv", content);
  521. },
  522.  
  523. /**
  524. * 存储所有canvas图形为png到一个压缩包
  525. * @param {Array} node_list canvas元素列表
  526. * @param {String} title 文档标题
  527. */
  528. saveCanvasesToZip: function(node_list, title) {
  529. // canvas元素转为png图像
  530. // 所有png合并为一个zip压缩包
  531. let zip = new JSZip();
  532. let n = node_list.length;
  533.  
  534. for (let i = 0; i < n; i++) {
  535. let canvas = node_list[i];
  536. let data_base64 = canvas.toDataURL();
  537. let blob = atob(data_base64.split(",")[1]);
  538. zip.file(`page-${i+1}.png`, blob, { binary: true });
  539. }
  540.  
  541. // 导出zip
  542. // promise.then(onCompleted, onRejected);
  543. zip.generateAsync({ type: "blob" }).then(function(content) {
  544. // see filesaver.js
  545. console.log(content);
  546. saveAs(content, `${title}.zip`);
  547. });
  548. },
  549.  
  550. /**
  551. * 将canvas转为jpeg,然后导出PDF
  552. * @param {Array} node_list canvas元素列表
  553. * @param {String} title 文档标题
  554. */
  555. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  556. // 如果没有手动指定canvas的长宽,则自动检测
  557. if (!width && !height) {
  558. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  559. let first_canvas = node_list[0];
  560. // 如果style的长宽不存在,则直接用canvas的元素长宽
  561. let width_str, height_str;
  562. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  563. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  564. } else {
  565. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  566. }
  567. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  568. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  569. }
  570. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  571. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  572. let orientation = width > height ? 'l' : 'p';
  573. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  574.  
  575. // 根据canvas数量确定quality
  576. let quality = this.getQualityByCanvasAmount(node_list.length);
  577.  
  578. // 保存每一页文档到每一页pdf
  579. node_list.forEach(function(canvas, index) {
  580. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  581. // 如果当前不是文档最后一页,则需要添加下一个空白页
  582. if (index !== node_list.length - 1) {
  583. pdf.addPage();
  584. }
  585. });
  586.  
  587. // 导出文件
  588. pdf.save(`${title}.pdf`);
  589. },
  590.  
  591. /**
  592. * Image元素列表合并到一个PDF中
  593. * @param {NodeList} imgs Image元素列表
  594. * @param {String} title 文档名
  595. */
  596. imgs2pdf: function(imgs, title) {
  597. // 取得宽高
  598. let model = imgs[0];
  599. let width = model.offsetWidth;
  600. let height = model.offsetHeight;
  601.  
  602. // 创建pdf
  603. let orientation = width > height ? 'l' : 'p';
  604. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  605.  
  606. // 添加图像到pdf
  607. imgs.forEach((img, index) => {
  608. pdf.addImage(img, 'PNG', 0, 0, width, height);
  609. // 如果当前不是文档最后一页,则需要添加下一个空白页
  610. if (index !== imgs.length - 1) {
  611. pdf.addPage();
  612. }
  613. });
  614.  
  615. // 导出文件
  616. pdf.save(`${title}.pdf`);
  617. },
  618.  
  619. /**
  620. * 取得elem的class为class_name的父级元素
  621. * @param {String} class_name
  622. * @param {Element} elem 起点元素
  623. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  624. * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  625. * @returns {null | Element} parent_element
  626. */
  627. getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
  628. let parent = elem.parentElement;
  629. let iterator_count = JSobj.iterator_count;
  630. let now_name;
  631.  
  632. try {
  633. now_name = parent.className;
  634. } catch (e) {
  635. JSobj.iterator_count = 0;
  636. // 没有父级元素了
  637. return "no parent node";
  638. }
  639.  
  640. // 如果不忽略递归次数计数器
  641. if (!ignore) {
  642. if (iterator_count > 9) {
  643. // 超过最大迭代次数,认为不存在,返回null
  644. JSobj.iterator_count = 0;
  645. return "over max iterator counts limit";
  646. } else {
  647. JSobj.iterator_count += 1;
  648. }
  649. }
  650. // 如果类名匹配,返回该节点
  651. if (now_name.split(" ").includes(class_name)) {
  652. iterator_count = 0;
  653. return parent;
  654. }
  655. return this.getParentByClassName(class_name, parent, JSobj);
  656. },
  657.  
  658. /**
  659. * 将func绑定到window.onscroll,并设置触发频率
  660. * @param {Function} func scroll的监听函数
  661. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  662. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  663. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  664. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  665. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  666. */
  667. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  668. if (JSobj.scroll_count === undefined) {
  669. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  670. return;
  671. }
  672.  
  673. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  674. JSobj.scroll_count += 1;
  675. if (JSobj.scroll_count < useful_range) {
  676. func();
  677. console.log(hint);
  678. } else if (JSobj.scroll_count > wait_range) {
  679. JSobj.scroll_count = 0;
  680. }
  681. };
  682. // 如果没有指定的window对象,则使用默认的window
  683. if (!inner_window) {
  684. window.onscroll = () => {
  685. new_func(func, JSobj, useful_range, wait_range, hint);
  686. };
  687. return;
  688. }
  689. // 特定的window对象,一般用于iframe,追加scroll监听器
  690. let scrollFunc = () => {
  691. new_func(func, JSobj, useful_range, wait_range, hint);
  692. };
  693. JSobj.scrollFunc = scrollFunc;
  694. inner_window.addEventListener("scroll", scrollFunc, false);
  695. },
  696.  
  697. /**
  698. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  699. */
  700. createBtns: function() {
  701. // 创建按钮组
  702. let section = document.createElement("section");
  703. section.className = "btns_section";
  704. section.innerHTML = `
  705. <p class="logo_tit">Wenku Doc Downloader</p>
  706. <button class="btn-1">展开文档 😈</button>
  707. <button class="btn-2">未设定2</button>
  708. <button class="btn-3">未设定3</button>
  709. <button class="btn-4">未设定4</button>
  710. <button class="btn-5">未设定5</button>
  711. `;
  712. document.body.appendChild(section);
  713.  
  714. // 添加隐藏/展示按钮
  715. // 隐藏【🙈】,展开【🐵】
  716. let hide_btn = document.createElement("p");
  717. hide_btn.className = "hide_btn_wk";
  718. hide_btn.textContent = "🐵";
  719. hide_btn.onclick = () => {
  720. // 显示 -> 隐藏
  721. if (getComputedStyle(section).display === "block") {
  722. section.style.display = "none";
  723. hide_btn.style.left = "20px";
  724. hide_btn.textContent = "🙈";
  725. // 隐藏 -> 显示
  726. } else {
  727. section.style.display = "block";
  728. hide_btn.style.left = "155px";
  729. hide_btn.textContent = "🐵";
  730. }
  731. };
  732. document.body.appendChild(hide_btn);
  733.  
  734. // 设定样式
  735. let style = document.createElement("style");
  736. style.innerHTML = `
  737. .hide_btn_wk {
  738. position: fixed;
  739. left: 155px;
  740. top: 36%;
  741. user-select: none;
  742. font-size: large;
  743. z-index: 5001;
  744. }
  745. .btns_section{
  746. position: fixed;
  747. width: 154px;
  748. left: 10px;
  749. top: 32%;
  750. background: #E7F1FF;
  751. border: 2px solid #1676FF;
  752. padding: 0px 0px 10px 0px;
  753. font-weight: 600;
  754. border-radius: 2px;
  755. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  756. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  757. 'Segoe UI Emoji', 'Segoe UI Symbol';
  758. z-index: 5000;
  759. }
  760. .logo_tit{
  761. width: 100%;
  762. background: #1676FF;
  763. text-align: center;
  764. font-size:12px ;
  765. color: #E7F1FF;
  766. line-height: 40px;
  767. height: 40px;
  768. margin: 0 0 16px 0;
  769. }
  770.  
  771. .btn-1{
  772. display: block;
  773. width: 128px;
  774. height: 28px;
  775. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  776. border-radius: 4px;
  777. color: #fff;
  778. font-size: 12px;
  779. border: none;
  780. outline: none;
  781. margin: 8px auto;
  782. font-weight: bold;
  783. cursor: pointer;
  784. opacity: .9;
  785. }
  786. .btn-2{
  787. display: none;
  788. width: 128px;
  789. height: 28px;
  790. background: #07C160;
  791. border-radius: 4px;
  792. color: #fff;
  793. font-size: 12px;
  794. border: none;
  795. outline: none;
  796. margin: 8px auto;
  797. font-weight: bold;
  798. cursor: pointer;
  799. opacity: .9;
  800. }
  801. .btn-3{
  802. display: none;
  803. width: 128px;
  804. height: 28px;
  805. background:#FA5151;
  806. border-radius: 4px;
  807. color: #fff;
  808. font-size: 12px;
  809. border: none;
  810. outline: none;
  811. margin: 8px auto;
  812. font-weight: bold;
  813. cursor: pointer;
  814. opacity: .9;
  815. }
  816. .btn-4{
  817. display: none;
  818. width: 128px;
  819. height: 28px;
  820. background: #1676FF;
  821. border-radius: 4px;
  822. color: #fff;
  823. font-size: 12px;
  824. border: none;
  825. outline: none;
  826. margin: 8px auto;
  827. font-weight: bold;
  828. cursor: pointer;
  829. opacity: .9;
  830. }
  831. .btn-5{
  832. display: none;
  833. width: 128px;
  834. height: 28px;
  835. background: #ff6600;
  836. border-radius: 4px;
  837. color: #fff;
  838. font-size: 12px;
  839. border: none;
  840. outline: none;
  841. margin: 8px auto;
  842. font-weight: bold;
  843. cursor: pointer;
  844. opacity: .9;
  845. }
  846. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  847. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  848. document.head.appendChild(style);
  849. }
  850. };
  851.  
  852. /**
  853. * 清理百度文库页面的无关元素
  854. */
  855. function clearPage_Baidu() {
  856. let selectors = [
  857. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  858. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  859. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  860. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  861. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  862. ".hx-recom-wrapper, .reader-topbar, #page-footer, .copyright-wrap",
  863. ".bg-theme-wap"
  864. ];
  865. let elem_list = document.querySelectorAll(selectors.join(", "));
  866. for (let elem of elem_list) {
  867. utils.tryToRemoveElement(elem);
  868. }
  869. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  870. utils.forceHide(nut_selector);
  871.  
  872. // 页边距调整
  873. // 顶部距离改为0
  874. let rc = document.querySelector("#reader-container");
  875. rc.style.paddingTop = "0";
  876. let cw = document.querySelector(".content-wrapper");
  877. cw.style.paddingTop = "0";
  878. // 底部距离改为0
  879. let foot = document.querySelector(".try-end-fold-page");
  880. foot.style.paddingBottom = "0";
  881. foot.style.height = "0";
  882. }
  883.  
  884.  
  885. /**
  886. * 调整页间距为 width px
  887. */
  888. function adjustPageGap() {
  889. let old_gap = window.baiduJS.page_gap;
  890. let hints = [
  891. `旧的页间距为 ${old_gap} px`,
  892. "请输入新的页间距(0-500的整数):\n"
  893. ];
  894. let new_gap = prompt(hints.join("\n"));
  895. new_gap = parseInt(new_gap);
  896.  
  897. // 创建空白段落节点充当间隔
  898. let div = document.createElement("div");
  899. // 取得实心填充物
  900. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  901. block.style.height = `${new_gap}px`;
  902. // 创建间隔
  903. div.style.background = "rgb(255, 255, 255)"; // 页间距设置为白色
  904. div.appendChild(block);
  905. div.className = "page-gap";
  906.  
  907. // 调整页间距
  908. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  909. let next_elem = elem.nextElementSibling;
  910.  
  911. if (next_elem === null) {
  912. return; // 最后一个节点后面无需间隔
  913. }
  914.  
  915. let cls = next_elem.className;
  916. if (cls === "page-gap") {
  917. next_elem.style.height = `${new_gap}px`;
  918. } else {
  919. utils.insertAfter(div.cloneNode(true), elem);
  920. }
  921. });
  922. window.baiduJS.page_gap = new_gap;
  923. console.log(`页间距已经调整为:${new_gap} px`);
  924. }
  925.  
  926.  
  927. /**
  928. * 判断是否所有可预览页面都冻结了
  929. * @returns {Boolean}
  930. */
  931. function areAllFrozen() {
  932. let frozen = 0;
  933. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  934. if (canvas.getAttribute("width") !== "0") {
  935. frozen += 1;
  936. }
  937. });
  938. if (frozen < window.free_page) {
  939. return false;
  940. }
  941. return true;
  942. }
  943.  
  944.  
  945. /**
  946. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  947. */
  948. function freezeDocView() {
  949. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  950. if (canvas.getAttribute("width") !== "0") {
  951. canvas.id = "";
  952. }
  953. });
  954.  
  955. if (areAllFrozen()) {
  956. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  957. console.log("wk: 文档页: 全部冻结完毕");
  958. window.baiduJS.finished = true;
  959. window.onscroll = () => { };
  960. }
  961. }
  962.  
  963.  
  964. /**
  965. * 优化阅读体验的零碎任务
  966. */
  967. function better() {
  968. /**
  969. * 内部主函数,便于捕获异常
  970. * 代码改自 https://greasyfork.org/zh-CN/scripts/438420
  971. */
  972. let _better = function() {
  973. let pageData = window.pageData;
  974. // 改为本地 VIP
  975. pageData.vipInfo.global_svip_status = 1;
  976. pageData.vipInfo.global_vip_status = 1;
  977. pageData.vipInfo.isVip = 1;
  978. pageData.vipInfo.isWenkuVip = 1;
  979.  
  980. // 手机版优化
  981. if (pageData.appUniv) {
  982. // 取消百度文库对谷歌、搜狗浏览器 referrer 的屏蔽
  983. pageData.appUniv.blackBrowser = [];
  984. // 隐藏 APP 下载按钮
  985. pageData.viewBiz.docInfo.needHideDownload = true;
  986. }
  987.  
  988. // 强制改变背景为中灰色
  989. document.querySelector("#app")
  990. .style.backgroundColor = "rgb(95, 99, 104)";
  991. };
  992.  
  993. try {
  994. console.log("wk: 优化");
  995. _better();
  996. } catch (error) {
  997. console.log("wk: baiduWenku: better: main:");
  998. console.error(error);
  999. }
  1000. }
  1001.  
  1002.  
  1003. /**
  1004. * 展开文档
  1005. */
  1006. function readAllOld() {
  1007. better();
  1008. let btn = document.querySelector(".read-all");
  1009. if (!btn) {
  1010. // 显示按钮
  1011. utils.toggleBtnStatus("btn_1");
  1012. utils.toggleBtnStatus("btn_2");
  1013. utils.toggleBtnStatus("btn_3");
  1014. // utils.toggleBtnStatus("btn_4");
  1015. } else {
  1016. btn.click();
  1017. }
  1018. }
  1019.  
  1020.  
  1021. function getTips() {
  1022. let hints = [
  1023. `一共 ${window.all_page} 页, 免费预览 ${window.free_page} 页,`,
  1024. "请优先尝试【导出图片链接】,如果不行再【打印页面到PDF】。",
  1025. "!!由于百度改版,图片链接可能是假的,如若发生请尝试其他办法!!",
  1026. "",
  1027. "如果<免费预览页数>等于<总页数>,",
  1028. "但点击展开文档, 却跳转到vip付费,",
  1029. "请尝试:",
  1030. "1. 清除全部cookies,刷新页面并登录账号",
  1031. "2. 复制以下链接,并在【新标签页】中打开,然后尝试展开文档。",
  1032. "如果还不行就没办法了。",
  1033. "",
  1034. "如果出现空白页,请浏览对应页面使其加载,然后再打印页面。",
  1035. "页数超过20页时,打印预览明显缓慢,请耐心等待,真的只是很慢。",
  1036. "",
  1037. "页面间距通过按钮调整。",
  1038. "页面宽度通过打印时缩放比调整。",
  1039. "推荐缩放比: 114%",
  1040. "",
  1041. "打印时设置:",
  1042. "更多设置 -> 缩放 -> 自定义",
  1043. "选项 -> ☑ 背景图形",
  1044. ];
  1045. let url_no_params = window.location.href.replace(/[?].*/, "");
  1046. prompt(hints.join("\n"), url_no_params);
  1047. alert(
  1048. [
  1049. "只能导出可以【免费预览】的页面。",
  1050. "脚本的能力是有限的,烦请谅解。",
  1051. "",
  1052. "百度文库会记住你打开文档的操作路径,如:",
  1053. "百度搜索 -> 文档,或 文库搜索 -> 百度文档,",
  1054. "百度会让通过特定路径打开免费文档的人必须付费,",
  1055. "所以解决办法是复制刚才弹窗中的链接,",
  1056. "新建标签页,粘贴链接,然后回车打开,这样的操作是零路径。",
  1057. "",
  1058. "此外,发现此脚本与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  1059. "应该是此脚本删去文档页id所导致的,",
  1060. "暂无解决方案, 如需复制文字请禁用此脚本。"
  1061. ].join("\n")
  1062. );
  1063. }
  1064.  
  1065.  
  1066. /**
  1067. * 清理页面,然后打印页面
  1068. */
  1069. function clearThenPrint() {
  1070. // 清理页面
  1071. clearPage_Baidu();
  1072. // 调整文档内容的定位
  1073. let content = document.querySelector(".left-wrapper");
  1074. content.style.marginLeft = "0";
  1075. // 打印页面
  1076. utils.hideBtnThenPrint();
  1077. }
  1078.  
  1079.  
  1080. /**
  1081. * 取得pageData接口中的urls并下载
  1082. * @returns {Boolean} 是否成功下载(是否存在图片元素)
  1083. */
  1084. function downloadPicUrls() {
  1085. let warn = () => {
  1086. let hints = [
  1087. "当前文档非ppt或pdf, 无法使用该功能。",
  1088. "请在展开文档后使用【打印页面到PDF】"
  1089. ];
  1090. alert(hints.join("\n"));
  1091. };
  1092.  
  1093. let html_urls = window.pageData.readerInfo.htmlUrls;
  1094. if (!html_urls) {
  1095. warn();
  1096. return false;
  1097. }
  1098.  
  1099. // pdf
  1100. if (html_urls.png && html_urls.png.length > 0) {
  1101. let urls = [];
  1102. let pngs = html_urls.png;
  1103. pngs.forEach((png) => {
  1104. urls.push(png.pageLoadUrl);
  1105. });
  1106. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  1107. return true;
  1108. }
  1109. // 非图形
  1110. if (html_urls.length === undefined) {
  1111. warn();
  1112. return false;
  1113. }
  1114. // ppt
  1115. utils.createAndDownloadFile("urls.csv", html_urls.join("\n"));
  1116. return true;
  1117. }
  1118.  
  1119.  
  1120. /**
  1121. * 百度文档下载策略
  1122. */
  1123. function baiduWenkuOld() {
  1124. // 允许打印页面
  1125. utils.allowPrint();
  1126. better();
  1127.  
  1128. // 绑定监听器给滚动。在滚动时冻结文档页面
  1129. let log = "wk: 文档页: 冻结";
  1130. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  1131.  
  1132. // 创建按钮
  1133. utils.createBtns();
  1134. // 按钮1: 展开预览
  1135. utils.setBtnEvent(readAllOld, [], "btn_1");
  1136. // 按钮2: 清理页面元素,打印页面
  1137. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  1138. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  1139. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  1140. // 按钮4: 导出图片链接(如果文档是ppt或pdf)
  1141. utils.setBtnEvent(downloadPicUrls, [], "btn_4", "导出图片链接");
  1142. utils.toggleBtnStatus("btn_4");
  1143. // 按钮5: 提示说明
  1144. utils.setBtnEvent(getTips, [], "btn_5", "有问题点我");
  1145. utils.toggleBtnStatus("btn_5");
  1146. }
  1147.  
  1148.  
  1149. /**
  1150. * 居中百度文库文档
  1151. */
  1152. function centerDoc() {
  1153. // 居中文档
  1154. $(".content-wrapper")[0].style = `
  1155. display: flex;
  1156. flex-direction: row;
  1157. justify-content: space-around;
  1158. `.replace(/\s/g, "");
  1159.  
  1160. $(".left-wrapper")[0].style = "margin: 0;";
  1161.  
  1162. let academic = $(".doc-info-wrapper")[0];
  1163. if (academic) {academic.style = "display: none;";}}
  1164.  
  1165.  
  1166. function readAll$1() {
  1167. let vip_read = $(".page-text")[0];
  1168. if (!vip_read) {return;}
  1169.  
  1170. let read_all = $(".read-all")[0];
  1171. // read_all.style = "color: red; font-weight: bold;";
  1172. read_all.textContent += "*";
  1173. read_all.parentElement.onclick = () => {
  1174. location.href = location.origin + location.pathname;
  1175. };
  1176. }
  1177.  
  1178.  
  1179. function baiduWenku() {
  1180. // 取得页码,创建全局对象
  1181. window.free_page = window.pageData.readerInfo.freePage;
  1182. window.all_page = window.pageData.readerInfo.page;
  1183. window.baiduJS = {
  1184. finished: false, // 文档页是否全部冻结
  1185. free_page: window.free_page, // 免费页数
  1186. all_page: window.all_page, // 全部页数
  1187. scroll_count: 0, // 滚动事件触发次数
  1188. page_gap: 0, // 页间距
  1189. oldTech: baiduWenkuOld // 旧版主函数入口
  1190. };
  1191.  
  1192. // 便捷选择器
  1193. window.$ = (s) => {
  1194. return document.querySelectorAll(s);
  1195. };
  1196. // 允许打印页面
  1197. utils.allowPrint();
  1198. better();
  1199.  
  1200. // 居中文档
  1201. centerDoc();
  1202.  
  1203. // 增加预览功能
  1204. setTimeout(readAll$1, 500);
  1205. }
  1206.  
  1207. /**
  1208. * 展开道客巴巴的文档
  1209. */
  1210. function readAllDoc88() {
  1211. // 获取“继续阅读”按钮
  1212. let continue_btn = document.querySelector("#continueButton");
  1213. // 如果存在“继续阅读”按钮
  1214. if (continue_btn) {
  1215. // 跳转到文末(等同于展开全文)
  1216. let cur_page = document.querySelector("#pageNumInput");
  1217. // 取得最大页码
  1218. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1219. // 跳转到尾页
  1220. utils.jump2pageNo(cur_page, page_max, "keypress");
  1221. // 返回顶部
  1222. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1223. }
  1224. // 文档展开后,显示按钮2、3
  1225. else {
  1226. // 隐藏按钮
  1227. utils.toggleBtnStatus("btn_1");
  1228. // 显示按钮
  1229. utils.toggleBtnStatus("btn_2");
  1230. utils.toggleBtnStatus("btn_3");
  1231. }
  1232. }
  1233.  
  1234. /**
  1235. * 道客巴巴文档下载策略
  1236. */
  1237. function doc88() {
  1238. // 创建脚本启动按钮1、2
  1239. utils.createBtns();
  1240.  
  1241. // 绑定主函数
  1242. let prepare = function() {
  1243. // 获取canvas元素列表
  1244. let node_list = document.querySelectorAll(".inner_page");
  1245. // 获取文档标题
  1246. let title;
  1247. if (document.querySelector(".doctopic h1")) {
  1248. title = document.querySelector(".doctopic h1").title;
  1249. } else {
  1250. title = "文档";
  1251. }
  1252. return [node_list, title];
  1253. };
  1254.  
  1255. // btn_1: 展开文档
  1256. utils.setBtnEvent(() => {
  1257. readAllDoc88();
  1258. }, [], "btn_1");
  1259. // btn_2: 导出zip
  1260. utils.setBtnEvent(() => {
  1261. if (confirm("确定每页内容都加载完成了吗?")) {
  1262. utils.saveCanvasesToZip(...prepare());
  1263. }
  1264. }, [], "btn_2", "导出图片到zip");
  1265. // btn_3: 导出PDF
  1266. utils.setBtnEvent(() => {
  1267. if (confirm("确定每页内容都加载完成了吗?")) {
  1268. utils.saveCanvasesToPDF(...prepare());
  1269. }
  1270. }, [], "btn_3", "导出图片到PDF");
  1271. }
  1272.  
  1273. // 绑定主函数
  1274. function getCanvasList() {
  1275. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1276. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1277. let node_list = [];
  1278. for (let node of parent_node_list) {
  1279. node_list.push(node.children[0]);
  1280. }
  1281. return node_list;
  1282. }
  1283.  
  1284.  
  1285. function prepare() {
  1286. // 获取canvas元素列表
  1287. let node_list = getCanvasList();
  1288. // 获取文档标题
  1289. let title;
  1290. if (document.querySelector("h1 [title=doc]")) {
  1291. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1292. } else if (document.querySelector(".doc_title")) {
  1293. title = document.querySelector(".doc_title").textContent;
  1294. } else {
  1295. title = "文档";
  1296. }
  1297. return [node_list, title];
  1298. }
  1299.  
  1300.  
  1301. // 判断是否有canvas元素
  1302. function detectCanvas() {
  1303. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1304.  
  1305. // 隐藏按钮
  1306. utils.toggleBtnStatus("btn_1");
  1307. // 显示按钮
  1308. utils.toggleBtnStatus("btn_2");
  1309.  
  1310. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1311. if (!haveCanvas) {
  1312. // btn_2: 导出图片链接
  1313. utils.setBtnEvent(() => {
  1314. if (confirm("确定每页内容都加载完成了吗?")) {
  1315. utils.savePicUrls("[id*=img_]");
  1316. }
  1317. }, [], "btn_2", "导出全部图片链接");
  1318. } else {
  1319. // 显示按钮3
  1320. utils.toggleBtnStatus("btn_3");
  1321. // btn_2: 导出zip
  1322. utils.setBtnEvent(() => {
  1323. if (confirm("确定每页内容都加载完成了吗?")) {
  1324. utils.saveCanvasesToZip(...prepare());
  1325. }
  1326. }, [], "btn_2", "导出图片到zip");
  1327. // btn_3: 导出PDF
  1328. utils.setBtnEvent(() => {
  1329. if (confirm("确定每页内容都加载完成了吗?")) {
  1330. utils.saveCanvasesToPDF(...prepare());
  1331. }
  1332. }, [], "btn_3", "导出图片到PDF");
  1333. }
  1334. }
  1335.  
  1336.  
  1337. /**
  1338. * 豆丁文档下载策略
  1339. */
  1340. function docin() {
  1341. // 创建脚本启动按钮
  1342. utils.createBtns();
  1343.  
  1344. // 隐藏底部工具栏
  1345. document.querySelector("#j_select").click(); // 选择指针
  1346. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1347. tool_bar.style.display = "none";
  1348.  
  1349. // btn_1: 判断文档类型
  1350. utils.setBtnEvent(() => {
  1351. utils.forceHide(".jz_watermark");
  1352. detectCanvas();
  1353. }, [], "btn_1", "判断文档类型");
  1354. }
  1355.  
  1356. /**
  1357. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1358. */
  1359. function readAlliShare() {
  1360. // 获取“继续阅读”元素
  1361. let red_btn = document.getElementsByClassName("red-color")[0];
  1362. let red_text = red_btn.textContent;
  1363. // 如果可以展开,则展开
  1364. if (red_text.search("点击可继续阅读") !== -1) {
  1365. red_btn.click();
  1366. setTimeout(readAlliShare, 1000);
  1367. }
  1368. // 否则启动按钮2,准备清理页面然后打印为PDF
  1369. else {
  1370. // 隐藏按钮
  1371. utils.toggleBtnStatus("btn_1");
  1372. // 显示按钮
  1373. utils.toggleBtnStatus("btn_2");
  1374. utils.toggleBtnStatus("btn_3");
  1375.  
  1376. // 显示svg图片的链接
  1377. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1378. if (!page1) {
  1379. // 如果不存在svg图形,终止后续代码
  1380. console.log("当前页面不存在svg图形");
  1381. return;
  1382. }
  1383. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1384. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1385. svg1_src_div.innerHTML = `<div id="src-1"
  1386. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1387. 访问以下链接以复制文字:<br>${page1.src}
  1388. </div>`;
  1389. svg2_src_div.innerHTML = `<div id="src-1"
  1390. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1391. 访问以下链接以复制文字:<br>${page2.src}
  1392. </div>`;
  1393. // 添加到页面上
  1394. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1395. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1396. }
  1397. }
  1398.  
  1399.  
  1400. /**
  1401. * 清理并打印爱问共享资料的文档页
  1402. * @returns 如果输入偏移量非法,返回空值以终止函数
  1403. */
  1404. function printPageiShare() {
  1405. // # 清理并打印爱问共享资料的文档页
  1406. // ## 移除页面上无关的元素
  1407. // ### 移除单个元素
  1408. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1409. let header = document.getElementsByClassName("new-detail-header")[0];
  1410. let fixright = document.getElementById("fix-right");
  1411. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1412. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1413. let footer = document.getElementsByClassName("website-footer")[0];
  1414. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1415. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1416. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1417. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1418. let crumb_arrow;
  1419. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1420. let copyright = document.getElementsByClassName("copyright-container")[0];
  1421. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1422. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1423. // ### 执行移除
  1424. let elem_list = [
  1425. topbanner,
  1426. header,
  1427. fixright,
  1428. redpacket,
  1429. fixedrightfull,
  1430. footer,
  1431. guess,
  1432. detailtopbox,
  1433. fullscreen,
  1434. endhint,
  1435. crumb_arrow,
  1436. copyright,
  1437. state_btn,
  1438. comments
  1439. ];
  1440. for (let elem of elem_list) {
  1441. utils.tryToRemoveElement(elem);
  1442. }
  1443. // ### 移除全部同类元素
  1444. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1445. for (let elem_2 of elem_list_2) {
  1446. utils.tryToRemoveElement(elem_2);
  1447. }
  1448. // 使文档居中
  1449. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1450. if (!utils.centerDoc("doc-main", "18")) {
  1451. return; // 如果输入非法,终止函数调用
  1452. }
  1453. // 隐藏按钮,然后打印页面
  1454. utils.hideBtnThenPrint();
  1455. }
  1456.  
  1457.  
  1458. /**
  1459. * 爱问共享资料文档下载策略
  1460. */
  1461. function ishare() {
  1462. // 创建脚本启动按钮1、2
  1463. utils.createBtns();
  1464.  
  1465. // btn_1: 展开文档
  1466. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1467. // btn_2: 导出图片链接
  1468. utils.setBtnEvent(() => {
  1469. utils.savePicUrls(".data-detail");
  1470. }, [], "btn_2", "导出图片链接(推荐)");
  1471. // btn_3: 打印页面到PDF
  1472. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1473. // btn_4: 不支持爱问办公
  1474. utils.setBtnEvent(() => null, [], "btn_4", "不支持爱问办公");
  1475. utils.toggleBtnStatus("btn_4");
  1476.  
  1477. // 移除底部下载条
  1478. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1479. utils.tryToRemoveElement(detailfixed);
  1480. }
  1481.  
  1482. /**
  1483. * 清理并打印得力文库的文档页
  1484. */
  1485. function printPageDeliwenku() {
  1486. // 移除页面上的无关元素
  1487. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1488. let elem_list = document.querySelectorAll(selector);
  1489. for (let elem of elem_list) {
  1490. utils.tryToRemoveElement(elem);
  1491. }
  1492. // 修改页间距
  1493. let outer_pages = document.getElementsByClassName("outer_page");
  1494. for (let page of outer_pages) {
  1495. page.style.marginBottom = "20px";
  1496. }
  1497. // 使文档居中
  1498. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1499. if (!utils.centerDoc("#boxleft", "3")) {
  1500. return; // 如果输入非法,终止函数调用
  1501. }
  1502. // 打印文档
  1503. utils.hideBtnThenPrint();
  1504. }
  1505.  
  1506.  
  1507. /**
  1508. * 点击“继续阅读”,适用性:得力文库
  1509. */
  1510. function readAllDeliwenku() {
  1511. // 点击“同意并开始预览全文”
  1512. let start_btn = document.getElementsByClassName("pre_button")[0];
  1513. let display = start_btn.parentElement.parentElement.style.display;
  1514. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1515. if (!display) {
  1516. start_btn.children[0].click();
  1517. setTimeout(() => {
  1518. scroll(0, document.body.scrollHeight);
  1519. }, 200);
  1520. return;
  1521. }
  1522. // 增强按钮点击效果
  1523. utils.enhanceBtnClickReaction();
  1524.  
  1525. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1526. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1527. // 继续阅读
  1528. if (display2 !== "none") {
  1529. // 获取input元素
  1530. let cur_page = document.querySelector("#pageNumInput");
  1531. let page_old = cur_page.value;
  1532. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1533. // 跳转到尾页
  1534. utils.jump2pageNo(cur_page, page_max, "keydown");
  1535. // 跳转回来
  1536. utils.jump2pageNo(cur_page, page_old, "keydown");
  1537.  
  1538. // 切换按钮准备导出
  1539. } else {
  1540. // 推荐导出图片链接
  1541. utils.modifyBtnText("btn_2", null, true);
  1542. // 隐藏按钮
  1543. utils.toggleBtnStatus("btn_1");
  1544. // 显示按钮
  1545. utils.toggleBtnStatus("btn_2");
  1546. utils.toggleBtnStatus("btn_3");
  1547. // btn_3 橙色按钮
  1548. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1549. }
  1550. }
  1551.  
  1552.  
  1553. /**
  1554. * 得力文库文档下载策略
  1555. */
  1556. function deliwenku() {
  1557. // 创建脚本启动按钮1、2
  1558. utils.createBtns();
  1559.  
  1560. // btn_1: 展开文档
  1561. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1562. // btn_2: 导出图片链接
  1563. utils.setBtnEvent(() => {
  1564. if (confirm("确定每页内容都加载完成了吗?")) {
  1565. utils.savePicUrls('.inner_page div');
  1566. }
  1567. }, [], "btn_2", "导出图片链接");
  1568.  
  1569. // 尝试关闭页面弹窗
  1570. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1571. // 解除打印限制
  1572. utils.allowPrint();
  1573. }
  1574.  
  1575. function readAll360Doc() {
  1576. // 展开文档
  1577. document.querySelector(".article_showall a").click();
  1578. // 隐藏按钮
  1579. utils.toggleBtnStatus("btn_1");
  1580. // 显示按钮
  1581. utils.toggleBtnStatus("btn_2");
  1582. utils.toggleBtnStatus("btn_3");
  1583. }
  1584.  
  1585.  
  1586. function saveText_360Doc() {
  1587. // 捕获图片链接
  1588. let images = document.querySelectorAll("#artContent img");
  1589. let content = [];
  1590.  
  1591. for (let i = 0; i < images.length; i++) {
  1592. let src = images[i].src;
  1593. content.push(`图${i+1},链接:${src}`);
  1594. }
  1595. // 捕获文本
  1596. let text = document.querySelector("#artContent").textContent;
  1597. content.push(text);
  1598.  
  1599. // 保存纯文本文档
  1600. let title = document.querySelector("#titiletext").textContent;
  1601. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1602. }
  1603.  
  1604.  
  1605. function printPage360Doc() {
  1606. // # 清理并打印360doc的文档页
  1607. // ## 移除页面上无关的元素
  1608. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1609. let elem_list = document.querySelectorAll(selector);
  1610. let under_doc_1, under_doc_2;
  1611. try {
  1612. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1613. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1614. } catch (e) { console.log(); }
  1615. // 执行移除
  1616. for (let elem of elem_list) {
  1617. utils.tryToRemoveElement(elem);
  1618. }
  1619. utils.tryToRemoveElement(under_doc_1);
  1620. utils.tryToRemoveElement(under_doc_2);
  1621. // 执行隐藏
  1622. document.querySelector("a[title]").style.display = "none";
  1623.  
  1624. // 使文档居中
  1625. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1626. if (!utils.centerDoc(".a_left", "20")) {
  1627. return; // 如果输入非法,终止函数调用
  1628. }
  1629. // 隐藏按钮,然后打印页面
  1630. utils.hideBtnThenPrint();
  1631. }
  1632.  
  1633.  
  1634. /**
  1635. * 360doc个人图书馆下载策略
  1636. */
  1637. function doc360() {
  1638. // 创建按钮区
  1639. utils.createBtns();
  1640. // btn_1: 展开文档
  1641. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1642. // btn_2: 导出纯文本
  1643. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1644. // btn_3: 打印页面到PDF
  1645. utils.setBtnEvent(() => {
  1646. if (confirm("确定每页内容都加载完成了吗?")) {
  1647. printPage360Doc();
  1648. }
  1649. }, [], "btn_3", "打印页面到PDF");
  1650. }
  1651.  
  1652. /**
  1653. * 查找出所有未被捕获的页码,并返回列表
  1654. * @returns 未捕获页码列表
  1655. */
  1656. function getMissedPages() {
  1657. let all = []; // 全部页码
  1658. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1659. all[i] = i + 1;
  1660. }
  1661. let missed = []; // 未捕获页码
  1662. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1663.  
  1664. // 排除并录入未捕获页码
  1665. for (let num of all) {
  1666. if (!possessed.includes(`page${num}`)) {
  1667. missed.push(num);
  1668. }
  1669. }
  1670. return missed;
  1671. }
  1672.  
  1673.  
  1674. /**
  1675. * 根据键中的id数字对map排序
  1676. * @param {Map} elems_map
  1677. * @returns sorted_map
  1678. */
  1679. function sortMapByID(elems_map) {
  1680. // id形式:page2
  1681. let elems_arr = Array.from(elems_map);
  1682. elems_arr.sort((item1, item2) => {
  1683. // 从key中取出id
  1684. let id1 = parseInt(item1[0].replace("page", ""));
  1685. let id2 = parseInt(item2[0].replace("page", ""));
  1686. // 升序排序
  1687. return id1 - id2;
  1688. });
  1689. // 返回排序好的map
  1690. return new Map(elems_arr);
  1691. }
  1692.  
  1693.  
  1694. /**
  1695. * 存储动态加载的canvas元素、textContent
  1696. */
  1697. function storeElements_MBA() {
  1698. let canvases_map = window.mbaJS.canvases_map;
  1699. let texts_map = window.mbaJS.texts_map;
  1700. let quality = window.mbaJS.quality;
  1701.  
  1702. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1703. (elem) => {
  1704. let capture = (elem) => {
  1705. // (1) 存储页面为canvas图形
  1706. let canvas, data_base64;
  1707. // 导出canvas数据防止丢失
  1708. try {
  1709. // 存储canvas
  1710. canvas = elem.querySelector("canvas[id*=page]");
  1711. if (window.mbaJS.only_text) {
  1712. data_base64 = null;
  1713. } else {
  1714. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1715. }
  1716. } catch (e) {
  1717. // utils.sleep(500);
  1718. return;
  1719. }
  1720. // 增量录入map
  1721. let id = canvas.id; // id的形式:page2
  1722. if (!canvases_map.has(id)) {
  1723. canvases_map.set(id, data_base64);
  1724. }
  1725. // 确定canvas长宽
  1726. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1727. window.mbaJS.width = parseInt(canvas.width);
  1728. window.mbaJS.height = parseInt(canvas.height);
  1729. }
  1730.  
  1731. // (2) 存储text
  1732. let text = elem.textContent;
  1733. if (!texts_map.has(id)) {
  1734. texts_map.set(id, text);
  1735. }
  1736. };
  1737. setTimeout(capture, 500, elem);
  1738. });
  1739. if (canvases_map.size === window.mbaJS.max_page) {
  1740. // 根据id排序
  1741. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  1742. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  1743. window.mbaJS.finished = true;
  1744. window.onscroll = null;
  1745. }
  1746. }
  1747.  
  1748.  
  1749. /**
  1750. * 将canvas转为jpeg,然后导出PDF
  1751. * @param {Array} base64_list canvas元素列表
  1752. * @param {String} title 文档标题
  1753. */
  1754. function saveCanvasesToPDF_MBA(base64_list, title) {
  1755. let width = window.mbaJS.width;
  1756. let height = window.mbaJS.height;
  1757.  
  1758. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1759. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1760. let orientation = width > height ? 'l' : 'p';
  1761. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1762.  
  1763. // 保存每一页文档到每一页pdf
  1764. let i = 0;
  1765. for (let base64 of base64_list) {
  1766. i += 1;
  1767. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1768. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1769. if (i < window.mbaJS.max_page) {
  1770. pdf.addPage();
  1771. }
  1772. }
  1773. // 导出文件
  1774. pdf.save(`${title}.pdf`);
  1775. }
  1776.  
  1777. /**
  1778. * 判断文档页是否收集完毕,当不行时给出提示
  1779. * @returns boolean
  1780. */
  1781. function ready2use() {
  1782. removeAds(); // 顺便清理广告
  1783. // 如果是首次点击按钮,给出提示
  1784. if (window.mbaJS.first_hint) {
  1785. let hint = [
  1786. "如果浏览速度过快,比如:",
  1787. "当前页面还没完全加载好就滚动页面去看下一页",
  1788. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1789. "由防范技术的干扰,该功能目前很不好用,见谅"
  1790. ].join("\n");
  1791. alert(hint);
  1792. window.mbaJS.first_hint = false;
  1793. }
  1794. // 如果文档页没有收集完,给出提示
  1795. if (!window.mbaJS.finished) {
  1796. let hint = [
  1797. "仍有内容未加载完,无法使用该功能",
  1798. "建议从头到尾慢速地再浏览一遍",
  1799. "以下是没有加载完成页面的页码:",
  1800. getMissedPages().join(",")
  1801. ];
  1802. alert(hint.join("\n"));
  1803. return false;
  1804. }
  1805. return true;
  1806. }
  1807.  
  1808.  
  1809. /**
  1810. * 用捕获好的canvas转jpg,生成PDF
  1811. * @returns
  1812. */
  1813. function canvas2PDF_mba() {
  1814. if (!ready2use()) {
  1815. return;
  1816. }
  1817. let canvases = window.mbaJS.canvases_map.values();
  1818. // 导出PDF
  1819. let title = document.title.split("-")[0].trim();
  1820. saveCanvasesToPDF_MBA(canvases, title);
  1821. }
  1822.  
  1823.  
  1824. /**
  1825. * 拼合捕获好的文本,保存到txt文件
  1826. * @returns
  1827. */
  1828. function saveText_mba() {
  1829. if (!ready2use()) {
  1830. return;
  1831. }
  1832. let content = Array.from(window.mbaJS.texts_map.values());
  1833. let title = document.title.split("-")[0].trim();
  1834. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1835. }
  1836.  
  1837.  
  1838. /**
  1839. * 移除广告
  1840. */
  1841. function removeAds() {
  1842. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1843. utils.tryToRemoveElement(ad_elem);
  1844. });
  1845. }
  1846.  
  1847.  
  1848. function mbalib_() {
  1849. // 移除广告和左侧工具栏
  1850. removeAds();
  1851. let tool_bar = document.querySelector(".tool-bar");
  1852. utils.tryToRemoveElement(tool_bar);
  1853.  
  1854. // 创建按钮
  1855. utils.createBtns();
  1856. // 隐藏按钮
  1857. utils.toggleBtnStatus("btn_1");
  1858. // 显示按钮
  1859. utils.toggleBtnStatus("btn_2");
  1860. utils.toggleBtnStatus("btn_3");
  1861. utils.toggleBtnStatus("btn_4");
  1862.  
  1863. // 取得页数
  1864. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1865. let quality = utils.getQualityByCanvasAmount(max_page);
  1866.  
  1867. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1868. window.mbaJS = {
  1869. max_page: max_page,
  1870. texts_map: new Map(), // id: text
  1871. canvases_map: new Map(), // id: canvas_data_base64
  1872. quality: quality, // canvas转jpg的质量
  1873. width: null, // canvas宽度(px)
  1874. height: null,
  1875. finished: false, // 是否收集完了全部文档页元素
  1876. first_hint: true,
  1877. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1878. only_text: false // 是否仅捕获文本
  1879. };
  1880. // 跟随浏览,动态收集页面元素
  1881. window.onscroll = () => {
  1882. storeElements_MBA();
  1883. };
  1884. // 跟随浏览,动态收集页面元素
  1885. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  1886. // 绑定事件
  1887. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  1888. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  1889.  
  1890. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  1891. let btn_text, aim_btn, hint;
  1892. if (max_page > 40) {
  1893. btn_text = "失效说明";
  1894. aim_btn = "btn_3";
  1895. hint = [
  1896. "页数超过40,脚本无效",
  1897. "只能使用导出文本功能",
  1898. "而此脚本会使页面内容加载明显变慢,建议禁用"
  1899. ];
  1900. utils.setBtnEvent(utils.banSelf, [
  1901. () => { window.onscroll = null; }
  1902. ], "btn_4", "临时禁用脚本");
  1903. } else {
  1904. btn_text = "空白页说明";
  1905. aim_btn = "btn_4";
  1906. hint = [
  1907. "导致空白页的原因如下",
  1908. "加载该页的时间超过2秒 / 明显等待",
  1909. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  1910. ];
  1911. }
  1912.  
  1913. utils.setBtnEvent(() => {
  1914. alert(hint.join("\n"));
  1915. }, [], aim_btn, btn_text);
  1916. }
  1917.  
  1918.  
  1919. function mbalib() {
  1920. setTimeout(mbalib_, 2000);
  1921. }
  1922.  
  1923. /**
  1924. * 判断是否进入预览模式
  1925. * @returns Boolean
  1926. */
  1927. function isInPreview() {
  1928. let p_elem = document.querySelector("#preview_tips");
  1929. if (p_elem.style.display === "none") {
  1930. return true;
  1931. }
  1932. return false;
  1933. }
  1934.  
  1935.  
  1936. /**
  1937. * 判断是否展开了全文
  1938. * @returns Boolean
  1939. */
  1940. function isNoMorePage() {
  1941. let read_more = document.querySelector("#ntip2");
  1942. if (read_more.style.display === "none") {
  1943. return true;
  1944. }
  1945. return false;
  1946. }
  1947.  
  1948.  
  1949. /**
  1950. * 确保进入预览模式
  1951. */
  1952. function ensureInPreview() {
  1953. if (!isInPreview()) {
  1954. // 如果没有进入预览,则先进入
  1955. document.querySelector(".pre_button a").click();
  1956. utils.sleep(500);
  1957. }
  1958. }
  1959.  
  1960.  
  1961. /**
  1962. * 展开全文预览,当展开完成后再次调用时,返回true
  1963. * @returns
  1964. */
  1965. function unfoldAll() {
  1966. ensureInPreview();
  1967. if (isNoMorePage()) {
  1968. // 如果全文展开了,则切换按钮,然后退出
  1969. utils.toggleBtnStatus("btn_1");
  1970. utils.toggleBtnStatus("btn_2");
  1971. return true;
  1972. }
  1973. // 跳转到最后一页,以展开全文
  1974. let cur_page = document.querySelector("#pageNumInput");
  1975. utils.jump2pageNo(cur_page, "999", "keydown");
  1976. }
  1977.  
  1978.  
  1979. /**
  1980. * 取得最大页码(最大20)
  1981. * @returns {Number} 页码int
  1982. */
  1983. function getPageCounts$1() {
  1984. let counts_str = document.querySelector(".counts").textContent;
  1985. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  1986. if (counts > 20) {
  1987. counts = 20; // 最多免费预览20页,所以设置最大页码20
  1988. }
  1989. return parseInt(counts);
  1990. }
  1991.  
  1992.  
  1993. /**
  1994. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  1995. * @returns Array | null
  1996. */
  1997. function getImgUrls() {
  1998. let pages = document.querySelectorAll("[id*=pageflash_]");
  1999. // 尚未浏览完全部页面,返回null
  2000. if (pages.length < window.dugenJS.page_counts) {
  2001. return null;
  2002. }
  2003. // 浏览完全部页面,返回urls
  2004. let urls = [];
  2005. pages.forEach((page) => {
  2006. let url = page.querySelector("img").src;
  2007. urls.push(url);
  2008. });
  2009. return urls;
  2010. }
  2011.  
  2012.  
  2013. /**
  2014. * 返回当前未加载页面的页码
  2015. * @returns not_loaded
  2016. */
  2017. function getNotloadedPages() {
  2018. // 已经取得的页码
  2019. let pages = document.querySelectorAll("[id*=pageflash_]");
  2020. let loaded = new Set();
  2021. pages.forEach((page) => {
  2022. let id = page.id.split("_")[1];
  2023. id = parseInt(id);
  2024. loaded.add(id);
  2025. });
  2026. // 未取得的页码
  2027. let not_loaded = [];
  2028. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2029. if (!loaded.has(i)) {
  2030. not_loaded.push(i);
  2031. }
  2032. }
  2033. return not_loaded;
  2034. }
  2035.  
  2036.  
  2037. function WantImgUrls() {
  2038. let res = getImgUrls();
  2039. // 页面尚未加载完
  2040. if (res === null) {
  2041. let hints = [
  2042. "尚未加载完全部页面",
  2043. "以下页面需要浏览并加载:",
  2044. getNotloadedPages().join(",")
  2045. ];
  2046. alert(hints.join("\n"));
  2047. return;
  2048. }
  2049. // 页面全部加载完
  2050. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2051. }
  2052.  
  2053.  
  2054. /**
  2055. * dugen文档下载策略
  2056. */
  2057. function dugen() {
  2058. ensureInPreview();
  2059. // 全局对象
  2060. window.dugenJS = {
  2061. page_counts: getPageCounts$1() // 最大页码(int)
  2062. };
  2063.  
  2064. // 创建按钮区
  2065. utils.createBtns();
  2066.  
  2067. // 绑定监听器
  2068. // 按钮1:展开文档
  2069. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2070. // 按钮2:导出图片链接
  2071. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2072. }
  2073.  
  2074. /**
  2075. * 取得文档类型
  2076. * @returns {String} 文档类型str
  2077. */
  2078. function getDocType() {
  2079. let type_elem = document.querySelector(".title .icon.icon-format");
  2080. // ["icon", "icon-format", "icon-format-doc"]
  2081. let cls_str = type_elem.classList[2];
  2082. // "icon-format-doc"
  2083. let type = cls_str.split("-")[2];
  2084. return type;
  2085. }
  2086.  
  2087.  
  2088. /**
  2089. * 判断文档类型是否为type_list其中之一
  2090. * @returns 是否为type
  2091. */
  2092. function isTypeof(type_list) {
  2093. let type = getDocType();
  2094. if (type_list.includes(type)) {
  2095. return true;
  2096. }
  2097. return false;
  2098. }
  2099.  
  2100.  
  2101. /**
  2102. * 判断文档类型是否为PPT
  2103. * @returns 是否为PPT
  2104. */
  2105. function isPPT() {
  2106. return isTypeof(["ppt", "pptx"]);
  2107. }
  2108.  
  2109.  
  2110. /**
  2111. * 判断文档类型是否为Excel
  2112. * @returns 是否为Excel
  2113. */
  2114. function isEXCEL() {
  2115. return isTypeof(["xls", "xlsm", "xlsx"]);
  2116. }
  2117.  
  2118.  
  2119. /**
  2120. * 取得最大页码
  2121. * @returns {Number} 最大页码
  2122. */
  2123. function getPageCounts() {
  2124. let page_counts_str = document.querySelector(".intro-list").textContent;
  2125. let page_counts = parseInt(page_counts_str.match(/(?<=约 )[0-9]{1,3}(?=页)/)[0]);
  2126. return page_counts;
  2127. }
  2128.  
  2129.  
  2130. /**
  2131. * 取得未加载页面的页码
  2132. * @param {Set} loaded 已加载的页码集合
  2133. * @returns {Array} not_loaded 未加载页码列表
  2134. */
  2135. function getNotLoaded(loaded) {
  2136. let not_loaded = [];
  2137. let page_counts = window.book118JS.page_counts;
  2138. for (let i = 1; i <= page_counts; i++) {
  2139. if (!loaded.has(i)) {
  2140. not_loaded.push(i);
  2141. }
  2142. }
  2143. return not_loaded;
  2144. }
  2145.  
  2146.  
  2147. /**
  2148. * 取得全部文档页的url
  2149. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2150. */
  2151. function getUrls() {
  2152. let loaded = new Set(); // 存储已加载页面的页码
  2153. let urls = []; // 存储已加载页面的图形src
  2154. // 收集已加载页面的url
  2155. document.querySelectorAll("div[data-id]").forEach((div) => {
  2156. let src = div.querySelector("img").src;
  2157. if (src) {
  2158. // "1": "https://view-cache.book118.com/..."
  2159. loaded.add(parseInt(div.getAttribute("data-id")));
  2160. urls.push(src);
  2161. }
  2162. });
  2163. // 如果所有页面加载完毕
  2164. if (loaded.size === window.book118JS.page_counts) {
  2165. return [true, urls];
  2166. }
  2167. // 否则收集未加载页面的url
  2168. return [false, getNotLoaded(loaded)];
  2169. }
  2170.  
  2171.  
  2172. /**
  2173. * 展开全文
  2174. */
  2175. function readAll() {
  2176. window.preview.jump(999);
  2177. }
  2178.  
  2179.  
  2180. /**
  2181. * btn_2: 导出图片链接
  2182. */
  2183. function wantUrls() {
  2184. let [flag, res] = getUrls();
  2185. // 页面都加载完毕,下载urls
  2186. if (flag) {
  2187. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2188. return;
  2189. }
  2190. // 没有加载完,提示出未加载好的页码
  2191. let hints = [
  2192. "仍有页面没有加载",
  2193. "请浏览并加载如下页面:",
  2194. res.join(",")
  2195. ];
  2196. alert(hints.join("\n"));
  2197. }
  2198.  
  2199.  
  2200. /**
  2201. * 打开PPT预览页面
  2202. */
  2203. function openPPTpage() {
  2204. window.preview.getSrc();
  2205. let openPPT = () => {
  2206. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2207. utils.openInNewTab(ppt_src);
  2208. window.preview.close();
  2209. };
  2210. setTimeout(openPPT, 1000);
  2211. }
  2212.  
  2213.  
  2214. /**
  2215. * 原创力文档(非PPT或Excel)下载策略
  2216. */
  2217. function book118_CommonDoc() {
  2218. // 创建全局对象
  2219. window.book118JS = {
  2220. doc_type: getDocType(),
  2221. page_counts: getPageCounts()
  2222. };
  2223.  
  2224. // 处理非PPT文档
  2225. // 创建按钮组
  2226. utils.createBtns();
  2227. // 绑定监听器到按钮
  2228. // 按钮1:展开文档
  2229. utils.setBtnEvent(() => {
  2230. readAll();
  2231. utils.toggleBtnStatus("btn_1");
  2232. utils.toggleBtnStatus("btn_2");
  2233. }, [], "btn_1");
  2234. // 按钮2:导出图片链接
  2235. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2236. }
  2237.  
  2238.  
  2239. /**
  2240. * 取得PPT文档最大页码
  2241. * @returns PPT文档最大页码int
  2242. */
  2243. function getPageCountsPPT() {
  2244. let counts_str = document.querySelector("#PageCount").textContent;
  2245. let counts = parseInt(counts_str);
  2246. // console.log(`get page counts: ${counts}`);
  2247. return counts;
  2248. }
  2249.  
  2250.  
  2251. /**
  2252. * 取得当前的页码
  2253. * @returns {Number} this_page
  2254. */
  2255. function getThisPage() {
  2256. let this_page = document.querySelector("#PageIndex").textContent;
  2257. this_page = parseInt(this_page);
  2258. return this_page;
  2259. }
  2260.  
  2261.  
  2262. /**
  2263. * 点击下一动画直到变成下一页,再切回上一页
  2264. * @param {Number} next_page 下一页的页码
  2265. */
  2266. async function __nextFrameUntillNextPage(next_page) {
  2267. // 如果已经抵达下一页,则返回上一页
  2268. let this_page = getThisPage();
  2269.  
  2270. // 最后一页直接退出
  2271. if (next_page > getPageCountsPPT()) {
  2272. return;
  2273. }
  2274. // 不是最后一页,但完成了任务
  2275. else if (this_page === next_page) {
  2276. document.querySelector(".btmLeft").click();
  2277. await utils.sleepAsync(500);
  2278. return;
  2279. }
  2280. // 否则递归的点击下一动画
  2281. document.querySelector(".btmRight").click();
  2282. await utils.sleepAsync(500);
  2283. await __nextFrameUntillNextPage(next_page);
  2284. }
  2285.  
  2286.  
  2287. /**
  2288. * 确保当前页面是最后一帧动画
  2289. */
  2290. async function ensurePageLoaded() {
  2291. // 取得当前页码和下一页页码
  2292. let this_page = getThisPage();
  2293. let next_page = this_page + 1;
  2294. // 开始点击下一页按钮,直到变成下一页,再点击上一页按钮来返回
  2295. await __nextFrameUntillNextPage(next_page);
  2296. }
  2297.  
  2298.  
  2299. /**
  2300. * (异步)转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2301. */
  2302. async function docView2Canvas() {
  2303. await ensurePageLoaded();
  2304. // 取得页码
  2305. let cur_page = getThisPage();
  2306. // 取得视图元素,计数从0开始
  2307. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2308. // 转化为canvas
  2309. let canvas_promise = html2canvas(doc_view);
  2310. console.log(canvas_promise); // 打印信息以检查状况
  2311.  
  2312. await canvas_promise.then((canvas) => {
  2313. // 保存canvas到全局对象
  2314. window.book118JS.canvases.push(canvas);
  2315. // 打印日志
  2316. console.log(`wk: ${cur_page} complete`);
  2317. });
  2318.  
  2319. // 如果到最后一页
  2320. let page_counts = getPageCountsPPT();
  2321. // console.log(`docView2Canvas: cur_page: ${cur_page}, page_counts: ${page_counts}`);
  2322. if (cur_page === page_counts) {
  2323. // 终止递归,并且显示导出PDF按钮
  2324. utils.toggleBtnStatus("btn_2");
  2325. return;
  2326. }
  2327. // 否则下一次递归(继续捕获下一页)
  2328. document.querySelector(".pgRight").click();
  2329. await utils.sleepAsync(500);
  2330. await docView2Canvas();
  2331. }
  2332.  
  2333.  
  2334. /**
  2335. * 将捕获的canvases合并并导出为pdf
  2336. * @returns
  2337. */
  2338. function canvases2pdf() {
  2339. // 已经捕获的页面数量
  2340. let stored_amount = window.book118JS.canvases.length;
  2341. // 总页面数量
  2342. let page_counts = window.book118JS.page_counts;
  2343. // 校验数量
  2344. let diff = page_counts - stored_amount;
  2345. if (diff > 0) {
  2346. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2347. if (!confirm("是否仍要导出PDF?")) {
  2348. // 不坚持导出PDF的情况
  2349. return;
  2350. }
  2351. }
  2352. // 导出PDF
  2353. let canvases = window.book118JS.canvases;
  2354. // 取得宽高
  2355. let model = canvases[0];
  2356. let width = model.width;
  2357. let height = model.height;
  2358. // 取得标题然后导出pdf
  2359. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2360. }
  2361.  
  2362.  
  2363. /**
  2364. * 原创力文档(PPT)下载策略
  2365. */
  2366. function book118_PPT() {
  2367. // 创建全局对象
  2368. window.book118JS = {
  2369. page_counts: getPageCountsPPT(),
  2370. canvases: [] // 存储每页文档转化的canvas
  2371. };
  2372.  
  2373. // 创建按钮区
  2374. utils.createBtns();
  2375. // 绑定监听器到按钮1
  2376. utils.setBtnEvent(() => {
  2377. let hints = [
  2378. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2379. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2380. ];
  2381. alert(hints.join("\n"));
  2382. // 隐藏按钮1
  2383. utils.toggleBtnStatus("btn_1");
  2384. // 开始捕获页面(异步)
  2385. docView2Canvas(window.book118JS.page_counts);
  2386. }, [], "btn_1", "捕获页面");
  2387. // 为按钮2绑定监听器
  2388. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2389. }
  2390.  
  2391.  
  2392. /**
  2393. * 取得当前页面的excel,返回csv string
  2394. * @returns {String} csv
  2395. */
  2396. function excel2CSV() {
  2397. let table = [];
  2398. let rows = document.querySelectorAll("tr[id]");
  2399.  
  2400. // 遍历行
  2401. for (let row of rows) {
  2402. let csv_row = [];
  2403. // 遍历列(单元格)
  2404. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2405. // 判断单元格是否存储图片
  2406. let img = cell.querySelector("img");
  2407. if (img) {
  2408. // 如果是图片,保存图片链接
  2409. csv_row.push(img.src);
  2410. } else {
  2411. // 否则保存单元格文本
  2412. csv_row.push(cell.textContent);
  2413. }
  2414. }
  2415. table.push(csv_row.join(","));
  2416. }
  2417.  
  2418. let csv = table.join("\n");
  2419. csv = csv.replace(/\n{2,}/g, "\n");
  2420. return csv;
  2421. }
  2422.  
  2423.  
  2424. /**
  2425. * 下载当前表格内容,保存为csv(utf-8编码)
  2426. */
  2427. function wantEXCEL() {
  2428. let file_name = "原创力表格_UTF-8.csv";
  2429. utils.createAndDownloadFile(file_name, excel2CSV());
  2430. }
  2431.  
  2432.  
  2433. /**
  2434. * 在Excel预览页面给出操作提示
  2435. */
  2436. function help() {
  2437. let hints = [
  2438. "【导出表格到CSV】只能导出当前sheet,",
  2439. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2440. "CSV是一种简单的表格格式,可以被Excel打开,",
  2441. "并转为 xls 或 xlsx 格式存储,",
  2442. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2443. "",
  2444. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2445. "有两个办法:",
  2446. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2447. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2448. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2449. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2450. ];
  2451. alert(hints.join("\n"));
  2452. }
  2453.  
  2454.  
  2455. /**
  2456. * 原创力文档(EXCEL)下载策略
  2457. */
  2458. function book118_EXCEL() {
  2459. // 创建按钮区
  2460. utils.createBtns();
  2461. // 绑定监听器到按钮
  2462. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2463. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2464. // 显示按钮
  2465. utils.toggleBtnStatus("btn_2");
  2466. }
  2467.  
  2468.  
  2469. /**
  2470. * 打开Excel预览页面
  2471. */
  2472. function openEXCELpage() {
  2473. openPPTpage();
  2474. }
  2475.  
  2476.  
  2477. /**
  2478. * 原创力文档下载策略
  2479. */
  2480. function book118() {
  2481. let host = window.location.hostname;
  2482. if (host === 'max.book118.com') {
  2483. if (isEXCEL()) {
  2484. utils.createBtns();
  2485. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2486. } else if (isPPT()) {
  2487. utils.createBtns();
  2488. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2489. } else {
  2490. book118_CommonDoc();
  2491. }
  2492. } else if (host === "view-cache.book118.com") {
  2493. book118_PPT();
  2494. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2495. book118_EXCEL();
  2496. } else {
  2497. console.log(`wk: Unknown host: ${host}`);
  2498. }
  2499. }
  2500.  
  2501. /**
  2502. * 设置图像质量为100
  2503. */
  2504. function HD() {
  2505. window.img_quality = 1;
  2506. console.log("图像质量已经设置为100%");
  2507. console.log("如果刷新页面或跳转页面则需要再次使用该命令");
  2508. }
  2509.  
  2510. /**
  2511. * 主函数:识别网站,执行对应文档下载策略
  2512. */
  2513. function main() {
  2514. // 显示当前位置
  2515. let host = window.location.host;
  2516. console.log(`当前host: ${host}`);
  2517. // 挂载工具包到全局
  2518. window.user_utils = utils;
  2519. console.log("wk: user_utils已经挂载到全局");
  2520.  
  2521. // 附加任务
  2522. utils.globalFunc(HD); // 全局设置高清图片的函数
  2523.  
  2524. // 主任务
  2525. if (host.includes("docin.com")) {
  2526. docin();
  2527. } else if (host.includes("ishare.iask")) {
  2528. ishare();
  2529. } else if (host === "www.deliwenku.com") {
  2530. deliwenku();
  2531. } else if (host === "www.doc88.com") {
  2532. doc88();
  2533. } else if (host === "www.360doc.com") {
  2534. doc360();
  2535. } else if (host === "wenku.baidu.com") {
  2536. baiduWenku();
  2537. } else if (host === "doc.mbalib.com") {
  2538. mbalib();
  2539. } else if (host === "www.dugen.com") {
  2540. dugen();
  2541. } else if (host.includes("book118.com")) {
  2542. book118();
  2543. } else {
  2544. console.log("匹配到了无效网页");
  2545. }
  2546. }
  2547.  
  2548. let options = {
  2549. fast_mode: false,
  2550. activation_test: false
  2551. };
  2552. if (options.cli_mode) {
  2553. (() => {
  2554. loadExternalScripts();
  2555. setTimeout(main, 2000);
  2556. return;
  2557. })();
  2558. }
  2559. if (options.activation_test) {
  2560. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  2561. }
  2562. if (options.fast_mode) {
  2563. main();
  2564. } else {
  2565. window.onload = main;
  2566. }
  2567.  
  2568. })();