Wenku Doc Downloader

下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③道客巴巴④360doc个人图书馆⑤得力文库⑥MBA智库⑦爱问共享资料(新浪文档)。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。

目前为 2022-02-02 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.4.8
  5. // @description 下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③道客巴巴④360doc个人图书馆⑤得力文库⑥MBA智库⑦爱问共享资料(新浪文档)。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/*/*
  13. // @match *://doc.mbalib.com/view/*
  14. // @require https://cdn.bootcdn.net/ajax/libs/FileSaver.js/2.0.5/FileSaver.min.js
  15. // @require https://cdn.bootcdn.net/ajax/libs/jszip/3.7.1/jszip.min.js
  16. // @require https://cdn.bootcdn.net/ajax/libs/jspdf/2.3.1/jspdf.umd.min.js
  17. // @require https://cdn.bootcdn.net/ajax/libs/html2canvas/0.5.0-beta4/html2canvas.min.js
  18. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  19. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  20. // @grant none
  21. // @license GPL-3.0-only
  22. // @create 2021-11-22
  23. // ==/UserScript==
  24.  
  25. (function () {
  26. 'use strict';
  27.  
  28. let utils = {
  29. /**
  30. * 创建并下载文件
  31. * @param {string} fileName
  32. * @param {string} content
  33. */
  34. createAndDownloadFile: function(fileName, content) {
  35. let aTag = document.createElement('a');
  36. let blob = new Blob([content]);
  37. aTag.download = fileName;
  38. aTag.href = URL.createObjectURL(blob);
  39. aTag.click();
  40. URL.revokeObjectURL(blob);
  41. },
  42.  
  43. /**
  44. * 临时禁用脚本,执行func后移除btns_section。
  45. * @param {Function} func
  46. */
  47. banSelf: function(func) {
  48. func();
  49. document.querySelector(".btns_section").remove();
  50. },
  51.  
  52. /**
  53. * 睡眠 delay 毫秒
  54. * @param {Number} delay
  55. */
  56. sleep: function(delay) {
  57. let start = (new Date()).getTime();
  58. while ((new Date()).getTime() - start < delay) {
  59. continue;
  60. }
  61. },
  62.  
  63. /**
  64. * 允许打印页面
  65. */
  66. allowPrint: function() {
  67. let style = document.createElement("style");
  68. style.innerHTML = `@media print {
  69. body{
  70. display:block;
  71. }
  72. }`;
  73. document.head.appendChild(style);
  74. },
  75.  
  76. /**
  77. * 绑定事件到指定按钮,返回按钮引用
  78. * @param {Function} event click事件
  79. * @param {Array} args 事件的参数列表
  80. * @param {String} aim_btn 按钮的变量名
  81. * @param {String} new_text 按钮的新文本,为null则不替换
  82. * @returns 按钮元素的引用
  83. */
  84. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  85. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  86. // 如果需要,替换按钮内文本
  87. if (new_text) {
  88. btn.textContent = new_text;
  89. }
  90. // 绑定事件,添加到页面上
  91. btn.onclick = () => {
  92. this.enhanceBtnClickReaction(aim_btn);
  93. if (args.length) {
  94. event(...args);
  95. } else {
  96. event();
  97. }
  98. };
  99. return btn;
  100. },
  101.  
  102. /**
  103. * 强制隐藏元素
  104. * @param {String} selector
  105. */
  106. forceHide: function(selector) {
  107. document.querySelectorAll(selector).forEach((elem) => {
  108. elem.className += " force_hide";
  109. });
  110. let style = document.createElement("style");
  111. style.innerHTML = `.force_hide {
  112. visibility: hidden !important;
  113. }`;
  114. document.head.appendChild(style);
  115. },
  116.  
  117. /**
  118. * 隐藏按钮,打印页面,显示按钮
  119. */
  120. hideBtnThenPrint: function() {
  121. // 隐藏按钮,然后打印页面
  122. let section = document.getElementsByClassName("btns_section")[0];
  123. section.style.display = "none";
  124. window.print();
  125. // 打印结束,显示按钮
  126. section.style.removeProperty("display");
  127. },
  128.  
  129. /**
  130. * 返回times个倍数连接的str
  131. * @param {String} str
  132. * @param {Number} times
  133. * @returns multiplied_str
  134. */
  135. multiplyStr: function(str, times) {
  136. let str_list = [];
  137. for (let i = 0; i < times; i++) {
  138. str_list.push(str);
  139. }
  140. return str_list.join("");
  141. },
  142.  
  143. /**
  144. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  145. * @param {String} custom_btn 按钮变量名
  146. */
  147. enhanceBtnClickReaction: function(custom_btn = null) {
  148. let aim_btn;
  149. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  150. if (!custom_btn || custom_btn === "btn_1") {
  151. aim_btn = document.querySelector(".btn-1");
  152. } else {
  153. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  154. }
  155.  
  156. let old_color = aim_btn.style.color; // 保存旧的颜色
  157. let old_text = aim_btn.textContent; // 保存旧的文字内容
  158. // 变黑缩小
  159. aim_btn.style.color = "black";
  160. aim_btn.style.fontWeight = "normal";
  161. aim_btn.textContent = `->${old_text}<-`;
  162. // 复原加粗
  163. let changeColorBack = function() {
  164. aim_btn.style.color = old_color;
  165. aim_btn.style.fontWeight = "bold";
  166. aim_btn.textContent = old_text;
  167. };
  168. setTimeout(changeColorBack, 1250);
  169. },
  170.  
  171. /**
  172. * 切换按钮显示/隐藏状态
  173. * @param {String} aim_btn 按钮变量名
  174. * @returns 按钮元素的引用
  175. */
  176. toggleBtnStatus: function(aim_btn) {
  177. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  178. let display = getComputedStyle(btn).display;
  179. // return;
  180. if (display === "none") {
  181. btn.style.display = "block";
  182. } else {
  183. btn.style.display = "none";
  184. }
  185. return btn;
  186. },
  187.  
  188. /**
  189. * 根据canvas元素数量返回quality值
  190. * @param {Number} canvas_amount
  191. * @returns quality: Number
  192. */
  193. getQualityByCanvasAmount: function(canvas_amount) {
  194. let quality;
  195. if (canvas_amount <= 25) {
  196. quality = 1.0;
  197. } else if (25 < canvas_amount <= 50) {
  198. quality = 0.85;
  199. } else {
  200. quality = 0.7;
  201. }
  202. return quality;
  203. },
  204.  
  205. /**
  206. * 用input框跳转到对应页码
  207. * @param {Element} cur_page 当前页码
  208. * @param {string} aim_page 目标页码
  209. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  210. */
  211. jump2pageNo: function(cur_page, aim_page, event_type) {
  212. // 设置跳转页码为目标页码
  213. cur_page.value = aim_page;
  214. // 模拟回车事件来跳转
  215. let keyboard_event_enter = new KeyboardEvent(event_type, {
  216. bubbles: true,
  217. cancelable: true,
  218. keyCode: 13
  219. });
  220. cur_page.dispatchEvent(keyboard_event_enter);
  221. },
  222.  
  223. /**
  224. * 滚动到页面底部
  225. */
  226. scrollToBottom: function() {
  227. window.scrollTo({
  228. top: document.body.scrollHeight,
  229. behavior: "smooth"
  230. });
  231. },
  232.  
  233. /**
  234. * 用try移除元素
  235. * @param {Element} element 要移除的元素
  236. */
  237. tryToRemoveElement: function(element) {
  238. try {
  239. element.remove();
  240. } catch (e) {
  241. console.log();
  242. }
  243. },
  244.  
  245. /**
  246. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  247. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  248. */
  249. tryToRemoveSameElem: function(elem_list_box) {
  250. for (let elem_list of elem_list_box) {
  251. if (!elem_list) {
  252. continue;
  253. }
  254. for (let elem of elem_list) {
  255. try {
  256. elem.remove();
  257. } catch (e) {
  258. console.log();
  259. }
  260. }
  261. }
  262. },
  263.  
  264. /**
  265. * 使文档在页面上居中
  266. * @param {String} selector 文档容器的css选择器
  267. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  268. * @returns 偏移值是否合法
  269. */
  270. centerDoc: function(selector, default_offset) {
  271. let doc_main = document.querySelector(selector);
  272. let offset = window.prompt("请输入偏移百分位:", default_offset);
  273. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  274. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  275. doc_main.style.marginLeft = offset + "%";
  276. return true;
  277. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  278. doc_main.style.marginLeft = offset + "%";
  279. return true
  280. } else {
  281. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  282. return false;
  283. }
  284. },
  285.  
  286. /**
  287. * 调整按钮内文本
  288. * @param {String} aim_btn 按钮变量名
  289. * @param {String} new_text 新的文本,null则保留旧文本
  290. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  291. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  292. */
  293. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  294. // 提示文档已经展开
  295. if (use_hint) {
  296. let hint = "文档已经完全展开,可以导出";
  297. alert(hint);
  298. }
  299. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  300. // 要替换的文本
  301. if (new_text) {
  302. btn.textContent = new_text;
  303. }
  304. // 推荐按钮
  305. if (recommend_btn) {
  306. btn.textContent += "(推荐)";
  307. }
  308. },
  309.  
  310. /**
  311. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  312. * @param {Array} elem_list html元素列表
  313. * @param {String} title 文档标题
  314. */
  315. html2PDF: async function(elem_list, title = "文档") {
  316. // 如果是空元素列表,返回null并终止函数
  317. if (elem_list.length === 0) {
  318. console.log("html2PDF was called, but no canvas element avaiable.");
  319. return null;
  320. }
  321. let tasks = []; // 存放异步任务
  322. let contents = []; // 存放canvas元素
  323. for (let elem of elem_list) {
  324. let task = html2canvas(elem).then((canvas) => {
  325. contents.push(canvas);
  326. });
  327. tasks.push(task);
  328. }
  329. // 等待全部page转化完成
  330. await Promise.all(tasks);
  331. // 控制台检查结果
  332. console.log("生成的canvas元素如下:");
  333. console.log(contents);
  334.  
  335. // 拿到canvas宽、高:如果第二页存在,就用第二页的宽高,如果不存在就用第一页的
  336. let model_page = document.querySelector("#pageNo-2") ? document.querySelector("#pageNo-2") : document.querySelector("#pageNo-1");
  337. let width, height;
  338. width = model_page.offsetWidth;
  339. height = model_page.offsetHeight;
  340. // 打包为pdf
  341. this.saveCanvasesToPDF(contents, title, width, height);
  342. },
  343.  
  344. /**
  345. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  346. * @param {string} selector 图形元素的父级元素
  347. */
  348. savePicUrls: function(selector) {
  349. let pages = document.querySelectorAll(selector);
  350. let pic_urls = [];
  351.  
  352. for (let elem of pages) {
  353. let pic_obj = elem.children[0];
  354. let url = pic_obj.src;
  355. pic_urls.push(url);
  356. }
  357. let content = pic_urls.join("\n");
  358. // 启动下载
  359. this.createAndDownloadFile("urls.csv", content);
  360. },
  361.  
  362. /**
  363. * 存储所有canvas图形为png到一个压缩包
  364. * @param {Array} node_list canvas元素列表
  365. * @param {String} title 文档标题
  366. */
  367. saveCanvasesToZip: function(node_list, title) {
  368. // canvas元素转为png图像
  369. // 所有png合并为一个zip压缩包
  370. let zip = new JSZip();
  371. let n = node_list.length;
  372.  
  373. for (let i = 0; i < n; i++) {
  374. let canvas = node_list[i];
  375. let data_base64 = canvas.toDataURL();
  376. let blob = atob(data_base64.split(",")[1]);
  377. zip.file(`page-${i+1}.png`, blob, { binary: true });
  378. }
  379.  
  380. // 导出zip
  381. // promise.then(onCompleted, onRejected);
  382. zip.generateAsync({ type: "blob" }).then(function(content) {
  383. // see filesaver.js
  384. console.log(content);
  385. saveAs(content, `${title}.zip`);
  386. });
  387. },
  388.  
  389. /**
  390. * 将canvas转为jpeg,然后导出PDF
  391. * @param {Array} node_list canvas元素列表
  392. * @param {String} title 文档标题
  393. */
  394. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  395. // 如果没有手动指定canvas的长宽,则自动检测
  396. if (!width && !height) {
  397. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  398. let first_canvas = node_list[0];
  399. // 如果style的长宽不存在,则直接用canvas的元素长宽
  400. let width_str, height_str;
  401. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  402. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  403. } else {
  404. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  405. }
  406. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  407. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  408. }
  409. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  410. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  411. let orientation = width > height ? 'l' : 'p';
  412. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  413.  
  414. // 根据canvas数量确定quality
  415. let quality = this.getQualityByCanvasAmount(node_list.length);
  416.  
  417. // 保存每一页文档到每一页pdf
  418. node_list.forEach(function(canvas, index) {
  419. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  420. // 如果当前不是文档最后一页,则需要添加下一个空白页
  421. if (index !== node_list.length - 1) {
  422. pdf.addPage();
  423. }
  424. });
  425.  
  426. // 导出文件
  427. pdf.save(`${title}.pdf`);
  428. },
  429.  
  430. /**
  431. * 取得elem的class为class_name的父级元素
  432. * @param {String} class_name
  433. * @param {Element} elem
  434. * @param {object} JSobj 默认为window.baiduJS
  435. */
  436. getParentByClassName: function(class_name, elem, JSobj) {
  437. let parent = elem.parentElement;
  438. let now_name;
  439. try {
  440. now_name = parent.className;
  441. } catch (e) {
  442. // 没有父级元素了,返回null
  443. return "no parent node";
  444. }
  445. let iterator_count = JSobj.iterator_count;
  446. if (iterator_count > 9) {
  447. // 超过最大迭代次数,认为不存在,返回null
  448. JSobj.iterator_count = 0;
  449. return "over max iterator counts limit";
  450. } else {
  451. JSobj.iterator_count += 1;
  452. }
  453. // 如果类名匹配,返回该节点
  454. if (now_name.split(" ").includes(class_name)) {
  455. iterator_count = 0;
  456. return parent;
  457. }
  458. return this.getParentByClassName(class_name, parent, JSobj);
  459. },
  460.  
  461. /**
  462. * 将func绑定到window.onscroll,并设置触发频率
  463. * @param {Function} func scroll的监听函数
  464. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  465. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  466. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  467. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  468. */
  469. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "") {
  470. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  471. JSobj.scroll_count += 1;
  472.  
  473. if (JSobj.scroll_count < useful_range) {
  474. func();
  475. console.log(hint);
  476. } else if (JSobj.scroll_count > wait_range) {
  477. JSobj.scroll_count = 0;
  478. }
  479. };
  480. window.onscroll = () => {
  481. new_func(func, JSobj, useful_range, wait_range, hint);
  482. };
  483. },
  484.  
  485. /**
  486. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  487. */
  488. createBtns: function() {
  489. // 创建按钮组
  490. let section = document.createElement("section");
  491. section.className = "btns_section";
  492. section.innerHTML = `
  493. <p class="logo_tit">Wenku Doc Downloader</p>
  494. <button class="btn-1" title="请先滑到底部,使内容加载完,防止出现空白页">展开文档 😈</button>
  495. <button class="btn-2">导出图片 🖼️</button>
  496. <button class="btn-3">导出PDF 🌼</button>
  497. <button class="btn-4">未设定4</button>
  498. <button class="btn-5">未设定5</button>`;
  499. document.body.appendChild(section);
  500.  
  501. // 设定样式
  502. let style = document.createElement("style");
  503. style.innerHTML = `
  504. .btns_section{
  505. position: fixed;
  506. width: 154px;
  507. left: 10px;
  508. top: 32%;
  509. background: #E7F1FF;
  510. border: 2px solid #1676FF;
  511. padding: 0px 0px 10px 0px;
  512. font-weight: 600;
  513. border-radius: 2px;
  514. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  515. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  516. 'Segoe UI Emoji', 'Segoe UI Symbol';
  517. z-index: 5000;
  518. }
  519. .logo_tit{
  520. width: 100%;
  521. background: #1676FF;
  522. text-align: center;
  523. font-size:12px ;
  524. color: #E7F1FF;
  525. line-height: 40px;
  526. height: 40px;
  527. margin: 0 0 16px 0;
  528. }
  529.  
  530. .btn-1{
  531. display: block;
  532. width: 128px;
  533. height: 28px;
  534. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  535. border-radius: 4px;
  536. color: #fff;
  537. font-size: 12px;
  538. border: none;
  539. outline: none;
  540. margin: 8px auto;
  541. font-weight: bold;
  542. cursor: pointer;
  543. opacity: .9;
  544. }
  545. .btn-2{
  546. display: none;
  547. width: 128px;
  548. height: 28px;
  549. background: #07C160;
  550. border-radius: 4px;
  551. color: #fff;
  552. font-size: 12px;
  553. border: none;
  554. outline: none;
  555. margin: 8px auto;
  556. font-weight: bold;
  557. cursor: pointer;
  558. opacity: .9;
  559. }
  560. .btn-3{
  561. display: none;
  562. width: 128px;
  563. height: 28px;
  564. background:#FA5151;
  565. border-radius: 4px;
  566. color: #fff;
  567. font-size: 12px;
  568. border: none;
  569. outline: none;
  570. margin: 8px auto;
  571. font-weight: bold;
  572. cursor: pointer;
  573. opacity: .9;
  574. }
  575. .btn-4{
  576. display: none;
  577. width: 128px;
  578. height: 28px;
  579. background: #1676FF;
  580. border-radius: 4px;
  581. color: #fff;
  582. font-size: 12px;
  583. border: none;
  584. outline: none;
  585. margin: 8px auto;
  586. font-weight: bold;
  587. cursor: pointer;
  588. opacity: .9;
  589. }
  590. .btn-5{
  591. display: none;
  592. width: 128px;
  593. height: 28px;
  594. background: #ff6600;
  595. border-radius: 4px;
  596. color: #fff;
  597. font-size: 12px;
  598. border: none;
  599. outline: none;
  600. margin: 8px auto;
  601. font-weight: bold;
  602. cursor: pointer;
  603. opacity: .9;
  604. }
  605. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  606. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  607. document.head.appendChild(style);
  608. }
  609. };
  610.  
  611. /**
  612. * 提取文字,导出txt。适用于百度文库
  613. */
  614. function saveText_Baidu() {
  615. // 判断是否存在文字元素
  616. let elems = document.querySelectorAll(".reader-txt-layer");
  617. if (!elems.length) {
  618. alert("当前页面没有文字元素\n如果你看到了文字说明它的原文档就是图片,所以提取不到文字");
  619. return;
  620. }
  621. // 判断页面是否加载完成
  622. if (!window.baiduJS.finished) {
  623. alert("仍有内容未加载完,无法使用该功能\n建议从头到尾慢速地再浏览一遍");
  624. return;
  625. }
  626. let title = document.title.split("-")[0].trim(); // 取得文档标题
  627. let page_texts = [];
  628. for (let elem of window.baiduJS.elems_map.values()) {
  629. // 取得该页文档下的全部文字
  630. let text = elem.textContent;
  631. page_texts.push(text);
  632. }
  633. utils.createAndDownloadFile(`${title}.txt`, page_texts.join("\n"));
  634. }
  635.  
  636.  
  637. /**
  638. * 动态存储".ppt-image-wrap img"图形,并导出urls
  639. * @returns
  640. */
  641. function savePicUrls_Baidu() {
  642. let urls = [];
  643. let elems = document.querySelectorAll(".ppt-image-wrap img");
  644. if (!elems.length) {
  645. alert("当前页面没有PPT图形");
  646. return;
  647. }
  648. elems.forEach((elem) => {
  649. if (elem.hasAttribute("src")) {
  650. urls.push(elem.src);
  651. } else {
  652. urls.push(elem.getAttribute("data-src"));
  653. }
  654. });
  655. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  656. }
  657.  
  658.  
  659. /**
  660. * 动态存储".reader-pic-item"图形,并导出urls
  661. * @returns
  662. */
  663. function savePicUrls_BaiduNonPPT() {
  664. // 判断是否存在非PPT图形元素
  665. let elems = document.querySelectorAll(".reader-pic-item");
  666. if (!elems.length) {
  667. alert("当前页面没有非PPT图形");
  668. return;
  669. }
  670. // 判断是否页面都加载完成
  671. if (!window.baiduJS.finished) {
  672. alert("仍有内容未加载完,无法使用该功能\n建议从头到尾慢速地再浏览一遍");
  673. return;
  674. }
  675. // 找到img元素,导出urls
  676. let img_urls = [];
  677. for (let elem of window.baiduJS.elems_map.values()) {
  678. // 取得img元素
  679. elem.querySelectorAll(".reader-pic-item").forEach((img) => {
  680. // 取得img链接
  681. let url = img.style.backgroundImage.split('"')[1];
  682. img_urls.push(url);
  683. });
  684. }
  685. utils.createAndDownloadFile("urls.csv", img_urls.join("\n"));
  686. }
  687.  
  688.  
  689. /**
  690. * 找出没有收录的id,需求的id列表形如:["pageNo-4", "pageNo-5", ...]
  691. * @returns 未收录的id_list: [1, 2, 3, ...]
  692. */
  693. function getUnfrozen() {
  694. // 已经冻结的id
  695. let id_nums = [];
  696. window.baiduJS.elems.forEach((id) => {
  697. let id_num = parseInt(id.split("-")[1]);
  698. id_nums.push(id_num);
  699. });
  700. // 全部id
  701. let all_id_nums = [];
  702. for (let i = 0; i < window.baiduJS.max_page; i++) {
  703. all_id_nums.push(i + 1);
  704. }
  705. // 未冻结的id
  706. let unfrozen = [];
  707. for (let id of all_id_nums) {
  708. if (id_nums.includes(id)) {
  709. continue;
  710. }
  711. unfrozen.push(id);
  712. }
  713. return unfrozen;
  714. }
  715.  
  716.  
  717. function printPage_Baidu() {
  718. // 判断是否页面都加载完成
  719. if (!window.baiduJS.finished) {
  720. let hint = [
  721. "仍有内容未加载完,无法使用该功能",
  722. "建议从头到尾慢速地再浏览一遍",
  723. "未加载的页面如下:",
  724. getUnfrozen().join(", ")
  725. ];
  726. alert(hint.join("\n"));
  727. return;
  728. }
  729. utils.hideBtnThenPrint();
  730. }
  731.  
  732.  
  733. /**
  734. * 调整页间距为 width px
  735. * @param {Number} width 页间距
  736. */
  737. function adjustSpace(width) {
  738. // 调整页间距
  739. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  740. document.querySelectorAll(space_selector).forEach((space) => {
  741. space.style.margin = `0 0 ${width}px`;
  742. });
  743. console.log(`页间距已经调整为:${width}px`);
  744. }
  745.  
  746.  
  747. /**
  748. * 根据键中的id数字对map排序
  749. * @param {Map} elems_map
  750. * @returns sorted_map
  751. */
  752. function sortMapByID$1(elems_map) {
  753. // id形式:pageNo-10
  754. let elems_arr = Array.from(elems_map);
  755. elems_arr.sort((item1, item2) => {
  756. // 从key中取出id
  757. let id1 = parseInt(item1[0].split("-")[1]);
  758. let id2 = parseInt(item2[0].split("-")[1]);
  759. // 升序排序
  760. return id1 - id2;
  761. });
  762. // 返回排序好的map
  763. return new Map(elems_arr);
  764. }
  765.  
  766.  
  767. /**
  768. * 存储html元素。适用于百度文库的文字型文档
  769. */
  770. function storeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  771. let elems_map = window.baiduJS.elems_map;
  772. document.querySelectorAll(selector).forEach(
  773. (elem) => {
  774. let origin_page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  775. if (typeof(origin_page_elem) === "string") {
  776. return;
  777. }
  778. // 复制元素防止丢失
  779. let page_elem = origin_page_elem.cloneNode(true);
  780. // 移除data标签,切断vue对数据的渲染控制
  781. page_elem.removeAttribute("data-page-no");
  782. let id = page_elem.id; // id的形式:pageNo-10
  783. if (!elems_map.has(id)) {
  784. elems_map.set(id, page_elem);
  785. }
  786. });
  787. if (elems_map.size === window.baiduJS.max_page) {
  788. // 根据id排序,保证导出的图片链接不是乱序的
  789. window.baiduJS.elems_map = sortMapByID$1(window.baiduJS.elems_map);
  790. // 已经保存完全部文档页元素,移除滚动事件的绑定函数
  791. window.baiduJS.finished = true;
  792. window.onscroll = () => { };
  793. }
  794. }
  795.  
  796.  
  797. /**
  798. * 移除html元素上的data标签,切断vue的数据渲染控制。适用于百度文库的文字型文档
  799. */
  800. function freezeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  801. let elems = window.baiduJS.elems;
  802. document.querySelectorAll(selector).forEach(
  803. (elem) => {
  804. let page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  805. if (typeof(page_elem) === "string") {
  806. return;
  807. }
  808. // 移除data标签,切断vue对数据的渲染控制
  809. page_elem.removeAttribute("data-page-no");
  810. // 存储已经冻结的元素id
  811. let id = page_elem.id; // id的形式:pageNo-10
  812. if (!elems.includes(id)) {
  813. elems.push(id);
  814. }
  815. });
  816. if (elems.length === window.baiduJS.max_page) {
  817. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  818. window.baiduJS.finished = true;
  819. window.onscroll = () => { };
  820. }
  821. }
  822.  
  823.  
  824. /**
  825. * 百度文档下载策略
  826. */
  827. function baiduWenku() {
  828. // 原文档解析到预览文档
  829. if (location.href.includes("\u002f\u0076\u0069\u0065\u0077\u002f")) {
  830. utils.createBtns();
  831. let jump2sharePage_Baidu = function() {
  832. location.href = `https://${location.host}${location.pathname.replace("\u0076\u0069\u0065\u0077", "\u0073\u0068\u0061\u0072\u0065")}`;
  833. };
  834. utils.setBtnEvent(jump2sharePage_Baidu, [], "btn_1");
  835. } else {
  836. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  837. window.baiduJS = {
  838. max_page: null,
  839. iterator_count: 0, // getParentByClassName的最大迭代次数为9
  840. finished: false, // 是否收集完了全部文档页元素
  841. scroll_count: 0 // 用于统计累计触发scroll的次数
  842. };
  843.  
  844. if (location.href.includes("?share_api=1&width=800")) {
  845. // 带分享参数的页面,适用于word和excel
  846.  
  847. window.baiduJS.elems = []; // 存储已经冻结的元素id
  848. window.baiduJS.max_page = parseInt(location.href.split("max_page=")[1]); // 最大页码
  849. // 跟随浏览,动态冻结页面元素
  850. utils.scrollFunc(freezeHtmlElemts_Baidu, window.baiduJS, 20, 50, "冻结");
  851.  
  852. // 创建按钮组
  853. utils.createBtns();
  854. // 隐藏按钮
  855. utils.toggleBtnStatus("btn_1");
  856. // 显示按钮
  857. utils.toggleBtnStatus("btn_2");
  858. utils.toggleBtnStatus("btn_3");
  859. // 绑定事件到按钮
  860. // 按钮2:调整页间距
  861. utils.setBtnEvent(() => {
  862. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  863. let space = document.querySelector(space_selector);
  864. let old_width = getComputedStyle(space).marginBottom;
  865. let width_str = prompt(`当前页间距为:${old_width}\n请输入调整后的页间距(0-500的整数):`);
  866. let width = parseInt(width_str);
  867. width = Number.isInteger(width) && (0 <= width <= 500) ? width : parseInt(old_width);
  868. adjustSpace(width);
  869. console.log(`调整后的页间距为:${width}px`);
  870. }, [], "btn_2", "调整页间距");
  871. // 按钮3:打印页面到PDF
  872. utils.setBtnEvent(printPage_Baidu, [], "btn_3", "打印页面到PDF");
  873.  
  874. } else if (location.href.includes("\u002f\u0073\u0068\u0061\u0072\u0065\u002f")) {
  875. // old version for fetch doc elemts
  876. let max_page = parseInt(document.querySelector(".page-count").textContent.replace("/", ""));
  877. window.baiduJS.max_page = max_page;
  878. window.baiduJS.elems_map = new Map(); // id: element
  879. // 跟随浏览,动态收集页面元素
  880. utils.scrollFunc(storeHtmlElemts_Baidu, window.baiduJS, 20, 50, "baidu元素: 收集");
  881.  
  882. // 创建按钮组
  883. utils.createBtns();
  884. // 隐藏按钮
  885. utils.toggleBtnStatus("btn_1");
  886. // 显示按钮
  887. utils.toggleBtnStatus("btn_2");
  888. utils.toggleBtnStatus("btn_3");
  889. utils.toggleBtnStatus("btn_4");
  890. utils.toggleBtnStatus("btn_5");
  891. // 绑定事件到按钮
  892. // utils.setBtnEvent(html2PDF, [], "btn_2", "导出PDF");
  893. utils.setBtnEvent(() => {
  894. if (confirm("仅对excel和word文档有效,是否继续?")) {
  895. location.href += `?share_api=1&width=800&max_page=${max_page}`;
  896. }
  897. }, [], "btn_2", "打印页面到PDF");
  898. utils.setBtnEvent(saveText_Baidu, [], "btn_3", "导出纯文本");
  899. utils.setBtnEvent(savePicUrls_Baidu, [], "btn_4", "导出图片链接(仅PPT)");
  900. utils.setBtnEvent(savePicUrls_BaiduNonPPT, [], "btn_5", "导出图片链接(除PPT)");
  901. } else {
  902. console.log(`无法识别的页面:${location.href}`);
  903. }
  904. }
  905. }
  906.  
  907. /**
  908. * 展开道客巴巴的文档
  909. */
  910. function readAllDoc88() {
  911. // 获取“继续阅读”按钮
  912. let continue_btn = document.querySelector("#continueButton");
  913. // 如果存在“继续阅读”按钮
  914. if (continue_btn) {
  915. // 跳转到文末(等同于展开全文)
  916. let cur_page = document.querySelector("#pageNumInput");
  917. // 取得最大页码
  918. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  919. // 跳转到尾页
  920. utils.jump2pageNo(cur_page, page_max, "keypress");
  921. // 返回顶部
  922. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  923. }
  924. // 文档展开后,显示按钮2、3
  925. else {
  926. // 隐藏按钮
  927. utils.toggleBtnStatus("btn_1");
  928. // 显示按钮
  929. utils.toggleBtnStatus("btn_2");
  930. utils.toggleBtnStatus("btn_3");
  931. }
  932. }
  933.  
  934. /**
  935. * 道客巴巴文档下载策略
  936. */
  937. function doc88() {
  938. // 创建脚本启动按钮1、2
  939. utils.createBtns();
  940.  
  941. // 绑定主函数
  942. let prepare = function() {
  943. // 获取canvas元素列表
  944. let node_list = document.querySelectorAll(".inner_page");
  945. // 获取文档标题
  946. let title;
  947. if (document.querySelector(".doctopic h1")) {
  948. title = document.querySelector(".doctopic h1").title;
  949. } else {
  950. title = "文档";
  951. }
  952. return [node_list, title];
  953. };
  954.  
  955. // btn_1: 展开文档
  956. utils.setBtnEvent(() => {
  957. readAllDoc88();
  958. }, [], "btn_1");
  959. // btn_2: 导出zip
  960. utils.setBtnEvent(() => {
  961. if (confirm("确定每页内容都加载完成了吗?")) {
  962. utils.saveCanvasesToZip(...prepare());
  963. }
  964. }, [], "btn_2", "导出图片到zip");
  965. // btn_3: 导出PDF
  966. utils.setBtnEvent(() => {
  967. if (confirm("确定每页内容都加载完成了吗?")) {
  968. utils.saveCanvasesToPDF(...prepare());
  969. }
  970. }, [], "btn_3", "导出图片到PDF");
  971. }
  972.  
  973. // 绑定主函数
  974. function getCanvasList() {
  975. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  976. let parent_node_list = document.querySelectorAll(".hkswf-content");
  977. let node_list = [];
  978. for (let node of parent_node_list) {
  979. node_list.push(node.children[0]);
  980. }
  981. return node_list;
  982. }
  983.  
  984.  
  985. function prepare() {
  986. // 获取canvas元素列表
  987. let node_list = getCanvasList();
  988. // 获取文档标题
  989. let title;
  990. if (document.querySelector("h1 [title=doc]")) {
  991. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  992. } else if (document.querySelector(".doc_title")) {
  993. title = document.querySelector(".doc_title").textContent;
  994. } else {
  995. title = "文档";
  996. }
  997. return [node_list, title];
  998. }
  999.  
  1000.  
  1001. // 判断是否有canvas元素
  1002. function detectCanvas() {
  1003. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1004.  
  1005. // 隐藏按钮
  1006. utils.toggleBtnStatus("btn_1");
  1007. // 显示按钮
  1008. utils.toggleBtnStatus("btn_2");
  1009.  
  1010. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1011. if (!haveCanvas) {
  1012. // btn_2: 导出图片链接
  1013. utils.setBtnEvent(() => {
  1014. if (confirm("确定每页内容都加载完成了吗?")) {
  1015. utils.savePicUrls("[id*=img_]");
  1016. }
  1017. }, [], "btn_2", "导出全部图片链接");
  1018. } else {
  1019. // 显示按钮3
  1020. utils.toggleBtnStatus("btn_3");
  1021. // btn_2: 导出zip
  1022. utils.setBtnEvent(() => {
  1023. if (confirm("确定每页内容都加载完成了吗?")) {
  1024. utils.saveCanvasesToZip(...prepare());
  1025. }
  1026. }, [], "btn_2", "导出图片到zip");
  1027. // btn_3: 导出PDF
  1028. utils.setBtnEvent(() => {
  1029. if (confirm("确定每页内容都加载完成了吗?")) {
  1030. utils.saveCanvasesToPDF(...prepare());
  1031. }
  1032. }, [], "btn_3", "导出图片到PDF");
  1033. }
  1034. }
  1035.  
  1036.  
  1037. /**
  1038. * 豆丁文档下载策略
  1039. */
  1040. function docin() {
  1041. // 创建脚本启动按钮
  1042. utils.createBtns();
  1043.  
  1044. // 隐藏底部工具栏
  1045. document.querySelector("#j_select").click(); // 选择指针
  1046. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1047. tool_bar.style.display = "none";
  1048.  
  1049. // btn_1: 判断文档类型
  1050. utils.setBtnEvent(() => {
  1051. utils.forceHide(".jz_watermark");
  1052. detectCanvas();
  1053. }, [], "btn_1", "判断文档类型");
  1054. }
  1055.  
  1056. /**
  1057. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1058. */
  1059. function readAlliShare() {
  1060. // 获取“继续阅读”元素
  1061. let red_btn = document.getElementsByClassName("red-color")[0];
  1062. let red_text = red_btn.textContent;
  1063. // 如果可以展开,则展开
  1064. if (red_text.search("点击可继续阅读") !== -1) {
  1065. red_btn.click();
  1066. setTimeout(readAlliShare, 1000);
  1067. }
  1068. // 否则启动按钮2,准备清理页面然后打印为PDF
  1069. else {
  1070. // 隐藏按钮
  1071. utils.toggleBtnStatus("btn_1");
  1072. // 显示按钮
  1073. utils.toggleBtnStatus("btn_2");
  1074. utils.toggleBtnStatus("btn_3");
  1075.  
  1076. // 显示svg图片的链接
  1077. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1078. if (!page1) {
  1079. // 如果不存在svg图形,终止后续代码
  1080. console.log("当前页面不存在svg图形");
  1081. return;
  1082. }
  1083. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1084. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1085. svg1_src_div.innerHTML = `<div id="src-1"
  1086. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1087. 访问以下链接以复制文字:<br>${page1.src}
  1088. </div>`;
  1089. svg2_src_div.innerHTML = `<div id="src-1"
  1090. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1091. 访问以下链接以复制文字:<br>${page2.src}
  1092. </div>`;
  1093. // 添加到页面上
  1094. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1095. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1096. }
  1097. }
  1098.  
  1099.  
  1100. /**
  1101. * 清理并打印爱问共享资料的文档页
  1102. * @returns 如果输入偏移量非法,返回空值以终止函数
  1103. */
  1104. function printPageiShare() {
  1105. // # 清理并打印爱问共享资料的文档页
  1106. // ## 移除页面上无关的元素
  1107. // ### 移除单个元素
  1108. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1109. let header = document.getElementsByClassName("new-detail-header")[0];
  1110. let fixright = document.getElementById("fix-right");
  1111. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1112. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1113. let footer = document.getElementsByClassName("website-footer")[0];
  1114. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1115. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1116. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1117. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1118. let crumb_arrow;
  1119. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1120. let copyright = document.getElementsByClassName("copyright-container")[0];
  1121. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1122. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1123. // ### 执行移除
  1124. let elem_list = [
  1125. topbanner,
  1126. header,
  1127. fixright,
  1128. redpacket,
  1129. fixedrightfull,
  1130. footer,
  1131. guess,
  1132. detailtopbox,
  1133. fullscreen,
  1134. endhint,
  1135. crumb_arrow,
  1136. copyright,
  1137. state_btn,
  1138. comments
  1139. ];
  1140. for (let elem of elem_list) {
  1141. utils.tryToRemoveElement(elem);
  1142. }
  1143. // ### 移除全部同类元素
  1144. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1145. for (let elem_2 of elem_list_2) {
  1146. utils.tryToRemoveElement(elem_2);
  1147. }
  1148. // 使文档居中
  1149. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1150. if (!utils.centerDoc("doc-main", "18")) {
  1151. return; // 如果输入非法,终止函数调用
  1152. }
  1153. // 隐藏按钮,然后打印页面
  1154. utils.hideBtnThenPrint();
  1155. }
  1156.  
  1157.  
  1158. /**
  1159. * 爱问共享资料文档下载策略
  1160. */
  1161. function ishare() {
  1162. // 创建脚本启动按钮1、2
  1163. utils.createBtns();
  1164.  
  1165. // btn_1: 展开文档
  1166. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1167. // btn_2: 导出图片链接
  1168. utils.setBtnEvent(() => {
  1169. utils.savePicUrls(".data-detail");
  1170. }, [], "btn_2", "导出图片链接(推荐)");
  1171. // btn_3: 打印页面到PDF
  1172. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1173.  
  1174. // 移除底部下载条
  1175. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1176. utils.tryToRemoveElement(detailfixed);
  1177. }
  1178.  
  1179. /**
  1180. * 清理并打印得力文库的文档页
  1181. */
  1182. function printPageDeliwenku() {
  1183. // 移除页面上的无关元素
  1184. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1185. let elem_list = document.querySelectorAll(selector);
  1186. for (let elem of elem_list) {
  1187. utils.tryToRemoveElement(elem);
  1188. }
  1189. // 修改页间距
  1190. let outer_pages = document.getElementsByClassName("outer_page");
  1191. for (let page of outer_pages) {
  1192. page.style.marginBottom = "20px";
  1193. }
  1194. // 使文档居中
  1195. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1196. if (!utils.centerDoc("#boxleft", "3")) {
  1197. return; // 如果输入非法,终止函数调用
  1198. }
  1199. // 打印文档
  1200. utils.hideBtnThenPrint();
  1201. }
  1202.  
  1203.  
  1204. /**
  1205. * 点击“继续阅读”,适用性:得力文库
  1206. */
  1207. function readAllDeliwenku() {
  1208. // 点击“同意并开始预览全文”
  1209. let start_btn = document.getElementsByClassName("pre_button")[0];
  1210. let display = start_btn.parentElement.parentElement.style.display;
  1211. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1212. if (!display) {
  1213. start_btn.children[0].click();
  1214. setTimeout("scroll(0, document.body.scrollHeight)", 200);
  1215. return;
  1216. }
  1217. // 增强按钮点击效果
  1218. utils.enhanceBtnClickReaction();
  1219.  
  1220. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1221. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1222. // 继续阅读
  1223. if (display2 !== "none") {
  1224. // 获取input元素
  1225. let cur_page = document.querySelector("#pageNumInput");
  1226. let page_old = cur_page.value;
  1227. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1228. // 跳转到尾页
  1229. utils.jump2pageNo(cur_page, page_max, "keydown");
  1230. // 跳转回来
  1231. utils.jump2pageNo(cur_page, page_old, "keydown");
  1232.  
  1233. // 切换按钮准备导出
  1234. } else {
  1235. // 推荐导出图片链接
  1236. utils.modifyBtnText("btn_2", null, true);
  1237. // 隐藏按钮
  1238. utils.toggleBtnStatus("btn_1");
  1239. // 显示按钮
  1240. utils.toggleBtnStatus("btn_2");
  1241. utils.toggleBtnStatus("btn_3");
  1242. // btn_3 橙色按钮
  1243. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1244. }
  1245. }
  1246.  
  1247.  
  1248. /**
  1249. * 得力文库文档下载策略
  1250. */
  1251. function deliwenku() {
  1252. // 创建脚本启动按钮1、2
  1253. utils.createBtns();
  1254.  
  1255. // btn_1: 展开文档
  1256. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1257. // btn_2: 导出图片链接
  1258. utils.setBtnEvent(() => {
  1259. if (confirm("确定每页内容都加载完成了吗?")) {
  1260. utils.savePicUrls('.inner_page div');
  1261. }
  1262. }, [], "btn_2", "导出图片链接");
  1263.  
  1264. // 尝试关闭页面弹窗
  1265. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1266. // 解除打印限制
  1267. utils.allowPrint();
  1268. }
  1269.  
  1270. function readAll360Doc() {
  1271. // 展开文档
  1272. document.querySelector(".articleMaxH").setAttribute("class", "");
  1273. // 隐藏按钮
  1274. utils.toggleBtnStatus("btn_1");
  1275. // 显示按钮
  1276. utils.toggleBtnStatus("btn_2");
  1277. utils.toggleBtnStatus("btn_3");
  1278. }
  1279.  
  1280.  
  1281. function saveText_360Doc() {
  1282. // 捕获图片链接
  1283. let images = document.querySelectorAll("#artContent img");
  1284. let content = [];
  1285.  
  1286. for (let i = 0; i < images.length; i++) {
  1287. let src = images[i].src;
  1288. content.push(`图${i+1},链接:${src}`);
  1289. }
  1290. // 捕获文本
  1291. let text = document.querySelector("#artContent").textContent;
  1292. content.push(text);
  1293.  
  1294. // 保存纯文本文档
  1295. let title = document.querySelector("#titiletext").textContent;
  1296. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1297. }
  1298.  
  1299.  
  1300. function printPage360Doc() {
  1301. // # 清理并打印360doc的文档页
  1302. // ## 移除页面上无关的元素
  1303. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1304. let elem_list = document.querySelectorAll(selector);
  1305. let under_doc_1, under_doc_2;
  1306. try {
  1307. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1308. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1309. } catch (e) { console.log(); }
  1310. // 执行移除
  1311. for (let elem of elem_list) {
  1312. utils.tryToRemoveElement(elem);
  1313. }
  1314. utils.tryToRemoveElement(under_doc_1);
  1315. utils.tryToRemoveElement(under_doc_2);
  1316. // 执行隐藏
  1317. document.querySelector("a[title]").style.display = "none";
  1318.  
  1319. // 使文档居中
  1320. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1321. if (!utils.centerDoc(".a_left", "20")) {
  1322. return; // 如果输入非法,终止函数调用
  1323. }
  1324. // 隐藏按钮,然后打印页面
  1325. utils.hideBtnThenPrint();
  1326. }
  1327.  
  1328.  
  1329. /**
  1330. * 360doc个人图书馆下载策略
  1331. */
  1332. function doc360() {
  1333. // 创建按钮区
  1334. utils.createBtns();
  1335. // btn_1: 展开文档
  1336. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1337. // btn_2: 导出纯文本
  1338. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1339. // btn_3: 打印页面到PDF
  1340. utils.setBtnEvent(() => {
  1341. if (confirm("确定每页内容都加载完成了吗?")) {
  1342. printPage360Doc();
  1343. }
  1344. }, [], "btn_3", "打印页面到PDF");
  1345. }
  1346.  
  1347. /**
  1348. * 查找出所有未被捕获的页码,并返回列表
  1349. * @returns 未捕获页码列表
  1350. */
  1351. function getMissedPages() {
  1352. let all = []; // 全部页码
  1353. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1354. all[i] = i + 1;
  1355. }
  1356. let missed = []; // 未捕获页码
  1357. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1358.  
  1359. // 排除并录入未捕获页码
  1360. for (let num of all) {
  1361. if (!possessed.includes(`page${num}`)) {
  1362. missed.push(num);
  1363. }
  1364. }
  1365. return missed;
  1366. }
  1367.  
  1368.  
  1369. /**
  1370. * 根据键中的id数字对map排序
  1371. * @param {Map} elems_map
  1372. * @returns sorted_map
  1373. */
  1374. function sortMapByID(elems_map) {
  1375. // id形式:page2
  1376. let elems_arr = Array.from(elems_map);
  1377. elems_arr.sort((item1, item2) => {
  1378. // 从key中取出id
  1379. let id1 = parseInt(item1[0].replace("page", ""));
  1380. let id2 = parseInt(item2[0].replace("page", ""));
  1381. // 升序排序
  1382. return id1 - id2;
  1383. });
  1384. // 返回排序好的map
  1385. return new Map(elems_arr);
  1386. }
  1387.  
  1388.  
  1389. /**
  1390. * 存储动态加载的canvas元素、textContent
  1391. */
  1392. function storeElements_MBA() {
  1393. let canvases_map = window.mbaJS.canvases_map;
  1394. let texts_map = window.mbaJS.texts_map;
  1395. let quality = window.mbaJS.quality;
  1396.  
  1397. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1398. (elem) => {
  1399. let capture = (elem) => {
  1400. // (1) 存储页面为canvas图形
  1401. let canvas, data_base64;
  1402. // 导出canvas数据防止丢失
  1403. try {
  1404. // 存储canvas
  1405. canvas = elem.querySelector("canvas[id*=page]");
  1406. if (window.mbaJS.only_text) {
  1407. data_base64 = null;
  1408. } else {
  1409. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1410. }
  1411. } catch (e) {
  1412. // utils.sleep(500);
  1413. return;
  1414. }
  1415. // 增量录入map
  1416. let id = canvas.id; // id的形式:page2
  1417. if (!canvases_map.has(id)) {
  1418. canvases_map.set(id, data_base64);
  1419. }
  1420. // 确定canvas长宽
  1421. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1422. window.mbaJS.width = parseInt(canvas.width);
  1423. window.mbaJS.height = parseInt(canvas.height);
  1424. }
  1425.  
  1426. // (2) 存储text
  1427. let text = elem.textContent;
  1428. if (!texts_map.has(id)) {
  1429. texts_map.set(id, text);
  1430. }
  1431. };
  1432. setTimeout(capture, 500, elem);
  1433. });
  1434. if (canvases_map.size === window.mbaJS.max_page) {
  1435. // 根据id排序
  1436. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  1437. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  1438. window.mbaJS.finished = true;
  1439. window.onscroll = null;
  1440. }
  1441. }
  1442.  
  1443.  
  1444. /**
  1445. * 将canvas转为jpeg,然后导出PDF
  1446. * @param {Array} base64_list canvas元素列表
  1447. * @param {String} title 文档标题
  1448. */
  1449. function saveCanvasesToPDF_MBA(base64_list, title) {
  1450. let width = window.mbaJS.width;
  1451. let height = window.mbaJS.height;
  1452.  
  1453. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1454. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1455. let orientation = width > height ? 'l' : 'p';
  1456. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1457.  
  1458. // 保存每一页文档到每一页pdf
  1459. let i = 0;
  1460. for (let base64 of base64_list) {
  1461. i += 1;
  1462. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1463. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1464. if (i < window.mbaJS.max_page) {
  1465. pdf.addPage();
  1466. }
  1467. }
  1468. // 导出文件
  1469. pdf.save(`${title}.pdf`);
  1470. }
  1471.  
  1472. /**
  1473. * 判断文档页是否收集完毕,当不行时给出提示
  1474. * @returns boolean
  1475. */
  1476. function ready2use() {
  1477. removeAds(); // 顺便清理广告
  1478. // 如果是首次点击按钮,给出提示
  1479. if (window.mbaJS.first_hint) {
  1480. let hint = [
  1481. "如果浏览速度过快,比如:",
  1482. "当前页面还没完全加载好就滚动页面去看下一页",
  1483. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1484. "由防范技术的干扰,该功能目前很不好用,见谅"
  1485. ].join("\n");
  1486. alert(hint);
  1487. window.mbaJS.first_hint = false;
  1488. }
  1489. // 如果文档页没有收集完,给出提示
  1490. if (!window.mbaJS.finished) {
  1491. let hint = [
  1492. "仍有内容未加载完,无法使用该功能",
  1493. "建议从头到尾慢速地再浏览一遍",
  1494. "以下是没有加载完成页面的页码:",
  1495. getMissedPages().join(",")
  1496. ];
  1497. alert(hint.join("\n"));
  1498. return false;
  1499. }
  1500. return true;
  1501. }
  1502.  
  1503.  
  1504. /**
  1505. * 用捕获好的canvas转jpg,生成PDF
  1506. * @returns
  1507. */
  1508. function canvas2PDF_mba() {
  1509. if (!ready2use()) {
  1510. return;
  1511. }
  1512. let canvases = window.mbaJS.canvases_map.values();
  1513. // 导出PDF
  1514. let title = document.title.split("-")[0].trim();
  1515. saveCanvasesToPDF_MBA(canvases, title);
  1516. }
  1517.  
  1518.  
  1519. /**
  1520. * 拼合捕获好的文本,保存到txt文件
  1521. * @returns
  1522. */
  1523. function saveText_mba() {
  1524. if (!ready2use()) {
  1525. return;
  1526. }
  1527. let content = Array.from(window.mbaJS.texts_map.values());
  1528. let title = document.title.split("-")[0].trim();
  1529. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1530. }
  1531.  
  1532.  
  1533. /**
  1534. * 移除广告
  1535. */
  1536. function removeAds() {
  1537. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1538. utils.tryToRemoveElement(ad_elem);
  1539. });
  1540. }
  1541.  
  1542.  
  1543. function mbalib_() {
  1544. // 移除广告和左侧工具栏
  1545. removeAds();
  1546. let tool_bar = document.querySelector(".tool-bar");
  1547. utils.tryToRemoveElement(tool_bar);
  1548.  
  1549. // 创建按钮
  1550. utils.createBtns();
  1551. // 隐藏按钮
  1552. utils.toggleBtnStatus("btn_1");
  1553. // 显示按钮
  1554. utils.toggleBtnStatus("btn_2");
  1555. utils.toggleBtnStatus("btn_3");
  1556. utils.toggleBtnStatus("btn_4");
  1557.  
  1558. // 取得页数
  1559. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1560. let quality = utils.getQualityByCanvasAmount(max_page);
  1561.  
  1562. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1563. window.mbaJS = {
  1564. max_page: max_page,
  1565. texts_map: new Map(), // id: text
  1566. canvases_map: new Map(), // id: canvas_data_base64
  1567. quality: quality, // canvas转jpg的质量
  1568. width: null, // canvas宽度(px)
  1569. height: null,
  1570. finished: false, // 是否收集完了全部文档页元素
  1571. first_hint: true,
  1572. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1573. only_text: false // 是否仅捕获文本
  1574. };
  1575. // 跟随浏览,动态收集页面元素
  1576. window.onscroll = () => {
  1577. storeElements_MBA();
  1578. };
  1579. // 跟随浏览,动态收集页面元素
  1580. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  1581. // 绑定事件
  1582. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  1583. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  1584.  
  1585. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  1586. let btn_text, aim_btn, hint;
  1587. if (max_page > 40) {
  1588. btn_text = "失效说明";
  1589. aim_btn = "btn_3";
  1590. hint = [
  1591. "页数超过40,脚本无效",
  1592. "只能使用导出文本功能",
  1593. "而此脚本会使页面内容加载明显变慢,建议禁用"
  1594. ];
  1595. utils.setBtnEvent(utils.banSelf, [
  1596. () => { window.onscroll = null; }
  1597. ], "btn_4", "临时禁用脚本");
  1598. } else {
  1599. btn_text = "空白页说明";
  1600. aim_btn = "btn_4";
  1601. hint = [
  1602. "导致空白页的原因如下",
  1603. "加载该页的时间超过2秒 / 明显等待",
  1604. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  1605. ];
  1606. }
  1607.  
  1608. utils.setBtnEvent(() => {
  1609. alert(hint.join("\n"));
  1610. }, [], aim_btn, btn_text);
  1611. }
  1612.  
  1613.  
  1614. function mbalib() {
  1615. setTimeout(mbalib_, 2000);
  1616. }
  1617.  
  1618. /**
  1619. * 主函数:识别网站,执行对应文档下载策略
  1620. */
  1621. function main() {
  1622. let host = window.location.host;
  1623. console.log(`当前host: ${host}`);
  1624.  
  1625. if (host.includes("docin.com")) {
  1626. docin();
  1627. } else if (host === "ishare.iask.sina.com.cn") {
  1628. ishare();
  1629. } else if (host === "www.deliwenku.com") {
  1630. deliwenku();
  1631. } else if (host === "www.doc88.com") {
  1632. doc88();
  1633. } else if (host === "www.360doc.com") {
  1634. doc360();
  1635. } else if (host === "wenku.baidu.com") {
  1636. baiduWenku();
  1637. } else if (host === "doc.mbalib.com") {
  1638. mbalib();
  1639. } else {
  1640. console.log("匹配到了无效网页");
  1641. }
  1642. }
  1643.  
  1644. let options = {
  1645. fast_mode: false,
  1646. activation_test: false
  1647. };
  1648. if (options.cli_mode) {
  1649. (() => {
  1650. loadExternalScripts();
  1651. setTimeout(main, 2000);
  1652. return;
  1653. })();
  1654. }
  1655. if (options.activation_test) {
  1656. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  1657. }
  1658. if (options.fast_mode) {
  1659. main();
  1660. } else {
  1661. window.onload = main;
  1662. }
  1663.  
  1664. })();