Wenku Doc Downloader

下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③道客巴巴④360doc个人图书馆⑤得力文库⑥MBA智库⑦爱问共享资料(新浪文档)。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。

当前为 2022-02-03 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.4.9
  5. // @description 下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③道客巴巴④360doc个人图书馆⑤得力文库⑥MBA智库⑦爱问共享资料(新浪文档)。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/*/*
  13. // @match *://doc.mbalib.com/view/*
  14. // @require https://cdn.bootcdn.net/ajax/libs/FileSaver.js/2.0.5/FileSaver.min.js
  15. // @require https://cdn.bootcdn.net/ajax/libs/jszip/3.7.1/jszip.min.js
  16. // @require https://cdn.bootcdn.net/ajax/libs/jspdf/2.3.1/jspdf.umd.min.js
  17. // @require https://cdn.bootcdn.net/ajax/libs/html2canvas/1.4.1/html2canvas.min.js
  18. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  19. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  20. // @grant none
  21. // @license GPL-3.0-only
  22. // @create 2021-11-22
  23. // ==/UserScript==
  24.  
  25.  
  26. (function () {
  27. 'use strict';
  28.  
  29. let utils = {
  30. /**
  31. * 创建并下载文件
  32. * @param {string} fileName
  33. * @param {string} content
  34. */
  35. createAndDownloadFile: function(fileName, content) {
  36. let aTag = document.createElement('a');
  37. let blob = new Blob([content]);
  38. aTag.download = fileName;
  39. aTag.href = URL.createObjectURL(blob);
  40. aTag.click();
  41. URL.revokeObjectURL(blob);
  42. },
  43.  
  44. /**
  45. * 临时禁用脚本,执行func后移除btns_section。
  46. * @param {Function} func
  47. */
  48. banSelf: function(func) {
  49. func();
  50. document.querySelector(".btns_section").remove();
  51. },
  52.  
  53. /**
  54. * 睡眠 delay 毫秒
  55. * @param {Number} delay
  56. */
  57. sleep: function(delay) {
  58. let start = (new Date()).getTime();
  59. while ((new Date()).getTime() - start < delay) {
  60. continue;
  61. }
  62. },
  63.  
  64. /**
  65. * 允许打印页面
  66. */
  67. allowPrint: function() {
  68. let style = document.createElement("style");
  69. style.innerHTML = `
  70. @media print {
  71. body{
  72. display:block;
  73. }
  74. }
  75. `;
  76. document.head.appendChild(style);
  77. },
  78.  
  79. /**
  80. * 求main_set去除cut_set后的set
  81. * @param {Set} main_set
  82. * @param {Set} cut_set
  83. * @returns 差集
  84. */
  85. difference: function(main_set, cut_set) {
  86. let _diff = new Set(main_set);
  87. for (let elem of cut_set) {
  88. _diff.delete(elem);
  89. }
  90. return _diff;
  91. },
  92.  
  93. /**
  94. * 抛出set中的第一个元素
  95. * @param {Set} set
  96. * @returns 一个元素
  97. */
  98. setPop: function(set) {
  99. for (let item of set) {
  100. set.delete(item);
  101. return item;
  102. }
  103. },
  104.  
  105. /**
  106. * 绑定事件到指定按钮,返回按钮引用
  107. * @param {Function} event click事件
  108. * @param {Array} args 事件的参数列表
  109. * @param {String} aim_btn 按钮的变量名
  110. * @param {String} new_text 按钮的新文本,为null则不替换
  111. * @returns 按钮元素的引用
  112. */
  113. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  114. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  115. // 如果需要,替换按钮内文本
  116. if (new_text) {
  117. btn.textContent = new_text;
  118. }
  119. // 绑定事件,添加到页面上
  120. btn.onclick = () => {
  121. this.enhanceBtnClickReaction(aim_btn);
  122. if (args.length) {
  123. event(...args);
  124. } else {
  125. event();
  126. }
  127. };
  128. return btn;
  129. },
  130.  
  131. /**
  132. * 强制隐藏元素
  133. * @param {String} selector
  134. */
  135. forceHide: function(selector) {
  136. document.querySelectorAll(selector).forEach((elem) => {
  137. elem.className += " force_hide";
  138. });
  139. let style = document.createElement("style");
  140. style.innerHTML = `.force_hide {
  141. visibility: hidden !important;
  142. }`;
  143. document.head.appendChild(style);
  144. },
  145.  
  146. /**
  147. * 隐藏按钮,打印页面,显示按钮
  148. */
  149. hideBtnThenPrint: function() {
  150. // 隐藏按钮,然后打印页面
  151. let section = document.getElementsByClassName("btns_section")[0];
  152. section.style.display = "none";
  153. window.print();
  154. // 打印结束,显示按钮
  155. section.style.removeProperty("display");
  156. },
  157.  
  158. /**
  159. * 返回times个倍数连接的str
  160. * @param {String} str
  161. * @param {Number} times
  162. * @returns multiplied_str
  163. */
  164. multiplyStr: function(str, times) {
  165. let str_list = [];
  166. for (let i = 0; i < times; i++) {
  167. str_list.push(str);
  168. }
  169. return str_list.join("");
  170. },
  171.  
  172. /**
  173. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  174. * @param {String} custom_btn 按钮变量名
  175. */
  176. enhanceBtnClickReaction: function(custom_btn = null) {
  177. let aim_btn;
  178. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  179. if (!custom_btn || custom_btn === "btn_1") {
  180. aim_btn = document.querySelector(".btn-1");
  181. } else {
  182. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  183. }
  184.  
  185. let old_color = aim_btn.style.color; // 保存旧的颜色
  186. let old_text = aim_btn.textContent; // 保存旧的文字内容
  187. // 变黑缩小
  188. aim_btn.style.color = "black";
  189. aim_btn.style.fontWeight = "normal";
  190. aim_btn.textContent = `->${old_text}<-`;
  191. // 复原加粗
  192. let changeColorBack = function() {
  193. aim_btn.style.color = old_color;
  194. aim_btn.style.fontWeight = "bold";
  195. aim_btn.textContent = old_text;
  196. };
  197. setTimeout(changeColorBack, 1250);
  198. },
  199.  
  200. /**
  201. * 切换按钮显示/隐藏状态
  202. * @param {String} aim_btn 按钮变量名
  203. * @returns 按钮元素的引用
  204. */
  205. toggleBtnStatus: function(aim_btn) {
  206. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  207. let display = getComputedStyle(btn).display;
  208. // return;
  209. if (display === "none") {
  210. btn.style.display = "block";
  211. } else {
  212. btn.style.display = "none";
  213. }
  214. return btn;
  215. },
  216.  
  217. /**
  218. * 根据canvas元素数量返回quality值
  219. * @param {Number} canvas_amount
  220. * @returns quality: Number
  221. */
  222. getQualityByCanvasAmount: function(canvas_amount) {
  223. let quality;
  224. if (canvas_amount <= 25) {
  225. quality = 1.0;
  226. } else if (25 < canvas_amount <= 50) {
  227. quality = 0.85;
  228. } else {
  229. quality = 0.7;
  230. }
  231. return quality;
  232. },
  233.  
  234. /**
  235. * 用input框跳转到对应页码
  236. * @param {Element} cur_page 当前页码
  237. * @param {string} aim_page 目标页码
  238. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  239. */
  240. jump2pageNo: function(cur_page, aim_page, event_type) {
  241. // 设置跳转页码为目标页码
  242. cur_page.value = aim_page;
  243. // 模拟回车事件来跳转
  244. let keyboard_event_enter = new KeyboardEvent(event_type, {
  245. bubbles: true,
  246. cancelable: true,
  247. keyCode: 13
  248. });
  249. cur_page.dispatchEvent(keyboard_event_enter);
  250. },
  251.  
  252. /**
  253. * 滚动到页面底部
  254. */
  255. scrollToBottom: function() {
  256. window.scrollTo({
  257. top: document.body.scrollHeight,
  258. behavior: "smooth"
  259. });
  260. },
  261.  
  262. /**
  263. * 用try移除元素
  264. * @param {Element} element 要移除的元素
  265. */
  266. tryToRemoveElement: function(element) {
  267. try {
  268. element.remove();
  269. } catch (e) {
  270. }
  271. },
  272.  
  273. /**
  274. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  275. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  276. */
  277. tryToRemoveSameElem: function(elem_list_box) {
  278. for (let elem_list of elem_list_box) {
  279. if (!elem_list) {
  280. continue;
  281. }
  282. for (let elem of elem_list) {
  283. try {
  284. elem.remove();
  285. } catch (e) {
  286. console.log();
  287. }
  288. }
  289. }
  290. },
  291.  
  292. /**
  293. * 使文档在页面上居中
  294. * @param {String} selector 文档容器的css选择器
  295. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  296. * @returns 偏移值是否合法
  297. */
  298. centerDoc: function(selector, default_offset) {
  299. let doc_main = document.querySelector(selector);
  300. let offset = window.prompt("请输入偏移百分位:", default_offset);
  301. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  302. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  303. doc_main.style.marginLeft = offset + "%";
  304. return true;
  305. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  306. doc_main.style.marginLeft = offset + "%";
  307. return true
  308. } else {
  309. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  310. return false;
  311. }
  312. },
  313.  
  314. /**
  315. * 调整按钮内文本
  316. * @param {String} aim_btn 按钮变量名
  317. * @param {String} new_text 新的文本,null则保留旧文本
  318. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  319. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  320. */
  321. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  322. // 提示文档已经展开
  323. if (use_hint) {
  324. let hint = "文档已经完全展开,可以导出";
  325. alert(hint);
  326. }
  327. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  328. // 要替换的文本
  329. if (new_text) {
  330. btn.textContent = new_text;
  331. }
  332. // 推荐按钮
  333. if (recommend_btn) {
  334. btn.textContent += "(推荐)";
  335. }
  336. },
  337.  
  338. /**
  339. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  340. * @param {Array} elem_list html元素列表
  341. * @param {String} title 文档标题
  342. */
  343. html2PDF: async function(elem_list, title = "文档") {
  344. // 如果是空元素列表,返回null并终止函数
  345. if (elem_list.length === 0) {
  346. console.log("html2PDF was called, but no canvas element avaiable.");
  347. return null;
  348. }
  349. let tasks = []; // 存放异步任务
  350. let contents = []; // 存放canvas元素
  351. for (let elem of elem_list) {
  352. let task = html2canvas(elem).then((canvas) => {
  353. contents.push(canvas);
  354. });
  355. tasks.push(task);
  356. }
  357. // 等待全部page转化完成
  358. await Promise.all(tasks);
  359. // 控制台检查结果
  360. console.log("生成的canvas元素如下:");
  361. console.log(contents);
  362.  
  363. // 拿到canvas宽、高:如果第二页存在,就用第二页的宽高,如果不存在就用第一页的
  364. let model_page = document.querySelector("#pageNo-2") ? document.querySelector("#pageNo-2") : document.querySelector("#pageNo-1");
  365. let width, height;
  366. width = model_page.offsetWidth;
  367. height = model_page.offsetHeight;
  368. // 打包为pdf
  369. this.saveCanvasesToPDF(contents, title, width, height);
  370. },
  371.  
  372. /**
  373. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  374. * @param {string} selector 图形元素的父级元素
  375. */
  376. savePicUrls: function(selector) {
  377. let pages = document.querySelectorAll(selector);
  378. let pic_urls = [];
  379.  
  380. for (let elem of pages) {
  381. let pic_obj = elem.children[0];
  382. let url = pic_obj.src;
  383. pic_urls.push(url);
  384. }
  385. let content = pic_urls.join("\n");
  386. // 启动下载
  387. this.createAndDownloadFile("urls.csv", content);
  388. },
  389.  
  390. /**
  391. * 存储所有canvas图形为png到一个压缩包
  392. * @param {Array} node_list canvas元素列表
  393. * @param {String} title 文档标题
  394. */
  395. saveCanvasesToZip: function(node_list, title) {
  396. // canvas元素转为png图像
  397. // 所有png合并为一个zip压缩包
  398. let zip = new JSZip();
  399. let n = node_list.length;
  400.  
  401. for (let i = 0; i < n; i++) {
  402. let canvas = node_list[i];
  403. let data_base64 = canvas.toDataURL();
  404. let blob = atob(data_base64.split(",")[1]);
  405. zip.file(`page-${i+1}.png`, blob, { binary: true });
  406. }
  407.  
  408. // 导出zip
  409. // promise.then(onCompleted, onRejected);
  410. zip.generateAsync({ type: "blob" }).then(function(content) {
  411. // see filesaver.js
  412. console.log(content);
  413. saveAs(content, `${title}.zip`);
  414. });
  415. },
  416.  
  417. /**
  418. * 将canvas转为jpeg,然后导出PDF
  419. * @param {Array} node_list canvas元素列表
  420. * @param {String} title 文档标题
  421. */
  422. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  423. // 如果没有手动指定canvas的长宽,则自动检测
  424. if (!width && !height) {
  425. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  426. let first_canvas = node_list[0];
  427. // 如果style的长宽不存在,则直接用canvas的元素长宽
  428. let width_str, height_str;
  429. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  430. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  431. } else {
  432. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  433. }
  434. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  435. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  436. }
  437. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  438. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  439. let orientation = width > height ? 'l' : 'p';
  440. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  441.  
  442. // 根据canvas数量确定quality
  443. let quality = this.getQualityByCanvasAmount(node_list.length);
  444.  
  445. // 保存每一页文档到每一页pdf
  446. node_list.forEach(function(canvas, index) {
  447. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  448. // 如果当前不是文档最后一页,则需要添加下一个空白页
  449. if (index !== node_list.length - 1) {
  450. pdf.addPage();
  451. }
  452. });
  453.  
  454. // 导出文件
  455. pdf.save(`${title}.pdf`);
  456. },
  457.  
  458. /**
  459. * 取得elem的class为class_name的父级元素
  460. * @param {String} class_name
  461. * @param {Element} elem
  462. * @param {object} JSobj 默认为window.baiduJS
  463. */
  464. getParentByClassName: function(class_name, elem, JSobj) {
  465. let parent = elem.parentElement;
  466. let now_name;
  467. try {
  468. now_name = parent.className;
  469. } catch (e) {
  470. // 没有父级元素了,返回null
  471. return "no parent node";
  472. }
  473. let iterator_count = JSobj.iterator_count;
  474. if (iterator_count > 9) {
  475. // 超过最大迭代次数,认为不存在,返回null
  476. JSobj.iterator_count = 0;
  477. return "over max iterator counts limit";
  478. } else {
  479. JSobj.iterator_count += 1;
  480. }
  481. // 如果类名匹配,返回该节点
  482. if (now_name.split(" ").includes(class_name)) {
  483. iterator_count = 0;
  484. return parent;
  485. }
  486. return this.getParentByClassName(class_name, parent, JSobj);
  487. },
  488.  
  489. /**
  490. * 将func绑定到window.onscroll,并设置触发频率
  491. * @param {Function} func scroll的监听函数
  492. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  493. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  494. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  495. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  496. */
  497. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "") {
  498. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  499. JSobj.scroll_count += 1;
  500.  
  501. if (JSobj.scroll_count < useful_range) {
  502. func();
  503. console.log(hint);
  504. } else if (JSobj.scroll_count > wait_range) {
  505. JSobj.scroll_count = 0;
  506. }
  507. };
  508. window.onscroll = () => {
  509. new_func(func, JSobj, useful_range, wait_range, hint);
  510. };
  511. },
  512.  
  513. /**
  514. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  515. */
  516. createBtns: function() {
  517. // 创建按钮组
  518. let section = document.createElement("section");
  519. section.className = "btns_section";
  520. section.innerHTML = `
  521. <p class="logo_tit">Wenku Doc Downloader</p>
  522. <button class="btn-1" title="请先滑到底部,使内容加载完,防止出现空白页">展开文档 😈</button>
  523. <button class="btn-2">导出图片 🖼️</button>
  524. <button class="btn-3">导出PDF 🌼</button>
  525. <button class="btn-4">未设定4</button>
  526. <button class="btn-5">未设定5</button>`;
  527. document.body.appendChild(section);
  528.  
  529. // 设定样式
  530. let style = document.createElement("style");
  531. style.innerHTML = `
  532. .btns_section{
  533. position: fixed;
  534. width: 154px;
  535. left: 10px;
  536. top: 32%;
  537. background: #E7F1FF;
  538. border: 2px solid #1676FF;
  539. padding: 0px 0px 10px 0px;
  540. font-weight: 600;
  541. border-radius: 2px;
  542. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  543. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  544. 'Segoe UI Emoji', 'Segoe UI Symbol';
  545. z-index: 5000;
  546. }
  547. .logo_tit{
  548. width: 100%;
  549. background: #1676FF;
  550. text-align: center;
  551. font-size:12px ;
  552. color: #E7F1FF;
  553. line-height: 40px;
  554. height: 40px;
  555. margin: 0 0 16px 0;
  556. }
  557.  
  558. .btn-1{
  559. display: block;
  560. width: 128px;
  561. height: 28px;
  562. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  563. border-radius: 4px;
  564. color: #fff;
  565. font-size: 12px;
  566. border: none;
  567. outline: none;
  568. margin: 8px auto;
  569. font-weight: bold;
  570. cursor: pointer;
  571. opacity: .9;
  572. }
  573. .btn-2{
  574. display: none;
  575. width: 128px;
  576. height: 28px;
  577. background: #07C160;
  578. border-radius: 4px;
  579. color: #fff;
  580. font-size: 12px;
  581. border: none;
  582. outline: none;
  583. margin: 8px auto;
  584. font-weight: bold;
  585. cursor: pointer;
  586. opacity: .9;
  587. }
  588. .btn-3{
  589. display: none;
  590. width: 128px;
  591. height: 28px;
  592. background:#FA5151;
  593. border-radius: 4px;
  594. color: #fff;
  595. font-size: 12px;
  596. border: none;
  597. outline: none;
  598. margin: 8px auto;
  599. font-weight: bold;
  600. cursor: pointer;
  601. opacity: .9;
  602. }
  603. .btn-4{
  604. display: none;
  605. width: 128px;
  606. height: 28px;
  607. background: #1676FF;
  608. border-radius: 4px;
  609. color: #fff;
  610. font-size: 12px;
  611. border: none;
  612. outline: none;
  613. margin: 8px auto;
  614. font-weight: bold;
  615. cursor: pointer;
  616. opacity: .9;
  617. }
  618. .btn-5{
  619. display: none;
  620. width: 128px;
  621. height: 28px;
  622. background: #ff6600;
  623. border-radius: 4px;
  624. color: #fff;
  625. font-size: 12px;
  626. border: none;
  627. outline: none;
  628. margin: 8px auto;
  629. font-weight: bold;
  630. cursor: pointer;
  631. opacity: .9;
  632. }
  633. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  634. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  635. document.head.appendChild(style);
  636. }
  637. };
  638.  
  639. /**
  640. * 清理百度文库页面的无关元素
  641. */
  642. function clearPage_Baidu() {
  643. let selectors = [
  644. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  645. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  646. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  647. ".owner-desc-wrap, a[title='全屏显示']"
  648. ];
  649. let elem_list = document.querySelectorAll(selectors.join(", "));
  650. for (let elem of elem_list) {
  651. utils.tryToRemoveElement(elem);
  652. }
  653. let nut_selector = ".fix-searchbar-wrap, #hd";
  654. utils.forceHide(nut_selector);
  655. // 去除页面顶部空白
  656. document.querySelector("#doc").style.paddingTop = "0";
  657. }
  658.  
  659.  
  660. /**
  661. * 判断是否收集完元素,如果没有,则给出提醒
  662. * @param {Array} msg_list 附加提示信息列表
  663. * @returns bool 是否完成元素收集/冻结
  664. */
  665. function isFinished(msg_list = []) {
  666. if (!window.baiduJS.finished) {
  667. let hint = [
  668. "仍有内容未加载完,无法使用该功能",
  669. "建议从头到尾慢速地再浏览一遍",
  670. ...msg_list
  671. ];
  672. alert(hint.join("\n"));
  673. return false;
  674. }
  675. return true;
  676. }
  677.  
  678.  
  679. /**
  680. * 提取文字,导出txt。适用于百度文库
  681. */
  682. function saveText_Baidu() {
  683. // 判断是否存在文字元素
  684. let elems = document.querySelectorAll(".reader-txt-layer");
  685. if (!elems.length) {
  686. alert("当前页面没有文字元素\n如果你看到了文字说明它的原文档就是图片,所以提取不到文字");
  687. return;
  688. }
  689. // 判断页面是否加载完成
  690. if (!isFinished()) {
  691. return;
  692. }
  693. let title = document.title.split("-")[0].trim(); // 取得文档标题
  694. let page_texts = [];
  695. for (let elem of window.baiduJS.elems_map.values()) {
  696. // 取得该页文档下的全部文字
  697. let text = elem.textContent;
  698. page_texts.push(text);
  699. }
  700. utils.createAndDownloadFile(`${title}.txt`, page_texts.join("\n"));
  701. }
  702.  
  703.  
  704. /**
  705. * 动态存储".ppt-image-wrap img"图形,并导出urls
  706. * @returns
  707. */
  708. function savePicUrls_Baidu() {
  709. let urls = [];
  710. let elems = document.querySelectorAll(".ppt-image-wrap img");
  711. if (!elems.length) {
  712. alert("当前页面没有PPT图形");
  713. return;
  714. }
  715. elems.forEach((elem) => {
  716. if (elem.hasAttribute("src")) {
  717. urls.push(elem.src);
  718. } else {
  719. urls.push(elem.getAttribute("data-src"));
  720. }
  721. });
  722. utils.createAndDownloadFile("urls.csv", urls.join("\n"));
  723. }
  724.  
  725.  
  726. /**
  727. * 动态存储".reader-pic-item"图形,并导出urls
  728. * @returns
  729. */
  730. function savePicUrls_BaiduNonPPT() {
  731. // 判断是否存在非PPT图形元素
  732. let elems = document.querySelectorAll(".reader-pic-item");
  733. if (!elems.length) {
  734. alert("当前页面没有非PPT图形");
  735. return;
  736. }
  737. // 判断是否页面都加载完成
  738. if (!isFinished()) {
  739. return;
  740. }
  741. // 找到img元素,导出urls
  742. let img_urls = [];
  743. for (let elem of window.baiduJS.elems_map.values()) {
  744. // 取得img元素
  745. elem.querySelectorAll(".reader-pic-item").forEach((img) => {
  746. // 取得img链接
  747. let url = img.style.backgroundImage.split('"')[1];
  748. img_urls.push(url);
  749. });
  750. }
  751. utils.createAndDownloadFile("urls.csv", img_urls.join("\n"));
  752. }
  753.  
  754.  
  755. /**
  756. * 找出没有收录的id,需求的id列表形如:["pageNo-4", "pageNo-5", ...]
  757. * @returns 未收录的id_list: [1, 2, 3, ...]
  758. */
  759. function getUnfrozen() {
  760. // 获取已经冻结的文档元素
  761. let _frozen_ids = new Set(window.baiduJS.elems);
  762. let frozen_ids = new Set();
  763. _frozen_ids.forEach((full_id) => {
  764. // full_id: pageNo-1
  765. let id = parseInt(full_id.split("-")[1]);
  766. frozen_ids.add(id);
  767. });
  768.  
  769. if (!frozen_ids.size) {
  770. return ["all pages"];
  771. }
  772.  
  773. // 取得基础页码
  774. let a_id = utils.setPop(frozen_ids);
  775. let basis = parseInt(a_id / 50) * 50;
  776. // 获取全部文档元素
  777. let all_ids = new Set();
  778. let all_elems = document.querySelectorAll(".mod.reader-page.complex[class*=reader-page]");
  779. all_elems.forEach((elem) => {
  780. // ['mod', 'reader-page', 'complex', 'hidden-doc-banner', 'reader-page-1'] -> "1" -> 1
  781. let id = parseInt(elem.className.split(" ").at(-1).split("-")[2]);
  782. all_ids.add(basis + id);
  783. });
  784.  
  785. // 求差集,取得未冻结的
  786. let unfrozen_set = utils.difference(all_ids, frozen_ids);
  787. let unfrozen_list = Array.from(unfrozen_set);
  788. unfrozen_list.sort((prev, next) => { return prev - next; });
  789. // 打印日志
  790. console.log([
  791. `all_ids: ${Array.from(all_ids)}`,
  792. `frozen_ids: ${Array.from(frozen_ids)}`,
  793. `unfrozen_list: ${unfrozen_list}`
  794. ].join("\n"));
  795. return unfrozen_list;
  796. }
  797.  
  798.  
  799. /**
  800. * 适用于【带有api=1】get参数的页面。可以打印页面。
  801. * @returns
  802. */
  803. function printPage_Baidu() {
  804. // 判断是否页面都加载完成
  805. let msg_list = [
  806. "未加载的页面如下:",
  807. getUnfrozen().join(", ")
  808. ];
  809. if (!isFinished(msg_list)) {
  810. return;
  811. }
  812. let next50pages = document.querySelector(".pageList-btn.next-pageList");
  813. utils.tryToRemoveElement(next50pages);
  814. utils.hideBtnThenPrint();
  815. }
  816.  
  817.  
  818. /**
  819. * 适用于【*不*带有api=1】get参数的页面。可以打印页面。
  820. * @returns
  821. */
  822. function printPage_BaiduNoArgs() {
  823. // 判断是否页面都加载完成
  824. let msg_list = [
  825. "未加载的页面如下:",
  826. getUnfrozen().join(", ")
  827. ];
  828. if (!isFinished(msg_list)) {
  829. return;
  830. }
  831. // 清理页面
  832. clearPage_Baidu();
  833. // 隐藏上下页按钮
  834. document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
  835. elem.setAttribute("style", "display: none !important;");
  836. });
  837. // 打印
  838. utils.hideBtnThenPrint();
  839. // 显示上下页按钮
  840. document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
  841. elem.style.display = "block";
  842. });
  843. }
  844.  
  845.  
  846. /**
  847. * 调整页间距为 width px
  848. * @param {Number} width 页间距
  849. */
  850. function adjustSpace(width) {
  851. // 调整页间距
  852. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  853. document.querySelectorAll(space_selector).forEach((space) => {
  854. space.style.margin = `0 0 ${width}px`;
  855. });
  856. console.log(`页间距已经调整为:${width}px`);
  857. }
  858.  
  859.  
  860. function userAdjustSpace() {
  861. let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
  862. let space = document.querySelector(space_selector);
  863. let old_width = getComputedStyle(space).marginBottom;
  864. let width_str = prompt(`当前页间距为:${old_width}\n请输入调整后的页间距(0-500的整数):`);
  865. let width = parseInt(width_str);
  866. width = Number.isInteger(width) && (0 <= width <= 500) ? width : parseInt(old_width);
  867. adjustSpace(width);
  868. console.log(`调整后的页间距为:${width}px`);
  869. }
  870.  
  871.  
  872. /**
  873. * 根据键中的id数字对map排序
  874. * @param {Map} elems_map
  875. * @returns sorted_map
  876. */
  877. function sortMapByID$1(elems_map) {
  878. // id形式:pageNo-10
  879. let elems_arr = Array.from(elems_map);
  880. elems_arr.sort((item1, item2) => {
  881. // 从key中取出id
  882. let id1 = parseInt(item1[0].split("-")[1]);
  883. let id2 = parseInt(item2[0].split("-")[1]);
  884. // 升序排序
  885. return id1 - id2;
  886. });
  887. // 返回排序好的map
  888. return new Map(elems_arr);
  889. }
  890.  
  891.  
  892. /**
  893. * 存储html元素。适用于百度文库的文字型文档
  894. */
  895. function storeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  896. let elems_map = window.baiduJS.elems_map;
  897. document.querySelectorAll(selector).forEach(
  898. (elem) => {
  899. let origin_page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  900. if (typeof(origin_page_elem) === "string") {
  901. return;
  902. }
  903. // 复制元素防止丢失
  904. let page_elem = origin_page_elem.cloneNode(true);
  905. // 移除data标签,切断vue对数据的渲染控制
  906. page_elem.removeAttribute("data-page-no");
  907. let id = page_elem.id; // id的形式:pageNo-10
  908. if (!elems_map.has(id)) {
  909. elems_map.set(id, page_elem);
  910. }
  911. });
  912. if (elems_map.size === window.baiduJS.max_page) {
  913. // 根据id排序,保证导出的图片链接不是乱序的
  914. window.baiduJS.elems_map = sortMapByID$1(window.baiduJS.elems_map);
  915. // 已经保存完全部文档页元素,移除滚动事件的绑定函数
  916. window.baiduJS.finished = true;
  917. window.onscroll = () => { };
  918. }
  919. }
  920.  
  921.  
  922. /**
  923. * 移除html元素上的data标签,切断vue的数据渲染控制。适用于百度文库的文字型文档
  924. * @param {String} selector 要移除 data-page-no属性 的元素选择器
  925. */
  926. function freezeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
  927. let elems = window.baiduJS.elems;
  928. document.querySelectorAll(selector).forEach(
  929. (elem) => {
  930. let page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
  931. if (typeof(page_elem) === "string") {
  932. return;
  933. }
  934. // 移除data标签,切断vue对数据的渲染控制
  935. page_elem.removeAttribute("data-page-no");
  936. // 存储已经冻结的元素id
  937. let id = page_elem.id; // id的形式:pageNo-10
  938. if (!elems.includes(id)) {
  939. elems.push(id);
  940. }
  941. });
  942. if (elems.length === window.baiduJS.max_page) {
  943. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  944. window.baiduJS.finished = true;
  945. window.onscroll = () => { };
  946. }
  947. }
  948.  
  949.  
  950. /**
  951. * 递归的展开百度文档,适用于旧版页面。
  952. * @param {Function} extra_task 在文档展开完成后执行的追加函数
  953. * @returns
  954. */
  955. function readMoreRecursively(extra_task = () => { }) {
  956. let go_more = document.querySelector("#html-reader-go-more");
  957. if (!go_more || go_more.style.display === "none") {
  958. // 如果不存在继续阅读按钮,或隐藏显示,则认为完成了展开
  959. console.log("wk: 文档展开完成");
  960. extra_task();
  961. return;
  962. }
  963. let read_more = go_more.querySelector(".moreBtn.goBtn");
  964. read_more.click();
  965. console.log("wk: 展开文档");
  966. setTimeout(readMoreRecursively, 500);
  967. }
  968.  
  969.  
  970. /**
  971. * 统计文档页的数量
  972. * @param {String} selector 文档页元素选择器
  973. * @returns 文档页的数量
  974. */
  975. function countPages(selector = ".mod.reader-page.complex[class*=reader-page]") {
  976. let all_elems = document.querySelectorAll(selector);
  977. return all_elems.length;
  978. }
  979.  
  980.  
  981. function baiduWenku_OldVer() {
  982. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  983. let real_max_page;
  984. try {
  985. real_max_page = parseInt(document.querySelector(".page-count").textContent.replace("/", ""));
  986. } catch (e) {
  987. real_max_page = countPages();
  988. }
  989.  
  990. window.baiduJS = {
  991. max_page: countPages(), // 当前文档页面数量
  992. real_max_page: real_max_page, // 当前文档的总页数
  993. iterator_count: 0, // getParentByClassName的最大迭代次数为9
  994. finished: false, // 是否收集完了全部文档页元素
  995. scroll_count: 0, // 用于统计累计触发scroll的次数
  996. elems: [], // 存储已经冻结的元素id
  997. elems_map: new Map() // id: element
  998. };
  999.  
  1000. if (location.href.includes("?share_api=1&width=800")) {
  1001. // 带分享参数的页面,适用于word和excel
  1002.  
  1003. // 跟随浏览,动态冻结页面元素
  1004. utils.scrollFunc(freezeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 冻结");
  1005.  
  1006. // 隐藏按钮
  1007. utils.toggleBtnStatus("btn_1");
  1008. // 显示按钮
  1009. utils.toggleBtnStatus("btn_2");
  1010. utils.toggleBtnStatus("btn_3");
  1011. // 绑定事件到按钮
  1012. // 按钮2:调整页间距
  1013. utils.setBtnEvent(userAdjustSpace, [], "btn_2", "调整页间距");
  1014. // 按钮3:打印页面到PDF
  1015. utils.setBtnEvent(printPage_Baidu, [], "btn_3", "打印页面到PDF");
  1016.  
  1017. } else if (location.href.includes("\u002f\u0073\u0068\u0061\u0072\u0065\u002f")) {
  1018. // old version for fetch doc elements
  1019. // 跟随浏览,动态收集页面元素
  1020. utils.scrollFunc(storeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 收集");
  1021.  
  1022. // 隐藏按钮
  1023. utils.toggleBtnStatus("btn_1");
  1024. // 显示按钮
  1025. utils.toggleBtnStatus("btn_2");
  1026. utils.toggleBtnStatus("btn_3");
  1027. utils.toggleBtnStatus("btn_4");
  1028. utils.toggleBtnStatus("btn_5");
  1029. // 绑定事件到按钮
  1030. utils.setBtnEvent(saveText_Baidu, [], "btn_3", "导出纯文本");
  1031. utils.setBtnEvent(savePicUrls_Baidu, [], "btn_4", "导出图片链接(仅PPT)");
  1032. utils.setBtnEvent(savePicUrls_BaiduNonPPT, [], "btn_5", "导出图片链接(除PPT)");
  1033. // btn_2
  1034. utils.setBtnEvent(() => {
  1035. if (confirm("仅对excel和word文档有效,是否继续?")) {
  1036. let href_without_args = location.href.split("?")[0];
  1037. if (window.baiduJS.real_max_page <= 50) {
  1038. // 在api=1的旧版分享页面处理不大于50页的文档
  1039. location.href = `${href_without_args}?share_api=1&width=800`;
  1040. } else {
  1041. // 在无参数的旧版页面处理超过50页的文档
  1042. // 跟随浏览,动态冻结页面元素
  1043. window.baiduJS.finished = false;
  1044. utils.scrollFunc(freezeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 冻结");
  1045. // 重新绑定按钮监听器
  1046. utils.setBtnEvent(userAdjustSpace, [], "btn_4", "调整页间距");
  1047. utils.setBtnEvent(printPage_BaiduNoArgs, [], "btn_3", "打印页面到PDF◈");
  1048. alert("正在截获文档内容,请上下浏览页面后再次点击该按钮");
  1049.  
  1050. // 隐藏按钮
  1051. utils.toggleBtnStatus("btn_2");
  1052. utils.toggleBtnStatus("btn_5");
  1053. }
  1054. }
  1055. }, [], "btn_2", "打印页面到PDF");
  1056. } else {
  1057. console.log(`无法识别的页面:${location.href}`);
  1058. }
  1059. }
  1060.  
  1061.  
  1062. /**
  1063. * 百度文档下载策略
  1064. */
  1065. function baiduWenku() {
  1066. // 允许打印页面
  1067. utils.allowPrint();
  1068. // 原文档解析到预览文档
  1069. if (location.href.includes("\u002f\u0076\u0069\u0065\u0077\u002f")) {
  1070. utils.createBtns();
  1071. let jump2sharePage_Baidu = function() {
  1072. location.href = `https://${location.host}${location.pathname.replace("\u0076\u0069\u0065\u0077", "\u0073\u0068\u0061\u0072\u0065")}`;
  1073. };
  1074. utils.setBtnEvent(jump2sharePage_Baidu, [], "btn_1");
  1075. } else {
  1076. // 在完全展开文档后启用旧版页面处理函数
  1077. // 创建按钮组
  1078. console.log("\n\nwk: 进入旧版页面\n\n\n");
  1079. utils.createBtns();
  1080. utils.setBtnEvent(readMoreRecursively, [baiduWenku_OldVer], "btn_1");
  1081. }
  1082. }
  1083.  
  1084. /**
  1085. * 展开道客巴巴的文档
  1086. */
  1087. function readAllDoc88() {
  1088. // 获取“继续阅读”按钮
  1089. let continue_btn = document.querySelector("#continueButton");
  1090. // 如果存在“继续阅读”按钮
  1091. if (continue_btn) {
  1092. // 跳转到文末(等同于展开全文)
  1093. let cur_page = document.querySelector("#pageNumInput");
  1094. // 取得最大页码
  1095. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1096. // 跳转到尾页
  1097. utils.jump2pageNo(cur_page, page_max, "keypress");
  1098. // 返回顶部
  1099. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1100. }
  1101. // 文档展开后,显示按钮2、3
  1102. else {
  1103. // 隐藏按钮
  1104. utils.toggleBtnStatus("btn_1");
  1105. // 显示按钮
  1106. utils.toggleBtnStatus("btn_2");
  1107. utils.toggleBtnStatus("btn_3");
  1108. }
  1109. }
  1110.  
  1111. /**
  1112. * 道客巴巴文档下载策略
  1113. */
  1114. function doc88() {
  1115. // 创建脚本启动按钮1、2
  1116. utils.createBtns();
  1117.  
  1118. // 绑定主函数
  1119. let prepare = function() {
  1120. // 获取canvas元素列表
  1121. let node_list = document.querySelectorAll(".inner_page");
  1122. // 获取文档标题
  1123. let title;
  1124. if (document.querySelector(".doctopic h1")) {
  1125. title = document.querySelector(".doctopic h1").title;
  1126. } else {
  1127. title = "文档";
  1128. }
  1129. return [node_list, title];
  1130. };
  1131.  
  1132. // btn_1: 展开文档
  1133. utils.setBtnEvent(() => {
  1134. readAllDoc88();
  1135. }, [], "btn_1");
  1136. // btn_2: 导出zip
  1137. utils.setBtnEvent(() => {
  1138. if (confirm("确定每页内容都加载完成了吗?")) {
  1139. utils.saveCanvasesToZip(...prepare());
  1140. }
  1141. }, [], "btn_2", "导出图片到zip");
  1142. // btn_3: 导出PDF
  1143. utils.setBtnEvent(() => {
  1144. if (confirm("确定每页内容都加载完成了吗?")) {
  1145. utils.saveCanvasesToPDF(...prepare());
  1146. }
  1147. }, [], "btn_3", "导出图片到PDF");
  1148. }
  1149.  
  1150. // 绑定主函数
  1151. function getCanvasList() {
  1152. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1153. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1154. let node_list = [];
  1155. for (let node of parent_node_list) {
  1156. node_list.push(node.children[0]);
  1157. }
  1158. return node_list;
  1159. }
  1160.  
  1161.  
  1162. function prepare() {
  1163. // 获取canvas元素列表
  1164. let node_list = getCanvasList();
  1165. // 获取文档标题
  1166. let title;
  1167. if (document.querySelector("h1 [title=doc]")) {
  1168. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1169. } else if (document.querySelector(".doc_title")) {
  1170. title = document.querySelector(".doc_title").textContent;
  1171. } else {
  1172. title = "文档";
  1173. }
  1174. return [node_list, title];
  1175. }
  1176.  
  1177.  
  1178. // 判断是否有canvas元素
  1179. function detectCanvas() {
  1180. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1181.  
  1182. // 隐藏按钮
  1183. utils.toggleBtnStatus("btn_1");
  1184. // 显示按钮
  1185. utils.toggleBtnStatus("btn_2");
  1186.  
  1187. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1188. if (!haveCanvas) {
  1189. // btn_2: 导出图片链接
  1190. utils.setBtnEvent(() => {
  1191. if (confirm("确定每页内容都加载完成了吗?")) {
  1192. utils.savePicUrls("[id*=img_]");
  1193. }
  1194. }, [], "btn_2", "导出全部图片链接");
  1195. } else {
  1196. // 显示按钮3
  1197. utils.toggleBtnStatus("btn_3");
  1198. // btn_2: 导出zip
  1199. utils.setBtnEvent(() => {
  1200. if (confirm("确定每页内容都加载完成了吗?")) {
  1201. utils.saveCanvasesToZip(...prepare());
  1202. }
  1203. }, [], "btn_2", "导出图片到zip");
  1204. // btn_3: 导出PDF
  1205. utils.setBtnEvent(() => {
  1206. if (confirm("确定每页内容都加载完成了吗?")) {
  1207. utils.saveCanvasesToPDF(...prepare());
  1208. }
  1209. }, [], "btn_3", "导出图片到PDF");
  1210. }
  1211. }
  1212.  
  1213.  
  1214. /**
  1215. * 豆丁文档下载策略
  1216. */
  1217. function docin() {
  1218. // 创建脚本启动按钮
  1219. utils.createBtns();
  1220.  
  1221. // 隐藏底部工具栏
  1222. document.querySelector("#j_select").click(); // 选择指针
  1223. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1224. tool_bar.style.display = "none";
  1225.  
  1226. // btn_1: 判断文档类型
  1227. utils.setBtnEvent(() => {
  1228. utils.forceHide(".jz_watermark");
  1229. detectCanvas();
  1230. }, [], "btn_1", "判断文档类型");
  1231. }
  1232.  
  1233. /**
  1234. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1235. */
  1236. function readAlliShare() {
  1237. // 获取“继续阅读”元素
  1238. let red_btn = document.getElementsByClassName("red-color")[0];
  1239. let red_text = red_btn.textContent;
  1240. // 如果可以展开,则展开
  1241. if (red_text.search("点击可继续阅读") !== -1) {
  1242. red_btn.click();
  1243. setTimeout(readAlliShare, 1000);
  1244. }
  1245. // 否则启动按钮2,准备清理页面然后打印为PDF
  1246. else {
  1247. // 隐藏按钮
  1248. utils.toggleBtnStatus("btn_1");
  1249. // 显示按钮
  1250. utils.toggleBtnStatus("btn_2");
  1251. utils.toggleBtnStatus("btn_3");
  1252.  
  1253. // 显示svg图片的链接
  1254. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1255. if (!page1) {
  1256. // 如果不存在svg图形,终止后续代码
  1257. console.log("当前页面不存在svg图形");
  1258. return;
  1259. }
  1260. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1261. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1262. svg1_src_div.innerHTML = `<div id="src-1"
  1263. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1264. 访问以下链接以复制文字:<br>${page1.src}
  1265. </div>`;
  1266. svg2_src_div.innerHTML = `<div id="src-1"
  1267. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1268. 访问以下链接以复制文字:<br>${page2.src}
  1269. </div>`;
  1270. // 添加到页面上
  1271. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1272. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1273. }
  1274. }
  1275.  
  1276.  
  1277. /**
  1278. * 清理并打印爱问共享资料的文档页
  1279. * @returns 如果输入偏移量非法,返回空值以终止函数
  1280. */
  1281. function printPageiShare() {
  1282. // # 清理并打印爱问共享资料的文档页
  1283. // ## 移除页面上无关的元素
  1284. // ### 移除单个元素
  1285. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1286. let header = document.getElementsByClassName("new-detail-header")[0];
  1287. let fixright = document.getElementById("fix-right");
  1288. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1289. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1290. let footer = document.getElementsByClassName("website-footer")[0];
  1291. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1292. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1293. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1294. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1295. let crumb_arrow;
  1296. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1297. let copyright = document.getElementsByClassName("copyright-container")[0];
  1298. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1299. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1300. // ### 执行移除
  1301. let elem_list = [
  1302. topbanner,
  1303. header,
  1304. fixright,
  1305. redpacket,
  1306. fixedrightfull,
  1307. footer,
  1308. guess,
  1309. detailtopbox,
  1310. fullscreen,
  1311. endhint,
  1312. crumb_arrow,
  1313. copyright,
  1314. state_btn,
  1315. comments
  1316. ];
  1317. for (let elem of elem_list) {
  1318. utils.tryToRemoveElement(elem);
  1319. }
  1320. // ### 移除全部同类元素
  1321. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1322. for (let elem_2 of elem_list_2) {
  1323. utils.tryToRemoveElement(elem_2);
  1324. }
  1325. // 使文档居中
  1326. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1327. if (!utils.centerDoc("doc-main", "18")) {
  1328. return; // 如果输入非法,终止函数调用
  1329. }
  1330. // 隐藏按钮,然后打印页面
  1331. utils.hideBtnThenPrint();
  1332. }
  1333.  
  1334.  
  1335. /**
  1336. * 爱问共享资料文档下载策略
  1337. */
  1338. function ishare() {
  1339. // 创建脚本启动按钮1、2
  1340. utils.createBtns();
  1341.  
  1342. // btn_1: 展开文档
  1343. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1344. // btn_2: 导出图片链接
  1345. utils.setBtnEvent(() => {
  1346. utils.savePicUrls(".data-detail");
  1347. }, [], "btn_2", "导出图片链接(推荐)");
  1348. // btn_3: 打印页面到PDF
  1349. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1350.  
  1351. // 移除底部下载条
  1352. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1353. utils.tryToRemoveElement(detailfixed);
  1354. }
  1355.  
  1356. /**
  1357. * 清理并打印得力文库的文档页
  1358. */
  1359. function printPageDeliwenku() {
  1360. // 移除页面上的无关元素
  1361. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1362. let elem_list = document.querySelectorAll(selector);
  1363. for (let elem of elem_list) {
  1364. utils.tryToRemoveElement(elem);
  1365. }
  1366. // 修改页间距
  1367. let outer_pages = document.getElementsByClassName("outer_page");
  1368. for (let page of outer_pages) {
  1369. page.style.marginBottom = "20px";
  1370. }
  1371. // 使文档居中
  1372. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1373. if (!utils.centerDoc("#boxleft", "3")) {
  1374. return; // 如果输入非法,终止函数调用
  1375. }
  1376. // 打印文档
  1377. utils.hideBtnThenPrint();
  1378. }
  1379.  
  1380.  
  1381. /**
  1382. * 点击“继续阅读”,适用性:得力文库
  1383. */
  1384. function readAllDeliwenku() {
  1385. // 点击“同意并开始预览全文”
  1386. let start_btn = document.getElementsByClassName("pre_button")[0];
  1387. let display = start_btn.parentElement.parentElement.style.display;
  1388. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1389. if (!display) {
  1390. start_btn.children[0].click();
  1391. setTimeout("scroll(0, document.body.scrollHeight)", 200);
  1392. return;
  1393. }
  1394. // 增强按钮点击效果
  1395. utils.enhanceBtnClickReaction();
  1396.  
  1397. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1398. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1399. // 继续阅读
  1400. if (display2 !== "none") {
  1401. // 获取input元素
  1402. let cur_page = document.querySelector("#pageNumInput");
  1403. let page_old = cur_page.value;
  1404. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1405. // 跳转到尾页
  1406. utils.jump2pageNo(cur_page, page_max, "keydown");
  1407. // 跳转回来
  1408. utils.jump2pageNo(cur_page, page_old, "keydown");
  1409.  
  1410. // 切换按钮准备导出
  1411. } else {
  1412. // 推荐导出图片链接
  1413. utils.modifyBtnText("btn_2", null, true);
  1414. // 隐藏按钮
  1415. utils.toggleBtnStatus("btn_1");
  1416. // 显示按钮
  1417. utils.toggleBtnStatus("btn_2");
  1418. utils.toggleBtnStatus("btn_3");
  1419. // btn_3 橙色按钮
  1420. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1421. }
  1422. }
  1423.  
  1424.  
  1425. /**
  1426. * 得力文库文档下载策略
  1427. */
  1428. function deliwenku() {
  1429. // 创建脚本启动按钮1、2
  1430. utils.createBtns();
  1431.  
  1432. // btn_1: 展开文档
  1433. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1434. // btn_2: 导出图片链接
  1435. utils.setBtnEvent(() => {
  1436. if (confirm("确定每页内容都加载完成了吗?")) {
  1437. utils.savePicUrls('.inner_page div');
  1438. }
  1439. }, [], "btn_2", "导出图片链接");
  1440.  
  1441. // 尝试关闭页面弹窗
  1442. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1443. // 解除打印限制
  1444. utils.allowPrint();
  1445. }
  1446.  
  1447. function readAll360Doc() {
  1448. // 展开文档
  1449. document.querySelector(".articleMaxH").setAttribute("class", "");
  1450. // 隐藏按钮
  1451. utils.toggleBtnStatus("btn_1");
  1452. // 显示按钮
  1453. utils.toggleBtnStatus("btn_2");
  1454. utils.toggleBtnStatus("btn_3");
  1455. }
  1456.  
  1457.  
  1458. function saveText_360Doc() {
  1459. // 捕获图片链接
  1460. let images = document.querySelectorAll("#artContent img");
  1461. let content = [];
  1462.  
  1463. for (let i = 0; i < images.length; i++) {
  1464. let src = images[i].src;
  1465. content.push(`图${i+1},链接:${src}`);
  1466. }
  1467. // 捕获文本
  1468. let text = document.querySelector("#artContent").textContent;
  1469. content.push(text);
  1470.  
  1471. // 保存纯文本文档
  1472. let title = document.querySelector("#titiletext").textContent;
  1473. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1474. }
  1475.  
  1476.  
  1477. function printPage360Doc() {
  1478. // # 清理并打印360doc的文档页
  1479. // ## 移除页面上无关的元素
  1480. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1481. let elem_list = document.querySelectorAll(selector);
  1482. let under_doc_1, under_doc_2;
  1483. try {
  1484. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1485. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1486. } catch (e) { console.log(); }
  1487. // 执行移除
  1488. for (let elem of elem_list) {
  1489. utils.tryToRemoveElement(elem);
  1490. }
  1491. utils.tryToRemoveElement(under_doc_1);
  1492. utils.tryToRemoveElement(under_doc_2);
  1493. // 执行隐藏
  1494. document.querySelector("a[title]").style.display = "none";
  1495.  
  1496. // 使文档居中
  1497. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1498. if (!utils.centerDoc(".a_left", "20")) {
  1499. return; // 如果输入非法,终止函数调用
  1500. }
  1501. // 隐藏按钮,然后打印页面
  1502. utils.hideBtnThenPrint();
  1503. }
  1504.  
  1505.  
  1506. /**
  1507. * 360doc个人图书馆下载策略
  1508. */
  1509. function doc360() {
  1510. // 创建按钮区
  1511. utils.createBtns();
  1512. // btn_1: 展开文档
  1513. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1514. // btn_2: 导出纯文本
  1515. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1516. // btn_3: 打印页面到PDF
  1517. utils.setBtnEvent(() => {
  1518. if (confirm("确定每页内容都加载完成了吗?")) {
  1519. printPage360Doc();
  1520. }
  1521. }, [], "btn_3", "打印页面到PDF");
  1522. }
  1523.  
  1524. /**
  1525. * 查找出所有未被捕获的页码,并返回列表
  1526. * @returns 未捕获页码列表
  1527. */
  1528. function getMissedPages() {
  1529. let all = []; // 全部页码
  1530. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1531. all[i] = i + 1;
  1532. }
  1533. let missed = []; // 未捕获页码
  1534. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1535.  
  1536. // 排除并录入未捕获页码
  1537. for (let num of all) {
  1538. if (!possessed.includes(`page${num}`)) {
  1539. missed.push(num);
  1540. }
  1541. }
  1542. return missed;
  1543. }
  1544.  
  1545.  
  1546. /**
  1547. * 根据键中的id数字对map排序
  1548. * @param {Map} elems_map
  1549. * @returns sorted_map
  1550. */
  1551. function sortMapByID(elems_map) {
  1552. // id形式:page2
  1553. let elems_arr = Array.from(elems_map);
  1554. elems_arr.sort((item1, item2) => {
  1555. // 从key中取出id
  1556. let id1 = parseInt(item1[0].replace("page", ""));
  1557. let id2 = parseInt(item2[0].replace("page", ""));
  1558. // 升序排序
  1559. return id1 - id2;
  1560. });
  1561. // 返回排序好的map
  1562. return new Map(elems_arr);
  1563. }
  1564.  
  1565.  
  1566. /**
  1567. * 存储动态加载的canvas元素、textContent
  1568. */
  1569. function storeElements_MBA() {
  1570. let canvases_map = window.mbaJS.canvases_map;
  1571. let texts_map = window.mbaJS.texts_map;
  1572. let quality = window.mbaJS.quality;
  1573.  
  1574. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1575. (elem) => {
  1576. let capture = (elem) => {
  1577. // (1) 存储页面为canvas图形
  1578. let canvas, data_base64;
  1579. // 导出canvas数据防止丢失
  1580. try {
  1581. // 存储canvas
  1582. canvas = elem.querySelector("canvas[id*=page]");
  1583. if (window.mbaJS.only_text) {
  1584. data_base64 = null;
  1585. } else {
  1586. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1587. }
  1588. } catch (e) {
  1589. // utils.sleep(500);
  1590. return;
  1591. }
  1592. // 增量录入map
  1593. let id = canvas.id; // id的形式:page2
  1594. if (!canvases_map.has(id)) {
  1595. canvases_map.set(id, data_base64);
  1596. }
  1597. // 确定canvas长宽
  1598. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1599. window.mbaJS.width = parseInt(canvas.width);
  1600. window.mbaJS.height = parseInt(canvas.height);
  1601. }
  1602.  
  1603. // (2) 存储text
  1604. let text = elem.textContent;
  1605. if (!texts_map.has(id)) {
  1606. texts_map.set(id, text);
  1607. }
  1608. };
  1609. setTimeout(capture, 500, elem);
  1610. });
  1611. if (canvases_map.size === window.mbaJS.max_page) {
  1612. // 根据id排序
  1613. window.mbaJS.canvases_map = sortMapByID(window.mbaJS.canvases_map);
  1614. window.mbaJS.texts_map = sortMapByID(window.mbaJS.texts_map);
  1615. window.mbaJS.finished = true;
  1616. window.onscroll = null;
  1617. }
  1618. }
  1619.  
  1620.  
  1621. /**
  1622. * 将canvas转为jpeg,然后导出PDF
  1623. * @param {Array} base64_list canvas元素列表
  1624. * @param {String} title 文档标题
  1625. */
  1626. function saveCanvasesToPDF_MBA(base64_list, title) {
  1627. let width = window.mbaJS.width;
  1628. let height = window.mbaJS.height;
  1629.  
  1630. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1631. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1632. let orientation = width > height ? 'l' : 'p';
  1633. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1634.  
  1635. // 保存每一页文档到每一页pdf
  1636. let i = 0;
  1637. for (let base64 of base64_list) {
  1638. i += 1;
  1639. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1640. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1641. if (i < window.mbaJS.max_page) {
  1642. pdf.addPage();
  1643. }
  1644. }
  1645. // 导出文件
  1646. pdf.save(`${title}.pdf`);
  1647. }
  1648.  
  1649. /**
  1650. * 判断文档页是否收集完毕,当不行时给出提示
  1651. * @returns boolean
  1652. */
  1653. function ready2use() {
  1654. removeAds(); // 顺便清理广告
  1655. // 如果是首次点击按钮,给出提示
  1656. if (window.mbaJS.first_hint) {
  1657. let hint = [
  1658. "如果浏览速度过快,比如:",
  1659. "当前页面还没完全加载好就滚动页面去看下一页",
  1660. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1661. "由防范技术的干扰,该功能目前很不好用,见谅"
  1662. ].join("\n");
  1663. alert(hint);
  1664. window.mbaJS.first_hint = false;
  1665. }
  1666. // 如果文档页没有收集完,给出提示
  1667. if (!window.mbaJS.finished) {
  1668. let hint = [
  1669. "仍有内容未加载完,无法使用该功能",
  1670. "建议从头到尾慢速地再浏览一遍",
  1671. "以下是没有加载完成页面的页码:",
  1672. getMissedPages().join(",")
  1673. ];
  1674. alert(hint.join("\n"));
  1675. return false;
  1676. }
  1677. return true;
  1678. }
  1679.  
  1680.  
  1681. /**
  1682. * 用捕获好的canvas转jpg,生成PDF
  1683. * @returns
  1684. */
  1685. function canvas2PDF_mba() {
  1686. if (!ready2use()) {
  1687. return;
  1688. }
  1689. let canvases = window.mbaJS.canvases_map.values();
  1690. // 导出PDF
  1691. let title = document.title.split("-")[0].trim();
  1692. saveCanvasesToPDF_MBA(canvases, title);
  1693. }
  1694.  
  1695.  
  1696. /**
  1697. * 拼合捕获好的文本,保存到txt文件
  1698. * @returns
  1699. */
  1700. function saveText_mba() {
  1701. if (!ready2use()) {
  1702. return;
  1703. }
  1704. let content = Array.from(window.mbaJS.texts_map.values());
  1705. let title = document.title.split("-")[0].trim();
  1706. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1707. }
  1708.  
  1709.  
  1710. /**
  1711. * 移除广告
  1712. */
  1713. function removeAds() {
  1714. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1715. utils.tryToRemoveElement(ad_elem);
  1716. });
  1717. }
  1718.  
  1719.  
  1720. function mbalib_() {
  1721. // 移除广告和左侧工具栏
  1722. removeAds();
  1723. let tool_bar = document.querySelector(".tool-bar");
  1724. utils.tryToRemoveElement(tool_bar);
  1725.  
  1726. // 创建按钮
  1727. utils.createBtns();
  1728. // 隐藏按钮
  1729. utils.toggleBtnStatus("btn_1");
  1730. // 显示按钮
  1731. utils.toggleBtnStatus("btn_2");
  1732. utils.toggleBtnStatus("btn_3");
  1733. utils.toggleBtnStatus("btn_4");
  1734.  
  1735. // 取得页数
  1736. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1737. let quality = utils.getQualityByCanvasAmount(max_page);
  1738.  
  1739. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1740. window.mbaJS = {
  1741. max_page: max_page,
  1742. texts_map: new Map(), // id: text
  1743. canvases_map: new Map(), // id: canvas_data_base64
  1744. quality: quality, // canvas转jpg的质量
  1745. width: null, // canvas宽度(px)
  1746. height: null,
  1747. finished: false, // 是否收集完了全部文档页元素
  1748. first_hint: true,
  1749. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1750. only_text: false // 是否仅捕获文本
  1751. };
  1752. // 跟随浏览,动态收集页面元素
  1753. window.onscroll = () => {
  1754. storeElements_MBA();
  1755. };
  1756. // 跟随浏览,动态收集页面元素
  1757. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  1758. // 绑定事件
  1759. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  1760. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  1761.  
  1762. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  1763. let btn_text, aim_btn, hint;
  1764. if (max_page > 40) {
  1765. btn_text = "失效说明";
  1766. aim_btn = "btn_3";
  1767. hint = [
  1768. "页数超过40,脚本无效",
  1769. "只能使用导出文本功能",
  1770. "而此脚本会使页面内容加载明显变慢,建议禁用"
  1771. ];
  1772. utils.setBtnEvent(utils.banSelf, [
  1773. () => { window.onscroll = null; }
  1774. ], "btn_4", "临时禁用脚本");
  1775. } else {
  1776. btn_text = "空白页说明";
  1777. aim_btn = "btn_4";
  1778. hint = [
  1779. "导致空白页的原因如下",
  1780. "加载该页的时间超过2秒 / 明显等待",
  1781. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  1782. ];
  1783. }
  1784.  
  1785. utils.setBtnEvent(() => {
  1786. alert(hint.join("\n"));
  1787. }, [], aim_btn, btn_text);
  1788. }
  1789.  
  1790.  
  1791. function mbalib() {
  1792. setTimeout(mbalib_, 2000);
  1793. }
  1794.  
  1795. /**
  1796. * 主函数:识别网站,执行对应文档下载策略
  1797. */
  1798. function main() {
  1799. let host = window.location.host;
  1800. console.log(`当前host: ${host}`);
  1801. window.user_utils = utils;
  1802. console.log("wk: user_utils已经挂载到全局");
  1803.  
  1804. if (host.includes("docin.com")) {
  1805. docin();
  1806. } else if (host === "ishare.iask.sina.com.cn") {
  1807. ishare();
  1808. } else if (host === "www.deliwenku.com") {
  1809. deliwenku();
  1810. } else if (host === "www.doc88.com") {
  1811. doc88();
  1812. } else if (host === "www.360doc.com") {
  1813. doc360();
  1814. } else if (host === "wenku.baidu.com") {
  1815. baiduWenku();
  1816. } else if (host === "doc.mbalib.com") {
  1817. mbalib();
  1818. } else {
  1819. console.log("匹配到了无效网页");
  1820. }
  1821. }
  1822.  
  1823. let options = {
  1824. fast_mode: false,
  1825. activation_test: false
  1826. };
  1827. if (options.cli_mode) {
  1828. (() => {
  1829. loadExternalScripts();
  1830. setTimeout(main, 2000);
  1831. return;
  1832. })();
  1833. }
  1834. if (options.activation_test) {
  1835. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  1836. }
  1837. if (options.fast_mode) {
  1838. main();
  1839. } else {
  1840. window.onload = main;
  1841. }
  1842.  
  1843. })();