- // ==UserScript==
- // @name Wenku Doc Downloader
- // @namespace http://tampermonkey.net/
- // @version 1.5.2
- // @description 下载文档,导出PDF。支持①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档(前20页) ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。暂不支持手机端,手机端请切换为电脑UA访问。
- // @author allenlv2690@gmail.com
- // @match *://*.docin.com/p-*
- // @match *://ishare.iask.sina.com.cn/f/*
- // @match *://www.deliwenku.com/p-*
- // @match *://www.doc88.com/p-*
- // @match *://www.360doc.com/content/*
- // @match *://wenku.baidu.com/*/*
- // @match *://doc.mbalib.com/view/*
- // @match *://www.woc88.com/so-*
- // @match *://www.dugen.com/p-*
- // @match *://max.book118.com/html/*
- // @match *://view-cache.book118.com/pptView.html?*
- // @match *://*.book118.com/?readpage=*
- // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
- // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
- // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
- // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
- // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
- // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
- // @grant none
- // @license GPL-3.0-only
- // @create 2021-11-22
- // @note 1. 修复了百度文库 /tfview/ 路径不可用的问题
- // @note 2. 修复了360doc 极个别情况下文档展开按钮失效的问题
- // @note 3. 修复了脚本在手机端打印页面时按钮区隐藏失效的问题
- // ==/UserScript==
-
-
- (function () {
- 'use strict';
-
- // import "./lib/jspdf.umd.min";
- // import "./lib/html2canvas.min";
- // import "./lib/jszip.min";
- // import "./lib/FileSaver.min";
-
-
- let utils = {
- ver: (() => {
- // 显示版本号
- let _ver = "wk-utils: ver-1.5.2";
- console.log(_ver);
- return _ver;
- })(),
-
- /**
- * 创建并下载文件
- * @param {String} file_name 文件名
- * @param {String | Blob} content 文本或blob
- */
- createAndDownloadFile: function(file_name, content) {
- let aTag = document.createElement('a');
- let blob;
- if (typeof(content) === "string") {
- blob = new Blob([content]);
- }
- aTag.download = file_name;
- aTag.href = URL.createObjectURL(blob);
- aTag.click();
- URL.revokeObjectURL(blob);
- },
-
- /**
- * 创建并下载链接资源
- * @param {String} file_name
- * @param {String} src
- */
- downloadUrlFile: function(file_name, src) {
- let aTag = document.createElement('a');
- aTag.download = file_name;
- aTag.href = src;
- aTag.click();
- },
-
- /**
- * 添加外部js到当前页面
- * @param {String} url
- */
- addScripts2HTML: function(url) {
- let script = document.createElement("script");
- script.src = url;
- document.head.appendChild(script);
- },
-
- /**
- * 临时禁用脚本,执行func后移除btns_section。
- * @param {Function} func
- */
- banSelf: function(func = () => { }) {
- func();
- document.querySelector(".btns_section").remove();
- },
-
- /**
- * 睡眠 delay 毫秒
- * @param {Number} delay
- */
- sleep: function(delay) {
- let start = (new Date()).getTime();
- while ((new Date()).getTime() - start < delay) {
- continue;
- }
- },
-
- /**
- * 允许打印页面
- */
- allowPrint: function() {
- let style = document.createElement("style");
- style.innerHTML = `
- @media print {
- body{
- display:block;
- }
- }
- `;
- document.head.appendChild(style);
- },
-
- /**
- * 求main_set去除cut_set后的set
- * @param {Set} main_set
- * @param {Set} cut_set
- * @returns 差集
- */
- difference: function(main_set, cut_set) {
- let _diff = new Set(main_set);
- for (let elem of cut_set) {
- _diff.delete(elem);
- }
- return _diff;
- },
-
- /**
- * 抛出set中的第一个元素
- * @param {Set} set
- * @returns 一个元素
- */
- setPop: function(set) {
- for (let item of set) {
- set.delete(item);
- return item;
- }
- },
-
- /**
- * 绑定事件到指定按钮,返回按钮引用
- * @param {Function} event click事件
- * @param {Array} args 事件的参数列表
- * @param {String} aim_btn 按钮的变量名
- * @param {String} new_text 按钮的新文本,为null则不替换
- * @returns 按钮元素的引用
- */
- setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
- let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
- // 如果需要,替换按钮内文本
- if (new_text) {
- btn.textContent = new_text;
- }
- // 绑定事件,添加到页面上
- btn.onclick = () => {
- this.enhanceBtnClickReaction(aim_btn);
- if (args.length) {
- event(...args);
- } else {
- event();
- }
- };
- return btn;
- },
-
- /**
- * 强制隐藏元素
- * @param {String} selector
- */
- forceHide: function(selector) {
- let style_cls = "force-hide";
- document.querySelectorAll(selector).forEach((elem) => {
- elem.className += ` ${style_cls}`;
- });
- // 判断css样式是否已经存在
- let style;
- style = document.querySelector(`style.${style_cls}`);
- // 如果已经存在,则无须重复创建
- if (style) {
- return;
- }
- // 否则创建
- style = document.createElement("style");
- style.innerHTML = `style.${style_cls} {
- visibility: hidden !important;
- }`;
- document.head.appendChild(style);
- },
-
- /**
- * 隐藏按钮,打印页面,显示按钮
- */
- hideBtnThenPrint: function() {
- // 隐藏按钮,然后打印页面
- let section = document.getElementsByClassName("btns_section")[0];
- section.style.display = "none";
- this.sleep(500);
- window.print();
- // 打印结束,显示按钮
- section.style.removeProperty("display");
- },
-
- /**
- * 返回times个倍数连接的str
- * @param {String} str
- * @param {Number} times
- * @returns multiplied_str
- */
- multiplyStr: function(str, times) {
- let str_list = [];
- for (let i = 0; i < times; i++) {
- str_list.push(str);
- }
- return str_list.join("");
- },
-
- /**
- * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
- * @param {String} custom_btn 按钮变量名
- */
- enhanceBtnClickReaction: function(custom_btn = null) {
- let aim_btn;
- // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
- if (!custom_btn || custom_btn === "btn_1") {
- aim_btn = document.querySelector(".btn-1");
- } else {
- aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
- }
-
- let old_color = aim_btn.style.color; // 保存旧的颜色
- let old_text = aim_btn.textContent; // 保存旧的文字内容
- // 变黑缩小
- aim_btn.style.color = "black";
- aim_btn.style.fontWeight = "normal";
- aim_btn.textContent = `->${old_text}<-`;
- // 复原加粗
- let changeColorBack = function() {
- aim_btn.style.color = old_color;
- aim_btn.style.fontWeight = "bold";
- aim_btn.textContent = old_text;
- };
- setTimeout(changeColorBack, 1250);
- },
-
- /**
- * 切换按钮显示/隐藏状态
- * @param {String} aim_btn 按钮变量名
- * @returns 按钮元素的引用
- */
- toggleBtnStatus: function(aim_btn) {
- let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
- let display = getComputedStyle(btn).display;
- // return;
- if (display === "none") {
- btn.style.display = "block";
- } else {
- btn.style.display = "none";
- }
- return btn;
- },
-
- /**
- * 根据canvas元素数量返回quality值
- * @param {Number} canvas_amount
- * @returns quality: Number
- */
- getQualityByCanvasAmount: function(canvas_amount) {
- // 如果有全局参数,优先用全局的
- if (window.img_quality !== undefined) {
- console.log(`image quality: ${window.img_quality*100}%`);
- return window.img_quality;
- }
- // 否则用默认的
- let quality;
- if (canvas_amount <= 25) {
- quality = 1.0;
- } else if (25 < canvas_amount <= 50) {
- quality = 0.9;
- } else {
- quality = 0.8;
- }
- console.log(`image quality: ${quality*100}%`);
- return quality;
- },
-
- /**
- * 挂载func到全局
- * @param {Function} func
- */
- globalFunc: function(func) {
- globalThis[func.name] = func;
- },
-
- /**
- * 用input框跳转到对应页码
- * @param {Element} cur_page 当前页码
- * @param {string} aim_page 目标页码
- * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
- */
- jump2pageNo: function(cur_page, aim_page, event_type) {
- // 设置跳转页码为目标页码
- cur_page.value = aim_page;
- // 模拟回车事件来跳转
- let keyboard_event_enter = new KeyboardEvent(event_type, {
- bubbles: true,
- cancelable: true,
- keyCode: 13
- });
- cur_page.dispatchEvent(keyboard_event_enter);
- },
-
- /**
- * 在新标签页打开链接
- * @param {String} href
- */
- openInNewTab: function(href) {
- let link = document.createElement("a");
- link.href = href;
- link.target = "_blank";
- link.click();
- },
-
- /**
- * 滚动到页面底部
- */
- scrollToBottom: function() {
- window.scrollTo({
- top: document.body.scrollHeight,
- behavior: "smooth"
- });
- },
-
- /**
- * 用try移除元素
- * @param {Element} element 要移除的元素
- */
- tryToRemoveElement: function(element) {
- try {
- element.remove();
- } catch (e) {
- }
- },
-
- /**
- * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
- * @param {Array} elem_list_box 要移除的元素列表构成的列表
- */
- tryToRemoveSameElem: function(elem_list_box) {
- for (let elem_list of elem_list_box) {
- if (!elem_list) {
- continue;
- }
- for (let elem of elem_list) {
- try {
- elem.remove();
- } catch (e) {
- console.log();
- }
- }
- }
- },
-
- /**
- * 使文档在页面上居中
- * @param {String} selector 文档容器的css选择器
- * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
- * @returns 偏移值是否合法
- */
- centerDoc: function(selector, default_offset) {
- let doc_main = document.querySelector(selector);
- let offset = window.prompt("请输入偏移百分位:", default_offset);
- // 如果输入的数字不在 0-59 内,提醒用户重新设置
- if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
- doc_main.style.marginLeft = offset + "%";
- return true;
- } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
- doc_main.style.marginLeft = offset + "%";
- return true
- } else {
- alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
- return false;
- }
- },
-
- /**
- * 调整按钮内文本
- * @param {String} aim_btn 按钮变量名
- * @param {String} new_text 新的文本,null则保留旧文本
- * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
- * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
- */
- modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
- // 提示文档已经展开
- if (use_hint) {
- let hint = "文档已经完全展开,可以导出";
- alert(hint);
- }
- let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
- // 要替换的文本
- if (new_text) {
- btn.textContent = new_text;
- }
- // 推荐按钮
- if (recommend_btn) {
- btn.textContent += "(推荐)";
- }
- },
-
- html2Canvases: async function(elem_list) {
- // 如果是空元素列表,返回null并终止函数
- if (elem_list.length === 0) {
- console.log("html2canvases was called, but no element is avaiable.");
- return null;
- }
- let tasks = []; // 存放异步任务
- let contents = []; // 存放canvas元素
- for (let elem of elem_list) {
- let task = html2canvas(elem).then((canvas) => {
- contents.push(canvas);
- });
- tasks.push(task);
- }
- // 等待全部page转化完成
- await Promise.all(tasks);
- return contents;
- },
-
- /**
- * 将html元素转为canvas再合并到pdf中,最后下载pdf
- * @param {Array} elem_list html元素列表
- * @param {String} title 文档标题
- */
- html2PDF: async function(elem_list, title = "文档") {
- // 如果是空元素列表,终止函数
- let _contents = this.html2Canvases(elem_list);
- if (_contents === null) {
- return;
- }
- _contents.then((contents) => {
- // 控制台检查结果
- console.log("生成的canvas元素如下:");
- console.log(contents);
-
- // 拿到canvas宽、高
- let model = elem_list[0];
- let width, height;
- width = model.offsetWidth;
- height = model.offsetHeight;
- // 打包为pdf
- this.saveCanvasesToPDF(contents, title, width, height);
- });
- },
-
- /**
- * 下载全部图片链接,适用性:爱问共享资料、得力文库
- * @param {string} selector 图形元素的父级元素
- */
- savePicUrls: function(selector) {
- let pages = document.querySelectorAll(selector);
- let pic_urls = [];
-
- for (let elem of pages) {
- let pic_obj = elem.children[0];
- let url = pic_obj.src;
- pic_urls.push(url);
- }
- let content = pic_urls.join("\n");
- // 启动下载
- this.createAndDownloadFile("urls.csv", content);
- },
-
- /**
- * 存储所有canvas图形为png到一个压缩包
- * @param {Array} node_list canvas元素列表
- * @param {String} title 文档标题
- */
- saveCanvasesToZip: function(node_list, title) {
- // canvas元素转为png图像
- // 所有png合并为一个zip压缩包
- let zip = new JSZip();
- let n = node_list.length;
-
- for (let i = 0; i < n; i++) {
- let canvas = node_list[i];
- let data_base64 = canvas.toDataURL();
- let blob = atob(data_base64.split(",")[1]);
- zip.file(`page-${i+1}.png`, blob, { binary: true });
- }
-
- // 导出zip
- // promise.then(onCompleted, onRejected);
- zip.generateAsync({ type: "blob" }).then(function(content) {
- // see filesaver.js
- console.log(content);
- saveAs(content, `${title}.zip`);
- });
- },
-
- /**
- * 将canvas转为jpeg,然后导出PDF
- * @param {Array} node_list canvas元素列表
- * @param {String} title 文档标题
- */
- saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
- // 如果没有手动指定canvas的长宽,则自动检测
- if (!width && !height) {
- // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
- let first_canvas = node_list[0];
- // 如果style的长宽不存在,则直接用canvas的元素长宽
- let width_str, height_str;
- if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
- [width_str, height_str] = [first_canvas.width, first_canvas.height];
- } else {
- [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
- }
- // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
- [width, height] = [parseFloat(width_str), parseFloat(height_str)];
- }
- console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
- // 如果文档第一页的宽比长更大,则landscape,否则portrait
- let orientation = width > height ? 'l' : 'p';
- let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
-
- // 根据canvas数量确定quality
- let quality = this.getQualityByCanvasAmount(node_list.length);
-
- // 保存每一页文档到每一页pdf
- node_list.forEach(function(canvas, index) {
- pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
- // 如果当前不是文档最后一页,则需要添加下一个空白页
- if (index !== node_list.length - 1) {
- pdf.addPage();
- }
- });
-
- // 导出文件
- pdf.save(`${title}.pdf`);
- },
-
- /**
- * Image元素列表合并到一个PDF中
- * @param {NodeList} imgs Image元素列表
- * @param {String} title 文档名
- */
- imgs2pdf: function(imgs, title) {
- // 取得宽高
- let model = imgs[0];
- let width = model.offsetWidth;
- let height = model.offsetHeight;
-
- // 创建pdf
- let orientation = width > height ? 'l' : 'p';
- let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
-
- // 添加图像到pdf
- imgs.forEach((img, index) => {
- pdf.addImage(img, 'PNG', 0, 0, width, height);
- // 如果当前不是文档最后一页,则需要添加下一个空白页
- if (index !== imgs.length - 1) {
- pdf.addPage();
- }
- });
-
- // 导出文件
- pdf.save(`${title}.pdf`);
- },
-
- /**
- * 取得elem的class为class_name的父级元素
- * @param {String} class_name
- * @param {Element} elem 起点元素
- * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
- * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
- * @returns {null | Element} parent_element
- */
- getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
- let parent = elem.parentElement;
- let iterator_count = JSobj.iterator_count;
- let now_name;
-
- try {
- now_name = parent.className;
- } catch (e) {
- JSobj.iterator_count = 0;
- // 没有父级元素了
- return "no parent node";
- }
-
- // 如果不忽略递归次数计数器
- if (!ignore) {
- if (iterator_count > 9) {
- // 超过最大迭代次数,认为不存在,返回null
- JSobj.iterator_count = 0;
- return "over max iterator counts limit";
- } else {
- JSobj.iterator_count += 1;
- }
- }
- // 如果类名匹配,返回该节点
- if (now_name.split(" ").includes(class_name)) {
- iterator_count = 0;
- return parent;
- }
- return this.getParentByClassName(class_name, parent, JSobj);
- },
-
- /**
- * 将func绑定到window.onscroll,并设置触发频率
- * @param {Function} func scroll的监听函数
- * @param {Object} JSobj 全局对象,至少要有srcoll_count
- * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
- * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
- * @param {String} hint 触发函数后的日志内容,默认为空字符串。
- * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
- */
- scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
- let new_func = (func, JSobj, useful_range, wait_range, hint) => {
- JSobj.scroll_count += 1;
-
- if (JSobj.scroll_count < useful_range) {
- func();
- console.log(hint);
- } else if (JSobj.scroll_count > wait_range) {
- JSobj.scroll_count = 0;
- }
- };
- // 如果没有指定的window对象,则使用默认的window
- if (!inner_window) {
- window.onscroll = () => {
- new_func(func, JSobj, useful_range, wait_range, hint);
- };
- return;
- }
- // 特定的window对象,一般用于iframe,追加scroll监听器
- let scrollFunc = () => {
- new_func(func, JSobj, useful_range, wait_range, hint);
- };
- JSobj.scrollFunc = scrollFunc;
- inner_window.addEventListener("scroll", scrollFunc, false);
- },
-
- /**
- * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
- */
- createBtns: function() {
- // 创建按钮组
- let section = document.createElement("section");
- section.className = "btns_section";
- section.innerHTML = `
- <p class="logo_tit">Wenku Doc Downloader</p>
- <button class="btn-1" title="请先使内容加载完,防止出现空白页">展开文档 😈</button>
- <button class="btn-2">未设定2</button>
- <button class="btn-3">未设定3</button>
- <button class="btn-4">未设定4</button>
- <button class="btn-5">未设定5</button>`;
- document.body.appendChild(section);
-
- // 设定样式
- let style = document.createElement("style");
- style.innerHTML = `
- .btns_section{
- position: fixed;
- width: 154px;
- left: 10px;
- top: 32%;
- background: #E7F1FF;
- border: 2px solid #1676FF;
- padding: 0px 0px 10px 0px;
- font-weight: 600;
- border-radius: 2px;
- font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
- 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
- 'Segoe UI Emoji', 'Segoe UI Symbol';
- z-index: 5000;
- }
- .logo_tit{
- width: 100%;
- background: #1676FF;
- text-align: center;
- font-size:12px ;
- color: #E7F1FF;
- line-height: 40px;
- height: 40px;
- margin: 0 0 16px 0;
- }
-
- .btn-1{
- display: block;
- width: 128px;
- height: 28px;
- background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
- border-radius: 4px;
- color: #fff;
- font-size: 12px;
- border: none;
- outline: none;
- margin: 8px auto;
- font-weight: bold;
- cursor: pointer;
- opacity: .9;
- }
- .btn-2{
- display: none;
- width: 128px;
- height: 28px;
- background: #07C160;
- border-radius: 4px;
- color: #fff;
- font-size: 12px;
- border: none;
- outline: none;
- margin: 8px auto;
- font-weight: bold;
- cursor: pointer;
- opacity: .9;
- }
- .btn-3{
- display: none;
- width: 128px;
- height: 28px;
- background:#FA5151;
- border-radius: 4px;
- color: #fff;
- font-size: 12px;
- border: none;
- outline: none;
- margin: 8px auto;
- font-weight: bold;
- cursor: pointer;
- opacity: .9;
- }
- .btn-4{
- display: none;
- width: 128px;
- height: 28px;
- background: #1676FF;
- border-radius: 4px;
- color: #fff;
- font-size: 12px;
- border: none;
- outline: none;
- margin: 8px auto;
- font-weight: bold;
- cursor: pointer;
- opacity: .9;
- }
- .btn-5{
- display: none;
- width: 128px;
- height: 28px;
- background: #ff6600;
- border-radius: 4px;
- color: #fff;
- font-size: 12px;
- border: none;
- outline: none;
- margin: 8px auto;
- font-weight: bold;
- cursor: pointer;
- opacity: .9;
- }
- .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
- .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
- document.head.appendChild(style);
- }
- };
-
- /**
- * 清理百度文库页面的无关元素
- */
- function clearPage_Baidu() {
- let selectors = [
- "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
- ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
- "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
- ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap"
- ];
- let elem_list = document.querySelectorAll(selectors.join(", "));
- for (let elem of elem_list) {
- utils.tryToRemoveElement(elem);
- }
- let nut_selector = ".fix-searchbar-wrap, #hd";
- utils.forceHide(nut_selector);
- // 去除页面顶部空白
- document.querySelector("#doc").style.paddingTop = "0";
- }
-
-
- /**
- * 判断是否收集完元素,如果没有,则给出提醒
- * @param {Array} msg_list 附加提示信息列表
- * @returns bool 是否完成元素收集/冻结
- */
- function isFinished(msg_list = []) {
- if (!window.baiduJS.finished) {
- let hint = [
- "仍有内容未加载完,无法使用该功能",
- "建议从头到尾慢速地再浏览一遍",
- ...msg_list
- ];
- alert(hint.join("\n"));
- return false;
- }
- return true;
- }
-
-
- /**
- * 提取文字,导出txt。适用于百度文库
- */
- function saveText_Baidu() {
- // 判断是否存在文字元素
- let elems = document.querySelectorAll(".reader-txt-layer");
- if (!elems.length) {
- alert("当前页面没有文字元素\n如果你看到了文字说明它的原文档就是图片,所以提取不到文字");
- return;
- }
- // 判断页面是否加载完成
- if (!isFinished()) {
- return;
- }
- let title = document.title.split("-")[0].trim(); // 取得文档标题
- let page_texts = [];
- for (let elem of window.baiduJS.elems_map.values()) {
- // 取得该页文档下的全部文字
- let text = elem.textContent;
- page_texts.push(text);
- }
- utils.createAndDownloadFile(`${title}.txt`, page_texts.join("\n"));
- }
-
-
- /**
- * 存储ppt格式的ppt图形
- * @param {NodeList} elems ppt元素列表
- */
- function savePPTurls_1(elems) {
- let urls = [];
- elems.forEach((elem) => {
- if (elem.hasAttribute("src")) {
- urls.push(elem.src);
- } else {
- urls.push(elem.getAttribute("data-src"));
- }
- });
- utils.createAndDownloadFile("urls.csv", urls.join("\n"));
- }
-
-
- /**
- * 取得未捕获pdf格式ppt元素的页码的列表
- * @returns {Array} not_loaded
- */
- function getNotLoaded_pdf_PPT() {
- if (window.baiduJS.finished) {
- return [];
- }
-
- //取得loaded
- let elems_map = window.baiduJS.elems_map;
- elems_map = sortMapByID$2(elems_map); // id形式:"pageNo-1"
-
- // 找出not loaded
- let not_loaded = [];
- for (let i = 1; i <= window.baiduJS.max_page; i++) {
- if (!elems_map.has(`pageNo-${i}`)) {
- not_loaded.push(i);
- }
- }
- return not_loaded;
- }
-
-
- /**
- * 存储pdf格式的ppt元素
- */
- function storePPTurls() {
- let imgs = document.querySelectorAll("img.reader-pptstyle");
- for (let img of imgs) {
- let page = utils.getParentByClassName("bd", img, window.baiduJS, true);
- let src = img.src;
- let id = page.id;
-
- if (id === undefined) {
- continue;
- }
-
- // 如果不存在则录入
- if (!window.baiduJS.elems_map.has(id)) {
- window.baiduJS.elems_map.set(id, src);
- }
- }
- // 如果全部捕获,则解绑
- if (window.baiduJS.elems_map.size === window.baiduJS.max_page) {
- window.onscroll = () => { };
- window.baiduJS.elems_map = sortMapByID$2(window.baiduJS.elems_map);
- window.baiduJS.finished = true;
- }
- }
-
-
- function savePPTurls_2() {
- let not_loaded = getNotLoaded_pdf_PPT();
- let hints = [
- "以下页面需要浏览并再次加载:",
- not_loaded.join(",")
- ];
- if (!isFinished(hints)) {
- return;
- }
- // 页面都加载完毕
- let elems_map = window.baiduJS.elems_map;
- let urls = Array.from(elems_map.values());
- utils.createAndDownloadFile("urls.csv", urls.join("\n"));
- }
-
-
- /**
- * 动态存储".ppt-image-wrap img"图形,并导出urls
- * @returns
- */
- function savePicUrls_Baidu() {
- // 尝试取得ppt元素
- let elems = document.querySelectorAll(".ppt-image-wrap img"); // 真正的ppt
- let elems_2 = document.querySelectorAll("img.reader-pptstyle"); // pdf格式的ppt
-
- // 根据试探情况(ppt元素存在情况)做出相应决策
- if (!elems.length && !elems_2.length) {
- alert("当前页面没有PPT图形");
- return;
- } else if (elems.length && !elems_2.length) {
- // 真正的ppt
- savePPTurls_1(elems);
- } else if (!elems.length && elems_2.length) {
- // pdf格式的ppt
- utils.scrollFunc(storePPTurls, window.baiduJS, 10, 50, "baidu元素(ppt Ⅱ型): 收集");
- savePPTurls_2();
- } else {
- // 未知情况
- utils.banSelf();
- utils.createBtns();
- utils.setBtnEvent(() => { }, [], "btn_1", "未知情况");
- }
-
- }
-
-
- /**
- * 动态存储".reader-pic-item"图形,并导出urls
- * @returns
- */
- function savePicUrls_BaiduNonPPT() {
- // 判断是否存在非PPT图形元素
- let elems = document.querySelectorAll(".reader-pic-item");
- if (!elems.length) {
- alert("当前页面没有非PPT图形");
- return;
- }
- // 判断是否页面都加载完成
- if (!isFinished()) {
- return;
- }
- // 找到img元素,导出urls
- let img_urls = [];
- for (let elem of window.baiduJS.elems_map.values()) {
- // 取得img元素
- elem.querySelectorAll(".reader-pic-item").forEach((img) => {
- // 取得img链接
- let url = img.style.backgroundImage.split('"')[1];
- img_urls.push(url);
- });
- }
- utils.createAndDownloadFile("urls.csv", img_urls.join("\n"));
- }
-
-
- /**
- * 找出没有收录的id,需求的id列表形如:["pageNo-4", "pageNo-5", ...]
- * @returns 未收录的id_list: [1, 2, 3, ...]
- */
- function getUnfrozen() {
- // 获取已经冻结的文档元素
- let _frozen_ids = new Set(window.baiduJS.elems);
- let frozen_ids = new Set();
- _frozen_ids.forEach((full_id) => {
- // full_id: pageNo-1
- let id = parseInt(full_id.split("-")[1]);
- frozen_ids.add(id);
- });
-
- if (!frozen_ids.size) {
- return ["all pages"];
- }
-
- // 取得基础页码
- let a_id = utils.setPop(frozen_ids);
- let basis = parseInt(a_id / 50) * 50;
- // 获取全部文档元素
- let all_ids = new Set();
- let all_elems = document.querySelectorAll(".mod.reader-page.complex[class*=reader-page]");
- all_elems.forEach((elem) => {
- // ['mod', 'reader-page', 'complex', 'hidden-doc-banner', 'reader-page-1'] -> "1" -> 1
- let id = parseInt(elem.className.split(" ").slice(-1)[0].split("-")[2]);
- all_ids.add(basis + id);
- });
-
- // 求差集,取得未冻结的
- let unfrozen_set = utils.difference(all_ids, frozen_ids);
- let unfrozen_list = Array.from(unfrozen_set);
- unfrozen_list.sort((prev, next) => { return prev - next; });
- // 打印日志
- console.log([
- `all_ids: ${Array.from(all_ids)}`,
- `frozen_ids: ${Array.from(frozen_ids)}`,
- `unfrozen_list: ${unfrozen_list}`
- ].join("\n"));
- return unfrozen_list;
- }
-
-
- /**
- * 适用于【*不*带有api=1】get参数的页面。可以打印页面。
- * @returns
- */
- function printPage_BaiduNoArgs() {
- // 判断是否页面都加载完成
- let msg_list = [
- "未加载的页面如下:",
- getUnfrozen().join(", ")
- ];
- if (!isFinished(msg_list)) {
- return;
- }
- // 清理页面
- clearPage_Baidu();
- // 隐藏上下页按钮
- document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
- elem.setAttribute("style", "display: none !important;");
- });
- // 打印
- utils.hideBtnThenPrint();
- // 显示上下页按钮
- document.querySelectorAll("a[data-next-page], a[data-prev-page]").forEach((elem) => {
- elem.style.display = "block";
- });
- }
-
-
- /**
- * 调整页间距为 width px
- * @param {Number} width 页间距
- */
- function adjustSpace(width) {
- // 调整页间距
- let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
- document.querySelectorAll(space_selector).forEach((space) => {
- space.style.margin = `0 0 ${width}px`;
- });
- console.log(`页间距已经调整为:${width}px`);
- }
-
-
- function userAdjustSpace() {
- let space_selector = ".reader-container .reader-page, .reader-container .pay-page-mod";
- let space = document.querySelector(space_selector);
- let old_width = getComputedStyle(space).marginBottom;
- let width_str = prompt(`当前页间距为:${old_width}\n请输入调整后的页间距(0-500的整数):`);
- let width = parseInt(width_str);
- width = Number.isInteger(width) && (0 <= width <= 500) ? width : parseInt(old_width);
- adjustSpace(width);
- console.log(`调整后的页间距为:${width}px`);
- }
-
-
- /**
- * 根据键中的id数字对map排序
- * @param {Map} elems_map
- * @returns sorted_map
- */
- function sortMapByID$2(elems_map) {
- // id形式:pageNo-10
- let elems_arr = Array.from(elems_map);
- elems_arr.sort((item1, item2) => {
- // 从key中取出id
- let id1 = parseInt(item1[0].split("-")[1]);
- let id2 = parseInt(item2[0].split("-")[1]);
- // 升序排序
- return id1 - id2;
- });
- // 返回排序好的map
- return new Map(elems_arr);
- }
-
-
- /**
- * 存储html元素。适用于百度文库的文字型文档
- */
- function storeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
- let elems_map = window.baiduJS.elems_map;
- document.querySelectorAll(selector).forEach(
- (elem) => {
- let origin_page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
- if (typeof(origin_page_elem) === "string") {
- return;
- }
- // 复制元素防止丢失
- let page_elem = origin_page_elem.cloneNode(true);
- // 移除data标签,切断vue对数据的渲染控制
- page_elem.removeAttribute("data-page-no");
- let id = page_elem.id; // id的形式:pageNo-10
- if (!elems_map.has(id)) {
- elems_map.set(id, page_elem);
- }
- });
- if (elems_map.size === window.baiduJS.max_page) {
- // 根据id排序,保证导出的图片链接不是乱序的
- window.baiduJS.elems_map = sortMapByID$2(window.baiduJS.elems_map);
- // 已经保存完全部文档页元素,移除滚动事件的绑定函数
- window.baiduJS.finished = true;
- window.onscroll = () => { };
- }
- }
-
-
- /**
- * 移除html元素上的data标签,切断vue的数据渲染控制。适用于百度文库的文字型文档
- * @param {String} selector 要移除 data-page-no属性 的元素选择器
- */
- function freezeHtmlElemts_Baidu(selector = "[class*=reader-main]") {
- let elems = window.baiduJS.elems;
- document.querySelectorAll(selector).forEach(
- (elem) => {
- let page_elem = utils.getParentByClassName("bd", elem, window.baiduJS);
- if (typeof(page_elem) === "string") {
- return;
- }
- // 移除data标签,切断vue对数据的渲染控制
- page_elem.removeAttribute("data-page-no");
- // 存储已经冻结的元素id
- let id = page_elem.id; // id的形式:pageNo-10
- if (!elems.includes(id)) {
- elems.push(id);
- }
- });
- if (elems.length === window.baiduJS.max_page) {
- // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
- window.baiduJS.finished = true;
- window.onscroll = () => { };
- }
- }
-
-
- /**
- * 递归的展开百度文档,适用于旧版页面。
- * @param {Function} extra_task 在文档展开完成后执行的追加函数
- * @returns
- */
- function readMoreRecursively(extra_task = () => { }) {
- let go_more = document.querySelector("#html-reader-go-more");
- if (!go_more || go_more.style.display === "none") {
- // 如果不存在继续阅读按钮,或隐藏显示,则认为完成了展开
- console.log("wk: 文档展开完成");
- extra_task();
- return;
- }
- let read_more = go_more.querySelector(".moreBtn.goBtn");
- read_more.click();
- console.log("wk: 展开文档");
- setTimeout(readMoreRecursively, 500);
- }
-
-
- /**
- * 统计文档页的数量
- * @param {String} selector 文档页元素选择器
- * @returns 文档页的数量
- */
- function countPages$1(selector = ".mod.reader-page.complex[class*=reader-page]") {
- let all_elems = document.querySelectorAll(selector);
- return all_elems.length;
- }
-
-
- /**
- * 取得当前行高
- * @returns 行高,例如 192px
- */
- function getLineHeight() {
- let line = document.querySelector("p.reader-word-layer");
- if (!line) {
- // 对于没有文字的文档,返回null即可
- return null;
- }
- let height = getComputedStyle(line).lineHeight;
- console.log(`get line-height: ${height}`);
- return height;
- }
-
-
- /**
- * 增大行间距到1500px,用于解决文字重叠
- */
- function changeLineHeight() {
- let lines = document.querySelectorAll("p.reader-word-layer");
- let aim_height, aim_hint;
-
- if (getComputedStyle(lines[0]).lineHeight !== window.baiduJS.origin_line_height) {
- // 切换回旧的行高
- aim_height = window.baiduJS.origin_line_height;
- aim_hint = "解决文字重叠";
- console.log(`changed to original line height`);
- } else {
- // 切换到增大的行高
- aim_height = "1500px";
- aim_hint = "切回旧行高";
- console.log(`changed to new line height: 1500px`);
- }
- // 应用新的行高
- for (let line of lines) {
- line.style.lineHeight = aim_height;
- }
- // 应用新的按钮文本
- setTimeout(() => {
- utils.modifyBtnText("btn_5", aim_hint, false, false);
- }, 2000);
- }
-
-
- function baiduWenku_OldVer() {
- // 为导出内容提供全局变量,便于动态收集文档页元素的存取
- let real_max_page;
- try {
- real_max_page = parseInt(document.querySelector(".page-count").textContent.replace("/", ""));
- } catch (e) {
- real_max_page = countPages$1();
- }
-
- window.baiduJS = {
- max_page: countPages$1(), // 当前文档页面数量
- real_max_page: real_max_page, // 当前文档的总页数
- iterator_count: 0, // getParentByClassName的最大迭代次数为9
- finished: false, // 是否收集完了全部文档页元素
- scroll_count: 0, // 用于统计累计触发scroll的次数
- elems: [], // 存储已经冻结的元素id
- elems_map: new Map(), // id: element
- origin_line_height: getLineHeight() // 原始行高
- };
-
- if (location.href.includes("\u002f\u0073\u0068\u0061\u0072\u0065\u002f")) {
- // old version for fetch doc elements
- // 跟随浏览,动态收集页面元素
- utils.scrollFunc(storeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 收集");
-
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- utils.toggleBtnStatus("btn_4");
- utils.toggleBtnStatus("btn_5");
- // 绑定事件到按钮
- utils.setBtnEvent(saveText_Baidu, [], "btn_3", "导出纯文本");
- utils.setBtnEvent(savePicUrls_Baidu, [], "btn_4", "导出图片链接(仅PPT)");
- utils.setBtnEvent(savePicUrls_BaiduNonPPT, [], "btn_5", "导出图片链接(除PPT)");
- // btn_2
- utils.setBtnEvent(() => {
- let hints = [
- "最好是excel和word文档,是否继续?",
- "其他类型如ppt、pdf也可,但是不推荐。",
- "其他类型建议【导出图片链接】。"
- ];
- if (confirm(hints.join("\n"))) {
- // 在无参数的旧版页面处理超过50页的文档
- // 跟随浏览,动态冻结页面元素
- window.baiduJS.finished = false;
- utils.scrollFunc(freezeHtmlElemts_Baidu, window.baiduJS, 10, 50, "baidu元素: 冻结");
- // 重新绑定按钮监听器
- utils.setBtnEvent(userAdjustSpace, [], "btn_4", "调整页间距");
- utils.setBtnEvent(printPage_BaiduNoArgs, [], "btn_3", "打印页面到PDF◈");
- alert("正在截获文档内容,请上下浏览页面后再次点击该按钮");
- utils.setBtnEvent(changeLineHeight, [], "btn_5", "解决文字重叠");
-
- // 隐藏按钮
- utils.toggleBtnStatus("btn_2");
- }
- }, [], "btn_2", "打印页面到PDF");
- } else {
- console.log(`无法识别的页面:${location.href}`);
- }
- }
-
-
- /**
- * 百度文档下载策略
- */
- function baiduWenku() {
- // 允许打印页面
- utils.allowPrint();
- // 重定向到旧版框架
- let href = window.location.href;
- if (href.includes("/view/") || href.includes("/tfview/")) {
- utils.createBtns();
- let jump2sharePage_Baidu = function() {
- location.href = `https://${location.host}${location.pathname.replace("\u0076\u0069\u0065\u0077", "\u0073\u0068\u0061\u0072\u0065")}`;
- };
- utils.setBtnEvent(jump2sharePage_Baidu, [], "btn_1");
- } else {
- // 在完全展开文档后启用旧版页面处理函数
- // 创建按钮组
- console.log("\n\nwk: 进入旧版页面\n\n\n");
- utils.createBtns();
- utils.setBtnEvent(readMoreRecursively, [baiduWenku_OldVer], "btn_1");
- }
- }
-
- /**
- * 展开道客巴巴的文档
- */
- function readAllDoc88() {
- // 获取“继续阅读”按钮
- let continue_btn = document.querySelector("#continueButton");
- // 如果存在“继续阅读”按钮
- if (continue_btn) {
- // 跳转到文末(等同于展开全文)
- let cur_page = document.querySelector("#pageNumInput");
- // 取得最大页码
- let page_max = cur_page.parentElement.textContent.replace(" / ", "");
- // 跳转到尾页
- utils.jump2pageNo(cur_page, page_max, "keypress");
- // 返回顶部
- setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
- }
- // 文档展开后,显示按钮2、3
- else {
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- }
- }
-
- /**
- * 道客巴巴文档下载策略
- */
- function doc88() {
- // 创建脚本启动按钮1、2
- utils.createBtns();
-
- // 绑定主函数
- let prepare = function() {
- // 获取canvas元素列表
- let node_list = document.querySelectorAll(".inner_page");
- // 获取文档标题
- let title;
- if (document.querySelector(".doctopic h1")) {
- title = document.querySelector(".doctopic h1").title;
- } else {
- title = "文档";
- }
- return [node_list, title];
- };
-
- // btn_1: 展开文档
- utils.setBtnEvent(() => {
- readAllDoc88();
- }, [], "btn_1");
- // btn_2: 导出zip
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.saveCanvasesToZip(...prepare());
- }
- }, [], "btn_2", "导出图片到zip");
- // btn_3: 导出PDF
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.saveCanvasesToPDF(...prepare());
- }
- }, [], "btn_3", "导出图片到PDF");
- }
-
- // 绑定主函数
- function getCanvasList() {
- // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
- let parent_node_list = document.querySelectorAll(".hkswf-content");
- let node_list = [];
- for (let node of parent_node_list) {
- node_list.push(node.children[0]);
- }
- return node_list;
- }
-
-
- function prepare() {
- // 获取canvas元素列表
- let node_list = getCanvasList();
- // 获取文档标题
- let title;
- if (document.querySelector("h1 [title=doc]")) {
- title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
- } else if (document.querySelector(".doc_title")) {
- title = document.querySelector(".doc_title").textContent;
- } else {
- title = "文档";
- }
- return [node_list, title];
- }
-
-
- // 判断是否有canvas元素
- function detectCanvas() {
- let haveCanvas = getCanvasList().length === 0 ? false : true;
-
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
-
- // 如果没有canvas元素,则认为文档页面由外链图片构成
- if (!haveCanvas) {
- // btn_2: 导出图片链接
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.savePicUrls("[id*=img_]");
- }
- }, [], "btn_2", "导出全部图片链接");
- } else {
- // 显示按钮3
- utils.toggleBtnStatus("btn_3");
- // btn_2: 导出zip
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.saveCanvasesToZip(...prepare());
- }
- }, [], "btn_2", "导出图片到zip");
- // btn_3: 导出PDF
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.saveCanvasesToPDF(...prepare());
- }
- }, [], "btn_3", "导出图片到PDF");
- }
- }
-
-
- /**
- * 豆丁文档下载策略
- */
- function docin() {
- // 创建脚本启动按钮
- utils.createBtns();
-
- // 隐藏底部工具栏
- document.querySelector("#j_select").click(); // 选择指针
- let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
- tool_bar.style.display = "none";
-
- // btn_1: 判断文档类型
- utils.setBtnEvent(() => {
- utils.forceHide(".jz_watermark");
- detectCanvas();
- }, [], "btn_1", "判断文档类型");
- }
-
- /**
- * 点击“展开继续阅读”,适用性:爱尚共享资料
- */
- function readAlliShare() {
- // 获取“继续阅读”元素
- let red_btn = document.getElementsByClassName("red-color")[0];
- let red_text = red_btn.textContent;
- // 如果可以展开,则展开
- if (red_text.search("点击可继续阅读") !== -1) {
- red_btn.click();
- setTimeout(readAlliShare, 1000);
- }
- // 否则启动按钮2,准备清理页面然后打印为PDF
- else {
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
-
- // 显示svg图片的链接
- let page1 = document.querySelector('[data-num="1"] .data-detail embed');
- if (!page1) {
- // 如果不存在svg图形,终止后续代码
- console.log("当前页面不存在svg图形");
- return;
- }
- let page2 = document.querySelector('[data-num="2"] .data-detail embed');
- let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
- svg1_src_div.innerHTML = `<div id="src-1"
- style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
- 访问以下链接以复制文字:<br>${page1.src}
- </div>`;
- svg2_src_div.innerHTML = `<div id="src-1"
- style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
- 访问以下链接以复制文字:<br>${page2.src}
- </div>`;
- // 添加到页面上
- page1.parentElement.parentElement.parentElement.append(svg1_src_div);
- page2.parentElement.parentElement.parentElement.append(svg2_src_div);
- }
- }
-
-
- /**
- * 清理并打印爱问共享资料的文档页
- * @returns 如果输入偏移量非法,返回空值以终止函数
- */
- function printPageiShare() {
- // # 清理并打印爱问共享资料的文档页
- // ## 移除页面上无关的元素
- // ### 移除单个元素
- let topbanner = document.getElementsByClassName("detail-topbanner")[0];
- let header = document.getElementsByClassName("new-detail-header")[0];
- let fixright = document.getElementById("fix-right");
- let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
- let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
- let footer = document.getElementsByClassName("website-footer")[0];
- let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
- let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
- let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
- let endhint = document.getElementsByClassName("endof-trial-reading")[0];
- let crumb_arrow;
- try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
- let copyright = document.getElementsByClassName("copyright-container")[0];
- let state_btn = document.getElementsByClassName("state-bottom")[0];
- let comments = document.getElementsByClassName("user-comments-wrapper")[0];
- // ### 执行移除
- let elem_list = [
- topbanner,
- header,
- fixright,
- redpacket,
- fixedrightfull,
- footer,
- guess,
- detailtopbox,
- fullscreen,
- endhint,
- crumb_arrow,
- copyright,
- state_btn,
- comments
- ];
- for (let elem of elem_list) {
- utils.tryToRemoveElement(elem);
- }
- // ### 移除全部同类元素
- let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
- for (let elem_2 of elem_list_2) {
- utils.tryToRemoveElement(elem_2);
- }
- // 使文档居中
- alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
- if (!utils.centerDoc("doc-main", "18")) {
- return; // 如果输入非法,终止函数调用
- }
- // 隐藏按钮,然后打印页面
- utils.hideBtnThenPrint();
- }
-
-
- /**
- * 爱问共享资料文档下载策略
- */
- function ishare() {
- // 创建脚本启动按钮1、2
- utils.createBtns();
-
- // btn_1: 展开文档
- utils.setBtnEvent(readAlliShare, [], "btn_1");
- // btn_2: 导出图片链接
- utils.setBtnEvent(() => {
- utils.savePicUrls(".data-detail");
- }, [], "btn_2", "导出图片链接(推荐)");
- // btn_3: 打印页面到PDF
- utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
-
- // 移除底部下载条
- let detailfixed = document.getElementsByClassName("detail-fixed")[0];
- utils.tryToRemoveElement(detailfixed);
- }
-
- /**
- * 清理并打印得力文库的文档页
- */
- function printPageDeliwenku() {
- // 移除页面上的无关元素
- let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
- let elem_list = document.querySelectorAll(selector);
- for (let elem of elem_list) {
- utils.tryToRemoveElement(elem);
- }
- // 修改页间距
- let outer_pages = document.getElementsByClassName("outer_page");
- for (let page of outer_pages) {
- page.style.marginBottom = "20px";
- }
- // 使文档居中
- alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
- if (!utils.centerDoc("#boxleft", "3")) {
- return; // 如果输入非法,终止函数调用
- }
- // 打印文档
- utils.hideBtnThenPrint();
- }
-
-
- /**
- * 点击“继续阅读”,适用性:得力文库
- */
- function readAllDeliwenku() {
- // 点击“同意并开始预览全文”
- let start_btn = document.getElementsByClassName("pre_button")[0];
- let display = start_btn.parentElement.parentElement.style.display;
- // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
- if (!display) {
- start_btn.children[0].click();
- setTimeout(() => {
- scroll(0, document.body.scrollHeight);
- }, 200);
- return;
- }
- // 增强按钮点击效果
- utils.enhanceBtnClickReaction();
-
- let read_all_btn = document.getElementsByClassName("fc2e")[0];
- let display2 = read_all_btn.parentElement.parentElement.style.display;
- // 继续阅读
- if (display2 !== "none") {
- // 获取input元素
- let cur_page = document.querySelector("#pageNumInput");
- let page_old = cur_page.value;
- let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
- // 跳转到尾页
- utils.jump2pageNo(cur_page, page_max, "keydown");
- // 跳转回来
- utils.jump2pageNo(cur_page, page_old, "keydown");
-
- // 切换按钮准备导出
- } else {
- // 推荐导出图片链接
- utils.modifyBtnText("btn_2", null, true);
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- // btn_3 橙色按钮
- utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
- }
- }
-
-
- /**
- * 得力文库文档下载策略
- */
- function deliwenku() {
- // 创建脚本启动按钮1、2
- utils.createBtns();
-
- // btn_1: 展开文档
- utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
- // btn_2: 导出图片链接
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- utils.savePicUrls('.inner_page div');
- }
- }, [], "btn_2", "导出图片链接");
-
- // 尝试关闭页面弹窗
- try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
- // 解除打印限制
- utils.allowPrint();
- }
-
- function readAll360Doc() {
- // 展开文档
- document.querySelector(".article_showall a").click();
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- }
-
-
- function saveText_360Doc() {
- // 捕获图片链接
- let images = document.querySelectorAll("#artContent img");
- let content = [];
-
- for (let i = 0; i < images.length; i++) {
- let src = images[i].src;
- content.push(`图${i+1},链接:${src}`);
- }
- // 捕获文本
- let text = document.querySelector("#artContent").textContent;
- content.push(text);
-
- // 保存纯文本文档
- let title = document.querySelector("#titiletext").textContent;
- utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
- }
-
-
- function printPage360Doc() {
- // # 清理并打印360doc的文档页
- // ## 移除页面上无关的元素
- let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
- let elem_list = document.querySelectorAll(selector);
- let under_doc_1, under_doc_2;
- try {
- under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
- under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
- } catch (e) { console.log(); }
- // 执行移除
- for (let elem of elem_list) {
- utils.tryToRemoveElement(elem);
- }
- utils.tryToRemoveElement(under_doc_1);
- utils.tryToRemoveElement(under_doc_2);
- // 执行隐藏
- document.querySelector("a[title]").style.display = "none";
-
- // 使文档居中
- alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
- if (!utils.centerDoc(".a_left", "20")) {
- return; // 如果输入非法,终止函数调用
- }
- // 隐藏按钮,然后打印页面
- utils.hideBtnThenPrint();
- }
-
-
- /**
- * 360doc个人图书馆下载策略
- */
- function doc360() {
- // 创建按钮区
- utils.createBtns();
- // btn_1: 展开文档
- utils.setBtnEvent(readAll360Doc, [], "btn_1");
- // btn_2: 导出纯文本
- utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
- // btn_3: 打印页面到PDF
- utils.setBtnEvent(() => {
- if (confirm("确定每页内容都加载完成了吗?")) {
- printPage360Doc();
- }
- }, [], "btn_3", "打印页面到PDF");
- }
-
- /**
- * 查找出所有未被捕获的页码,并返回列表
- * @returns 未捕获页码列表
- */
- function getMissedPages() {
- let all = []; // 全部页码
- for (let i = 0; i < window.mbaJS.max_page; i++) {
- all[i] = i + 1;
- }
- let missed = []; // 未捕获页码
- let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
-
- // 排除并录入未捕获页码
- for (let num of all) {
- if (!possessed.includes(`page${num}`)) {
- missed.push(num);
- }
- }
- return missed;
- }
-
-
- /**
- * 根据键中的id数字对map排序
- * @param {Map} elems_map
- * @returns sorted_map
- */
- function sortMapByID$1(elems_map) {
- // id形式:page2
- let elems_arr = Array.from(elems_map);
- elems_arr.sort((item1, item2) => {
- // 从key中取出id
- let id1 = parseInt(item1[0].replace("page", ""));
- let id2 = parseInt(item2[0].replace("page", ""));
- // 升序排序
- return id1 - id2;
- });
- // 返回排序好的map
- return new Map(elems_arr);
- }
-
-
- /**
- * 存储动态加载的canvas元素、textContent
- */
- function storeElements_MBA() {
- let canvases_map = window.mbaJS.canvases_map;
- let texts_map = window.mbaJS.texts_map;
- let quality = window.mbaJS.quality;
-
- document.querySelectorAll(".page[data-loaded=true]").forEach(
- (elem) => {
- let capture = (elem) => {
- // (1) 存储页面为canvas图形
- let canvas, data_base64;
- // 导出canvas数据防止丢失
- try {
- // 存储canvas
- canvas = elem.querySelector("canvas[id*=page]");
- if (window.mbaJS.only_text) {
- data_base64 = null;
- } else {
- data_base64 = canvas.toDataURL("image/jpeg", quality);
- }
- } catch (e) {
- // utils.sleep(500);
- return;
- }
- // 增量录入map
- let id = canvas.id; // id的形式:page2
- if (!canvases_map.has(id)) {
- canvases_map.set(id, data_base64);
- }
- // 确定canvas长宽
- if (!window.mbaJS.only_text && !window.mbaJS.width) {
- window.mbaJS.width = parseInt(canvas.width);
- window.mbaJS.height = parseInt(canvas.height);
- }
-
- // (2) 存储text
- let text = elem.textContent;
- if (!texts_map.has(id)) {
- texts_map.set(id, text);
- }
- };
- setTimeout(capture, 500, elem);
- });
- if (canvases_map.size === window.mbaJS.max_page) {
- // 根据id排序
- window.mbaJS.canvases_map = sortMapByID$1(window.mbaJS.canvases_map);
- window.mbaJS.texts_map = sortMapByID$1(window.mbaJS.texts_map);
- window.mbaJS.finished = true;
- window.onscroll = null;
- }
- }
-
-
- /**
- * 将canvas转为jpeg,然后导出PDF
- * @param {Array} base64_list canvas元素列表
- * @param {String} title 文档标题
- */
- function saveCanvasesToPDF_MBA(base64_list, title) {
- let width = window.mbaJS.width;
- let height = window.mbaJS.height;
-
- console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
- // 如果文档第一页的宽比长更大,则landscape,否则portrait
- let orientation = width > height ? 'l' : 'p';
- let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
-
- // 保存每一页文档到每一页pdf
- let i = 0;
- for (let base64 of base64_list) {
- i += 1;
- pdf.addImage(base64, 'JPEG', 0, 0, width, height);
- // 如果当前不是文档最后一页,则需要添加下一个空白页
- if (i < window.mbaJS.max_page) {
- pdf.addPage();
- }
- }
- // 导出文件
- pdf.save(`${title}.pdf`);
- }
-
- /**
- * 判断文档页是否收集完毕,当不行时给出提示
- * @returns boolean
- */
- function ready2use() {
- removeAds(); // 顺便清理广告
- // 如果是首次点击按钮,给出提示
- if (window.mbaJS.first_hint) {
- let hint = [
- "如果浏览速度过快,比如:",
- "当前页面还没完全加载好就滚动页面去看下一页",
- "那就极有可能导致导出的PDF有空白页或文本有缺漏",
- "由防范技术的干扰,该功能目前很不好用,见谅"
- ].join("\n");
- alert(hint);
- window.mbaJS.first_hint = false;
- }
- // 如果文档页没有收集完,给出提示
- if (!window.mbaJS.finished) {
- let hint = [
- "仍有内容未加载完,无法使用该功能",
- "建议从头到尾慢速地再浏览一遍",
- "以下是没有加载完成页面的页码:",
- getMissedPages().join(",")
- ];
- alert(hint.join("\n"));
- return false;
- }
- return true;
- }
-
-
- /**
- * 用捕获好的canvas转jpg,生成PDF
- * @returns
- */
- function canvas2PDF_mba() {
- if (!ready2use()) {
- return;
- }
- let canvases = window.mbaJS.canvases_map.values();
- // 导出PDF
- let title = document.title.split("-")[0].trim();
- saveCanvasesToPDF_MBA(canvases, title);
- }
-
-
- /**
- * 拼合捕获好的文本,保存到txt文件
- * @returns
- */
- function saveText_mba() {
- if (!ready2use()) {
- return;
- }
- let content = Array.from(window.mbaJS.texts_map.values());
- let title = document.title.split("-")[0].trim();
- utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
- }
-
-
- /**
- * 移除广告
- */
- function removeAds() {
- document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
- utils.tryToRemoveElement(ad_elem);
- });
- }
-
-
- function mbalib_() {
- // 移除广告和左侧工具栏
- removeAds();
- let tool_bar = document.querySelector(".tool-bar");
- utils.tryToRemoveElement(tool_bar);
-
- // 创建按钮
- utils.createBtns();
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- utils.toggleBtnStatus("btn_4");
-
- // 取得页数
- let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
- let quality = utils.getQualityByCanvasAmount(max_page);
-
- // 为导出内容提供全局变量,便于动态收集文档页元素的存取
- window.mbaJS = {
- max_page: max_page,
- texts_map: new Map(), // id: text
- canvases_map: new Map(), // id: canvas_data_base64
- quality: quality, // canvas转jpg的质量
- width: null, // canvas宽度(px)
- height: null,
- finished: false, // 是否收集完了全部文档页元素
- first_hint: true,
- scroll_count: 0, // 用于统计累计触发scroll的次数,
- only_text: false // 是否仅捕获文本
- };
- // 跟随浏览,动态收集页面元素
- window.onscroll = () => {
- storeElements_MBA();
- };
- // 跟随浏览,动态收集页面元素
- utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
- // 绑定事件
- utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
- utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
-
- // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
- let btn_text, aim_btn, hint;
- if (max_page > 40) {
- btn_text = "失效说明";
- aim_btn = "btn_3";
- hint = [
- "页数超过40,脚本无效",
- "只能使用导出文本功能",
- "而此脚本会使页面内容加载明显变慢,建议禁用"
- ];
- utils.setBtnEvent(utils.banSelf, [
- () => { window.onscroll = null; }
- ], "btn_4", "临时禁用脚本");
- } else {
- btn_text = "空白页说明";
- aim_btn = "btn_4";
- hint = [
- "导致空白页的原因如下",
- "加载该页的时间超过2秒 / 明显等待",
- "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
- ];
- }
-
- utils.setBtnEvent(() => {
- alert(hint.join("\n"));
- }, [], aim_btn, btn_text);
- }
-
-
- function mbalib() {
- setTimeout(mbalib_, 2000);
- }
-
- // 拼接swf: https://pan.baidu.com/s/1PTM6watxNlqs-jvvX6XKzg?pwd=abe9 中的 JoinSWFFiles_setup.exe
- // swf转pdf: https://youfiles.herokuapp.com/swftopdf/
-
-
- /**
- * 统计文档页的数量
- * @param {String} inner_selector 【信息摘要】元素选择器
- * @returns 文档页的数量
- */
- function countPages(inner_selector = ".container div[style=' margin:20px; ']") {
- let abstract = inner_window.document.querySelector(inner_selector).textContent;
- let page_amount_pattern = /文档页数:共 ([1-9]|[1-9][0-9]|[1-9][0-9][0-9]) 页/;
- // 捕获到: ["文档页数:共 xx 页", "xx"]
- let max_page = parseInt(abstract.match(page_amount_pattern)[1]);
- return max_page;
- }
-
-
- /**
- * 判断当前帮帮文档是否为高清版页面
- * @returns 是否为高清
- */
- function isHD() {
- // 取得页面左侧【高清版】切换功能区
- let hd_bar = inner_window.document.querySelector("#gaoging");
- // 取得功能区内提示文字
- let hint = hd_bar.querySelector("#gqts").textContent;
- // 如果存在如下文字,认为当前页面是模糊版,否则是高清版
- if (hint.includes("点此阅读高清版")) {
- return false;
- }
- return true;
- }
-
-
- /**
- * 开启收集swf链接任务,隐藏按钮1,显示按钮2、3
- */
- function main$1() {
- // 已经是高清版
- // 跟随浏览,动态冻结页面元素
- utils.scrollFunc(storeSWFLinks_Woc88, window.woc88JS, 10, 30, "woc88元素: 收集", inner_window);
-
- // 绑定按钮的触发函数
- utils.setBtnEvent(btn2SaveSwfUrls, [], "btn_2", "导出swf链接");
- utils.setBtnEvent(() => {
- let hints = [
- "本脚本无需【flash】。",
- "你的电脑上无需安装任何flash player也可以使用。",
- "导出 media-urls.csv 后,",
- "需要使用【资源下载器】来取得swf文档资源。",
- "详细用法请访问脚本主页: ",
- "https://greasyfork.org/zh-CN/scripts/435884-wenku-doc-downloader"
- ];
- alert(hints.join("\n"));
- }, [], "btn_3", "友情提示");
-
- // 隐藏按钮
- utils.toggleBtnStatus("btn_1");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- utils.toggleBtnStatus("btn_3");
- }
-
-
- function switch2HD() {
- // 取得页面左侧【高清版】切换功能区
- let hd_bar = inner_window.document.querySelector("#gaoging");
- // 取得功能区内【切换高清版】按钮
- let hd_button = hd_bar.querySelector("#gqts span[onclick]");
- hd_button.click();
- // 开启主任务
- setTimeout(main$1, 1000);
- }
-
-
- /**
- * 根据键中的id数字对map排序
- * @param {Map} elems_map
- * @returns sorted_map
- */
- function sortMapByID(elems_map) {
- // id形式:5, 类型: int
- let elems_arr = Array.from(elems_map);
- elems_arr.sort((id1, id2) => {
- // 升序排序
- return id1 - id2;
- });
- // 返回排序好的map
- return new Map(elems_arr);
- }
-
-
- /**
- * 存储swf链接。适用于帮帮文库。
- * @param {String} inner_selector iframe#test 框架下的【swf链接所在元素】选择器
- */
- function storeSWFLinks_Woc88(inner_selector = "div[id*=imgcount] > div > object") {
- let elems_map = window.woc88JS.elems_map;
- inner_window.document.querySelectorAll(inner_selector).forEach(
- (elem) => {
- // 复制链接防止丢失
- // 拿到id
- let id_elem = elem.parentElement.parentElement.id;
- let id = parseInt(id_elem.replace("imgcount", ""));
- // 拿到link
- let link = elem.data;
- // 储存id: link
- elems_map.set(id, link);
- });
- if (elems_map.size === window.woc88JS.max_page) {
- // 根据id排序,保证导出的图片链接不是乱序的
- window.woc88JS.elems_map = sortMapByID(window.woc88JS.elems_map);
- // 已经保存完全部文档页元素,移除滚动事件的绑定函数
- window.woc88JS.finished = true;
- inner_window.removeEventListener("scroll", window.woc88JS.scrollFunc, false);
- }
- }
-
-
- /**
- * 导出swf链接到csv文件。需要配合【资源下载器】使用。
- */
- function saveSwfUrls_Woc88() {
- let urls = [];
- window.woc88JS.elems_map.forEach((url) => {
- // 遍历map就是遍历value
- urls.push(url);
- });
- utils.createAndDownloadFile("media-urls.csv", urls.join("\n"));
- }
-
-
- /**
- * 返回一个列表,包含所有未捕获的页码
- * @returns 未捕获页码列表
- */
- function getNotStored() {
- // 取得全部页码
- let max_page = window.woc88JS.max_page;
- // 取得未捕获页码
- let stored = new Set(window.woc88JS.elems_map.keys());
- let not_stored = [];
- for (let i = 1; i <= max_page; i++) {
- // 如果当前页码未被捕获,则录入not_stored
- if (!stored.has(i)) {
- not_stored.push(i);
- }
- }
- return not_stored;
- }
-
-
- function btn2SaveSwfUrls() {
- if (!window.woc88JS.finished) {
- let hints = [
- "仍有内容未加载完,无法使用该功能",
- "请再次浏览未加载出的页面,未加载的页码如下",
- getNotStored().join(",")
- ];
- alert(hints.join("\n"));
- return;
- }
- saveSwfUrls_Woc88();
- }
-
-
- /**
- * 帮帮文库下载策略
- */
- function woc88() {
- // 1 初始环境配置
- // 取得iframe的window
- window.inner_window = document.querySelector("#test").contentWindow;
- // 设置全局变量
- window.woc88JS = {
- max_page: countPages(), // 当前文档页面数量
- finished: false, // 是否收集完了全部文档页元素
- scroll_count: 0, // 用于统计累计触发scroll的次数
- elems_map: new Map(), // 存储已经捕获的元素: {id: element}
- scrollFunc: null
- };
-
- // 2 主任务
- // 创建按钮组
- utils.createBtns();
- // 如果不是高清版,先切换至高清版
- if (!isHD()) {
- utils.setBtnEvent(switch2HD, [], "btn_1", "高清版");
- return;
- }
- main$1();
- }
-
- /**
- * 判断是否进入预览模式
- * @returns Boolean
- */
- function isInPreview() {
- let p_elem = document.querySelector("#preview_tips");
- if (p_elem.style.display === "none") {
- return true;
- }
- return false;
- }
-
-
- /**
- * 判断是否展开了全文
- * @returns Boolean
- */
- function isNoMorePage() {
- let read_more = document.querySelector("#ntip2");
- if (read_more.style.display === "none") {
- return true;
- }
- return false;
- }
-
-
- /**
- * 确保进入预览模式
- */
- function ensureInPreview() {
- if (!isInPreview()) {
- // 如果没有进入预览,则先进入
- document.querySelector(".pre_button a").click();
- utils.sleep(500);
- }
- }
-
-
- /**
- * 展开全文预览,当展开完成后再次调用时,返回true
- * @returns
- */
- function unfoldAll() {
- ensureInPreview();
- if (isNoMorePage()) {
- // 如果全文展开了,则切换按钮,然后退出
- utils.toggleBtnStatus("btn_1");
- utils.toggleBtnStatus("btn_2");
- return true;
- }
- // 跳转到最后一页,以展开全文
- let cur_page = document.querySelector("#pageNumInput");
- utils.jump2pageNo(cur_page, "999", "keydown");
- }
-
-
- /**
- * 取得最大页码(最大20)
- * @returns {Number} 页码int
- */
- function getPageCounts$1() {
- let counts_str = document.querySelector(".counts").textContent;
- let counts = counts_str.match(/[0-9]{1,3}/)[0];
- if (counts > 20) {
- counts = 20; // 最多免费预览20页,所以设置最大页码20
- }
- return parseInt(counts);
- }
-
-
- /**
- * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
- * @returns Array | null
- */
- function getImgUrls() {
- let pages = document.querySelectorAll("[id*=pageflash_]");
- // 尚未浏览完全部页面,返回null
- if (pages.length < window.dugenJS.page_counts) {
- return null;
- }
- // 浏览完全部页面,返回urls
- let urls = [];
- pages.forEach((page) => {
- let url = page.querySelector("img").src;
- urls.push(url);
- });
- return urls;
- }
-
-
- /**
- * 返回当前未加载页面的页码
- * @returns not_loaded
- */
- function getNotloadedPages() {
- // 已经取得的页码
- let pages = document.querySelectorAll("[id*=pageflash_]");
- let loaded = new Set();
- pages.forEach((page) => {
- let id = page.id.split("_")[1];
- id = parseInt(id);
- loaded.add(id);
- });
- // 未取得的页码
- let not_loaded = [];
- for (let i = 1; i <= window.dugenJS.page_counts; i++) {
- if (!loaded.has(i)) {
- not_loaded.push(i);
- }
- }
- return not_loaded;
- }
-
-
- function WantImgUrls() {
- let res = getImgUrls();
- // 页面尚未加载完
- if (res === null) {
- let hints = [
- "尚未加载完全部页面",
- "以下页面需要浏览并加载:",
- getNotloadedPages().join(",")
- ];
- alert(hints.join("\n"));
- return;
- }
- // 页面全部加载完
- utils.createAndDownloadFile("urls.csv", res.join("\n"));
- }
-
-
- /**
- * dugen文档下载策略
- */
- function dugen() {
- ensureInPreview();
- // 全局对象
- window.dugenJS = {
- page_counts: getPageCounts$1() // 最大页码(int)
- };
-
- // 创建按钮区
- utils.createBtns();
-
- // 绑定监听器
- // 按钮1:展开文档
- utils.setBtnEvent(unfoldAll, [], "btn_1");
- // 按钮2:导出图片链接
- utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
- }
-
- /**
- * 取得文档类型
- * @returns {String} 文档类型str
- */
- function getDocType() {
- let type_elem = document.querySelector(".title .icon.icon-format");
- // ["icon", "icon-format", "icon-format-doc"]
- let cls_str = type_elem.classList[2];
- // "icon-format-doc"
- let type = cls_str.split("-")[2];
- return type;
- }
-
-
- /**
- * 判断文档类型是否为type_list其中之一
- * @returns 是否为type
- */
- function isTypeof(type_list) {
- let type = getDocType();
- if (type_list.includes(type)) {
- return true;
- }
- return false;
- }
-
-
- /**
- * 判断文档类型是否为PPT
- * @returns 是否为PPT
- */
- function isPPT() {
- return isTypeof(["ppt", "pptx"]);
- }
-
-
- /**
- * 判断文档类型是否为Excel
- * @returns 是否为Excel
- */
- function isEXCEL() {
- return isTypeof(["xls", "xlsm", "xlsx"]);
- }
-
-
- /**
- * 取得最大页码
- * @returns 最大页码int
- */
- function getPageCounts() {
- let page_counts_str = document.querySelector(".intro-list").children[3].textContent;
- let page_counts = parseInt(page_counts_str.match(/[0-9]{1,3}(?=页)/)[0]);
- return page_counts;
- }
-
-
- /**
- * 取得未加载页面的页码
- * @param {Set} loaded 已加载的页码集合
- * @returns {Array} not_loaded 未加载页码列表
- */
- function getNotLoaded(loaded) {
- let not_loaded = [];
- let page_counts = window.book118JS.page_counts;
- for (let i = 1; i <= page_counts; i++) {
- if (!loaded.has(i)) {
- not_loaded.push(i);
- }
- }
- return not_loaded;
- }
-
-
- /**
- * 取得全部文档页的url
- * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
- */
- function getUrls() {
- let loaded = new Set(); // 存储已加载页面的页码
- let urls = []; // 存储已加载页面的图形src
- // 收集已加载页面的url
- document.querySelectorAll("div[data-id]").forEach((div) => {
- let src = div.querySelector("img").src;
- if (src) {
- // "1": "https://view-cache.book118.com/..."
- loaded.add(parseInt(div.getAttribute("data-id")));
- urls.push(src);
- }
- });
- // 如果所有页面加载完毕
- if (loaded.size === window.book118JS.page_counts) {
- return [true, urls];
- }
- // 否则收集未加载页面的url
- return [false, getNotLoaded(loaded)];
- }
-
-
- /**
- * 展开全文
- */
- function readAll() {
- window.preview.jump(999);
- }
-
-
- /**
- * btn_2: 导出图片链接
- */
- function wantUrls() {
- let [flag, res] = getUrls();
- // 页面都加载完毕,下载urls
- if (flag) {
- utils.createAndDownloadFile("urls.csv", res.join("\n"));
- return;
- }
- // 没有加载完,提示出未加载好的页码
- let hints = [
- "仍有页面没有加载",
- "请浏览并加载如下页面:",
- res.join(",")
- ];
- alert(hints.join("\n"));
- }
-
-
- /**
- * 打开PPT预览页面
- */
- function openPPTpage() {
- window.preview.getSrc();
- let openPPT = () => {
- let ppt_src = document.querySelector("iframe.preview-iframe").src;
- utils.openInNewTab(ppt_src);
- window.preview.close();
- };
- setTimeout(openPPT, 1000);
- }
-
-
- /**
- * 原创力文档(非PPT或Excel)下载策略
- */
- function book118_CommonDoc() {
- // 创建全局对象
- window.book118JS = {
- doc_type: getDocType(),
- page_counts: getPageCounts()
- };
-
- // 处理非PPT文档
- // 创建按钮组
- utils.createBtns();
- // 绑定监听器到按钮
- // 按钮1:展开文档
- utils.setBtnEvent(() => {
- readAll();
- utils.toggleBtnStatus("btn_1");
- utils.toggleBtnStatus("btn_2");
- }, [], "btn_1");
- // 按钮2:导出图片链接
- utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
- }
-
-
- /**
- * 取得PPT文档最大页码
- * @returns PPT文档最大页码int
- */
- function getPageCountsPPT() {
- let counts_str = document.querySelector("#PageCount").textContent;
- let counts = parseInt(counts_str);
- console.log(`get page counts: ${counts}`);
- return counts;
- }
-
-
- /**
- * 转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
- * @param {Number} max 转换执行次数,或者说,页面数量
- */
- function docView2Canvas(max, i = 0) {
- // 取得页码
- let cur_page = document.querySelector("#PageIndex").textContent;
- cur_page = parseInt(cur_page);
- // 取得视图元素,计数从0开始
- let doc_view = document.querySelector(`#view${cur_page-1}`);
- // 转化为canvas
- let canvas_promise = html2canvas(doc_view);
- console.log(canvas_promise); // 打印信息以检查状况
- canvas_promise.then((canvas) => {
- // 保存canvas到全局对象
- window.book118JS.canvases.push(canvas);
- // 打印日志
- i += 1;
- console.log(`wk: ${cur_page} complete`);
-
- // 下一页
- document.querySelector(".btmRight").click();
- utils.sleep(500); // 等待页面加载
- // 如果递归未达到最大次数
- if (i < max) {
- // 则下一次递归
- docView2Canvas(max, i);
- } else {
- // 否则终止递归,并且显示导出PDF按钮
- utils.toggleBtnStatus("btn_2");
- }
- });
- }
-
-
- /**
- * 将捕获的canvases合并并导出为pdf
- * @returns
- */
- function canvases2pdf() {
- // 已经捕获的页面数量
- let stored_amount = window.book118JS.canvases.length;
- // 总页面数量
- let page_counts = window.book118JS.page_counts;
- // 校验数量
- let diff = page_counts - stored_amount;
- if (diff > 0) {
- alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
- if (!confirm("是否仍要导出PDF?")) {
- // 不坚持导出PDF的情况
- return;
- }
- }
- // 导出PDF
- let canvases = window.book118JS.canvases;
- // 取得宽高
- let model = canvases[0];
- let width = model.width;
- let height = model.height;
- // 取得标题然后导出pdf
- utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
- }
-
-
- /**
- * 原创力文档(PPT)下载策略
- */
- function book118_PPT() {
- // 创建全局对象
- window.book118JS = {
- page_counts: getPageCountsPPT(),
- canvases: [] // 存储每页文档转化的canvas
- };
-
- // 创建按钮区
- utils.createBtns();
- // 绑定监听器到按钮1
- utils.setBtnEvent(() => {
- let hints = [
- "正在为文档“截图”,请耐心等待过程完成,不要操作",
- "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
- ];
- alert(hints.join("\n"));
- // 隐藏按钮1
- utils.toggleBtnStatus("btn_1");
- // 开始捕获页面
- docView2Canvas(window.book118JS.page_counts);
- }, [], "btn_1", "捕获页面");
- // 为按钮2绑定监听器
- utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
- }
-
-
- /**
- * 取得当前页面的excel,返回csv string
- * @returns {String} csv
- */
- function excel2CSV() {
- let table = [];
- let rows = document.querySelectorAll("tr[id]");
-
- // 遍历行
- for (let row of rows) {
- let csv_row = [];
- // 遍历列(单元格)
- for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
- // 判断单元格是否存储图片
- let img = cell.querySelector("img");
- if (img) {
- // 如果是图片,保存图片链接
- csv_row.push(img.src);
- } else {
- // 否则保存单元格文本
- csv_row.push(cell.textContent);
- }
- }
- table.push(csv_row.join(","));
- }
-
- let csv = table.join("\n");
- csv = csv.replace(/\n{2,}/g, "\n");
- return csv;
- }
-
-
- /**
- * 下载当前表格内容,保存为csv(utf-8编码)
- */
- function wantEXCEL() {
- let file_name = "原创力表格_UTF-8.csv";
- utils.createAndDownloadFile(file_name, excel2CSV());
- }
-
-
- /**
- * 在Excel预览页面给出操作提示
- */
- function help() {
- let hints = [
- "【导出表格到CSV】只能导出当前sheet,",
- "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
- "CSV是一种简单的表格格式,可以被Excel打开,",
- "并转为 xls 或 xlsx 格式存储,",
- "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
- "",
- "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
- "有两个办法:",
- "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
- " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
- "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
- " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
- ];
- alert(hints.join("\n"));
- }
-
-
- /**
- * 原创力文档(EXCEL)下载策略
- */
- function book118_EXCEL() {
- // 创建按钮区
- utils.createBtns();
- // 绑定监听器到按钮
- utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
- utils.setBtnEvent(help, [], "btn_2", "使用说明");
- // 显示按钮
- utils.toggleBtnStatus("btn_2");
- }
-
-
- /**
- * 打开Excel预览页面
- */
- function openEXCELpage() {
- openPPTpage();
- }
-
-
- /**
- * 原创力文档下载策略
- */
- function book118() {
- let host = window.location.hostname;
- if (host === 'max.book118.com') {
- if (isEXCEL()) {
- utils.createBtns();
- utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
- } else if (isPPT()) {
- utils.createBtns();
- utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
- } else {
- book118_CommonDoc();
- }
- } else if (host === "view-cache.book118.com") {
- book118_PPT();
- } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
- book118_EXCEL();
- } else {
- console.log(`wk: Unknown host: ${host}`);
- }
- }
-
- /**
- * 设置图像质量为100
- */
- function HD() {
- window.img_quality = 1;
- console.log("图像质量已经设置为100%");
- console.log("如果刷新页面或跳转页面则需要再次使用该命令");
- }
-
- /**
- * 主函数:识别网站,执行对应文档下载策略
- */
- function main() {
- // 显示当前位置
- let host = window.location.host;
- console.log(`当前host: ${host}`);
- // 挂载工具包到全局
- window.user_utils = utils;
- console.log("wk: user_utils已经挂载到全局");
-
- // 附加任务
- utils.globalFunc(HD); // 全局设置高清图片的函数
-
- // 主任务
- if (host.includes("docin.com")) {
- docin();
- } else if (host === "ishare.iask.sina.com.cn") {
- ishare();
- } else if (host === "www.deliwenku.com") {
- deliwenku();
- } else if (host === "www.doc88.com") {
- doc88();
- } else if (host === "www.360doc.com") {
- doc360();
- } else if (host === "wenku.baidu.com") {
- baiduWenku();
- } else if (host === "doc.mbalib.com") {
- mbalib();
- } else if (host === "www.woc88.com") {
- woc88();
- } else if (host === "www.dugen.com") {
- dugen();
- } else if (host.includes("book118.com")) {
- book118();
- } else {
- console.log("匹配到了无效网页");
- }
- }
-
- let options = {
- fast_mode: false,
- activation_test: false
- };
-
- if (options.cli_mode) {
- (() => {
- loadExternalScripts();
- setTimeout(main, 2000);
- return;
- })();
- }
-
- if (options.activation_test) {
- alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
- }
-
- if (options.fast_mode) {
- main();
- } else {
- window.onload = main;
- }
-
- })();