语雀导出为Markdown

将语雀文档导出为Markdown格式,优化表格处理、图片和视频导出

// ==UserScript==
// @name         语雀导出为Markdown
// @namespace    http://tampermonkey.net/
// @version      2.1
// @description  将语雀文档导出为Markdown格式,优化表格处理、图片和视频导出
// @license      MIT
// @author       船长zscc
// @match        https://www.yuque.com/*
// @icon        
// @grant        none
// @require      https://unpkg.com/[email protected]/dist/turndown.js
// ==/UserScript==

(function() {
    'use strict';

    // 添加毛玻璃效果的CSS样式
    const addStyles = () => {
        const style = document.createElement('style');
        style.textContent = `
            #yuque-md-export-btn {
                padding: 5px 10px;
                background-color: rgba(51, 112, 255, 0.8);
                color: white;
                border: none;
                border-radius: 8px;
                cursor: pointer;
                font-weight: bold;
                backdrop-filter: blur(10px);
                box-shadow: 0 4px 12px rgba(0, 0, 0, 0.15);
                transition: all 0.3s ease;
                display: flex;
                align-items: center;
                justify-content: center;
                font-size: 12px;
            }

            #yuque-md-export-btn:hover {
                background-color: rgba(51, 112, 255, 0.9);
                transform: translateY(-2px);
                box-shadow: 0 6px 16px rgba(0, 0, 0, 0.2);
            }

            #yuque-md-export-btn:active {
                transform: translateY(1px);
                box-shadow: 0 2px 8px rgba(0, 0, 0, 0.15);
            }

            #yuque-md-export-loading {
                backdrop-filter: blur(8px);
                background-color: rgba(0, 0, 0, 0.7);
                border-radius: 12px;
                box-shadow: 0 8px 24px rgba(0, 0, 0, 0.2);
            }
        `;
        document.head.appendChild(style);
    };

    // 添加导出按钮
    function addExportButton() {
        // 检查是否已添加按钮
        if (document.getElementById('yuque-md-export-btn')) {
            return;
        }

        // 检查是否在文档页面
        if (!document.querySelector('.ne-viewer-body') &&
            !document.querySelector('.article-content')) {
            return;
        }

        // 查找目标元素
        const targetContainer = document.querySelector('.header-action');
        if (!targetContainer) {
            return;
        }

        const exportButton = document.createElement('button');
        exportButton.id = 'yuque-md-export-btn';
        exportButton.innerHTML = `👇MD`;
        exportButton.title = '导出为Markdown文件';
        exportButton.onclick = exportToMarkdown;
        exportButton.style.marginLeft = '8px';

        // 将按钮添加到目标容器的最右侧
        targetContainer.appendChild(exportButton);
    }

    // 导出为Markdown
    function exportToMarkdown() {
        try {
            // 显示加载提示
            showLoadingMessage('正在导出Markdown...');

            // 获取文档标题
            const title = document.querySelector('.index-module_articleTitle_VJTLJ')?.textContent ||
                          document.querySelector('.doc-article-title')?.textContent ||
                          document.title.replace(' · 语雀', '');

            // 获取文档内容
            const contentElement = document.querySelector('.ne-viewer-body') ||
                                  document.querySelector('.article-content');
            if (!contentElement) {
                hideLoadingMessage();
                alert('无法找到内容区域');
                return;
            }

            // 克隆内容以避免修改原页面
            const contentClone = contentElement.cloneNode(true);

            // 预处理多媒体元素
            preprocessMultimediaElements(contentClone);

            // 配置TurndownService
            const turndownService = new TurndownService({
                headingStyle: 'atx',
                codeBlockStyle: 'fenced',
                bulletListMarker: '-',
                emDelimiter: '*'
            });

            // 添加自定义规则
            addCustomRules(turndownService);

            // 转换为Markdown
            setTimeout(() => {
                let markdown = turndownService.turndown(contentClone);

                // 添加标题
                markdown = `# ${title}\n\n${markdown}`;

                // 后处理清理
                markdown = postprocessMarkdown(markdown);

                // 下载Markdown文件
                downloadMarkdown(markdown, `${title}.md`);
                hideLoadingMessage();
            }, 100);

        } catch (error) {
            hideLoadingMessage();
            console.error('导出过程中出错:', error);
            alert('导出过程中出错,请查看控制台获取更多信息。');
        }
    }

    // 预处理多媒体元素
    function preprocessMultimediaElements(contentElement) {
        // 处理视频卡片
        const videoCards = contentElement.querySelectorAll('ne-card[data-card-name="video"], div.ne-card-video');
        videoCards.forEach(card => {
            // 创建替代元素
            const videoPlaceholder = document.createElement('div');

            // 尝试获取视频源
            const videoElement = card.querySelector('video');
            if (videoElement) {
                let videoSrc = '';
                const sourceElement = videoElement.querySelector('source');
                if (sourceElement && sourceElement.src) {
                    videoSrc = sourceElement.src;
                } else if (videoElement.src) {
                    videoSrc = videoElement.src;
                }

                if (videoSrc) {
                    // 直接使用真实视频地址
                    videoPlaceholder.innerHTML = `<video src="${videoSrc}"></video>`;
                } else {
                    videoPlaceholder.innerHTML = `<p>[视频内容无法获取]</p>`;
                }
            } else {
                // 如果找不到视频元素,尝试从页面中查找视频信息
                const videoInfo = findVideoInfoInPage(card);
                if (videoInfo) {
                    videoPlaceholder.innerHTML = `<video src="${videoInfo}"></video>`;
                } else {
                    videoPlaceholder.innerHTML = `<p>[视频内容无法获取]</p>`;
                }
            }

            // 替换原卡片
            card.parentNode.replaceChild(videoPlaceholder, card);
        });

        // 处理控制元素,避免导出无关内容
        const controlElements = contentElement.querySelectorAll(
            '.ne-card-video-content, .index-module_controls__1JsEA, ' +
            '.Seek-module_component__3Jd8h, .index-module_bottom__z1Gae, ' +
            '.PlaybackRates-module_component__3rglH, .Volume-module_component__1UMWx'
        );
        controlElements.forEach(el => el.remove());

        // 处理图片卡片
        processImageCards(contentElement);

        // 处理其他卡片类型
        const otherCards = contentElement.querySelectorAll('ne-card:not([data-card-name="image"]):not([data-card-name="video"])');
        otherCards.forEach(card => {
            const cardType = card.getAttribute('data-card-name') || '未知类型';
            const cardPlaceholder = document.createElement('div');
            cardPlaceholder.innerHTML = `<p>[${cardType}卡片内容]</p>`;
            card.parentNode.replaceChild(cardPlaceholder, card);
        });

        // 移除不需要的元素
        const unwantedSelectors = [
            '.ne-viewer-header',
            '.ne-heading-anchor',
            '.ne-heading-fold',
            '.ne-td-break',
            '.ne-table-right-shadow',
            '.ne-card-container',
            '.ne-card-video-content',
            '.Overlay-module_component__11R_9',
            '.index-module_controls__1JsEA',
            '.Time-module_component__2c6Qh',
            '.PlaybackRates-module_component__3rglH',
            '.Volume-module_component__1UMWx',
            '.ant-slider',
            '.Seek-module_component__3Jd8h'
        ];

        unwantedSelectors.forEach(selector => {
            const elements = contentElement.querySelectorAll(selector);
            elements.forEach(el => el.remove());
        });
    }

    // 处理图片卡片 - 专门的函数
    function processImageCards(contentElement) {
        // 查找所有图片卡片
        const imageCards = contentElement.querySelectorAll('ne-card[data-card-name="image"]');

        imageCards.forEach(card => {
            // 查找图片元素 - 考虑多种可能的图片选择器
            const imgElement = card.querySelector('img');

            if (imgElement && imgElement.src) {
                // 获取alt文本
                const altText = imgElement.alt || '图片';

                // 获取原始图片URL,移除可能的处理参数
                let imgSrc = imgElement.src;
                // 如果是阿里云OSS处理的图片,尝试获取原始URL
                if (imgSrc.includes('?x-oss-process=')) {
                    imgSrc = imgSrc.split('?x-oss-process=')[0];
                }

                // 创建替代元素
                const imgPlaceholder = document.createElement('div');
                imgPlaceholder.innerHTML = `![${altText}](${imgSrc})`;

                // 替换原卡片
                if (card.parentNode) {
                    card.parentNode.replaceChild(imgPlaceholder, card);
                }
            }
        });

        // 处理常规图片元素
        const regularImages = contentElement.querySelectorAll('img:not(.ne-hn)');
        regularImages.forEach(img => {
            if (img.src && !img.closest('ne-card')) {
                const altText = img.alt || '图片';
                let imgSrc = img.src;

                // 清理OSS处理参数
                if (imgSrc.includes('?x-oss-process=')) {
                    imgSrc = imgSrc.split('?x-oss-process=')[0];
                }

                const imgWrapper = document.createElement('div');
                imgWrapper.innerHTML = `![${altText}](${imgSrc})`;

                // 替换图片元素
                if (img.parentNode) {
                    img.parentNode.replaceChild(imgWrapper, img);
                }
            }
        });

        // 处理可能嵌套在其他容器中的图片
        const nestedImageContainers = contentElement.querySelectorAll('.ne-image-wrap');
        nestedImageContainers.forEach(container => {
            const img = container.querySelector('img');
            if (img && img.src && !container.closest('ne-card')) {
                const altText = img.alt || '图片';
                let imgSrc = img.src;

                // 清理OSS处理参数
                if (imgSrc.includes('?x-oss-process=')) {
                    imgSrc = imgSrc.split('?x-oss-process=')[0];
                }

                const imgWrapper = document.createElement('div');
                imgWrapper.innerHTML = `![${altText}](${imgSrc})`;

                // 替换整个容器
                const parentElement = container.closest('.ne-image-wrap') || container;
                if (parentElement.parentNode) {
                    parentElement.parentNode.replaceChild(imgWrapper, parentElement);
                }
            }
        });
    }

    // 从页面中查找视频信息
    function findVideoInfoInPage(cardElement) {
        // 尝试从脚本标签中提取视频URL
        const scripts = document.querySelectorAll('script');
        for (let i = 0; i < scripts.length; i++) {
            const scriptContent = scripts[i].textContent;
            if (scriptContent && scriptContent.includes('videoUrl')) {
                const match = scriptContent.match(/"videoUrl":"([^"]+)"/);
                if (match && match[1]) {
                    return match[1].replace(/\\/g, '');
                }
            }
        }

        // 尝试从卡片的data属性中提取
        const cardId = cardElement.getAttribute('id');
        if (cardId) {
            const cardData = window.__INITIAL_STATE__?.cards?.[cardId];
            if (cardData && cardData.value && cardData.value.videoUrl) {
                return cardData.value.videoUrl;
            }
        }

        return null;
    }

    // 添加自定义规则
    function addCustomRules(turndownService) {
        // 处理表格
        turndownService.addRule('tables', {
            filter: 'table',
            replacement: function(content, node) {
                // 获取表格行
                const rows = node.querySelectorAll('tr');
                if (rows.length === 0) return '';

                // 处理表头
                const headerRow = rows[0];
                const headers = Array.from(headerRow.querySelectorAll('th')).map(th => {
                    return th.textContent.trim() || ' ';
                });

                // 如果没有表头,使用第一行作为表头
                if (headers.length === 0) {
                    const firstRowCells = Array.from(rows[0].querySelectorAll('td')).map(td => {
                        return td.textContent.trim() || ' ';
                    });
                    if (firstRowCells.length > 0) {
                        headers.push(...firstRowCells);
                    } else {
                        return ''; // 空表格
                    }
                }

                // 生成表头行
                let markdown = '| ' + headers.join(' | ') + ' |\n';

                // 生成分隔行
                markdown += '| ' + headers.map(() => '---').join(' | ') + ' |\n';

                // 处理数据行
                const startIndex = headers.length > 0 && rows[0].querySelectorAll('th').length > 0 ? 1 : 0;
                for (let i = startIndex; i < rows.length; i++) {
                    const cells = Array.from(rows[i].querySelectorAll('td')).map(td => {
                        return td.textContent.trim() || ' ';
                    });
                    if (cells.length > 0) {
                        // 确保单元格数量与表头一致
                        while (cells.length < headers.length) {
                            cells.push(' ');
                        }
                        markdown += '| ' + cells.join(' | ') + ' |\n';
                    }
                }

                return '\n' + markdown + '\n';
            }
        });

        // 处理语雀特殊标题
        turndownService.addRule('neHeadings', {
            filter: function(node) {
                return /^ne-h[1-6]$/.test(node.nodeName.toLowerCase());
            },
            replacement: function(content, node) {
                let level = parseInt(node.nodeName.toLowerCase().substring(4));
                return '\n' + '#'.repeat(level) + ' ' + content + '\n\n';
            }
        });

        // 处理图片
        turndownService.addRule('images', {
            filter: 'img',
            replacement: function(content, node) {
                const alt = node.alt || '';
                let src = node.getAttribute('src') || '';

                // 如果是base64图片,尝试获取原始URL
                if (src.startsWith('data:') && node.dataset.src) {
                    src = node.dataset.src;
                }

                // 清理OSS处理参数
                if (src.includes('?x-oss-process=')) {
                    src = src.split('?x-oss-process=')[0];
                }

                return `![${alt}](${src})`;
            }
        });

        // 处理视频 - 保留真实视频地址
        turndownService.addRule('videos', {
            filter: 'video',
            replacement: function(content, node) {
                const src = node.getAttribute('src') || '';
                if (src) {
                    return `<video src="${src}"></video>`;
                } else {
                    // 如果没有src属性,检查source子元素
                    const sourceEl = node.querySelector('source');
                    const sourceSrc = sourceEl ? sourceEl.getAttribute('src') : '';
                    if (sourceSrc) {
                        return `<video src="${sourceSrc}"></video>`;
                    }
                }
                return `<video src="视频地址无法获取"></video>`;
            }
        });

        // 保留HTML视频标签
        turndownService.keep(function(node) {
            return (
                node.nodeName === 'VIDEO' ||
                (node.nodeName === 'DIV' && node.innerHTML.includes('<video'))
            );
        });
    }

    // 后处理Markdown内容
    function postprocessMarkdown(markdown) {
        // 移除重复的空行
        markdown = markdown.replace(/\n{3,}/g, '\n\n');
        // 修复图片语法中的转义字符问题
        markdown = markdown.replace(/!\\\[(.*?)\\\]/g, '![$1]');

        // 确保图片链接格式正确
        markdown = markdown.replace(/!\[(.*?)\]\s*\((.*?)\)/g, '![$1]($2)');
        // 清理视频控制相关文本
        const controlTextsToRemove = [
            /\d+:\d+\/\d+:\d+/g,  // 时间格式如 0:00/0:42
            /倍速/g,
            /\d+\.\d+X/g,         // 如 1.5X
            /静音/g,
            /全屏/g,
            /播放/g,
            /暂停/g,
            /\d+%/g,             // 百分比值
            /自动播放/g
        ];

        controlTextsToRemove.forEach(regex => {
            markdown = markdown.replace(regex, '');
        });

        // 清理可能的空行
        markdown = markdown.replace(/\n\s*\n/g, '\n\n');

        // 修复视频标签格式,确保没有额外的div包裹
        markdown = markdown.replace(/<div><video src="(.*?)"><\/video><\/div>/g, '<video src="$1"></video>');

        // 修复可能的图片格式问题
        markdown = markdown.replace(/\!\[([^\]]*)\]\(([^)]+)\)/g, '![$1]($2)');

        // 移除可能的图片卡片标记
        markdown = markdown.replace(/\[image卡片内容\]/g, '');

        return markdown;
    }

    // 显示加载提示
    function showLoadingMessage(message) {
        // 移除可能已存在的加载提示
        hideLoadingMessage();

        const loadingDiv = document.createElement('div');
        loadingDiv.id = 'yuque-md-export-loading';
        loadingDiv.style.position = 'fixed';
        loadingDiv.style.top = '50%';
        loadingDiv.style.left = '50%';
        loadingDiv.style.transform = 'translate(-50%, -50%)';
        loadingDiv.style.color = 'white';
        loadingDiv.style.padding = '20px 30px';
        loadingDiv.style.borderRadius = '12px';
        loadingDiv.style.zIndex = '10000';
        loadingDiv.style.display = 'flex';
        loadingDiv.style.alignItems = 'center';
        loadingDiv.style.gap = '12px';

        const spinner = document.createElement('div');
        spinner.style.width = '24px';
        spinner.style.height = '24px';
        spinner.style.borderRadius = '50%';
        spinner.style.border = '3px solid rgba(255, 255, 255, 0.3)';
        spinner.style.borderTopColor = 'white';
        spinner.style.animation = 'yuque-md-spin 1s linear infinite';

        const style = document.createElement('style');
        style.textContent = `
            @keyframes yuque-md-spin {
                0% { transform: rotate(0deg); }
                100% { transform: rotate(360deg); }
            }
        `;

        document.head.appendChild(style);
        loadingDiv.appendChild(spinner);

        const messageEl = document.createElement('div');
        messageEl.textContent = message;
        messageEl.style.fontSize = '16px';
        loadingDiv.appendChild(messageEl);

        document.body.appendChild(loadingDiv);
    }

    // 隐藏加载提示
    function hideLoadingMessage() {
        const loadingDiv = document.getElementById('yuque-md-export-loading');
        if (loadingDiv) {
            loadingDiv.remove();
        }
    }

    // 下载Markdown文件
    function downloadMarkdown(content, filename) {
        const blob = new Blob([content], { type: 'text/markdown' });
        const url = URL.createObjectURL(blob);
        const a = document.createElement('a');
        a.href = url;
        a.download = filename;
        document.body.appendChild(a);
        a.click();
        document.body.removeChild(a);
        URL.revokeObjectURL(url);
    }

    // 添加样式
    addStyles();

    // 页面加载完成后添加导出按钮
    window.addEventListener('load', function() {
        // 等待一段时间确保语雀的内容完全加载
        setTimeout(addExportButton, 2000);
    });

    // 监听URL变化,在页面切换时重新添加按钮
    let lastUrl = location.href;
    new MutationObserver(() => {
        const url = location.href;
        if (url !== lastUrl) {
            lastUrl = url;
            setTimeout(addExportButton, 2000);
        }
    }).observe(document, {subtree: true, childList: true});

    // 初始运行
    setTimeout(addExportButton, 2000);
})();