MarkItDown是一款由微软支持的能够将多种文件格式(比如 PDF、Word、Excel、PowerPoint、图像、音频、网页等)转换为 Markdown 格式的开源工具。它还特别针对LLM的应用进行了优化,使输出的内容不仅适合人工阅读,也是 LLM 的理想输入格式。
多格式支持:支持转换 PDF、Word、Excel、ppt、图片(含 OCR 识别)、音频(语音转文字)、HTML、网页(如 YouTube 链接)等格式为结构化 Markdown。并且保留标题层级、表格结构等核心内容,适合 ai 理解与分析。
MCP 协议集成:作为 MCP 服务器,允许 AI 工具(如 Claude Desktop)通过标准协议调用文件转换功能,无需编程即可实现“语音指令转文件处理”。例如,用户说“将这份 PDF 转成 Markdown”,AI 可自动调用 MarkItDown 完成转换。
学术研究:快速转换论文、文献为 Markdown,便于文本分析。
办公自动化:将会议录音、PPT 等转为结构化笔记。
AI 工作流:结合 LLM 实现“语音指令→文件处理→内容总结”全链路自动化。
命令行模式:
pipinstallmarkitdown-mcpmarkitdown-mcp#启动STDIO模式markitdown-mcp--sse--host127.0.0.1--port3001#启动SSE服务[2,4,5](@ref)Docker 部署:
dockerbuild-tmarkitdown-mcp:latest.dockerrun-it--rmmarkitdown-mcp:latest#默认STDIO模式dockerrun-it--rm-v/本地目录:/workdirmarkitdown-mcp:latest#挂载本地文件[4,5](@ref)在 claude_desktop_config.json 中添加以下配置,启用 MarkItDown MCP 服务:
{"mcpServers":{"markitdown":{"command":"docker","args":["run","--rm","-i","-v","/本地目录:/workdir","markitdown-mcp:latest"]}}}配置后,Claude 可直接调用文件转换功能。
支持通过 llm_client 参数接入 LLM 模型(如 GPT-4o)优化输出。
github:https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp
下一篇: 最后一页
2025-01-06
PyTorch-Grad-CAM:计算机视觉的高级AI可解释性工具
2025-01-15
2025-01-26
2025-02-07
funNLP - 中文自然语言处理资源宝库 - 几乎最全的中文NLP工具资源集合
2025-01-13
RelBench:斯坦福大学最新发布,将关系型数据库转为图形表示,提高预测准确性
2025-01-21
2025-01-31
智谱AI推出最新一代预训练模型GLM-4的开源版本GLM-4-9B
2025-02-14
2025-01-06
2025-01-16