#MinerU #Python #文档处理 #TGAgent最近挖到个叫MinerU的工具,直接把PDF、Office这类复杂的文档转成LLM能直接用的markdown或者JSON格式,跑Agent工作流的时候对接特别顺
最近挖到个叫MinerU的工具,直接把PDF、Office这类复杂的文档转成LLM能直接用的markdown或者JSON格式,跑Agent工作流的时候对接特别顺。我之前整理一堆行业报告喂给模型做分析,全靠它批量转换,省了好多手动拆文档抠格式的麻烦。
https://github.com/opendatalab/MinerU
📡 来源:@shenzjd_com