需求详情

需求信息

招标
文字处理软件开发
所在地·长沙市
需求标题
pdf Parser解析
预算金额
10000 - 50000元
需求描述
1、开发“pdf处理程序”,提供一个调用接口; 2、该接口输入为“英文pdf输入文件”; 3、接口识别英文pdf输入文件页面布局(分栏、分段、位置、字体、字号、颜色、样式)、图片、公式、表格、图表、文本(标题、目录、正文、页眉页脚、符号、参考文献) 4、接口将识别内容输出到“word格式中间文件”和“json格式中间文件”,pdf中图片原样导出到json格式中间文件相同路径; 5、输出的word格式中间文件的内容、样式要和英文pdf输入文件保持一致; 6、输出的json格式中间文件需要记录英文pdf输入文件被识别出来的完整信息和导出的图片文件信息; 7、接口基于输出的json格式中间文件、输出的图片,继续后续处理,并输出和英文pdf输入文件内容、样式原样还原的“英文pdf输出文件”。 二、验收要求: 1、交付识别、还原pdf的思路,进行讲解 2、交付源码(代码格式规范,有良好的注释) 3、不允许调用第三方接口 4、项目可以使用开源解决方案 5、项目中不能包含需要付费的第三方库 6、接口运行环境为Linux 7、开发语言限制在Python/C#/Java/PHP/C++中的任何一种,优先Python 8、输出文件不能超过输入文件大小的1.5倍 9、100M的pdf文件,处理时间不超过 2 分钟
允许参与人才数量
不限
人才所在地
全国
人才类型
不限
工作反馈要求
需要定期反馈
期望完成日期
2023-12-05
开票类型要求
无要求
开发模式
定制开发
交付模式
源码交付
如果你也有类似需求,一键发布需求
5分钟有求必应,快速解决需求,提供品质服务

参与该需求的服务商(0)

雇主还在等待服务商参与需求