服务详情
服务内容全部包含: 提取PDF关键维度的内容,生成结构化的段落。 对字符的字体和样式做聚类分析,生成样式和PDF高度一致的HTML页面。 生成html高度还原PDF。 服务优势: 1. 利用PDF解析得到的字符,线,矩形框,文本行等元素的位置信息做聚类分析,精确定位表格,提高了解析的准确度。 2. 通过语义分析得到关键维度的内容,以HTML形式展示时,保留关键样式信息,和PDF原文保持高度一致,改善了阅读体验。 服务前需客户提供的信息: PDF样例需要覆盖用到的所有PDF基本排版。 需求需要明确HTML还原哪些元素,比如是否需要样式信息等。 解析性能要求比如错误率要求。