新闻动态
PDF中的复杂表格或少线表格收复时时需要借助专科的器用或在线做事,以下是一些可行的技艺:
技艺一:使用在线PDF诊治器用
技艺二:使用桌面PDF剪辑软件
技艺三:通过OCR技巧索要表格
技艺四:手动重建表格
✨在繁密的技艺及器用中,推选使用TextIn文档解析功能。
✨上风与所长:
TextIn通用文档解析最新推出表格处理优化版块。本次优化主要改善了表格识别效力,以搭伙决策替代有线表格与无线表格分类处理技艺,减少了级联耗费,大幅度擢升表格全对率,梗概有用扫尾PDF文献中的复杂表格、少线表格的收复。
▶案例分析:若何扫尾PDF文献中的复杂表格、少线表格的收复?伸开剩余79%以下将通过几个案例,直不雅展示TextIn表格解析性能优化的线路。
01 无线表格解析
图1-1 识别诞妄
图1-2 优化结果
如图所示,图1-1是无线表格解析中常见的bad case:合并单位格结构识别不准确。由于合并单位格有顶部对皆、垂直居中多种形貌,在骨子文档中版面复杂多变,在莫得框线的情况下,更加多了解析模子的识别难度。
图1-2中不错看到,最新TextIn文档解析表格性能,能妥善处理这类难点情况,扫尾正确的表格收复,保险下流信息处理的准确性。
02 不规定无线表格解析
图2-1 识别诞妄
图2-2优化结果
枯竭结构信息的表格笔墨识别会丢失迫切价值,导致数据成为无兴致的数字。
PDF文献中,领有不同业列数的不规定无线表格在统一版面呈现的情况额外常见。以图中的金融机构阐发为例,值得留意的是,TextIn表格优化后,模子会同步展望空cell,以擢升举座表格解析准确率。
03 低明晰度无线表格解析
图3-1 识别诞妄
图3-2优化结果
如图所示,关于明晰度较低、噪点多的扫描图像,优化后的表格模子也能扫尾精确的识别。
从具体案例来看,TextIn表格解析性能,对处置单位格中的多行问题有优异的效力,用户如有家具证据书、体检阐发、技巧规格书等文献额外他类型多行复杂表格的解析需求,解析引擎的准确性和使用体验都将大幅度擢升,梗概空闲证据、金融、数据处理等多种场景的密致化使用需求。
▶前端功能新增:撑握表格剪辑
新版前端组件撑握在线表格剪辑,包括笔墨剪辑、插入或删除行列、单位格合并与拆分等一系列常用表格剪辑操作,便于胜仗通过窗口操作对识别结果进行修改或校阅。
撑握单独索要文档中的表格元素,导出为Excel。
关于PDF文献里的复杂表格、少线表格,TextIn表格解析梗概扫尾精确收复,大幅度擢升表格全对率,空闲用户各种化的使用需求。
发布于:上海市