腾讯推出PDF识别神器:复杂文档解析准确率超98%

送交者: netcamel [★★声望品衔10★★] 于 2024-06-21 19:05 已读 11757 次 大字阅读 繁體閱讀
腾讯云大模型知识引擎新鲜出炉,它有一项新能力——大模型知识引擎文档解析!

基于腾讯优图实验室自研新一代多模态文档解析大模型,它能先通过版面分析定位文档所有内容的位置和类型,再对文本表格公式等内容进行精准识别,最后按照我们人类的阅读顺序输出连贯可读的内容。

比如,面对带表的PDF文档,特别表格没有框的,它能通过融合行列关系特征和元素特征来预测表格的行列间隔线。

算法能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!

不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。

更惊喜的是,它还支持将识别后的图片、PDF文档转换为Markdown格式输出。

腾讯表示,大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。

目前,这项文档解析功能已在多个产品上线。

快科技


评分完成:已经给本帖加上 10 银元!

喜欢netcamel朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!

  • ^

  • ^

  • ^

  • ^

  • ^

  • ^

[举报反馈] [ netcamel的个人频道 ] [-->>参与评论回复] [用户前期主贴] [手机扫描浏览分享] [返回电脑前线首页]

帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖: (主贴被主有权删除不文明回复,拉黑不受欢迎的用户)