项目需求:
1.支持多种语言,尤其是小语种的识别(除中英日韩俄外,哈萨文、维吾尔语等),支持识别常见混合语言(如中英文混合);
2.支持表格识别与导出(*)
3.图片内文字以及数学(包括罗马字)等特殊符号识别。
4.能够排除文本样式(下滑线、斜体、加粗、不同字体、背景色)、以及文本偏移的干扰,正常识别文本
5.支持图片自动翻转矫正扫描件;
6.支持布局分析,即文档的段落格式保留
7.提供语言库,并且支持字库训练学习;
8.支持智能识别,无需语言预置。
9.采用Java或.Net Core,提供图片识别API,后续根据需求支持其他语言;
10.识别文档中的图片(如简历中的头像)另存为附件;
交付条件:
(1)识别精度
常用语言(中、英、日、韩等)识别率达到95%以上,小语种(藏、蒙、意大利语等)达到90%以上。表格识别率达到90%。
(2)识别速率
在上述硬件条件下,识别速率达到5秒/1000字。
(3)拒识率
常用语言2%~5% ,小语种8%~10%
接包方 | 国家/地区 | |
---|---|---|
![]() |
10
Bestpartner
|
成都市 |
![]() |
6
Wortify
|
北京市 |
![]() |
0
Hxh20171020
|
成都市 |
0
Mingwei_66
|
北京市 |