下载啦:请放心下载,安全无病毒!

软件提交最近更新 热门排行
您现在的位置: 下载啦 > 应用软件 > 文字处理 > 丹青中英文文件辨识系统 v4.00官方版
丹青中英文文件辨识系统 v4.00官方版
0%
0%

丹青中英文文件辨识系统 v4.00官方版

  • 软件介绍
  • 软件截图
  • 相关下载
  • 相关文章

丹青中英文文件辨识系统是一款十分不错的文字识别软件,该软件可以进行扫描辨识和程序自动分析,可将辨识结果自动输出为文本文件,采用先进的文字识别技术,高效辨识引擎,新建多项智能侦测功能和自动校对流程,支持多种文件格式,多种语言。

丹青中英文文件辨识系统 v4.00官方版

软件说明

丹青中英文文件辨识系统能快速地将大量文件资料转换成可编辑的文本文件。

加速辨公室的自动化,帮助一般的公司行号解决大量中英文印刷文件输入 (如剪报 、商业信息、技术文件…等)的负担,让使用者能以较低的成本 (不需专业的打字员即可操作) 在短时间内 (每分钟九千字),建立属于自己的情报系统。同时,也可帮助一般使用者快速地建立自己的数据库。

丹青中英文文件辨识系统能辨识的范围包括各式彩色、黑白、表格及非表格文件;能辨识的内容包括 繁体中文、简体中文、英文及阿拉伯数字。辨识后的文本文件所占的内存空间远较 未辨识前的影像档案小。在经过校对后即可储存成TXT、RTF、DOC、XLS、SLK、 CSV等各种档案格式,并且可以在一般的文字处理软件 (如小作家、MS Word、 Excel等) 中被开启和编辑。除此之外还可直接传送成电子邮件,或将档案以HTML 格式,透过网络浏览器(如Internet Explorer、Netscape Navigator等)直接开启。

软件功能

影像扫描

可处理彩色、灰阶或黑白的文件影像。

倾斜校正:自动侦测文件影像倾斜角度,并提供旋转影像之功能。

辨识文件< 文件分析及辨识 >

自动辨识:轻按一钮,即可自动分析、辨识、校对影像文件,图文分离,并转换成可编辑的文件档案。

设定辨识字集:不需切换语文环境,即可辨识繁中、简中、纯英文及日文四种文件。

高辨识速率:在Pentium III 667MHz个人电脑环境下,每秒钟能辨识高达150个中文字。

多种字体辨识及重现:能够辨识多种印刷字体,如明体、黑体、仿宋体、楷书、圆体、隶书等,并在辨识后还原成原稿的字体。

原文重现编辑环境:可辨识各种表格及影像,辨识结果依照原文件的图文版面格式呈现,方便您校对、编辑,节省重新排版的时间。

< 自动校对与学习 >

再辨识功能:提供合/分字、合/分行、合/分区块、变更区块属性等再辨识功能,让您能够修正错误的辨识结果。

学习新字功能:可将易辨识错误的字元输入到学习资料库中,提高下次辨识之正确率。

候选字功能:提供原文影像供辨识后图文作校对,且针对型态相近之文字及语意上前后相连的字词提供候选字轻松更正辨识错误的文字。

自动校对:利用内建的常用词库自动校对辨识出的文字,并标示出辨识时所碰到的疑问字,节省您校对的时间。

输出档案

传送至其他应用软件:可将辨识结果直接传送至您所指定的应用软件中再处理,例如可设定辨识结果自动储存成HTML档案并直接传送至网络浏览器中。

可储存多种档案格式:辨识后的结果可储存成不同之档案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的应用与处理。

温馨提示:“如果根目录有CRACK或KeyGen文件夹则为破解或注册文件

本版新增“香港字集”及“快速输入”的功能。“香港字集”提供香港流通文件中特殊字的辨识;而“快速输入”则对常用标点符号或不易输入的文字提供快速输入的方法。

软件特点

一、全方位文件辨识与管理应用特点

丹青文件辨识系统5.5极致版提供方便快速的自动辨识功能,智能侦测模块引导您以四步骤从-开启档案、自动转正影像、自动分析辨识、输出或另存新档,简单完成文件辨识及管理应用,一次建立您专属的情报系统与数据库。

二、超精准辨识结果

1、自动更正倾斜文件:利用自动功能转正文件方向以便取得更佳的OCR辨识结果。也可使用工具栏图示手动扶正,或将影像以90度或180度方向旋转调整

2、自动侦测页面方向:支持云端数据同步至云端硬盘功能,文件、图片信息可汇至Google Drive及Evernote等云端硬盘平台

三、超好用的辨识功能

1、支持15种可辨识语言:除国人常用的繁中、简中、日文及纯英文文件外,全新丹青文件辨识系统5.5极致版新增丹麦文、荷兰文、芬兰文、法文、德文、意大利文、挪威文(巴克摩) 、挪威文(耐诺斯克) 、葡萄牙文(巴西)、西班牙文和瑞典文。

2、自动语文辨识:针对繁中、简中、日文等东方语系可自动语文辨识,操作既方便又省时。 运用类神经网络辨识技术,文字辨识结果更满意。

3、自动校对与智能学习功能:利用内建的常用字库,自动校对辨识出的文字,并标示出辨识时所碰到的疑问字,节省您校对的时间。另外也提供学习新字的功能,可将容易辨识错误的字符输入到学习字库中,供下一次辨识时选取使用,有效提高每次辨识的正确率。 自动分析中文原稿的横直排及单/多栏辨识,若输入的影像版面过于复杂,您也可自行设定版面格式,方便系统作出最正确的

4、再辨识功能:提供合/分字、合/分行、合/分区块、变更区块属性等再辨识功能,让您方便修正错误的辨识结果,以便利校对文稿。再辨识功能:提供合/分字、合/分行、合/分区块、变更区块属性等再辨识功能,让您方便修正错误的辨识结果,以便利校对文稿。

四、超满意辨识效率

1、支持多核心辨识技术:配合英特尔Intel或AMD等多核心处理器系统,依搭载硬件中配备核心数量的等级,以倍数提升多页文件的辨识处理效能。 支持扫瞄机自动馈纸功能,可一次处理并辨识超过200页的大量文稿,每秒钟能辨识超过150个中文字。

显示图文并陈的合并窗口,提供最直觉的校对环境,让您以键盘、候选字或个人词库等方式进行文稿校对或更正错误。

2、存取版面:提供版面存取功能,方便您将常用的版面格式储存成丹青文件辨识系统的版面档案(*.tpl),并可套用在新输入的文件影像上,以节省版面分析的时间。

设定Hot Key快速选单热键,只需要透过点击右键,就能显示可供您应用的功能项目,产品操作尽在弹指瞬间,让您更加得心应手。

五、超贴心输出应用

1、支持多核心辨识技术

a、配合英特尔Intel或AMD等多核心处理器系统,依搭载硬件中配备核心数量的等级,以倍数提升多页文件的辨识处理效能。 支持扫瞄机自动馈纸功能,可一次处理并辨识超过200页的大量文稿,每秒钟能辨识超过150个中文字。

b、显示图文并陈的合并窗口,提供最直觉的校对环境,让您以键盘、候选字或个人词库等方式进行文稿校对或更正错误。

2、支持多页TIF档辨识

支持多页TIF档辨识,并支持其他常见图像文件辨识包括JPG、BMP、PCX,让多元影像辨识功能再加强。 将文件辨识结果直接转存成TXT、DOC、RTF、XLS、SLK、CSV、PDF 等文件格式,在小作家、Word、Excel等字处理器中编辑。也可将档案存成HTML格式,直接透过网络浏览器开启运用。

多页文件辨识结果,合并汇出为单页或多页的PDF檔。

操作教程

一. 准备工作:

1.将扫描仪或超一体机与电脑连接好,并正确安装扫描仪驱动程序(操作方法请参考随机提供的用户指南)。

2.安装丹青中英文文件辨识系统。爱普生部分扫描仪或超一体机随机捆绑了该软件,安装方法请参考该软件的帮助文件。

3.将需要识别的文档放置在扫描仪的扫描板上,并打开扫描仪或超一体机的电源。

二. 开始扫描:

1. 选择“开始”—“程序”启动“丹青中英文文件辨识系统”软件,选择“文件” -- “扫描仪设定”选项,选择你所安装的扫描仪或超一体机型号。在工具栏中选择“扫描”按钮,系统自动调用“EPSON Scan”扫描程序

2. 调用“EPSON Scan”默认为“全自动模式”,推荐使用“专业模式”进行扫描

注:确保扫描文本的质量,避免出现以下内容:

a.复印件的复印件、传真、手写字符;

b.字符间距或行间距很小的文本;;

c.表格中的文本或带下划线的文本;

d.草体或斜体字体和8磅以下的字体;

3. 扫描普通文稿时,可以将“文稿类型”设置为“反射文稿”;“自动曝光类型”设置为“文稿”;“图像类型”选择为“黑白”,并且“分辨率”设置在300dpi-600dpi 之间(“分辨率”是影响文字识别效果的主要设置)

注:建议普通的五号印刷体采用250--300dpi ;四号以上的字体采用150--200dpi;如果是六号或七号字,使用400--600dpi。若扫描原件是较为粗糙的纸张(如:报纸等),建议您使用600dpi左右的分辨率。

4. 点击“预览”会弹出预览框,将需要扫描的部分通过鼠标框选出来,

5.适当调整“阀值”,使需要扫描的文字尽量清晰 (“阀值”是影响文字识别效果的主要设置),如图

丹青中英文文件辨识系统 v4.00官方版

注:若纸张过薄,扫描结果可能显示出纸张背面内容,影响到文字识别的效果。出现此现象时,请适当减小阀值。.若扫描结果显示出文字颜色较浅,请适当增加阀值。

6.当一切设置完毕后,选择“扫描”。扫描仪会将扫描的图像导入到软件中去,扫描完成后选择“关闭”。

三. 文稿调整:

1. 文稿辨识前先校正倾斜角度,选择“编辑”-“旋转”选项(文稿角度不正将影响文字识别的效果)

2. 使用“橡皮擦”工具将图片中的杂点去掉

注:由于丹青系统无法辨识黑底白字的图片,若输入的正是此类图片可利用“编辑”-“反白”的功能将图片转换成白底黑字之后再进行辨识。

四. 文稿识别:

(1)选择工具栏中的“版面设定”按钮设置文稿的版面,在“表格设定”中选择-“非表格文件”,“内容设定”中选择文档中所使用字符

(2) 选择“版面分析”,软件自动完成版面分析后,请点击工具栏中的“辨识”,软件会按照相应设置来识别文字

(3)选择“词库校对”,软件会根据软件词库中常见的词语搭配关系,分析整篇文章,自动校对并修改文稿中没有被正确识别的常见词语

(4)如果使用“词库校对”功能依然无法识别某些文字,可选择“查看”-“文稿编辑模式”选项,手动校正文稿,如图

(5) 校对完毕,选择“保存”,并将保存类型设置为“MS Word文件格式” 或者“TXT文本格式”。保存好之后就可以直接通过Word 等软件的进行文字编辑。

注:表格识别与文档识别的操作步骤基本相同,只在“版面设定”窗口中,“表格设定”选择“一般表格文件”,“内容设定”选择文档中所使用字符

五. 文稿扫描识别过程结束

环境需求

1、Microsoft Windows XP,Windows Vista,Windows 7 或 Windows8

2、Windows XP: Pentium III 800 MHz 或更高处理器; Windows Vista 及 Windows 7:Pentium 4 3.0 GHz处理器

3、屏幕分辨率 800×600 Hi-Color

4、非在线下载版本则另需CD-ROM光驱进行下载安装

5、支持 TWAIN 界面的扫描仪

  • 丹青中英文文件辨识系统v4.00官方版(1)
  • 丹青中英文文件辨识系统v4.00官方版(2)

下载地址

  • Pc版

丹青中英文文件辨识系统 v4.00官方版

软件评论 您的评论需要经过审核才能显示

请自觉遵守互联网相关政策法规,评论内容只代表网友观点,与本站立场无关!
网友评论

热门精选

热门推荐