您好,欢迎来到爱go旅游网。
搜索
您的当前位置:首页佳能说明书

佳能说明书

来源:爱go旅游网
1

Canon Canon RosettaStoneV3.10cRosettaStoneV3.10c 3.10c 用户指南 前言 安装RosettaStone RosettaStone RosettaStone概要 RosettaStone的启动与关闭 获取图象与识别文字 文本和图象的输出 改变显示 提高识别率 附录

前言 2 前 言 RosettaStone是在计算机上使用的应用程序。它的功能是通过图象扫描仪获取图象,并对图象进行文字识别处理,转换成文本数据。转换后的文本数据,可应用于各种应用程序。 有关注册商标 Microsoft®、MS-DOS®、Windows®是美国Microsoft公司在美国及其他国家注册的商标。Lotus、Lotus1-2-3是Lotus Development Corporation的商标。 Courier是Smith-Corona公司的注册商标。 Helvetica、Times、TimesRoman是Heidelberger Druckmachinen AG的注册商标。 Pentium是美国Intel公司的商标。 Copyright CANON INC.1998ALL Rights Reserved. RosettaStone是佳能株式会社的注册商标。 本书中记载的其他公司的名称、产品名称等是各自公司的商标或是注册商标。 本产品是使用微软公司的“Microsoft Visual C++ Version 5.0英文版”开发的。 The Sentry Spelling-Checker Engine Copyright© 1993 Wintertree Software Inc. TIFF and PCX handling DLL Copyright BLACK ICE SOFTWARE,INC. Copyright CANON INC.1998 ALL Rights Reserved. 1998年5月 第1版第1次印刷 SE-IJ-177

前言 3 注意 1. 本书部分或全部内容未经许可,禁止擅自转载。 2. 本书内容改版时,事先不予以通知。 3. 对于本书的内容,如有疑问,请与我们联系。 4. 由使用结果产生的影响,与上述3项无关,我们将不负任何责任。 有关本书的书写 文件名、命令名、显示项目等用“[ ]”括起来。 有关命令名连续操作时以如下书写方式表示。 (例)[编辑]-[查找]:选择[编辑]菜单下的[查找]命令。 对话框按钮用“< >”括起来。 键的书写用“ ”括起来。 同时按住2个以上键或者先按住某个键再进行操作时,用“+”连接的方式表示。 (例)Ctrl +Home :先按住Ctrl 键再按Home 键。 为了更方便的阅读,请您接受以下建议 如果用户手册中的图象文字显示模糊,请放大显示比例。

目录 4

目 录 1章 安装RosettaStone 1.1 1.2 1.3 2章 RosettaStone概要 2.1 有关RosettaStone 2.1.1 RosettaStone的优点 2.1.2 有关易识别的原件 2.2 3章 RosettaStone的启动与关闭 3.1 RosettaStone的启动与关闭 3.1.1 RosettaStone的启动与关闭 3.1.2 画面构成与命令菜单 3.2 4章 获取图象与识别文字 4.1 图象的获取与编辑 4.1.1 获取图象前的设定 4.1.2 用图象扫描仪扫描图象 4.1.3 修正图象 4.1.4 打开图象文件 4.1.5 粘贴剪贴板的图象 4.2 区域设定和识别处理 4.2.1 设定识别方法 4.2.2 连续处理输入、文字识别、输出 4.2.3 自动OCR 4.2.4 OCR向导 4.2.5 全部处理 4.2.6 设定区域进行文字识别 4.3 4.4 4.5 编辑识别结果 自动校正识别的文本 在资源管理器中直接识别文字图象

有关操作环境 安装RosettaStone 卸载RosettaStone 使用帮助 操作流程 目录 5

5章 文本和图象的输出 5.1 打印文本和图象 5.1.1 设定打印机 5.1.2 打印 5.2 保存文本和图象 5.2.1 保存文本 5.2.2 保存图象 5.2.3 以页为单位删除文本和图象 5.3 同时保存文本和图象 5.3.1 保存编辑文件 5.3.2 调出编辑文件 5.4 转送文本 5.4.1 登录应用程序 5.4.2 转送文本 5.5 6章 改变显示 6.1 6.2 6.3 6.4 6.5 6.6 6.7 7章 提高识别率 7.1 7.2 8章 附录 8.1 8.2 说明 事项 扫描时的注意事项 有关提高识别率的各种设定 改变图象的显示比例 改变窗口的排列方式 显示其他页面 选择工具栏的显示 扩展设定 改变字体 改变颜色 发送文本

6

第1章 安装RosettaStone osettaStone 本章针对使用RosettaStone的环境和安装方法进行说明。 1.1 1.2 1.3 有关操作环境 安装RosettaStone 卸载RosettaStone

有关操作环境 7

1.1 有关操作环境 ! 计算机 可以运行中文版Microsoft®Windows®95/98/NT的计算机。 # 内存 建议内存容量32MB以上。 # 硬盘空间容量 最低60MB。 扫描彩色图象时每一页需要的空间容量: A3、300dpi 48MB A4、300dpi 25MB ! 操作系统 中文版Microsoft®Windows®95/98/NT。 ! 显示器 建议SVGA(分辨率1024×768象素,显示色High Color16位以上。) ! 图象扫描仪 分辨率200~600dpi(建议400dpi)。建议32位TWAIN兼容的机种。 32位TWAIN不兼容的机种无法直接获取图象。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 8

.2 1.2 安装RosettaStone 将RosettaStone安装到硬盘上。 注意 1. 请将已启动的其他应用程序(包括屏幕保护程序)关闭。 2. 从安装程序启动后,到安装完毕前,请不要打开该安装程序以外的其他应用程序。 1. 将安装用的光盘放置到CD-ROM驱动器内。 2. 选择[开始]-[设置]-[控制面板]。 显示[控制面板]窗口。 3. 双击[添加/删除程序]图标。 显示[添加/删除程序 属性]对话框。 4. 点击<安装>按钮。 显示[从软盘或CD-ROM安装程序]对话框。 <下一步> 继续安装。 <取消> 停止安装。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 9

5. 点击<下一步>按钮。 显示[运行安装程序]对话框。 [安装程序的命令行] 显示设置的驱动名与安装程序。 <浏览> 显示[浏览]对话框,选择安装程序。 <上一步> 取消输入的内容,回到前一画面。 <完成> 继续安装。 <取消> 停止安装。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 10

点击<完成>按钮。 显示[…InstallShield指南在准备中。请稍候。]信息后,显示[欢迎使用]对话框。 <下一步> 继续安装。 <取消> 停止安装。 6. 点击<下一步>按钮。 显示[软件使用许可合同书]对话框。 <是> 同意许可条件,继续安装。 <否> 停止安装。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 11

7. 如同意许可条件,点击<是>按钮。 显示[用户信息登录]对话框。 [姓名] [公司] <上一步> <下一步> <取消> 输入姓名。 输入公司名称或所属名称。 取消已输入的内容,回到前一画面。 通过输入的信息继续安装。 停止安装。 8. 点击<下一步>按钮。 显示[选择目标位置]对话框。 显示RosettaStone安装位置的驱动器名称与文件夹名称。 <浏览> 指定新的安装路径。 <上一步> 回到[用户信息登录]对话框。 <下一步> 继续安装。 <取消> 停止安装。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 12

9. 更改[选择目标位置]时,点击<浏览>按钮后,显示[选择文件夹]对话框,指定安装位置的文件夹。 如果不更改,请继续操作12。 10. 输入安装位置的文件夹名,点击<确定>按钮。 在安装位置没有指定的文件夹时,会显示确认建立文件夹的信息。 11. 点击<是>按钮。 回到[选择目标位置]对话框。 12. 确认安装位置的文件夹,点击<下一步>按钮。 显示[选择应用程序的文件夹]对话框。 [程序文件夹] 显示程序文件夹名称。 更改时,输入或者从[现有的文件夹]中选择。 [现有的文件夹] 显示现有文件夹名称。 <上一步> 回到[选择目标位置]对话框。 <下一步> 开始安装。 <取消> 停止安装。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 13

13. 点击<下一步>按钮。 显示安装进度。 14. 安装完毕。 1.章 安装RosettaStone 佳能RosettaStone用户指南

卸载RosettaStone 14

.3 1.3 卸载RosettaStone 将RosettaStone从硬盘中删除。 注意 1. 请将已启动的其他应用程序(包括屏幕保护程序)关闭。 2. 从卸载程序启动后,到卸载完毕前,请不要打开该卸载程序以外的应用程序。 3. RosettaStone已经打开时,请不要卸载。 1. 从[控制面板]-[添加/删除程序 属性]中选择[RosettaStone V3.10c]。 2.点击<添加/删除>按钮。 显示[确认文件删除]对话框。 3.点击<是>按钮。 显示[从您的计算机上删除程序]对话框,依次删除文件。 4.卸载成功。 点击<确定>按钮。 1.章 安装RosettaStone 佳能RosettaStone用户指南

15

第2章 RosettaStone概要 本章针对RosettaStone的概要和帮助的使用方法进行说明。 2.1 有关RosettaStone 2.1.1 RosettaStone的优点 2.1.2 有关易识别的原件 2.2 使用帮助 有关RosettaStone 16

2.1 有关RosettaStone 2.1.1 RosettaStone的优点 RosettaStone是把从图象扫描仪扫描的图象转变成文本的OCR软件。 RosettaStone具有以下优点 省掉繁琐的操作 # 用事先设定的方法获取图象并自动转换成文本。 # 回答问题的同时,可自动获取图象并转换成文本。 # 在资源管理器中可直接将图象转换成文本。 正确获取图象 # 可使用与TWAIN兼容的扫描仪。 # 对倾斜的图象可进行自动倾斜校正或手动倾斜校正。 # 对镂空文字的原件可进行黑白反转。 # 具有修正图象的功能。 正确识别图象 # 具有中文、英文分别识别体系,可更加正确地进行识别。 # 可自动识别信息(文章、表、图)混合在一起的图象。 # 具有校正支援的功能。 # 具有保存区域信息的功能。 # 可自动设定区域单位的识别语言(中文或英文),也可手动指定。 保存、转送、发送输出文件 # 具有保存编辑中的文件(图象和文本)的功能。 # 文件的保存格式可有多种选择(图象:TIFF文件、BMP文件、PCX文件、JPEG文件/ 文本:TXT格式、RTF格式、HTML格式、CSV格式)。 # 可将文本转送到其他应用程序上。 # 可将文本作为邮件的附件进行发送。 通过图象的版面信息再现输出文件 # 在Microsoft Word上可用近似原图象文件的版面进行文字编辑(用RTF格式保存)。 # 可再现文字大小、文字两端对齐、缩进、Tab键等的书写格式(用RTF格式保存)。 # 区域单位上附加框架,可进行文本、图、表的版面设计(用带框RTF格式保存)。无框的情况下也可进行版面设计。 再现表格 # 在Microsoft Word上可直接编辑表格(用RTF格式保存)。 # 可将图象的表格转换成HTML格式的表格(用HTML格式保存)。 # 可将图象的表格输出到Microsoft Excel(用CSV格式保存)。 2.章 RosettaStone概要 佳能RosettaStone用户指南

有关RosettaStone 17

2.1.2 .2 有关易识别的原件 根据原件的情况,识别率会发生改变。请确认以下几点。 易识别原件 ! 打印状态 颜色深浅均匀的原件、白底上用黑色或者深色打印的原件。 ! 字体、文字种类 国标2312的汉字(宋体、黑体、楷体、仿宋体)。 英文(Times、Roman、Helvetica、Courier)。 ! 文字大小 中文 12~48磅(200 dpi) 8~48磅(300 dpi) 6~48磅(400 dpi) 6~32磅(600 dpi) 英文 6~96磅(200 dpi) 6~84磅(300 dpi) 6~72磅(400 dpi) 6~56磅(600 dpi) 不易识别原件 ! 打印状态 文字颜色与背景色反差太小的原件、有背景图案的原件、字迹不清晰的原件、弄脏的原件、文字歪斜的原件、文字写在横线上的原件、行歪斜的原件。 ! 文字修饰 底纹、阴影、镂空(反转)、上标、下标以及竖写文章中使用的横写英文、数字等。 ! 倾斜 斜体、扁体、长体的文字以及倾斜角度比较大的原件。 整个原件的倾斜在−10°~10°以内的情况下,用RosettaStone扫描后可自动校正。10°以上的倾斜可手动校正。 ! 字体 与隶书相近的字体(毛笔字体等)。 2.章 RosettaStone概要 佳能RosettaStone用户指南

使用帮助 18

2.2 2.2 使用帮助 在RosettaStone中设置了以下帮助: # 根据操作内容查找的帮助。 # 使用关键词查找的帮助。 # 希望了解菜单或按钮的内容时查找的帮助。 # 希望了解对话框内容时查找的帮助。 根据操作内容查找的帮助 1. 选择[帮助]-[目录]。 显示[帮助主题:RosettaStone V3.10c]对话框的[目录]页。 <显示> 显示所选择的帮助主题。 <打印> 打印所选择的帮助主题。 <取消> 关闭帮助。 2. 双击希望查找的主题或者点击<显示>按钮。 显示与选择的帮助主题相关联的目录一览和目录一览中第一个项目的详细说明画面。 3. 目录一览中,点击每个项目,将显示详细的帮助。 4. 详细说明的画面中,点击下方画有实线的文字,将显示与之相关的详细的帮助。 5. 点击下方画有虚线的文字,将显示详细说明。 使用关键词查找的帮助 1. 选择[帮助]-[关键词检索]。 显示[帮助主题:RosettaStone V3.10c]对话框的[索引]页。 2. 选择或者输入关键词后,点击<显示>按钮。 显示该关键词的帮助信息。 希望了解菜单或按钮的内容时查找的帮助 1. 选择标准工具栏的帮助按钮 。 或者按Shift+F1键。 2. 光标转换成 。 3. 点击希望了解的菜单或按钮。 显示详细的帮助。 2.章 RosettaStone概要 佳能RosettaStone用户指南

使用帮助 19

希望了解对话框内容时查找的帮助 有以下两种方法: 方法一: 1. 点击对话框右上角的 按钮。 2. 光标转换成 。 3. 点击希望了解内容的按钮后,将显示详细的帮助。 方法二: 1. 在希望了解内容的按钮上点击鼠标的右键,将弹出<帮助>按钮或者<这是什么?>按钮。 2. 用左键点击弹出的<帮助>按钮或者<这是什么?>按钮,将显示详细的帮助。 2.章 RosettaStone概要 佳能RosettaStone用户指南

20

第3章 RosettaStone的启动与关闭 本章针对RosettaStone的启动与关闭以及操作流程进行说明。 3.1 RosettaStone的启动与关闭 3.1.1 RosettaStone的启动与关闭 3.1.2 画面构成与命令菜单 3.2 操作流程

RosettaStone的启动与关闭 21

3.1 RosettaStone的启动与关闭 3.1.1 RosettaStone的启动与关闭 启动RosettaStone RosettaStone 选择[开始]-[程序]-[RosettaStone V3.10c]-[RosettaStone]。 显示RosettaStone窗口。 关闭RosettaStone RosettaStone选择[文件]-[退出]。 备忘 有未保存的内容时,将显示是否保存窗口内容的信息。确认后才能退出。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 22

3.1.2 .2 画面构成与命令菜单 画面构成 1) 菜单栏 显示命令菜单。 2) 标准工具栏 用图标显示较常用的命令。 3) 图象操作工具栏 用图标显示图象窗口操作的命令。 4) 自动OCR工具栏 显示为执行自动OCR而设定的图标。 5) 图象窗口 显示图象。 6) 文本窗口 显示识别结果。 7) 区域框架 对成为识别对象的区域进行设定的框架。 8) 区域标志 表示识别的顺序、方向和区域语言的种类。 9) 状态栏 显示操作中命令的说明、识别词典名、页数、显示比例等。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 23

菜单栏

3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 24

3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 25

3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 26

标准工具栏 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1) 打开图象文件按钮 打开图象文件。 2) 保存按钮 保存文本。 3) 打印按钮 打印操作中的文本或图象。 4) 全部校正按钮 校正认为有错误并且在字典中没有的文字。 5) 剪切按钮 将所选择的文字删除并保存到剪贴板。 6) 复制按钮 将所选择的图象或文字复制并保存到剪贴板。 7) 粘贴按钮 粘贴剪贴板上的数据。 8) 撤消按钮 取消刚才进行的操作,返回到操作前的状态。(有些操作不能撤消) 9) 字符串的替换按钮 在文本窗口替换文字。 10) 上页按钮 显示上页内容。 11) 下页按钮 显示下页内容。 12) 选项按钮 显示设定图象输入方法和识别方法的[选项]对话框。 13) 文字的转送按钮 将文本转送到其他应用程序上。 14) 应用程序的启动按钮 启动其他应用程序。 15) 文字分离按钮 分离识别成1个字的文字。 16) 文字合并按钮 将识别成2个或2个以上的文字合并成1个字。 17) 帮助按钮 光标变成 ,显示所点击项目的帮助。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 27

图象操作工具栏

1 2 3 4 5 6 7 8 9 10 11 12 13 14 1) 图象的放大/缩小按钮 放大或缩小图象。鼠标左键为放大,右键为缩小。 2) 全页按钮 在图象窗口显示全页内容。 3) 原图按钮 在图象窗口按照原图的大小进行显示。 4) 图象选择按钮 建立、选择、移动区域框架。 5) 区域标志按钮 选择是否显示区域标志。 6) 中文设定按钮 将区域内文字图象作为中文进行识别。 7) 英文设定按钮 将区域内文字图象作为英文进行识别。 8) 自动倾斜校正按钮 自动校正倾斜−10°~10°的图象。 9) 手动倾斜校正按钮 手动校正倾斜10°以上的图象。 10) 图象的旋转按钮 旋转图象。 11) 黑白反转按钮 黑白反转整个图象。 12) 橡皮按钮 选择橡皮的大小,擦掉图象窗口内不想要的部分。 13) 删除矩形按钮 框住图象窗口内不要的部分进行删除。 14) 绘制直线按钮 选择线的粗细,在图象窗口内绘制直线。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 28

自动OCR工具栏 1 3 5 7 9 2 4 6 7 10 11 12 1) 自动OCR按钮 2) OCR向导按钮 执行自动OCR。 执行OCR向导。 3) 打开图象文件按钮 打开图象文件。 4) 扫描仪按钮 用与TWAIN兼容的图象扫描仪扫描图象。 5) 自动区域划分按钮 自动划分图象区域。 6) 通栏区域划分按钮 通栏划分图象区域。 7) 识别按钮 进行图象的文字识别,并加以中文检查。 8) 保存到文件按钮 将识别的文本以文件的格式进行保存。 9) 发送按钮 将识别的文本做为邮件的附件进行发送。 10) 输出到剪贴板按钮 将在文本窗口中所有的文本复制到剪贴板上。 11) 在文本窗口中显示按钮 将识别的文本显示在文本窗口中。 *点击各按钮右侧的 后,可选择所需要的项目。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

RosettaStone的启动与关闭 29

状态栏 1 2 3 4 1) 操作提示 显示进行操作时的简短提示。 2) 页 显示当前页/总页数。 3) 显示比例 显示图象窗口的显示比例。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

操作流程 30

3.2 3.2 操作流程 操作RosettaStone有以下4种方法。 按步骤操作 自动OCR OCR向导 按步骤一步步进行操作。请参阅第4章。 自动执行图象输入、区域划分、识别、输出文本的过程。 在解答问题的同时,进行图象输入、区域划分、识别、输出文本的设定并自动执行。 全部处理 对于版面相同的多幅图象,按照一定的模板进行区域划分,并进行速度优先识别,输出文本的过程。 备忘 1. 初次操作时,建议使用按步骤操作的方法。 2. 有相同版面的多张原件时,首先选出一张原件,使用按步骤操作的方法进行文字识别。然后设定条件以便提高识别率,以下的原件用全部处理或者OCR向导、自动OCR的方法进行文字识别,可提高效率。 3.章 RosettaStone 的启动与关闭 佳能RosettaStone 用户指南

31

第4章 获取图象与识别文字 本章针对获取图象、识别文字、修正识别结果、使用用户词典等进行说明。 4.1 图象的获取与编辑 4.1.1 获取图象前的设定 4.1.2 用图象扫描仪扫描图象 4.1.3 修正图象 4.1.4 打开图象文件 4.1.5 粘贴剪贴板的图象 4.2 区域设定和识别处理 4.2.1 设定识别方法 4.2.2 连续处理输入、文字识别、输出 4.2.3 自动OCR 4.2.4 OCR向导 4.2.5 全部处理 4.2.6 设定区域进行文字识别 4.3 4.4 4.5 编辑识别结果 自动校正识别的文本 在资源管理器中直接识别文字图象 图象的获取与编辑 32

4.1 图象的获取与编辑 4.1.1 获取图象前的设定 选择扫描仪驱动程序 选择图象扫描仪的驱动程序。此程序需要事先安装。 注意 RosettaStone 能通过与32位TWAIN兼容的图象扫描仪直接获取图象。与32位TWAIN不兼容的图象扫描仪,将扫描的图象指定为TIFF格式、BMP格式、PCX格式(只适用于黑白图象)或者JPEG格式,并保存在图象文件中, 通过RosettaStone调出该文件来获取图象。 备忘 所谓TWAIN是指输入设备在驱动程序和应用程序之间交换数据的协议。与TWAIN兼容的图象输入装置只选择驱动程序就可通过RosettaStone直接获取图象。 1. 选择[文件]-[选择扫描设备]。 显示[选择源]对话框。 2. 选择驱动程序后,点击<选择>按钮。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 33

事先设定图象的修正内容 扫描图象之前,可事先设定图象的修正内容。关于可修正的内容,请参阅后文的[4.1.3 修正图象]。 1. 选择[工具]-[选项]-[输入设定]。 显示[选项]对话框的[输入设定]页。 [黑白反转] 选择读取图象时是否进行黑白反转。 [自动倾斜校正] 选择是否自动校正图象的倾斜度。可校正−10°∼10°的倾斜。 [图象页追加到] 指定新读取图象的放置位置。 [输入图象] 选择读取图象的状态。将读取的图象转换为黑白图象,或者按照扫描仪驱动程序的设定读取图象。 <标准设定> [选项]对话框中各页的每个项目的设定返回初始的设定状态。 2. 设定[黑白反转]、[自动倾斜校正]、[图象页追加到]、[输入图象]后,点击<确定>按钮。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 34

4.1.2 .2 用图象扫描仪扫描图象 将原件置于图象扫描仪中并进行图象的扫描。 使用ADF(自动给纸装置)可扫描多张图象。 注意 在扫描仪的电源没接通的情况下,扫描图象会有错误显示。此时,点击<确定>按钮后,接通扫描仪的电源,重新启动Windows进行扫描。 扫描图象 1. 将原件置于扫描仪内。 2. 选择[文件]−[扫描],或者选择自动OCR工具栏的扫描仪按钮 。 显示扫描仪驱动程序的对话框。 3. 在扫描仪驱动程序的对话框内进行各种设定后,点击扫描按钮。 对话框的详细说明,请参阅扫描仪驱动程序手册。 在图象窗口显示扫描的图象。在图象窗口已有图象的情况下,将被追加到指定的页上。 保存已扫描的图象,请参阅[5.2 保存文本和图象]。 注意 1. 与TWAIN不兼容的图象扫描仪,无法通过RosettaStone直接扫描图象。使用图象扫描仪附属的专用软件扫描图象,并保存为TIFF文件、BMP文件、PCX文件(只适用于黑白图象)或者JPEG文件后,通过RosettaStone可以调出该图象文件。 2. 使用图象扫描仪扫描时,建议事先依照以下几点进行设定和操作。 使用黑白模式 提高分辨率(300~400dpi、建议400dpi) 摆放端正 浓度均匀 确认原件方向 文字大小要在可扫描的范围内(参照[8.1 说明]) 3. 使用ADF(自动给纸装置)一次最多可扫描20页。由于受内存及硬盘的容量、扫描分辨率、纸张大小等因素的影响,最多可扫描的页数有时少于20页。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 35

连续扫描图象 1. 将原件置于ADF(自动给纸装置)内。 2. 选择[文件]-[连续扫描]。 显示[图象另存为]对话框。 [保存在] [文件名] [保存类型] [压缩方式] [无] [G3-1D] [G4] [彩色压缩] 指定保存文件的驱动器与文件夹。 输入要保存的文件名。 文件的保存格式为[TIFF文件(*.tif)]。 压缩保存图象时的设定。压缩图象仅限于TIFF格式的文件。 无压缩。 以G3 FAX的压缩方式(Modified Huffman)进行压缩。 以G4 FAX的压缩方式(Modified Modified Read)进行压缩。 压缩彩色图象。连续扫描图象时,不能选择此项。 [选择保存范围] 保存多页图象时,指定使用TIFF文件保存格式。 [全部] [当前页] 保存所有页面的图象。 保存当前页面的图象。连续扫描图象时,不能选择此项。 3. 设定[保存在]、[保存类型],输入[文件名],必要时设定[压缩方式],点击<保存>按钮后,继续设定扫描仪的自动给纸装置及其他相关项目,即可进行连续扫描,并以输入的文件名保存起来。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 36

4.1.3 .3 修正图象 为使获取的图象能够正确地进行文字识别处理,可对图象进行以下修正。 # 自动校正倾斜(−10°~10°以内)的图象 # 手动校正倾斜(10°以上)的图象 # 旋转图象使文字方向正立 # 黑白反转整个图象 # 黑白反转局部图象 # 删除不要的部分 # 修正表格 选择[工具]−[选项]−[输入设定]后,在所显示的[选项]对话框中设定自动倾斜校正、整个图象黑白反转,这样从图象扫描仪或者图象文件中获取图象时就可以得到进行自动修正后的结果。 自动校正自动校正倾斜图象校正倾斜图象 倾斜度在−10°~10°以内可自动进行校正。 1.在图象窗口选择[图象]−[自动倾斜校正],或者选择自动倾斜校正按钮 。 2.图象已经建立了区域框架或者已经进行了文字识别以后,会显示清除区域划分和识别信息的对话框,点击<确定>按钮。 3.图象的区域框架被消除。倾斜度得到校正。文本窗口的识别结果变为确定文字,与图象不再有关联。 手动校正手动校正倾斜图象校正倾斜图象 图象倾斜度在10°以上时,参照所指定的线进行校正。在图象倾斜的状态下进行识别,会降低识别率。 1.在图象窗口选择[图象]−[手动倾斜校正],或者选择手动倾斜校正按钮 。 2.沿倾斜图象的文字或图、表绘制水平线或垂直线。 显示实行手动倾斜校正的对话框,点击<确定>按钮。 3.图象已经建立了区域框架或者已经进行了文字识别以后,会显示清除区域划分和识别信息的对话框,点击<确定>按钮。 4.图象的区域框架被消除。按照绘制的水平线或垂直线校正图象的倾斜度。文本窗口的识别结果变为确定文字,与图象不再有关联。 备忘 停止手动倾斜校正时,选择图象选择按钮 。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 37

修正图象的方向 旋转图象使文字的方向垂直正立。可以以90°为单位进行旋转。 1.在图象窗口选择[图象]-[旋转图象]中的[右转90度]/[180度]/[左转90度],或者选择旋转图象按钮 中的[右转90度]/[180度]/[左转90度]。 2.图象已经建立了区域框架或者已经进行了文字识别后,会显示清除区域划分和识别信息的对话框,点击<确定>按钮。 3.图象的区域框架被消除。图象被旋转。文本窗口的识别结果变为确定文字,与图象不再有关联。 黑白反转整个图象 对于镂空文字的图象,黑白反转整个图象后,使其成为白底黑字的图象。 在图象窗口选择[图象]-[黑白反转]或选择黑白反转按钮 。 图象黑白反转。 注意 彩色图象、灰度图象无法进行黑白反转。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 38

黑白反转局部图象 1. 在图象窗口内拖动鼠标,框住镂空文字,建立区域框架,或者选择原有的区域框架。 区域建立方法请参阅[4.2.6 设定区域进行文字识别]。 2. 选择[图象]-[区域内黑白反转]。 或者在区域上点击鼠标右键,在弹出的菜单上选择[区域内黑白反转]。 建立或者选择的区域黑白反转。 注意 彩色图象、灰度图象无法进行黑白反转。 备忘 取消区域内黑白反转时,选择[编辑]-[撤消]或者撤消按钮 。 删除不要的部分 ! 指定范围删除 1. 在图象窗口选择删除矩形按钮 。 2. 通过拖动鼠标指定需要删除图象的范围,这部分将被删除。 ! 橡皮删除 1. 在图象窗口选择橡皮按钮 。 2. 选择橡皮的大小。 3. 在需要删除的图象上,按住鼠标左键擦拭。 注意 彩色图象、灰度图象无法进行删除。 备忘 1.取消图象的删除时,选择[编辑]-[撤消]或者撤消按钮 。 2.停止删除时,选择图象选择按钮 。 修正表格的边框 1. 在图象窗口选择绘制直线按钮 。 2. 选择直线的粗细。 通过拖动鼠标,重新绘制表格边框。 注意 彩色图象、灰度图象不能绘制直线。 备忘 1.取消绘制的直线时,选择[编辑]-[撤消]或者撤消按钮 。 2.停止绘制直线时,选择图象选择按钮 。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 39

4.1.4 .4 打开图象文件 可打开的文件类型有TIFF文件、BMP文件、PCX文件黑白图象和JPEG文件。 1. 选择[文件]-[打开]-[图象],或者标准工具栏的打开图象文件按钮 ,或者自动OCR工具栏的打开图象文件按钮 。 显示[打开图象文件]对话框。 [搜寻] [文件名] [文件类型] <详细设定> 选择文件所在的驱动器和文件夹。 选择或输入要打开图象的文件名。也可选择或输入多个文件。 选择打开文件的类型。 显示[已选文件]目录框。当一次选择不同的驱动器或文件夹的文件时可进行选择。 <追加> <全部追加> <删除> <全部删除> <基本设定> 追加已经选择的文件。追加的文件显示在[已选文件]中。 追加[搜寻]中显示的全部文件。追加文件显示在[已选文件]中。 从[已选文件]中删除所选文件。文件本身不删除。 从[已选文件]中删除所有文件。文件本身不删除。 不显示追加编辑框。 2. 使用[搜寻]、[文件类型]、[文件名]选择文件。选择多个文件时,可按以下方法操作。 ·按住Shift 键,选择连续文件的第一个和最后一个。 ·按住Ctrl 键,一个个选择需要的文件。 ·单击<详细设定>按钮,选择需要的文件后单击<追加>按钮,或者单击<全部追加>按钮。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

图象的获取与编辑 40

3. 点击<打开>按钮。 显示图象。此时,按照通过[工具]-[选项]-[输入设定]显示的对话框上设定的内容(黑白反转、倾斜校正等),图象被修正并进行显示。 4.1.5 .5 粘贴剪贴板的图象 将剪贴板的图象粘贴到图象窗口。 1.选择[编辑]-[粘贴],或者选择粘贴按钮 。 2.显示添加的确认信息,点击<确定>按钮。 3.剪贴板的图象数据被粘贴。 如果图象窗口已打开,追加到[选项]对话框[输入设定]页中[图象页追加到]设定的位置上。 如果图象窗口未打开,打开图象窗口并粘贴。 备忘 粘贴通过其他软件处理的图象时,请注意需要是DIB BMP格式或者BMP格式的图象数据。 注意 剪贴板的数据有以下类型。 1. 选择[编辑]-[复制]或者复制按钮 后将图象数据粘贴到剪贴板上的类型。 2. 使用其他图象处理用的软件粘贴到剪贴板上的类型。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 41 4.2 4.2 区域设定和识别处理 以下为图象识别的顺序: 识别图象 设定区域,建立区域框架 设定识别方法 4.2.1 设定识别方法 对识别方法做以下设定: ·识别语言(中文、英文) ·识别对象(文章文本、表内文本) ·识别文字的种类(全部、数字·符号、纯英文) ·表内文字的解析(框内合并、框内分割) ·输出格式(换行、设定中文半角) 设定识别语言 选择[工具]-[选项],通过[选项]对话框[区域设定]页中的[语言]的[自动]、[中文]、[英文] 对识别语言进行设定。 使用所选择的语言进行识别。 备忘 对于已经进行了区域划分的图象,在图象窗口选中区域后,选择[编辑]-[区域语言设定]中的[中文]或是[英文],或者点击中文设定按钮 或是英文设定按钮 。 设定识别对象 识别对象有文章文本和表内文本两种类型。把图、表以外的文章文字叫做文章文本,表内的文字叫做表内文本。 识别表内文本时,作为识别结果,会在表的栏(单元格)之间插入Tab代码,在各行末插入换行代码。因此,作为表格格式的数据可输入到Microsoft Excel等应用程序中。 在文本窗口上此Tab代码用换行代码表示。 对于文章文本,在图象窗口选中区域后,选择[编辑]-[区域类型设定]-[文本];对于表内文本, 应用程序可以自动判别,不需要用户进行设定。 选择的文章文本区域和自动判别的表内文本区域可以进行识别。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 42

设定识别文字的种类 原件为纯英文或只有数字、符号时,如果指定识别文字的种类可提高识别率。 选择[工具]-[选项],通过[选项]对话框[区域设定]页中的[英文的文字种类]进行设定。 [全部] [数字、符号] [纯英文] 作为英文、数字、符号进行识别。原件为一般的英文文章时进行设定。原件为数字或符号时进行设定。 原件为纯英文时进行设定。 备忘 对于已经进行了区域划分的图象,在图象窗口选中英文区域后,选择[编辑]-[英文区域的文字种类设定]中的[全部]、[数字、符号]、[纯英文]进行设定。 设定表内文本的识别方法 选择[工具]-[选项],通过[选项]对话框[区域设定]页中[表的解析]的[框内单元格的合并]或[框内单元格的分割]对表内文本的识别方法进行设定。 [框内合并] 将实线括住的表内区域设定为一个单元格,作为一个文本区域进行识别。 出生日 19XX年XX月XX日 [框内分割] 将实线括住的表内区域分割为多个单元格,作为多个文本区域进行识别。 出生日 19XX年XX月XX日 出生日 19XX年XX月XX日 出生日 19XX年XX月XX日 备忘 对于已经进行了区域划分的图象,在图象窗口选中表内文本区域后,选择[编辑]-[单元格的合并]中的[框内合并]、[框内分割]。 设定输出格式 1. 选择[工具]-[选项],[选项]对话框中的[输出格式]页。 显示[选项]对话框中的[输出格式]页。 [换行] 设定换行代码的插入方法。 [插入换行] 每行结尾插入换行代码。 [插入段落] 每段结尾插入换行代码。 [设定中文半角] 设定半角文字。 [英文] 英文为半角。 [数字] 数字为半角。 [符号] 符号为半角。 [空白] 空白为文本的半角空格。 [中文输出编码] 设定中文识别结果输出时采用的编码。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 43

[GB2312] 中文输出按照GB2312编码标准。 [BIG5] 中文输出按照BIG5编码标准。 [GBK] 中文输出按照GBK编码标准。 <标准设定> [选项]对话框中各页的每个项目的设定返回初始的设定状态。 2. 设定[换行]、[设定中文半角]的输出格式并点击<确定>按钮。 备忘 换行代码是指将文字强制换到下一行的代码,等同于在文字处理软件上按 Enter 键换行时输入的代码。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 44

4.2.2 4.2.2 连续处理输入、文字识别、输出 连续处理输入、文字识别、输出时具有以下3种方法。 自动OCR OCR向导 自动执行图象输入、区域划分、识别、输出文本的过程。 在解答问题的同时,进行图象输入、区域划分、识别、输出文本的设定并自动执行。 全部处理 对于版面相同的多幅图象,按照一定的模板进行区域划分,并进行速度优先识别,输出文本的过程。 进行连续处理前,对以下内容进行设定,可以提高识别率。 # 图象的输入方法 # 区域划分的方法 # 区域的识别方法 # 文本的输出方法 # 区域的识别语言或文字种类 # 中文输出格式 1.选择[工具]-[选项]或者点击选项按钮 。 显示[选项]对话框中的[识别处理]页。 [自动执行] [OCR向导] [图象输入] [输入原稿] 从自动OCR、OCR向导中选择自动执行的方法。 选中此项,则OCR向导被选择,不选此项,则自动OCR被选择。 从扫描仪、图象文件中选择图象输入的方法。 选择[扫描仪]后,使用扫描仪扫描图象;选择[图象文件]后,打开图象文件。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 45

[区域划分] [自动区域划分] [通栏区域划分] [识别数据的保存] [保存到文件] [发送]

选择图象区域划分的方法。 自动划分区域并建成区域框架。 自动划分通栏区域并建成区域框架。 选择输出识别结果的方法。 将识别结果保存到文件。

将识别结果作为邮件的附件发送。需要安装Microsoft Exchange、Microsoft Outlook或Outlook Express中的任一邮件发送软件。

[输出到剪贴板]

将识别结果输出到剪贴板。

[在文本窗口中显示] 在文本窗口中显示识别结果。

<标准设定> [选项]对话框中各页的每个项目的设定返回初始的设定状态。

2.选择[输入设定]页。

指定[黑白反转]、[自动倾斜校正]等来设定图象的修正方法。 详细内容请参阅[4.1.1 获取图象前的设定]。

3.选择[区域设定]页。

指定[语言]、[表的解析]、[中文识别字体]、[英文的文字种类]来设定区域的识别语言、文字种类、表内文字的识别方法等。

详细内容请参阅[4.2.1 设定识别方法]。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 46

4.选择[输出格式]页。

通过[换行]、[设定中文半角]设定输出格式。 详细内容请参阅[4.2.1 设定识别方法]。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 47

4. 2. 3自动OCR 1.选择自动OCR工具栏的自动OCR按钮 。 设定从扫描仪中输入图象时,显示扫描仪驱动程序的对话框。 设定从图象文件中输入图象时,显示[打开图象文件]对话框。 2.从扫描仪或者图象文件中获取图象。 对获取的图象进行区域划分和识别处理,在图象窗口显示图象,在文本窗口显示文本。 备忘 1. 输入图象,按照通过[工具]-[选项]-[输入设定]设定的内容进行图象的修正。 2. 选择[工具]-[选项]-[识别处理],在[识别数据的保存]中选择[在文本窗口中显示]以外的内容时,在文本窗口显示文本后,进行设定的处理。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 48

4.2.4 4.2.4 OCR向导 1. 选择自动OCR工具栏中的OCR向导按钮 。 显示[OCR向导第一步/共三步]对话框。 在此选择图象输入的方法。 [扫描仪] 通过扫描仪扫描图象。 [图象文件] 打开现有的图象文件。 <下一步> 前进到下一步。 <取消> 停止OCR向导。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 49

2. 选择图象输入的方法后点击<下一步>按钮。

显示[OCR向导第二步/共三步]对话框。 在此选择图象区域划分的方法。

[自动区域划分] 自动划分区域并建成区域框架。 [通栏区域划分] 自动划分通栏区域并建成区域框架。

<下一步> 前进到下一步。 <取消> 停止OCR向导。 <上一步> 返回到前一画面。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 50

3. 选择图象输入的方法后点击<下一步>按钮。

显示[OCR向导第三步/共三步]对话框。 在此选择输出识别结果的方法。

[保存到文件] [发送]

将识别结果保存到文件。

将识别结果作为邮件的附件发送。需要安装Microsoft Exchange、Microsoft Outlook或Outlook Express中的任一邮件发送软件。

[输出到剪贴板] [在文本窗口中显示] <结束>

将识别结果输出到剪贴板。 在文本窗口中显示识别结果。

按照设定的内容连续进行图象输入、区域划分、识别、输出文本等操作。

<取消> <上一步>

停止OCR向导。 返回到前一画面。

4. 选择输出识别结果的方法后,点击<结束>按钮。

按照设定的内容自动输入图象、划分区域、识别、输出识别结果。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 51

4.2.5 4.2.5 全部处理 1. 选择[识别]-[全部处理]。 显示[全部处理]对话框。 [原件输入] [扫描仪] [图象文件] <浏览> <输入时的设定> 选择图象数据的输入方法。 用与TWAIN兼容的图象扫描仪扫描图象。 从图象文件输入并指定文件名。 显示[打开图象文件]对话框,选择图象文件。 显示[选项]对话框的[输入设定]页,进行图象输入时的设定。 详细内容请参阅[4.1.1 获取图象前的设定]。 [模板] [模板名] <模板> 选择模板的使用方法。 使用模板时,单击<模板>按钮并输入模板的使用方法和模板名。 显示[选择模板]对话框。选择模板的使用方法,必要时选择模板。 [自动区域划分] [建立新模板] [使用现有模板] 自动划分区域每一页。 自动区域划分第1页,其结果作为模板适用于所有页。 显示[打开模板]对话框。从原有模板中选择要使用的模板。 有关模板的选择和设定请参阅[4.2.6 设定区域进行文字识别]。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 52

[输出文件] [文本文件名] <浏览> [图象文件]

指定输出文件的种类、位置和文件名。

输出文本文件时,在此显示文本文件的位置和文件名。

显示[保存文本]对话框。输入或选择保存位置与文件名、保存格式。 输出图象文件时,选中此项并输入文件名。把[全部处理]对话框中的<输入时的设定>显示的[选项]对话框中的[输入图象]项目中设定为[变为黑白图]时才可选择。

<浏览> [编辑文件名] <浏览>

2. 设定[原件输入]、[模板]、[输出文件]后点击<运行>按钮。

执行图象输入、区域划分、识别、输出文本。

注意 [全部处理]对话框中,[输出文件]各项的指定要在点击<浏览>按钮后所显示的对话框上进行。

显示[图象另存为]对话框。输入或选择保存位置与文件名、保存格式。 输出编辑文件时,在此显示编辑文件的位置和文件名。 显示[保存编辑文件]对话框。输入或选择保存位置与文件名。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 53

4.2.6 4.2.6 设定区域进行文字识别 图象在划分并建立区域后,才能进行文字识别。区域内,通过区域标志显示识别区域的顺序与识别文字的方向。 区域信息可作为模板进行保存。对于区域信息相同的图象,可使用模板。 区域可进行以下编辑和更改。 # 区域的建立、删除、保存 # 区域的放大、缩小、合并、移动 # 更改识别顺序 # 更改识别文字的方向(竖写、横写) 设定区域 以下方法可建立区域框架,设定区域。 # 自动划分区域 # 任意设定区域 # 使用模板设定 ! 自动划分区域 在图象窗口,选择自动OCR工具栏中的自动区域划分按钮 。 图象为通栏文章时,选择自动OCR工具栏中的通栏区域划分按钮 。 自动对图象窗口中的图象进行区域划分,建立区域框架。 已有区域框架时,通过[编辑]-[删除所有区域]进行删除后再操作。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理

! 任意设定区域

划分区域特定位置时,选择图象选择按钮 ,通过拖动鼠标建立区域框架。

注意 建立区域框架时,应只选中文字,否则会与图/表的线重叠。如与图/表的线重叠将无法正确识别文字。

! 使用模板设定区域

1. 获取图象后,选择[文件]-[打开模板]。

显示[打开模板]对话框。

[搜寻] 选择保存文件的驱动器或文件夹。 [文件名] 选择或者输入要打开模板的文件名。 [文件类型] 文件类型为模板,扩展名为[.bs]。

[模板读取范围] 选中[所有页]后,打开多页图象时,将选择的模板设定到所有页。解除选

择后,只设定到当前页。

2. 使用[搜寻]、[文件类型]、[文件名]选择文件,指定模板的读取范围。 3. 点击<打开>按钮。

在图象窗口,根据模板对图象进行区域划分,建立区域框架。

注意 使用模板设定区域,需要事先保存模板。有关保存请参阅58页[保存模板(区域信息)]。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 55

选择编辑区域 所选择的区域用粗的区域框架线表示,四角有可改变区域大小的小方块。 1. 选择图象操作工具栏的图象选择按钮 。 2. 使用以下方法选择区域和解除选择区域。 选择一个区域 点击区域框架内部。 点击选择多个区域 点击区域框架内部,可选择第一个区域。自第二个区域以后,可按住Ctrl 键点击区域框架内部进行选择。 拖动选择多个区域 从没有区域框架的地方拖动鼠标,被拖动框架线覆盖的区域全被选中。 选择所有区域 在图象窗口选择[编辑]-[全选]。 解除所有选中区域的选择 点击区域以外的部分。 解除多个选中区域中的1个 按住 Ctrl 键,点击要解除的区域框架的内部。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 56

放大、缩小区域 1. 选择图象操作工具栏的图象选择按钮 。 2. 选择区域后,将鼠标光标移至区域框架线上(或者四角上)。 3. 鼠标光标变为双箭头光标后,拖动此光标便可任意改变区域大小。 移动区域 1.选择图象操作工具栏的图象选择按钮 。 2.将光标放置在需要移动的区域内,按住鼠标左键,拖动鼠标可以对区域进行任意方向的移动。 备忘 移动多个区域框架时,选择多个框架后,按住Ctrl键拖动其中一个。 删除区域 ! 删除已选区域 1. 选择图象操作工具栏的图象选择按钮 。 2. 首先选择区域,然后选择[编辑]-[删除],或者按Del键。 ! 删除当前所有的区域 1. 在图象窗口显示要删除区域的页面。 2. 选择[编辑]-[删除所有区域]。 删除所有的区域框架。 3. 有多张图象数据时,重复前两步的操作。 备忘 取消区域的删除时,选择[编辑]-[撤消]或者撤消按钮 。 将多个区域合并成一个区域 1. 选择图象操作工具栏的图象选择按钮 后,选择多个区域。 选择方法请参阅上页[选择编辑区域]。 2. 选择[编辑]-[区域合并]。 所选择的区域成为一个区域。 备忘 1.合并后的区域序号为合并前区域序号中最小的一个。 识别文字的方向为合并前区域序号最小的区域的识别方向。 2.可进行合并的是同一类型的区域。文本与图的区域无法合并。 设定区域的语言(中文、英文) 1. 选择图象操作工具栏的图象选择按钮 后,选择区域。 2. 选择[编辑]-[区域语言设定]中的[中文]或[英文],或者选择图象操作工具栏的中文设定按钮 或英文设定按钮 。 备忘 使用全部处理、自动OCR、OCR向导设定语言时,选择[工具]-[选项],通过[选项]对话框[区域设定]页里的[中文]、[英文]或[自动]进行设定。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 57

改变识别文字的方向(竖写、横写) 每点击一次区域标志的三角部分,进行一次方向的改变。 横写 竖写 用鼠标点击此处改变识别顺序 更改区域序号后,识别顺序自动被改变。 例: 把[3]改为[1]时 更改前识别顺序 1 2 3 4 更改后识别顺序 2 3 1 4 1. 点击区域标志的序号。 转换为等待输入的状态。 2. 输入新序号后按Enter键。 保存模板(区域信息) 通过模板保存所设定的区域信息,如:区域划分、识别方向、识别顺序等信息。所保存的模板,可使用于版面相同的其他图象。 1. 在图象窗口设定区域。 2. 选择[文件]-[模板另存为]。 显示[模板另存为]对话框。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

区域设定和识别处理 58

[保存在] [文件名] [保存类型]

选择保存文件的驱动器或文件夹。 输入保存模板文件的名称。 文件类型为模板,扩展名为[.bs]。

3. 选择保存位置,输入文件名。 4. 点击<保存>按钮。

模板被保存。

识别文字并转换为文本

! 识别所有的区域

在图象窗口,选择[识别]-[识别图像],或者选择自动OCR工具栏中的识别按钮 所有区域的文字被识别,并显示到文本窗口。

备忘 1. 识别多个区域时,识别完毕的区域转变颜色并显示进度状态。但只限于黑白两色的图象。若是灰度图

象或彩色图象,区域颜色不转变。

2. 进度状态的显示可通过选择[显示]-[进度显示]进行显示/不显示的切换。

! 识别选择的区域

1. 选择图象选择按钮 后,选择要识别的区域。

2. 选择[识别]-[识别区域内文字],或者在区域内双击,或者在区域内点击鼠标右键,在弹出

的菜单中选择[识别区域内文字]。

选择的区域内文字被识别并显示在文本窗口上。

继续选择其他的区域进行区域内文字识别时,会在文本的最后添加识别的文本。

备忘 1. 执行[识别]-[速度优先识别]或[精度优先识别]时,即使选择了特定的区域,也会识别所有的区域。

2. 没有选择区域时,[识别]-[识别区域内文字]无法运行。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

编辑识别结果 59 4.3 4.3 编辑识别结果

如果识别的文本数量很多,建议首先进行校正。有关校正,请参阅[ 4.4 自动校正识别的文本]。

改变为其他候补文字

1.在文本窗口选择要修改的一个文字后,选择[识别]-[候补文字],或者点击鼠标右键,将弹出包括一系列候补文字的菜单。此时,在图象窗口上相应的文字图象也被框起来。

备忘 候补文字在8个字以上时,第8个候补文字显示为[其它]。从[其它]中查找时,点击[其它],在所显示的[选

择候补文字]对话框中选择文字后,点击<确定>按钮。 注意 作为英文进行识别的候补文字,只显示3个候补文字。

2.选择目的文字,目的文字将显示在文本窗口中。

插入文字

1.将光标移至文本窗口的插入位置。 2.输入文字。

注意 输入的文字为无候补的确定文字。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

编辑识别结果 60

删除文字 ! 一个个删除 1.将光标移至文本窗口中要删除的文字的前面(或后面)。 2.按Del(或BackSpace)键。 Del键删除光标后面的文字,BackSpace键删除光标前面的文字。 ! 指定范围删除 1. 拖动鼠标选择文本窗口中要删除的文字。 或者,将光标移至文本窗口中要删除的文字的前面,按住Shift键,再按→ ← ↓ ↑键进行选择。 选择的文字黑白反转。 2. 选择[编辑]-[删除],或者按Del键或BackSpace键。 选择的文字被删除。 备忘 取消文字的删除时,选择[编辑]-[撤消]或者撤消按钮 。 分离文字 两个文字被识别成一个文字时,可以用分离文字的功能使其重新识别为两个文字。 例 :文字分离 加 → 力 口 1. 在文本窗口上,选中要分离的文字。文字黑白反转。 在图象窗口上,相应的文字图象被括起来。 2. 选择[识别]-[文字分离],或者选择标准工具栏中的文字分离按钮 。 文字被放大并显示表示分离位置的线。 3. 使用鼠标将线移至分离位置并点击左键。文字被分离。 4.章 获取图象与识别文字 佳能RosettaStone用户指南

编辑识别结果 61

合并文字

一个文字的图象被识别成两个或两个以上文字时,可以用合并文字的功能使其重新识别为一个文字。

例 :文字合并 力 口 → 加

1. 在文本窗口上,选中要合并的两个或两个以上文字。文字黑白反转。

在图象窗口上,相应的文字图象被框起来。

2. 选择[识别]-[文字合并],或者选择标准工具栏中的文字合并按钮 。

文字合并,识别成一个文字。

查找文字

1. 在文本窗口上,将光标放置在开始查找的位置上。 2. 选择[编辑]-[查找]。显示[查找]对话框。

[查找目标] 输入要查找的内容。在文本窗口中选择的文字会在此项里显示出来。 [方向] 选择从光标位置开始查找的方向。

[全字匹配] 使用英文查找时,只查找整个词,而不搜索更长词中的文字。 [区分大小写] 只查找与[查找目标]中指定的文字大小写模式匹配的文字。 3. 在[查找目标]内输入文字并选择[方向]。

必要时,选择[全字匹配]、[区分大小写]。 4. 点击<找下一个>按钮。

查找的文字黑白反转。当没有所要查找的文字时,显示[未发现文字“××”]的信息。 5. 继续查找时,点击<找下一个>按钮。结束查找时,点击<取消>按钮。

替换文字

1. 在文本窗口上选择[编辑]-[替换],或者选择标准工具栏的替换按钮 。

显示[替换]对话框。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

编辑识别结果 62

[查找内容] 输入要替换的内容。当在文本窗口已选择了文字时,会在此项里显示出来。 [替换为] 输入替换后的文字。

[全字匹配] 使用英文查找时,只查找整个词,而不搜索更长词中的文字。如选中此项,

在检索[ship]时,就会查找单词[ship]而不是[shipper]。

[区分大小写] 只查找与[查找内容]中指定的文字大小写模式匹配的文字。 <找下一个> 查找文字但不进行替换。

<替换> 替换查找到的文字后,继续查找下一个。 <全部替换> 查找到的文字全部替换。 2. 将文字输入到[查找内容]和[替换为]上。

必要时,选中[全字匹配]、[区分大小写]。

3. 确认查找到的文字并进行替换后,点击<找下一个>按钮。

查找到的文字黑白反转。

没必要确认时,点击<全部替换>按钮。

查找到的文字全部被替换。此时没有必要进行下一步的操作。 4. 替换时,点击<替换>按钮。

查找到的文字被替换后,继续查找下一个文字。

不替换时,点击<找下一个>按钮。文字将不会被替换而只显示下一个文字。 替换结束时,点击<取消>按钮。

移动文字

1. 在文本窗口选择文字。

文字黑白反转。

2. 选择[编辑]-[剪切],或者选择标准工具栏的剪切按钮 。

文字被剪切并转送到剪贴板。

3. 将光标放置在要移动到的地方,选择[编辑]-[粘贴],或者选择标准工具栏的粘贴按钮 。

剪贴板上的文字被插入。

复制文字

1. 在文本窗口选择文字。

文字黑白反转。

2. 选择[编辑]-[复制],或者选择标准工具栏的复制按钮 。

文字被复制并转送到剪贴板上。

3. 将光标放置在要复制到的位置,选择[编辑]-[粘贴],或者选择标准工具栏的粘贴按钮 。

剪贴板上的文字被插入。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

自动校正识别的文本 63 4.4 4.4 自动校正识别的文本

检查文本窗口的文本并查出被认为是错误的文字。以下为检查文字的基准。 # 校正支援词典上没有登录的中文词语 # 拼写错误的英文

# 此功能仅在当前操作系统为简体中文并且选中的中文输出编码为“GB2312”或者“GBK”

时才有效

查找出的文字使用校正支援可全部校正。

固有名词等,即使是正确的文字也有可能被查找出来。将这样的文字登录到中文校正支援词典或英文校正支援词典上,下一次将不再被检查出来。

1.在文本窗口,选择[工具]-[全部校正],或者选择标准工具栏的全部校正按钮 。

对指定范围进行校正时,选中指定范围并选择[工具]-[校正指定范围]。

从文本的任意位置开始校正时,将光标移动到开始校正的位置上,选择[工具]-[校正光标以下]。 文本被检查,所检查出来的被认为是错误的文字将改变颜色。 检查完毕后会显示信息。 2.点击<确定>按钮。

显示[校正支援]对话框。

[对象图象] 显示被查找出来的文字的图象。 [对象文字] 显示被查找出来的文字。

[输入订正] 订正被检查出来的文字时,输入正确的文字。 <检查下一项> 不进行订正,继续显示下一个被检查出来的文字。

<订正> 将当前文字替换为[输入订正]中的文字后,继续显示下一个被检查出来的文字。 <同样订正> 将以下文章中显示的与[对象文字]中相同的文字全部替换为[输入订正]中的文

字。

<忽略> 忽略[对象文字]中的所有文字,不作为订正对象。继续显示下一个被检查出来的

4.章 获取图象与识别文字 佳能RosettaStone用户指南

自动校正识别的文本

文字。

<登录> 显示[英文校正支援词典]对话框。当[对象文字]中的文字没有错误时,可以将[对

象文字]的文字登录到校正支援词典上,确保下次不被检查出来。在捆绑版中,对于中文此项功能不可使用。

<结束> 停止校正。

3.订正[对象文字]中的文字时,将正确的文字输入到[输入订正]中并点击<订正>按钮。

相同的文字全部订正时,点击<同样订正>按钮。 不订正[对象文字]中的文字时,点击<检查下一项>按钮。 所有相同的文字都不订正时,点击<忽略>按钮。

将不订正但有可能以后还会被检查出来的文字,通过点击<登录>按钮,登录到词典上。 4.检查出来的文字一直确认到最后时,会显示表示结束的信息。

点击<确定>按钮。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

在资源管理器中直接识别文字图象 65 4.5 4.5 在资源管理器中直接识别文字图象

安装了RosettaStone后,在[资源管理器]窗口可以直接将图象文件转换为文本文件。转换后的文本文件将被自动保存。启动与所保存的文件格式相关联的应用程序后,可看到文本文件。 1. 显示[资源管理器]窗口,选择要转换的图象文件,点击鼠标右键。

显示弹出菜单。

2. 选择[OCR]-[TXT格式]、[RTF格式]、[CSV格式]、[剪贴板]中的任一项。

自动进行区域划分、识别、保存到文件。

启动与所保存的文件格式相关联的应用程序并显示文件。 3. 通过应用程序编辑转换后的文本并进行保存。

备忘 1.可转换图象文件的格式为TIFF文件、BMP文件、PCX文件黑白图象、JPEG文件。

2.通常,选择[TXT格式]后,记事本被关联并启动;选择[RTF格式]后,Microsoft Word被关联并启动;选

择[CSV格式]后,Microsoft Excel被关联并启动。

不相关的文件,可在选择[资源管理器]窗口中的[查看]-[文件夹选项]后,选择[文件类型]进行确认。 3.划分区域和识别的方法、以及是否启动相关联的应用程序等设定,是使用前一次RosettaStone的设定。

4.章 获取图象与识别文字 佳能RosettaStone用户指南

66

第5章

文本和图象的输出

本章针对文本和图象的打印、保存、转送、发送等方法进行说明。

5.1

打印文本和图象 5.1.1 设定打印机 5.1.2 打印

5.2

保存文本和图象 5.2.1 保存文本 5.2.2 保存图象

5.2.3 以页为单位删除文本和图象

5.3

同时保存文本和图象 5.3.1 保存编辑文件 5.3.2 调出编辑文件

5.4

转送文本

5.4.1 登录应用程序 5.4.2 转送文本

5.5

发送文本

打印文本和图象 67

5.1 打印文本和图象 5.1.1 设定打印机 设定要使用的打印机、纸张大小和来源、打印方向。 1. 选择[文件]-[打印设置]。 显示[打印设置]对话框。 [打印机] [名称] <属性> [纸张] [大小] [来源] [方向] [纵向] [横向] 选择要使用的打印机。 当前使用的打印机的名称。 对打印机做更加详细的设定。 选择纸张。 选择纸张大小。 选择纸张来源。 选择打印方向。 纵向打印。 横向打印。 2. 设定[打印机]、[纸张]、[方向]后,点击<确定>按钮。 备忘 有关点击<属性>按钮后对打印机做更加详细的设定,请参阅打印机驱动程序的使用说明书或帮助。 5.章 文本和图象的输出 佳能RosettaStone用户指南

打印文本和图象 68

5.1.2 .2 打印 打印文本窗口中的文本或者图象窗口中的图象。 1. 打印文本时,选择文本窗口。 打印图象时,选择图象窗口。 只打印一部分文本时,选择要打印的范围。 2. 选择[文件]-[打印],或者选择标准工具栏的打印按钮 。 显示[打印]对话框。 [打印机] [名称] <属性> [打印范围] [全部] [页数] [选择的范围] [份数] 选择要使用的打印机。 当前使用的打印机的名称。 对打印机做更加详细的设定。 选择要打印的页面或者要打印的部分。 打印图象窗口中的全部图象或者文本窗口中的全部文本。 在图象窗口中,当有多页图象时,指定要打印的页数。 在文本窗口中,无法选择此项。 在图象窗口中,无法选择此项。 在文本窗口中,选择一定范围后,则打印选择的范围。 输入打印份数。 3. 设定[打印机]、[打印范围]、[份数]后,点击<确定>按钮。 注意 根据打印机的种类不同,也有无法设定的项目。 5.章 文本和图象的输出 佳能RosettaStone用户指南

保存文本和图象 69

5.2 5.2 保存文本和图象 5.2.1 保存文本 保存文本有以下两种方法。 # 起一个文件名进行保存 # 用相同文件名进行保存 起名保存 1. 选择文本窗口。 2. 选择[文件]-[另存为]。 显示[保存文本]对话框。 [保存在] 指定保存文件的驱动器或文件夹。 [文件名] 输入要保存的文件名。 [保存类型] 从[带框RTF(*.rtf)]、[无框RTF(*.rtf)]、[HTML文件多页格式(*.htm)]、[HTML文件单页格式(*.htm)]、[文本文件(*.txt)]、[文本(Tab分段)(*.txt)]、[CSV(逗号分段)(*.csv)]中选择文件类型。 [启动相关应用程序] 选中此项后,自动启动与在[保存类型]中选择的保存格式的扩展名相关联的应用程序。保存的文本可立刻进行编辑。 3. 设定[保存在]、[保存类型],输入[文件名],必要时选中[启动相关应用程序],点击<保存>按钮,文本被保存到新文件里。 使用同一个文件名(替代)保存 编辑曾保存过的文本后还使用相同的文件名进行保存。 更改文本的内容时,覆盖保存。 1. 选择文本窗口。 2. 选择[文件]-[保存],或者选择保存按钮 。 原文件被新保存的文件替代。 5.章 文本和图象的输出 佳能RosettaStone用户指南

保存文本和图象 70

5.2.2 5.2.2 保存图象 1. 选择图象窗口。 从多张图象中只选择1张进行保存时,显示要保存的页面。 2. 选择[文件]-[另存为]。 显示[图象另存为]对话框。 [保存在] [文件名] [保存类型] 指定保存文件的驱动器和文件夹。 输入要保存的文件名。 为黑白二值图象时,从[TIFF文件(*.tif)]、[BMP文件(*.bmp)]、[PCX文件(*.pcx)]中选择图象的保存格式。为彩色(灰度)图象时,从[TIFF文件(*.tif)]、[BMP文件(*.bmp)]、[JPEG文件(*.jpg)]中选择。多页图象数据,只可使用选择TIFF文件格式进行保存。 [压缩方式] [无] [G3_1D] [G4] [彩色压缩] 以TIFF文件格式保存图象时,选择压缩方式。 无压缩。 使用G3 FAX的压缩方式(Modified Huffman)进行压缩。 使用G4 FAX的压缩方式(Modified Modified Read)进行压缩。 使用JPEG的压缩方式进行压缩。 [选择保存范围] 以TIFF文件格式保存多页图象时,选择保存的范围。 [全部] [当前页] 保存所有页面上的图象。 保存当前页面上的图象。 3. 设定[保存在]、[保存类型],输入[文件名],必要时设定[压缩方式]、[选择保存范围],然后点击<保存>按钮,图象被保存到新文件。 5.章 文本和图象的输出 佳能RosettaStone用户指南

保存文本和图象 71

5.2.3 以页为单位删除文本和图象 显示中的多页图象或文本以页为单位进行删除。图象窗口和文本窗口均显示的时候,两个窗口的当前页同时被删除。 1. 显示要删除的页面。 2. 选择[编辑]-[删除当前页]。 显示确认信息。 3. 点击<确定>按钮。 显示中的页面被删除。 备忘 只有当图象窗口有多页图象时,才能选择[编辑]-[删除当前页]。 5.章 文本和图象的输出 佳能RosettaStone用户指南

同时保存文本和图象 72

5.3 5.3 同时保存文本和图象 将文本窗口和图象窗口中的数据同时保存到同一个文件里并称其为编辑文件。 5.3.1 保存编辑文件 编辑文件的保存有两种方法。 # 起名保存 # 用同一个文件名进行保存(曾保存过的文件) 起名保存 1. 选择[文件]-[编辑文件另存为]。 显示[保存编辑文件]对话框。 [保存在] 指定保存文件的驱动器或文件夹。 [文件名] 输入要保存的文件名。 [保存类型] 文件类型为[编辑文件(*.rsx)]。 2. 设定[保存在]并输入[文件名]后,点击<保存>按钮。 用同一个文件名进行保存 编辑曾保存过的编辑文件后还使用同样的文件名进行保存。 选择[文件]-[保存编辑文件]。 编辑后的图象和文本被保存到同一个文件中。 5.章 文本和图象的输出 佳能RosettaStone用户指南

同时保存文本和图象 73

5.3.2 5.3.2 调出编辑文件 1. 选择[文件]-[打开编辑文件]。 显示[打开编辑文件]对话框。 [搜寻] 选择保存文件的驱动器或文件夹。 [文件名] 选择或输入要调出的文件名。 [文件类型] 文件类型为[编辑文件(*.rsx)]。 2. 设定[搜寻]并输入[文件名]后,点击<打开>按钮。 显示用编辑文件保存的文本和图象。 5.章 文本和图象的输出 佳能RosettaStone用户指南

转送文本 74

5.4 5.4 转送文本 将识别的文本转送到其他的应用程序。需要事先登录接收文本的应用程序。 5.4.1 登录应用程序 1. 选择[工具]-[应用程序的登录]。 显示[应用程序登录一览]对话框。 [应用程序登录表] [应用程序的登录] [名称] 显示已经被登录的应用程序。 选择应用程序并进行登录。 输入应用程序的名称(在40个字以内)。如省略,则应用程序的文件名自动成为名称。 [命令行] 输入应用程序的命令行。单击<浏览>按钮后,可在[文件的浏览]对话框上进行选择。 [运行时的目录] <登录> <浏览> <改变> <删除> 2. 点击<浏览>按钮。 指定运行应用程序时的文件夹(路径)。可省略。 登录在[命令行]上所输入的应用程序。 显示[文件的浏览]对话框,选择要登录的应用程序。 在[应用程序登录表]上更改所选择应用程序的名称。 在[应用程序登录表]上删除所选择的应用程序。 显示[文件的浏览]对话框。 3. 选择要登录的应用程序,点击<打开>按钮。 4. 点击<登录>按钮。 应用程序显示到[应用程序登录表]的目录框中。 5. 点击<确定>按钮。 5.章 文本和图象的输出 佳能RosettaStone用户指南

转送文本 75

5.4.2 5.4.2 转送文本 将文本窗口的文本转送到所登录的应用程序上。能够进行文字处理的应用程序主要有以下几种。 # Microsoft Word 97(及其以上版本) # Microsoft Excel 97(及其以上版本) # Lotus 1-2-3 96(只在Windows 95上) # 记事本 1. 在文本窗口,选择要转送的文字。转送全部文字时不用选择。 2. 选择[工具]-[文字的转送]或标准工具栏的文字的转送按钮 。 3. 只登录了一个应用程序时,直接将当前文本窗口的文本转送到该应用程序上。 4. 登录了多个应用程序时,显示[传输文字]对话框,选择应用程序后单击<确定>按钮,当前文本窗口的文本将被转送到所选择的应用程序上。 [应用程序列表] 显示已经登录的应用程序。 备忘 1. 以下方法也可转送文字。 通过[编辑]-[复制]或者[编辑]-[剪切]将文本送到[剪贴板]上,运行相关应用程序后执行[粘贴]。 2. 最多可登录10个应用程序。 5.章 文本和图象的输出 佳能RosettaStone用户指南

发送文本 76

5.5 5.5 发送文本

将文本窗口中所有的文本作为邮件的附件进行发送。发送需要安装Microsoft Exchange、Microsoft Outlook或Outlook Express中的任一邮件发送软件。

1. 在文本窗口选择[文件]-[发送]。

显示[发送]对话框。

[选择所添加文件的格式] [带框 RTF]

选择要添加文件的格式。

文字数据中包含简单格式信息的带框RTF形式的文件。在Microsoft Word中显示时,在框(框架)中显示文本。

[无框 RTF] 文字数据中包含简单格式信息的无框RTF形式的文件。在Microsoft Word中显示时,不显示框(框架),只显示文本。

[HTML 文件多页格式] 将多个图象数据相对应的多页文本内容保存到1个HTML格式的文件中。

[HTML 文件单页格式] 将多个图象数据相对应的多页文本内容保存到多个连续页码的单页HTML格式的文件中。

[文本文件] [文本(Tab分段)] [CSV(逗号分段)]

只记录文字数据的文件。

使用Tab将表内每一行的各单元格数据分段并保存起来。 使用逗号将表内每一行的各单元格数据分段并保存起来。

2. 通过[选择所添加文件的格式]选择添加文件的格式,然后点击<确定>按钮。 3. 启动相关邮件发送的应用程序。

4. 详细指定方法请参阅Microsoft Exchange等应用程序的说明书或帮助。

5.章 文本和图象的输出 佳能RosettaStone用户指南

77

第6章

改变显示

本章针对更改图象窗口和文本窗口的显示尺寸、显示状态、字体和颜色的方法进行说明。

6.1 6.2 6.3 6.4 6.5 6.6 6.7

改变图象的显示比例 改变窗口的排列方式 显示其他页面 选择工具栏的显示 扩展设定 改变字体 改变颜色

改变图象的显示比例 78

6.1 改变图象的显示比例

显示全页图象

在图象窗口选择[显示]-[图象的放大缩小]-[全页]或者点击全页按钮 。 在图象窗口显示整页图象。

以原图显示

在图象窗口选择[显示]-[图象的放大缩小]-[原图]或者点击原图按钮 。 在图象窗口以原图大小显示图象。

以固定比例显示

以固定比例显示。比例设定有100%、75%、50%、25%、12%。设定为100%时,为原图大小。 1. 在图象窗口选择[显示]-[图象的放大缩小]-[放大]或[缩小],或者点击图象的放大缩小按钮 。

2. 放大时点击鼠标左键,缩小时点击鼠标右键。

当显示比例为100%时,无法继续放大。 当显示比例为12%时,无法继续缩小。

设定任意比例进行显示

按照指定比例进行显示。指定范围在10%~200%之间。 1. 在图象窗口选择[显示]-[图象的放大缩小]-[指定]。

显示[显示比例指定]对话框。

[显示比例] 以10~200的半角整数输入比例。 2. 设定[显示比例]并点击<确定>按钮。

以指定的比例显示。

6.章 改变显示

佳能RosettaStone用户指南

改变窗口的排列方式 79

6.2 6.2 改变窗口的排列方式

水平并排显示

选择[窗口]-[水平并排显示]。

上下排列图象窗口和文本窗口。当前激活的窗口显示在上方。

垂直并排显示

选择[窗口]-[垂直并排显示]。

左右排列图象窗口和文本窗口。当前激活的窗口显示在左侧。

6.章 改变显示

佳能RosettaStone用户指南

改变窗口的排列方式 80

层叠显示

选择[窗口]-[层叠显示]。

层叠显示图象窗口和文本窗口。当前激活的窗口显示在前面。点击显示在后面的窗口的任意位置,可以激活该窗口,并使其显示在前面。

6.章 改变显示

佳能RosettaStone用户指南

显示其他页面 81

6.3 6.3 显示其他页面

在有多页图象或文本时,用以下方法可选择其他页面。

显示下页

选择[显示]-[下页]或者点击下页按钮 。 下页被显示。

显示上页

选择[显示]-[上页]或者点击上页按钮 。 上页被显示。

指定页面显示

1. 选择[显示]-[指定页]。

显示[指定页]对话框。

[页号] 以半角的整数输入页号。

2. 在[页号]中输入要显示的页号并点击<确定>按钮。

显示指定的页面。

6.章 改变显示

佳能RosettaStone用户指南

选择工具栏的显示 82

6.4 6.4 选择工具栏的显示

选择工具栏的显示

小按钮

大按钮

1.选择[显示]-[工具栏]。 显示[工具一览]对话框。

[工具条] 设定工具栏是否显示。 [按钮尺寸扩大] 设定工具栏的按钮大小。 [状态条] 设定状态条是否显示。 <标准设定> 返回初始的设定状态。

2.通过[工具条]、[按钮尺寸扩大]、[状态条]指定显示方法,点击<确定>按钮。 工具栏等按照设定进行显示。

6.章 改变显示

佳能RosettaStone用户指南

选择工具栏的显示 83

进度显示

在图象窗口选择[显示]-[进度显示],是否加注标记。

选中后,在执行文字识别过程中,各文字区域以红色进行显示。 显示彩色图象或者灰度图象时,即使选中也不会以红色进行显示。

区域标志显示

选择[显示]-[区域标志],是否加注标记。或者选择区域标志按钮 。

在区域划分后,显示区域标志,区域标志包含识别的顺序和识别的方向(横写、竖写)。

图象监视器

读取彩色图象或者灰度图象并显示彩色图象或者灰度图象时,在[OCR图象监视器]中显示OCR对象二值化后的黑白图象。

对于黑白图象,在[OCR图象监视器]中按照原图的大小显示图象。 选择[显示]-[图象监视器]。 显示[OCR图象监视器]窗口。

6.章 改变显示

佳能RosettaStone用户指南

扩展设定 84

6.5 6.5 扩展设定

1. 选择[格式]-[扩展设定]。

显示[扩展设定]对话框。

[识别后按原图大小显示图象]

选中后,在识别完毕时,图象窗口的图象以100%的比例显示。

[文字确认时显示文字图象]

选中后,在文本窗口选择识别结果的文字时,会在候补字序列上方显示相应的图象。

[保存结束时的设定]

选中后,关闭RosettaStone时,仍保存各种设定内容。下次启动时可继续使用。

<标准设定>

2. 设定更改内容并点击<确定>按钮。

操作环境被更改。

返回初始的设定状态。

6.章 改变显示

佳能RosettaStone用户指南

改变字体 85

6.6 6.6 改变字体

1. 选择[格式]-[字体]。

显示[字体]对话框。

[字体] 选择字体。 [字体样式] 选择字体样式。 [大小] 选择字体大小。

[示例] 显示所选字体、字体样式和大小。 [语系] 选择所选字体可使用的语系。 2. 设定改变的内容,点击<确定>按钮。

改变文本窗口所使用的字体、字体样式、大小。

注意 在此设定的字体只在文本窗口显示,对于打印和识别结果的保存此设定不起作用。

6.章 改变显示

佳能RosettaStone用户指南

改变颜色 86

6.7 6.7 改变颜色

1. 选择[格式]-[颜色]。

显示[颜色设定]对话框。

[图象] 选择图象窗口的图象显示颜色。 [区域框] 设定区域框架的显示颜色。 [区域特征] 设定区域标志的显示颜色。 [文字图象框] 选择文字图象框的显示颜色。 [文本] 设定在文本窗口的文本显示颜色。 <标准设定> 返回到初始的设定状态。

2. 设定更改内容并点击<确定>按钮。

显示颜色被更改。

6.章 改变显示

佳能RosettaStone用户指南

87 第7章

提高识别率

本章针对为提高识别率而进行的各种设定、将文字登录到识别词典等操作予以说明。

7.1 7.2

扫描时的注意事项 有关提高识别率的各种设定

扫描时的注意事项 88

7.1 扫描时的注意事项

识别率的高低,与原稿质量有关。为获得好的原稿图象,请注意以下几点:

扫描方式的选择

# 扫描时尽量将稿件放正。

# 如果要识别的文件为黑白稿件,采用黑白模式进行扫描;对于彩色稿件,如果只是要识别上面

的文字,建议也采用黑白模式进行扫描。

# 如果稿件很薄,其背景能够透射过来,建议采用Text模式进行扫描。 # 扫描稿件时注意调整图象的亮度和对比度。

分辨率的选择

# 一般的杂志和报纸只需要300dpi的分辨率进行扫描。

# 扫描文字过小的稿件时,需要提高分辨率,使用400dpi甚至600dpi;相反,对于文字较大的

稿件,分辨率可以低一些,使用200dpi扫描。扫描的图象以100%的大小显示时,如果屏幕上每一个字体的大小约为1厘米见方时,此时的文字大小适合识别。

7.2 7.2 有关提高识别率的各种设定

为提高识别率,检查以下项目并更改相关的设定。

图象是否倾斜

图象倾斜时,通过[图象]-[自动倾斜校正]修正整个图象。可自动修正-10°∼10°倾斜的图象。 超出10°的范围时,通过[图象]-[手动倾斜校正]进行修正。 详细内容请参阅[4.1.3 修正图象]。

图象是否摆正

图象没有正向摆放时,通过[图象]-[旋转图象]中的[右转90度]、[180度]、[左转90度]旋转图象,使其可以正确地进行文字识别处理。 详细内容请参阅[4.1.3 修正图象]。

是否黑白反转文字

图象为黑底白字时要进行黑白反转。有全部反转和部分反转两种方法。 反转全部图象时,选择[图象]-[黑白反转]。

反转部分图象时,首先在图象窗口指定范围,然后选择[图象]-[区域内黑白反转]。 详细内容请参阅[4.1.3 修正图象]。

7.章 提高识别率

佳能RosettaStone用户指南

扫描时的注意事项

是否建立区域框架

划分区域建立区域框架。

选择[识别]-[自动区域划分]或[通栏区域划分],或者选择自动OCR工具栏中的自动区域划分按 钮 或通栏区域划分按钮 。识别部分图象时,首先在图象窗口指定范围,然后建立区域框架。

详细内容请参阅[4.2.6 设定区域进行文字识别]。

识别的顺序是否正确

识别后的文本顺序不正确时,检查区域标志的顺序。 顺序错误时,修改区域标志的号码。

详细内容请参阅[4.2.6 设定区域进行文字识别]。

识别方向是纵向还是横向

纵向或横向出现识别错误时,检查区域标志的识别方向。 方向发生错误时,调整区域标志的方向。

详细内容请参阅[4.2.6 设定区域进行文字识别]。

区域框架的大小是否合适

因区域框架不合适而无法正确识别文字时,可以重新调整区域框架的大小。 详细内容请参阅[4.2.6 设定区域进行文字识别]。

无须识别的图象是否有框架

无须识别的图象有区域框架时,需要进行删除。 首先选择需要删除的区域框架,然后选择[编辑]-[删除]。 详细内容请参阅[4.2.6 设定区域进行文字识别]。

识别的文本是中文还是英文

从[编辑]-[区域语言设定]中选择[中文]或者[英文]。 详细内容请参阅[4.2.1 设定识别方法]中的[设定识别语言]。

识别文字的种类是否正确

识别英文时,从[编辑]-[英文区域的文字种类设定]的[全部]、[数字、符号]、[纯英文]中进行选择。

详细内容请参阅[4.2.1 设定识别方法]中的[设定识别文字的种类]。

7.章 提高识别率

佳能RosettaStone用户指南

90

第8章

附录

本章针对RosettaStone的补充事项进行说明。

8.1 8.2

说明 事项

说明 91

8.1 说明

对象字体

中文

简体(宋体、仿宋体、黑体、楷体), 繁体(宋体、仿宋体、黑体、楷体、魏碑)。

英文 Times,Roman,Helvetica,Courier。

对象文字大小

分辨率200 dpi 分辨率300 dpi 分辨率400 dpi 分辨率600 dpi

中文 12~48磅 8~48磅 6~48磅 6~32磅

英文 6~96磅 6~84磅 6~72磅 6~56磅

可识别图象

图象的种类

TIFF文件(黑白图象、彩色图象、灰度图象),

BMP文件(黑白图象、彩色图象、灰度图象), PCX文件(黑白图象),

JPEG文件(彩色图象、灰度图象)。

在RosettaStone V3.10c上只能使用彩色压缩图象为JPEG压缩的、灰度级为256、彩色是256色或者RGB24位真彩色。

原件大小 张数

A3以下。

使用ADF(自动给纸装置)扫描时,最多可一次扫描20页。由于受图象的分辨率、纸张大小、电脑内存大小、硬盘容量等因素的,最多页数也可能少于20页。(关于最多页数的基准请参照[8.2 事项]的[有关内存及硬盘的容量]。)

文章方向

纵写、横写。

自动修正倾斜 ±10°以内。 分辨率

200dpi~600dpi。

识别文字

识别率 识别速度

识别文字数

99%以上(本公司原件)。

约320字/秒(CPU:MMX Pentium 200MHz使用时), 约400字/秒(CPU:MMX Pentium 233MHz使用时)。

一次文字识别处理中,中文为3000字以内,英文为10,000字以内。不过,识别总文字数要根据内存或硬盘的空间容量来决定。

识别区域框架 每一页最多为1024个。

登录文字

登录文字数

最多1,000字(仅指中文)。

事项 92

8.2 8.2 事项

关于内存及硬盘的容量

1. 在进行多页处理时,可处理页数由图象的分辨率、纸张大小、电脑内存及硬盘的容量来决定。

以下是在没有启动其他应用程序时的处理能力。(以下的根据图象不同会有所改变。)

最大文件大小 扫描仪ADF扫描 文件输入

A4 A3

内存12MB 内存24MB A4以下(400 dpi) A3以下(400 dpi)

A4(400 dpi)约20张以下 A4(400 dpi)约20张以下 A4(400 dpi)100张以下 A3(400 dpi)50张以下 300 dpi 约1.1MB 约2.2MB

400 dpi 约2MB 约4MB

2. 以下是每页需要的临时文件的大小。

关于文件输入

1. 输入多个文件时,可输入文件名的长度是258个文字,即输入到[打开图象文件]对话框的[文

件名]中的文字数(包括空格)。

2. 可输入TIFF文件的文件名长度包括路径名在内不能超过126个字节。 3. RosettaStone可能打不开其他应用程序保存的某些无压缩TIFF文件。 4. 在系统资源允许的情况下,最多可以处理999页的TIFF文件。

有关倾斜自动校正

1. 文字内容很少的图象,有可能无法进行自动倾斜校正。

有关文字识别

1. 中文模式一次可识别文字在3000字以内,每行文字在150字以内。 2. 能够识别有一条下划线的文字。

3. 图象倾斜时,即使校正后,识别率也未必会提高。 4. 在中文模式下,对斜体字无法正确地进行识别。 5. 大小不一的文字在同一行中,无法正确地进行识别。

6. 文字图象横竖都未满5点时无法识别。(300dpi:5点=0.42mm ,400dpi:5点=0.32mm。) 7. 横写时,在行的左侧与竖线相接的图象有时无法识别。

8. 并不是所有的文字识别结果都有候补文字。当查看某个文字的候补文字时,如果只显示该文字

的图像,说明该文字在识别时没有产生候补文字。

事项 93

有关区域划分

1. 每页允许的区域个数最多为1024个。图象不干净时,每页允许的区域个数会少于1024个。 2. 区域划分有时候不能正确执行。

有关文字登录

1. 如果[登录文字]的内码不是有效的国标内码,不能点击<登录>按钮。 2. 可登录的文字最多不超过1000个。 3. 不能将多个文字作为一个文字进行登录。 4. 英文识别词典中无法登录文字。

有关RTF保存

1. 以下是用RTF格式进行保存时所支持的内容。

文本数据、直线、BMP图象数据、矩形框架线、表的外围矩形、文字大小、字符间距、行间距、缩进、字体(英文有Times New Roman、Courier New、Helvetica、Haettenschweiler)、斜体字(只有英文)、竖写/横写。

注意 在原件上文字大小、字符间隔、行间距的值与用RTF格式保存的值有时不同。

2. 以下是用RTF格式进行保存时所不支持的内容。

纸张大小、表的单元格的线。

3. 垂直或水平的直线有多个交叉点时,什么也不显示。

4. 要用RTF格式进行保存时,如果图象窗口被关闭,没有图象信息,将显示“无图象数据,无法

保存文件”的信息。

5. 内存不够时,BMP图象数据无法用RTF格式进行保存。

6. 如果用涉及多页的RTF格式进行保存,当内存不够时,信息将全部消失。 7. 在文本窗口中追加的文字,保存在RTF文件中时,字号为12磅。 8. 用校正支援功能订正文字后,字体和字号仍保持原有设定。 9. 用RTF格式进行保存时,可能会出现空白页。

10. BMP框架与文章重叠时,文字图象会残存,文字与文字图象会重叠。 11. 英文识别时,有时无法正确判定相近字体。

12. 对于区域太多的图象的识别结果,保存为RTF文件时,可能出现在其他应用程序上打不开的情

况。

有关HTML

1. 一个区域内的文字大小相同,其大小为原件区域内文字大小的平均值。 2. 区域属性为英文时,缩进不反映出来。 3. 区域属性为中文时,缩进为全角空格。

4. 要用HTML格式进行保存时,如果图象窗口被关闭,没有图象信息,将显示“无图象数据,无

事项 94

法保存文件”的信息。

有关表格

1. 忽略宽度或高度为4象素以下的单元。

2. 处理行数和列数的乘积在2000以上的表格时,需要花费较长的时间。 3. 无法处理行数和列数的乘积超过00的表格。

其他

1. 在区域框架的顺序上输入的文字数可达到4位数。 2. 宽度或高度在7点以下时,无法建成区域框架。

3. 查找和替换的单词单位是指2个字节的文字、1个字节的空格。 4. 超出127个字节的文字无法进行查找和替换。 5. 换行代码间插入的单词不作为查找对象。

6. 在[指定页]对话框中,输入的文字数可达到3位数。 7. 在打开菜单项目的状态下,除F1之外的快捷键无效。 8. 用竖线(∣)表示文字识别结果的TAB代码。

9. 文本窗口中虽无缩进,但用RTF格式进行保存时带有缩进功能。

10. 当使用英文版Office 97等查看RTF文件中的中文识别结果时,可能会显示为乱码。 11. 如果在英文区域的识别结果中输入中文并以RTF格式进行保存,则无法正确地显示输入的中

文。但是用文本文件格式进行保存时可以正确地显示。

12. 当使用“自动OCR”或“OCR向导”-“从扫描仪输入”功能识别图像时,识别完成后如果关

闭图像窗口,并不提示用户保存刚扫描的图像。

13. 在繁体操作系统下,有时无法打开以简体中文命名的图像文件,此时建议用户更改文件名为纯

英文。

14. 在繁体操作系统下,有时无法直接打开通过网络共享的简体中文操作系统中的图像文件,此时

建议用户将该共享文件夹映射为网络驱动器,然后访问该网络驱动器中的图像文件。 15. 根据运行环境的配置情况,系统对图像的处理有不同的表现;当图像尺寸超过2480*2480像素,

同时色彩超过16M色时, 可能出现无法放大图像至原图大小的情况; 建议先将图像缩小、另存为色彩信息较少的副本或者变更系统设定([选项]->[输入设定]->[输入图像]:变为黑白图), 然后再执行相关操作。

16. 识别如下图所示的横放B4的表格时,识别后的1行文字数有时为数百个文字。显示此种文本

时,需要很长时间。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务