Skip to content

Latest commit

 

History

History
972 lines (570 loc) · 52.8 KB

研究报告.md

File metadata and controls

972 lines (570 loc) · 52.8 KB

研究报告

Déjà Vu

概述

  • Déjà Vu是计算机辅助翻译软件市场的翘楚,独立翻译解析器平台的提出者,目前Trados、WordfastPro以及memoQ均效仿其理念,不再作为Word的控件出现,Déjà Vu是该软件模式的发起者。Déjà Vu是Atril Language Engineering公司所开发的翻译工具,也是CAT软件中最早采用如今流行的“翻译表格”界面,并采用高度集成的翻译界面的软件之一。Déjà Vu 是Atril公司于1993年发布的首款基于Windows的计算机辅助翻译系统。Déjà Vu有“似曾相识”之意,可理解为是翻译记忆的复现。它基于.net开发,使用access数据库存储术语和翻译记忆,支持SQL语句。ribbon界面,建立项目时会提示设置机器翻译。DéjéVu X3于2014年2月推出,是该计划最新、最先进的版本(2019年提供试用版升级)。软件通过服务对象区分为专业版(面向自由译员)、工作组版、企业版。(Déjà Vu X3 Free、Déjà Vu X3 Professional、Déjà Vu X3 Workgroup和Déjà Vu X3 TEAMserver。) Déjà Vu X3 是当今计算机辅助翻译领域的主流软件之一,其客户包括微软、思科、英特尔、惠普、康柏、戴尔、甲骨文、SAP、宏基、德国大众、上海大众、西门子、朗讯、北方电讯、沃尔玛、联合国、欧盟、国际货币基金组织、雅虎、新浪、深圳华为、深圳中兴、上海贝尔阿尔卡特、广州石化等,拥有全球四万多企业级用户,占有该领域较高的市场份额。同时,全球有超全球超过200家高校使用Déjà Vu X3 建设了计算机辅助翻译实验室。

发展历程

1993 – Atril 公司开发 Déjà Vu 软件——当时市场中首款基于 Windows 的计算机辅助翻译工具(CAT 工具)。 1990s – 作为行业先锋,Atril 进行技术创新,成为 CAT 工具行业的标准。 2011 – 法国经销商投资以利用研发成果,实施最佳产品开发并扩大商业开发;推出 Déjà Vu X2。 2012 –推出 TEAMserver 解决方案。 2014 –推出 Déjà Vu X3 2015 –开始进入中国市场

主要功能概览

  • Déjà Vu具有高度集成的翻译环境,集翻译项目管理功能、翻译编辑功能、翻译记忆库管理功能、术语库管理功能、语料对齐功能、质量保证功能等于一体。Déjà Vu提供了非常灵活的导出功能,导出双语Word时,可以直接排除锁定和重复的句子和完全匹配的句对,且在导出时可以去掉所有标记。Déjà Vu集成了多款世界主流的机器翻译引擎接口,其中,包括Google机器翻译引擎、My Memory机器翻译引擎、微软机器翻译引擎和百度机器翻译引擎等,能提供高效的机器翻译译后编辑环境,大大提高了翻译效率;Déjà Vu具备高级项目浏览器,能分级浏览计算机本地和当前项目的文件夹和多格式文件结构,为大型翻译项目(特别是文档本地化项目)中的文档管理提供了极大的便利;Déjà Vu具备资源压缩工具,能对翻译项目、翻译记忆库、术语库和筛选器进行压缩,以回收项目、翻译记忆库、术语库和筛选器中不再使用的空间,提高项目、翻译记忆库和术语库的性能;Déjà Vu具备资源修复工具,能修复已损坏的项目、翻译记忆库和术语库文件,以避免不必要的数据损坏和丢失。除此之外,Déjà Vu还具有模糊匹配修复 (Fuzzy Match Repair)、深度挖掘统计提取(DeepMiner Statistical Extraction)、片段汇编 (Assemble)等特色功能。

    • 项目模块:能创建多文件、多格式、多语种的项目;可以实时编辑和保存修改的内容;能创建项目词典;具有多文件夹、多文件实时动态预览功能;具有多文件上下文检索功能;内嵌文本格式功能;可以自动检索搜索过程中显示更改以及原文与TM的断句对比;自动检索中TB属性可视化;同一项目中允许添加2种目标语言;同一项目中允许加载5个翻译记忆库和5个术语库;可以加载指定的TM和TB。
    • 语料对齐模块:能创建、打开和编辑单个对齐工作文件;能创建、打开和编辑多文件和多格式对齐工作文件。
    • 翻译记忆库模块:能创建、打开和编辑翻译记忆库;可以编辑句段;能导入导出外部数据;可以管理副本;能合并翻译记忆库;可以执行和选择SQL数据库。
    • 术语库模块:能创建、打开和编辑术语库;可以编辑术语;能导入导出外部数据;可以执行和选择SQL数据库。
    • 编辑和工具模块:可以确认句段状态为:已翻译、已校对、已确认;能够创建XML筛选器;具有自动更正和自动文本功能;可以实时编辑原文;能合并和拆分句段;具有行选择器;(为行选择器)创建和存储SQL;能够压缩项目、TM、TB、过滤器和对齐项目;具有修复项目、TM和TB功能;安全功能:在项目、TM和TB种使用;能够与Dragon Naturally Speaking (DNS)软件包整合;具有自动更新通知功能。
    • 翻译模块:具有自动翻译、自动传播、自动检查功能;具有自动发送功能,即当确认某一句段为已翻译状态时,自动发送该句段至可更新的翻译记忆库;具有自动检索功能;具有智能匹配功能;具有预翻译功能;具有扫描和查找功能;具有片段汇编功能;具有深度挖掘统计提取功能;具有上下文匹配功能;能添加句段到TM;能添加术语到TB;可以发送整个项目到TM;可以发送自建词典到TM;可以发送自建词典到TB;能解决内建词典与TM、TB、深度挖掘和MT之间的冲突;可以连接使用TEAMserver;可以连接多个机器翻译引擎;
    • 项目管理:具有项目资源管理器;具有高级项目资源管理器;能导出已完成的翻译文件-导出指定文件或全部导出皆可;能从分发项目包中导出已翻译文件;导出项目到XILIFF文件和RTFWord表格;重新导入XILIFF文件和RTF Word表格;具有字数统计功能;具有字数统计功能,字数/文件(按文件单独统计);具有字数统计功能,字数/项目(按项目整体统计);具有分析功能;具有分析功能,字数/文件(按文件单独统计);可以导入词典;可以导出词典。
    • 质量保证(QA):可以检查术语一致性;能执行批量QA;能执行自定义的QA规则(执行和存储SQL语句,以执行QA和批量QA);能借助术语检查进行预翻译(质量);具有伪翻译功能;能执行高级匹配筛选;具有内建拼写检查功能。
    • 筛选器(filter):具有EBU筛选器;具有PDF筛选器;具有TagEditor、Trados Workbench、SDLXILIFF和ITD筛选器;具有其他所有筛选器(XML、InDesign、FrameMaker、YAML、Office等等)。

特色功能 DeepMiner

  • 作为DéjàVu X3 Professional核心的革命性数据挖掘和翻译引擎,与任何其他解决方案相比,DeepMiner从术语和翻译记忆库中提取的信息要多得多,并且可以发挥更大的作用。 这是因为它不仅使用数据库中的各个术语和句子,而且还可以即时对这些数据库进行复杂的交叉分析,以挖掘、构建基词和嵌入其中的短语的翻译。 然后,它使用常规的模糊匹配或这些挖掘后的术语和短语来创建模糊匹配修复,从而形成改进的翻译。
  • 设计原理: DeepMiner技术的原理是对翻译记忆库中的子片段(subsegment)进行细分,然后从这些子片段以及术语库中组合新的模糊匹配。也可以称为实时TM内容分析(动态TM分析(DTA))来识别匹配片段的翻译。为了提供最合适的翻译,该算法基于概率,该概率是通过所有数据库中术语和部分的共现(co-occurrences)频率计算得出的。 所以在比较句子后可以推断翻译。Deep Miner是改进的Assemble汇编功能,也称为Advanced Leveraging,并且数据库越丰富,算法提供的模糊匹配修复将越准确。 (举例图片例子需要更改) 这里出现的80%匹配的结果是使用DeepMiner技术进行的模糊匹配修复,可以看出它改善了预翻译功能。
  • 补充:如果出现过的单词或短语也在其他片段中使用,则Deepminer能够隔离该单词或短语。 DéjàVu X3 Professional中此功能有多种用途: 在翻译或预翻译过程中修复模糊匹配 在翻译或预翻译过程中组合匹配项 通过自动写入(autowrite)功能扩展建议

翻译记忆库

优势&待改进建议

  • 用户界面友好性&易用性 DéjàVu X3是完全独立界面,即完全在软件自己的独立界面中完成翻译任务,原文和译文区都会根据译员需求自己进行调整。所有功能集中在工作界面左侧原文,中间译文,右侧是其他辅助功能。
  • 翻译编辑 可以选择忽略文件中的嵌入代码、对象、隐藏文字等等,还可借助regex 和 codezapper,處理很多你不希望看的格式。其中,Codezapper 对从 pdf 转换而來的 word 文件而言,可谓神器,可轻松消除很多冗餘格式和代码。
  • 格式&句段自动对齐&合并功能 DéjàVu X3有保留原文格式、直接以原文格式排版输出译文的功能。CAT软件在处理格式上,通常会生成格式码或者格式标记,以保留格式。格式码以大括号加数字体现。处理方法为译员的人工复制。输出后排版也较清晰,与原文基本无差。但是有时对中文识别会出现乱码。 DéjàVu X3在文档对齐和句段处理上都有较大优势。自带对齐工具,操作方便。软件支持的对齐文件类型十分丰富,译者在导入文件时无需进行格式转换。人工检查时,若发现错误情况,可直接对句段进行合并、拆分、删除和移动。在合并句段功能上, 直接在原文译文两边提供合并的选项,操作简单。比其他软件更为便捷。
  • 翻译记忆库&术语库管理(创建&导入) DéjàVu X3的翻译记忆库支持多语言,同时各个语言之间并没有翻译方向的限制。中翻英和英翻中都可以基于同一个库进行 。翻译记忆库导入所支持的格式较多,包括该软件自己的翻译记忆库文件、TMX、Trados Workbench、Text、Access、ODBC、Excel ,较为丰富. DéjàVu X3的术语管理工具也极具特色,是分层级的包括术语库和词典两个层级。项目词典与当前翻译项目紧密相关,更具针对性。所以在实际翻译项目过程中,软件会先搜寻项目词典,在搜寻术语库,最后才搜索翻译记忆库,这种分层级的搜索查询管理体系更适用于翻译实际情况。 添加DéjàVu X3的翻译记忆和术语时,可以选择自动发送模式,保存的文件以数据文件形式储存,可以移植,有利于团队翻译风格一致性。
  • 翻译项目管理 与Trados没有太大差别(创建同一个项目文件夹、字数统计、预翻译、质量检查),特色的是“分析”功能可以计算重复率,还可显示模糊匹配的情况,利于译者更好预测翻译进度。
  • 内容索引 因为其独家技术deepminer,DéjàVu X3可以搜寻句段内部更小的单位。虽然在翻译过程中,在部分匹配度较低的文段,能够显示出个别词汇和短语的参考,但由于检索计算量大,检索的速度较慢,在每进入新的句段时,软件通常需要数秒来搜索以提供参考,大大减缓了翻译的速度。所以在整体检索方面,相对其他领军软件,不够稳定迅速。
  • 语言资产维护 一些CAT软件为了吸引用户,提供了直接打开待翻译文档进行翻译的功能,躲开了有点繁复的项目创建过程,使CAT的学习曲线似乎变得平缓了。但实际上,学习CAT的陡峭的曲线仍客观存在,这样做只是推迟了陡坡出现的时机。无论如何,如果CAT用户不知道创建翻译记忆库和术语库,不知道这两个库保存在哪里,就无法有效地维护自己的语言资产。从语言资产的角度讲,Déjà Vu的设计非常不错,用户只需要具备良好的文件夹管理习惯,那么,在创建了一个翻译项目之后,就能在项目文件夹里看到三种文件:TM,TB,Project.略有不足的是,当我们把一整个翻译项目的文件夹从一个位置移动到另一个位置(比如拷到另一台电脑上),重新打开翻译项目,DVX1-2-3这几个版本,都不能识别相对路径,会丢掉翻译项目和术语库以及记忆库的匹配链接。[1](https://www.jianshu.com/p/3f20e6fdc3ba)
  • 价格优势 更适合自由译者,性价比高。

译员工作 程璐

新建翻译项目

<情景:此处及下文SDL Trados和memoQ均采用三款欧米伽腕表介绍信息翻译为例新建翻译项目>

  1. 点击翻译项目中的新建项目进行创建,浏览项目存放的位置,创建出来的项目文件以 .dvprj 作为后缀。 1

  2. 选择源语言与目标语言(目标语言可多选,需要注意国家和地区)此处由于翻译欧米伽腕表简介的情景,选择英语-中文。

    2

  3. 添加/创建翻译记忆库,此处创建一个新的翻译记忆库,名为欧米伽腕表记忆库,后缀为 .dvmbd

    3

    假设在翻译公司工作,并没有权限修改现有记忆库,或者其他情景,则可以按需要取消“读取”、“可写”、“反转”的选项。

  4. 添加/创建术语库,此处创建一个新的术语库,操作与创建记忆库完全相同,命名为欧米伽腕表术语库,后缀为 .dvtdb

    4

  5. 指定辅助机器翻译引擎,共有9种可选,但选中之后需要提交API后才可使用

    5

  6. 管理DVX使用用户,可选择添加或删除。主题中可以选择翻译项目围绕内容,例如:科学、哲学、社会、教育等等共9299种不同主题,此处选择391-Costume, Clothing, National Dress, Fashion, Adornment一项。

    6

  7. 创建项目最后也是最重要的一步,浏览添加导入源语文件,DVX本身支持40多种文件格式。

翻译开始

项目预翻译

在进行人工翻译之前,如果先采用DVX自带的预翻译会为之后的人工翻译工作带来很多便利。系统会通过检索添加进项目的翻译记忆库和术语库,或者根据机器翻译,根据用户对匹配的限制自动补充尚未进行翻译的译文。但为保险起见保证质量,可以将匹配选项只选择“只接受精确匹配”,保证只有完美匹配的原文系统才会自动添加译文。

21

人工翻译

DVX的人机交互界面与Microsoft Office非常相似,使用便捷。

22

图中可以发现,DVX支持即时预览,清晰看到译后结果和正在翻译的位置。在DVX中,文本格式的加粗、斜体、下划线需要自己控制,与Office的使用相同,但文字的大小与之无关,直接继承源文档文字大小。其他格式由标签控制,可以通过ctrl+shift+enter沿用或者直接复制原文本。 在翻译过程中DVX会给予各种提示,比如上图中紫色条代表机器翻译辅助,深蓝条代表翻译记忆库辅助(Seamaster Diver 300M一句在标题出现并已加入记忆库)

23

弊端:与翻译记忆库中的格式不一致也将报错。 即使没有记忆,系统也会自动识别两段句对齐文字的数字是否一致,保证质量,为译员带来方便。 24

术语提取

为了给下一篇文档的翻译提供方便,可以在翻译的过程中尝试提取术语。添加术语后所有存储在术语库中的内容都会高亮显示。

25

项目分析

DVX提供的项目分析译员加强对待翻译文档和记忆库之间的关系提供了很大的帮助。

26

其中可以非常清楚的看出待翻译文档中句段与记忆库中锯断的匹配程度。比如:当前文件与记忆库中精确匹配的句段有6句,占全文的22.16%。重复句段与精确匹配的区别在于重复句段包括上下文的比对。

此外还有字符统计,在翻译项目结算时会有较用处。项目分析表还可以导出。

项目导出

在DVX中,存在未翻译句段的文档无法导出,这里可以采用系统中特色按钮“伪翻译”。顾名思义,伪翻译并不是真正的翻译,可以选择复制原文到译文或者插入随机字符占位。

27

右键点击项目浏览器中的翻译项目文件夹选择导出,并浏览保存位置。

28

至此,翻译项目结束。

质量检查

DVX菜单栏中提供审校选项,界面和功能几乎与Microsoft Office如出一辙。可以进行拼写检查、字数统计、编辑备注、切换数千、批量质量检查(其中包括检查术语、数字、多余空格、标记、删除警告)的功能。

31

上图表示进行批量质检,可以看到,在“计时表直径44毫米,采用精钢材质”之后的数字“18”被标红,因为源于文件中该句段并没有出现数字“18”,所以被标出。此外,所有批量质量检查出来的错误,在中间一栏都会出现一个小叹号,代表警告或许出现了错误,达能鼠标悬停于其之上时,即可看到DVX的修改建议。

32

上图未添加备注“需要删除!”后的界面,可以看到中间的小叹号变成蓝色调(若开始没错,叹号为蓝,有错即为紫),并且在鼠标悬停在叹号上的时候会在系统建议之上显示备注。

外部视图

点击文件选项卡-共享-导出双语RTF

33

即可生成一个分为ID、Source、Target、Comments、Status五列的句对齐外部文件,为不熟悉DVX的审校人员审校。但此处需要注意不要使用Microsoft Word的修订功能,需要直接在Target中修改译文。 更改后重新点击文件选项卡-共享-导入审校后的RTF文件并合并,会显示更改的条例,有权选择接受/不接受。

34

SDL Trados

基本功能(着重翻译记忆) 叶璐

Trados是桌面级计算机辅助翻译软件,基于翻译记忆库和术语库技术,为快速创建、编辑和审校高质量翻译提供了一套集成的工具。其支持57种语言的双向互译,并完美兼容所有流行文档格式,无需重新排版,堪称译者一大利器。

项目管理

与早期Trados版本不同的是,现在的Trados多面向项目而非单个翻译文件,用户可通过创建新项目或导入已创建项目对整个翻译流程进行管理。

  • 项目设置:包括文件类型、内嵌入内容处理器、验证、翻译质量评估和语言对设置。这些可以在新建项目时设置。
  • 项目详情:包括名称、状态、到期日、创建时间、类型。打开项目,可以看到文档进度。
  • 项目报告:Trados 的报告功能可提供项目文件的详细信息。 项目处理(项目经理篇):
  • 预分析:根据翻译记忆库分析文件,生成翻译时预计将利用的统计数据(文件字数、重复率、匹配率)。
  • 批处理:批处理功能大大提高了项目经理处理多个文件的大项目的效率。
  • 文件包:将需要分配的文件进行打包,指定记忆库和项目要求并发送给需要分配的译员。接收者只要打开该文件包,即可清楚地了解项目进行的情况,完成自己的任务,然后将文件包发回进行反馈。
  • 报告:对项目的很多批处理操作都可以生成报告,方便项目经理清楚地了解项目的完整信息。 项目处理(译员篇): 我们再来看看译员是怎么进行项目处理的。Trados创建项目流程非常清晰,先新建项目,填写项目的详细信息如名称、截止时间、语种等,再添加项目文件、翻译记忆库,术语库,对项目进行预分析。在新建项目时提示是否允许编辑原文,在选择语言时会优先展示最近使用的语言给用户选择,项目建好以后提示是否保存项目设置作为模板以方便将来使用。这些小细节都极大地提升了用户体验。

语料管理

1. 术语管理: Trados里能进行简单的术语管理,如果需要更精细的管理需要另外使用程序MultiTerm。我们先来看一下在Trados里可以进行哪些与术语有关的操作。

  • 创建、导入术语库:在新建项目或者翻译的时候都可以创建或者导入术语库,Trados对导入术语的格式非常挑剔,仅支持SDL MultiTerm 文件。
  • 查看、搜索术语:只能查看单条术语的详情信息,无法同时查看术语库里的所有术语信息。可以模糊匹配搜索术语。
  • 添加新术语:同时选中原文和译文即可添加新术语。
  • 编辑、删除术语:在查看项目详情里,功能比较隐蔽,不容易发现。 2. 记忆库管理: Trados的翻译记忆库功能相比其他的CAT工具来说是比较全面的,可以编辑已有的翻译记忆库,也可以利用对齐文档功能制作记忆库,甚至还可以设定翻译记忆库的访问权限。导入后的翻译记忆库能进行修改编辑,非常方便。Trados里常用到的记忆库操作有:
  • 新建记忆库:支持tmx文件、sdl xliff双语文档、Tradostag文档(.ttx)、sdl edit文档(.itd)和对齐文件(.sdlalign)
  • 设置:在新建记忆库时需要设置语言资源(断句规则、缩写列表等)以及访问权限。
  • 编辑:可编辑单条句段,也可批量编辑,但是批量编辑需要添加批编辑脚本,比较麻烦。
  • 筛选查找 3. 记忆库管理:对齐文档 Trados里有对齐文档功能,可以将单一或多个文件文件对齐后导入到记忆库中使用,但并不能导出为可以交换的标准记忆库格式tmx,因此对齐功能局限性很大。导入需要对齐的文档后需要进行1:1或者n:n的连接对齐,如果对齐文档中断句不正确,只能手动的复制粘贴,或者用n:n连接,没有合并功能。界面看起来比较混乱,操作也很复杂,没有memoQ的对齐好用。

翻译处理

  1. 文件管理:常用文档word、excel、ppt、txt、pdf、csv都可以导入到Trados里,翻译完成后导出纯译文和审校格式的双语文档。导出纯译文后文档的字体、字号、排版与原文保持一致。Trados的导出格式比较单一,甚至无法导出原译文对照,这一点国内的iCAT做得比较好。
  2. 预翻译和机器翻译:预翻译和机器翻译是每个CAT工具都有的功能。Trados预翻译在设置匹配率,执行预翻译操作后,记忆库里符合条件的语料会自动填充到译文中。Trados机器翻译不像其它CAT工具那样支持较多的机器翻译,它只提供SDL自己的机器翻译和google翻译,而且都需要API密钥。值得一提的是Trados2017推出的SDL Language Cloud 机器翻译是自适应机器翻译,当用户在机器翻译输出基础上进行修改并确认翻译句段后,机器翻译引擎会据此自我学习,并实时应用到下一个句段中。
  3. 翻译体验:接下来是翻译过程体验,先来说说Trados做得比较好的地方。
  • 导航:界面左下角的导航可以快速的切换到任何项目或文件,操作方便快捷。
  • 合并分割句段:可以编辑原文并合并或者分割句段(只能合并同一段落内的相邻句段)。
  • 高效的翻译界面:在一个界面能完成所有翻译相关操作,如术语和记忆库、翻译、格式设置、错误检查、实时进度显示。
  • 翻译状态:每一个句段都有翻译详情,显示翻译的状态、语料来源和匹配率。
  • 格式设置:快速调整译文字体大小、插入特殊符号和字符。
  • AnyTM:可以解决变体语言(主语言相同而子语言不同)TM问题,最大化的使用自己积累的翻译记忆库。
  • 自定义快捷键:这个功能是很多CAT工具里都有,对于提高译员翻译速度有很大帮助。快捷键自定义功能隐藏得比较深,可以在翻译记忆库选项里找到。

任何产品都有两面性,看完了优点,我们再来看看Trados在翻译过程中给用户体验减分的地方:

  • 语种分得太细,主语言相同子语言不同的在Trados里都默认为不同的语言,导致记忆库的匹配率降低。
  • 无实时预览全文,会影响语境。Trados只有执行预览操作才能预览(视图—预览),相比起来国外的memoQ和Déjà Vu的预览面板更方便一些。
  • Trados在最大限度还原原文版式的同时,由于格式tag的存在导致记忆库匹配率下降。
  • 机器翻译无法免费使用。
  • 功能太多,新手不太容易上手。
  1. 记忆库、术语匹配:记忆库在匹配时会用不同标记凸显翻译记忆库原文与当前待翻译原文的差异,供译员参考。术语匹配时系统自动识别原文句子中所含的术语,同时在术语库中搜索对应的术语翻译,通过鼠标点选取用。支持在术语库中搜索术语。
  2. 文档格式识别:经过测试,Trados导出的译文能很大程度上保持原文格式,特别是页眉、文本框、图片、字体颜色、字号大小、加粗字体、斜体、下划线、底纹、艺术字、编号、项目符号、表格、上下标、链接、公式以及特殊符号均可以在译文中保持原格式输出,省去了大量的排版时间。而在处理页脚(页脚为页码)和目录时,Trados并没有那么智能。当页脚是页码时,Trados无法导出正确的页码。Trados也无法识别和导出目录。

翻译质量管理

在翻译过程中,难免会有一些拼写错误或者是漏译等现象,Trados可以帮助译员快速发现这些问题。在Trados中执行验证操作,错误信息会显示在消息窗口中,双击消息可以查看具体的修改建议,非常方便。但注意执行验证的前提是事先对检查错误的类型进行了设置,这对于新手来说比较麻烦。 Trados可以进行拼写检查、标记验证、术语验证、QA检查。具体来说常见的有:漏译、一致性检查、标点检查(空格、大小写、括号)、数字检查(数字、时间、日期、度量单位)、商标检查。

审校管理

文档翻译好了以后,接下来就是交给审校员审校了,这里也简单的提一下Trados的审校管理。翻译后的文档可在Trados里审校,也可以导出外部审校。在Trados中打开项目,然后在要审校的文件中点击右键,并点击“打开并审校”,即进入到审校模式。国外的几款CAT软件里基本上都有审校功能,如Trados、Déjà Vu、memoQ,但是个人觉得Trados的审校模式更直观一些,和在word中修订差不多,不同的修订操作会有不同的显示标记,其它软件则不会。

特色功能

  • AutoSuggest:跟手机输入法中的联想输入有些类似。基于翻译记忆库中的词语和短语基础上,在翻译过程中给出拼写的参考建议。值得注意的是,导入的翻译记忆库需足够庞大并与待翻译文档领域相关,至少包含1万个翻译单元。
  • PerfectMatch:这个功能主要是在两个文档非常相似的时候用,比如,以前翻译过《火云译客操作手册1版》,现在要翻译《火云译客操作手册2版》,2版在1版的基础上只修改了一小部分内容,那么在翻译时应用PerfectMatch,导入《火云译客操作手册1版》双语文件,PerfectMatch会自动匹配一些没有改动过的地方,大大节约了翻译时间。
  • QuickPlace:根据原文内容提供智能建议,时间、日期、度量衡、数字等可以使用QuickPlace的功能自动翻译。

Trados作为知名度最高的一款CAT工具功能是非常全面的,这也许是因为它要考虑到各种群体的不同需求,但同时繁杂的操作步骤与流程也会给一些用户带来不便。综合考虑它的功能和价格因素,它更适合专业译员和项目经理,而不适合偶尔用用的兼职翻译或者是新手翻译。

译员工作 于玲

新建翻译项目

  1. 打开目标文件所在的文件夹,可以包含Word、Excel、HTML等多种类型,全选这些文件,右击 – 选择“Translate in SDL Trados Studio”,Trados会自行启动,在打开的界面中进行项目设置。 也可以打开Trados后选择新建项目,找到待翻译文件的目标文件夹。

111

  1. 按实际需求填写项目名称、选择项目路径,并设置合适的源语言与目标语言。此处为英译中,源语言选择英文(美国),目标语言选择简体中文。 特别值得注意的是,新版Trados的项目创建向导有了很大变化,下面窗口中,顶端的位置图在直观显示当前所处步骤的同时,还可直接点击相应序号跳转到该步骤,便于快速创建项目。

222

  1. 常规,可选择是否允许编辑原文和跨格式合并,通过设置客户和到期日,可方便进行项目管理和时间把控,此处不做设置。

333

  1. 添加/创建翻译记忆库,如果已有现成的翻译记忆库可供使用,直接点击 使用 – 文件翻译记忆库,并选择目标翻译记忆库。此处创建新的翻译记忆库。

444

勾选更新下的方框,意味着译员在翻译过程中可随时往记忆库中添加双语句对,可根据项目性质和公司需求自行设置。

555

SDL Trados还支持添加机器翻译插件,提供机器翻译译文供译员参考,不过需要购买相应的API。此处不进行设置。 666

  1. 同理,创建新的术语库

777

  1. 依据项目规模和协作方式进行GroupShare设置,此处跳过。

888

  1. 如果之前已经做过这个项目的翻译,此次翻译目的为更新部分内容,可在完全匹配界面下添加之前版本的双语文件,Trados会自动帮译者找出原文在更新前后的区别。此处为新建项目,跳过这一步。

999

  1. 批任务界面,译者可以选择不使用项目TM准备,也可以选择准备,完成文件的预翻译。

101010

也可以通过窗口左下方的语言对窗格,点击命令标签进行批任务的针对性设置。如预翻译文件标签下,可设置最低匹配率等,提高翻译效率。

111111

  1. 汇总界面下,Trados带你回顾之前的一系列设置,提示了项目中的源文件、翻译记忆库、术语库、存放路径、到期时间、语言对等信息,点击完成,完成项目创建。

121212

  1. 准备就绪。译员可将之前的所有设置另存为新模板方便下次直接创建项目,也可以不存储。项目创建完成,关闭向导。

131313

开始翻译

项目创建完成后,译员可进行翻译,Trados集成了翻译记忆库、术语库、QA检查等一些列辅助工具帮助译员提高翻译效率。

  1. 在开始正式翻译之前,译者可查看分析报告来对项目进行整体把控。点击界面左下角面板的报告按钮,查看项目分析文件报告和预翻译文件报告。

141414

Trados对项目文件的总字数、与翻译记忆库中100%匹配和非100%匹配的字数、重复句子的字数、以及待翻译的句子字数等都进行了分析,便于译者合理安排各阶段工作,准确预估工作时间。

151515

  1. 双击打开项目文件夹,找到要翻译的文件,双击打开,进入翻译编辑器界面。Trados会根据默认的断句规则,将待翻译文档拆分成若干个句段,每个句段按顺序编号,在编辑器右边留出译文的位置供译者翻译,部分内容基于预翻译操作已经给出。

161616

未翻译句段,中间一列会显示空白一张纸的图标,而译者键入译文后,会变成一支笔的图标,翻译完成并ctrl+enter保存后,会变成带有对号的一支笔。

171717

  1. 句段匹配方面,编辑器上方有两个可移动的窗口,分别是翻译记忆库匹配结果与术语识别。点击某句对,上方两个窗口会出现相应的匹配结果。如上图

  2. 添加术语,翻译过程中,假如碰到术语库中没有的术语,可直接选中该词,窗口上方菜单栏中点击添加新术语,输入相应译文即可。

181818

191919

  1. 标签处理,某些情况下,如果待译文件中含有特殊格式,反映到编辑器中会是紫色的标记,也叫标签tag。翻译时需要将这些标签原样插入译文中,包括前后空格,以保证译文与原文格式的统一。

202020

  1. 在翻译过程中,有时会遇到需要对相邻句段合并的情况,或者是将一个长句拆分后在进行翻译。合并句段的方法是,点击其中一句,按住shift键,再点击另一句,右击,菜单中选择合并句段,或使用快捷键Ctrl+Alt+S。 拆分句段的方法是,将光标放在需要拆分的位置,右击,选择分割句段即可。

212121

若想避免译员在翻译过程中处于理解不同而误操作,项目经理可以选择禁止编辑原文或禁用跨段落合并句段,在项目设置中,项目选项卡里进行勾选即可。 7. 实时预览,当翻译全部完成或完成一半时,可以执行预览功能,提前查看翻译效果。点击上方视图栏,点击预览按钮即可。

222222

  1. 翻译结束后,保存,既可找到文件存放路径获取译文,也可直接点击文件-译文另存为。

翻译验证工具

Trados自带验证翻译内容的工具,可针对拼写、漏译、标点符号、数字等一系列低级翻译错误进行检查。右击项目,选择项目设置,并点击验证选项。里面包含QA check3.0以及术语验证器、标记验证器等,译者可根据需要自行挑选需要的验证项,并根据右侧指定错误、警告还是注意三重错误级别。

232323

审校

除去Trados自带的翻译验证工具进行译文检查之外,也可以选择导出后由专业审校人员进行审校。 点击窗口上方审校标签,选择导出以进行双语审校

242424

导出完毕,点击关闭时,会有提示窗口询问是否是否打开包含导出文档的文件夹。点击是,找到导出的文件。

252525

打开导出的文档,审校人员进行修改,形式同word自带的修订功能相同,任何改动的部分会以不同颜色的标记注明。

262626

修改完毕后,将文件返回给译员,译员可再次使用Trados打开进行查看,通过从双语审校更新命令打开。下拉菜单中添加审校人员返回的审校文档即可。

272727

如图,审校人员进行的改动会同步反应在编辑器的编辑界面上。

282828

译员可直接右击改动部分,选择接受或拒绝修改。

292929

最终定稿

翻译项目经过了预处理、翻译、审校等环节之后,进入最终定稿阶段,目的有二:生成项目中所有的译文文件,以及将所有经过审校的内容更新至主翻译记忆库。 右击该项目,选择批任务-定稿,会包含两个环节,点击下一步自动执行即可完成,文件被完整保存在该项目的目标文件夹下。

303030

memoQ

基本功能(着重翻译记忆) 可欣

项目管理

用memoQ辅助翻译的第一步是新建项目。新建项目的步骤依次是:填写项目信息、导入翻译文档、记忆库、术语库。用户创建的项目可以进行备份、还原,也可以导出到memoQ服务器进行协同翻译。项目经理可以使用memoQ的创建视图和统计功能来管理项目。

创建视图

使用对文档创建视图功能,可以将项目中的文档连接起来、提取重复内容、分割文档,这样有利于同时管理项目中的多个文档,降低重复工作成本。

统计功能

统计功能可以根据项目文件、语料情况等条件统计出项目字数、语料匹配率并生成可供导出的报告。

语料管理

语料库

我们可以用语料库功能来创建记忆库:导入相关的文档(双语文档、对齐文档、单语文档)、对齐、导出。该功能可以将原文句段进行合并、分割。

翻译记忆库

memoQ支持创建翻译记忆库:使用项目主页中翻译记忆库功能。支持TMX/CSV格式记忆库的导入,支持导出TMX格式。翻译记忆库支持添加、删除、修改、排序、去重等功能,对记忆库进行不同的编辑操作后界面会有不同的高亮提示。

术语库

memoQ 的术语管理体验要比 SDL Trados 好很多。memoQ 的界面和功能都非常清晰,很方便浏览和修改。它还支持对单条术语进行匹配、用法、语法、图像等设置,可以有效提高术语匹配率。memoQ 支持 CSV/TSV/TMX/EXCEL/Multiterm/TBX 格式术语库导入,支持 CSV/ Multiterm 格式导出。

译前准备

预翻译

预翻译功能在准备菜单里,该功能既可以将匹配到的语料填充到译文框,也可以用机器翻译结果填充(前提是已启用机器翻译)。

机器翻译

memoQ机器翻译插件很多,但和Trados一样,大部分都是需要API的。

翻译质量管理

memoQ在翻译质量管理方面有最基础的拼写检查、质量保证(QA)之外,还提供语言质量评估功能(LQA)。memoQ 的语言质量评估功能自带 LISA、TAUS,以及 memoQ 自己的翻译质量评估框架,还可以自定义或直接导入客户提供的翻译质量评估标准,从而最大限度的确保交付译文满足客户的翻译质量要求。 审校管理

审校管理

memoQ 可以进行双语审校和单语审校。审校时运行质量保证 QA,可以根据错误警告进行修改。当然审校人员也可以直接跟踪更改,若选择显示更改,则每一处修改过的地方都会有提示。审校完成以后将更改导出至word,也能清楚地看到文档中有哪些地方进行了更改。

翻译处理:文档格式兼容与识别

memoQ支持常用文档格式:word、 excel、txt、pdf、csv以及Trados双语文档的导入。对于ppt文档,MemeQ的兼容性并不太好,导入后无法创建预览;对于office2010或以上版本支持还不稳定,在导入时文档的某些功能会被替换为office2007功能。翻译完成后可以导出纯译文和双语文档(memoQ XLIFF、Trados兼容的双语、两栏RTF),导出纯译文后可以看到文档的字体、字号、排版与原文保持一致,但也有一些文档内容是在memoQ中无法被识别并翻译的。

译员工作 慧敏

在此,以我们组内同学从翻译公司接受的翻译任务为案例,主要从译员的角度关注该计算机辅助翻译软件是如何帮助译员进行翻译的。以译员的实际工作为着眼点。

译前准备:新建项目

新建项目基于模板

适用于简单项目翻译,如单个文档且不需要翻译记忆库和术语库的情况。

  1. 点击新建项目>新建项目(基于模板),或者直接点击,默认就是这种情况
  2. 直接添加文档

  1. 填写项目模板信息

  1. 即可进行翻译

新建项目

  1. 新建项目

  2. 导入待翻译文档

  3. 新建翻译记忆库

    一般译员拿到手做笔译的素材,很少有翻译记忆库,所以需要自己新建,但如果对方提供翻译记忆库,那么也可以直接添加。

  4. 新建翻译术语库

  5. 新建翻译项目结束

    自动跳转到项目主页视图下的翻译视图,在此可以看到单个文件的字数,还可以点击“结构”查看整个项目的翻译字数。

其他功能
提取术语

可以像翻译记忆库一样将相关的术语库文件导入到当前项目术语库中。也可以从原文提取相关术语来准备术语库资源。

  1. “准备”选项库>“提取术语”

  2. 在弹出的提取候选对话框中,选择停用此表如图所示

  3. 可针对提取的术语进行选择,“接受为术语”,“舍弃术语”

  4. 最后将已接受的术语“导出至术语库”

  5. 转到“术语库视图”,在术语库右键单击>编辑,在术语库编辑器中查看导入的术语。

    在本例中,因为原文是英语单语文本,可以在此编辑术语对应的中文表达。

配置网络搜索

译者翻译离不开网络搜索,新词的意思、专业知识等都需要通过网络搜索来查找或验证。网络搜索是memoQ的特色功能,可以在“迷你浏览器”中同时搜索多个网页,非常方便。

  1. memoQ > 资源 > 资源控制台 >打开网络搜索

  2. “新建”网络搜索,并输入名称和描述

  3. 右键新建的网络搜索>在弹出的对话框中点击“新增”> 在“编辑查找提供方”对话框,填写信息

  4. 最后在“网络搜索设置”对话框点击使用

译中

预翻译

因为添加了术语库,所以可以基于此进行预翻译。

正式翻译
翻译界面
  • 预览窗口

Memo Q的界面清晰,值得一提的是,它拥有预览窗口,是相较于SDL Trados 最大的又是。译员能清晰知道自己翻译的东西最终呈现形式,所见即所得。

  • 重复句段标志

    翻译编辑窗口的右边,第一个句段的状态栏中有一个深绿色的图标,表示“这是一个重复”

  • 翻译结果页面

    其实翻译结果页面,有些显示太多,给译员反倒会带来一些困扰。

    第1项:翻译记忆库的匹配

    第2项:术语库的匹配

    第3项:提取的术语

    第4项:片段组合

翻译过程
  1. 实时质检

    在翻译过程中,如果我们将一些数字内容打错,确认句段后,会出现闪电图标

双击就会提示出具体出错信息,对于译员而言帮助很大,会防止犯一些低级错误。

  1. 网络查找

    比如在翻译的时候出现了新的不理解的概念,结合memoQ之前配置的网络搜索,可以直接查找

    选中要查询的内容> 右键>memoQ网络查找

    就可以直接在memoQ中直接到浏览器查询,但是经过测试,访问速度让人堪忧。

  2. 翻译记忆

    在遇到相似的句子时,在翻译结果页面会显示出匹配度,以及用红色标出不一样的地方,方便译者查看编辑。

译后审校

QA质检

其实memoQ在译员翻译过程中已经提供了很好的质量保障了,包括实时质检,只要稍微注意,一般不会出现问题了。但如果译员很粗心,那还是需要在最后进行QA质检。

审校 > 质量保证

勾选后两个对号,其他为默认选项

最终生成的解决错误和警告如下图,译员可根据建议修改。

双语审校

双语审校涉及原文的理解和疑问的表达。。

  1. 有3种格式可以选择,最后一种使用最普遍,也最方便。

  1. 导出后,在word中用修订功能进行审校

  1. 审校完成后,将双语文件导入,选中右下角的“将编辑导入为已跟踪的更改”前的小框。

    可以看出更新了3处

  2. 在memoQ中最终编辑修改的内容,就和在word中修订视图看到的一样。可以选择接受或者拒绝修订

三款软件对比

1.人机交互界面

Déjà Vu

Déjà Vu X3的新版界面几乎是完全仿照Microsoft Word设计。无论从色调,框架,组织形式都完全与MS word一致。其中多个选项卡:文件,插入,审校,视图以及其中的按钮设置,按钮图案,甚至选项设计,都是仿照MS word设计的,这为译员在翻译过程中提供熟悉的人机交互环境,几乎相同的按钮位置也提高了工作效率。

PC安装DVX之后,打开MS word会发现菜单栏多出来一项Déjà Vu X3,直接集成在MS word中,判断该文档中是否有不能正确导入DVX的objects,如果有的话可以转换成2007-2013版word提升兼容性。 另外,如果word文档中动态嵌套了excel等其他软件模块,翻译完成之后可以选择刷新所有objects进行更新。

35


marp: true

翻译记忆体验(垚鑫)


通用任务概览

已知:原文1、译文1(原文1对应的译文)、原文2
求:译文2(原文2对应的译文),并体验得出译文2时,CAT 软件所提供的翻译记忆功能


具体任务展示

化抽象已知为具体。在苹果公司官网支持中获取原文1、译文1(原文1对应的译文)、原文2

  • 原文1:苹果公司官网支持中的“更改桌面上看到的图片”操作说明,基于MacOS 10.13(英式英语)
  • 译文1:苹果公司官网支持中的“更改桌面上看到的图片”操作说明,基于MacOS 10.13(简体中文,中国)

为了在不兼容中文的软件中进行体验,也获取一份标准德语内容。

  • 原文2:苹果公司官网支持中的“更改桌面上看到的图片”操作说明,基于MacOS 10.14(英式英语)

使用浏览器审查元素复制所需代码块

使用开源中国在线工具进行 HTML 代码格式化


文件展示

  • 原文1:demoFiles/10.13_html_en.html
  • 译文1: demoFiles/10.13_html_cn.html(UTF-8编码) 或 demoFiles/10.13_html_cn_gb2312.html(gb2312编码) 或 demoFiles/10.13_html_de.html(软件不支持中文时)
  • 原文2:demoFiles/10.14_html_en.html

SDL Trados 的翻译记忆体验


创建记忆库,并添加一对要对齐的文档


对齐结果(基本对齐)


导入翻译记忆库


翻译单个文档


翻译记忆库和文档设置


批处理,预翻译,最低匹配率设为80%


预翻译结果


点击某些翻译区,匹配率不足刚刚设定值的,记忆翻译也自动出现了


小结,SDL Trados 的翻译记忆体验


优点

预翻译。提供基于翻译记忆库的预翻译功能,并可设定最低匹配度。

不足

步骤繁琐。需对齐文本、设置记忆库并导入该记忆库。

对齐不够好。测试中 HTML 的对齐情况不尽如人意。


Déjà Vu 的翻译记忆体验


开始对齐


中文乱码


指定对齐语言和文件(英式英语-德语)


对齐情况令人大跌眼镜,需手动调整对齐(此处略)


需要保存对齐文件至记忆库(截图略去)


创建翻译项目


指定翻译项目语言


指定翻译记忆库


预翻译


预翻译结果


小结,Déjà Vu 的翻译记忆体验


优点

预翻译。提供基于翻译记忆库的预翻译功能,并可自动填充译文。

不足

步骤繁琐。需对齐文本、设置记忆库并导入该记忆库。

对齐非常不好。测试中 HTML 的对齐情况让人大跌眼镜。

中文乱码。


memoQ 的翻译记忆体验

新建记忆库(软件中译为语料库,英文为 liveDocs)


添加对齐对


utf8中文乱码


gb2312中文乱码


查看对齐,对齐效果很好


右键,在项目中使用语料库


预翻译


翻译界面


小结,memoQ 的翻译记忆体验


优点

提供预翻译。提供基于翻译记忆库的预翻译功能。

不足

名称。翻译记忆库的译法让人匪夷所思。

中文乱码。


Transifex 的翻译记忆体验

<title>Localization Platform for Translating Digital Content | Transifex</title>

Transifex 主页


在 Transifex 上创建项目

项目名称


隐私类型与项目类型


团队与语言 设置源语言为英式英语,目标语言简体中文和德语


项目创建成功


上传原文1


上传译文1


查看原文1与译文1的对齐情况,无需也无法手动对齐。


上传原文2


开始翻译,并查看提供的翻译记忆


小结,Transifex 的翻译记忆体验


优点

步骤简化。创建翻译项目、对齐文本、创建翻译记忆库,合众为一,仅需上传文件即可轻松完成。

自动化。无需手动对齐文本,文本自动对齐。无需手动创建翻译记忆库,翻译记忆自在云端。

兼容多国语言。简体中文可流畅使用,无须担心乱码问题。


优点

交互良好。提供记忆差异对比,哪里不同,一目了然。提供一键复制,已有相似译文即刻跃然纸上。

在云端。文件、记忆库、术语库实时保存至云端,随时随地都能访问。

集成开发。与 GitHub 和 Bitbucket 集成,自动更新软件翻译。

简洁界面。极富现代感的扁平化设计,删繁就简,让您心无旁骛。


不足

未提供预翻译。未提供基于翻译记忆库的预翻译功能。

源语言单一。仅可在创建项目时指定单一语言为源语言,且日后不可更改或增加。

记忆库无法复用。由于翻译记忆是融合在项目中的,无法导出,亦无法在其他项目中复用。


Transifex,下一代 CAT?

绝妙的翻译记忆,无需知晓,却已在其中。