You are on page 1of 11

抄录指南

抄录员工作手册
2013年十月

目录

简介 ..............................................................................................................................1

绝对直录还是排噪直录 .................................................................................................1

为什么需要排噪直录? .................................................................................................1

习惯性口语连接词、无实意插入语、口吃式言语 ..........................................................1

反馈式语言 ...................................................................................................................2

如何建构语句 ................................................................................................................3

标点符号用法 ................................................................................................................3

逗号 ..............................................................................................................................3

冒号和分号 ...................................................................................................................4

引号 ..............................................................................................................................4

破折号和省略号 ............................................................................................................5

抄录指南 .......................................................................................................................5

话语发起失误和插话 .....................................................................................................6

标记非言语性声音和不可记录式语言 ............................................................................7

数量词 ...........................................................................................................................8

一般性原则 ....................................................................................................................8

资源使用 .......................................................................................................................9

©TranscribeMe! 2013
1

简介

该抄录指南为抄录员和校验员提供基本得指导原则,使抄录工作更顺畅进行并提供
令客户满意的、专业的抄录文件。此指南所列各项并非要求抄录员绝对地、无变通式的
遵循,一定程度上允许抄录员因风格不同而存在一定差异。

抄录指南中所列关于语法和句法的各项要求可为抄录工作提供基本指导,但不能提
供穷尽式或万能法则。此外,个别客户对抄录文件可能有具体要求,而指南未提及或与
之相悖,抄录员需查询工作平台所示“指南(guide)”以处理客户特定要求。

最后,欢迎质询和建议至 david.liu@transcribeme.com。

绝对直录还是排噪直录?

抄录和审核工作的默认方式为排噪后的逐字抄录文本,即逐字记录,但,去除谈话
人因思考延迟等而表达的口头惯用语、非强调式的重复、口吃等无实际意义的词语。在
遵循这一原则的前提下,抄录一份文件需要抄录员和校验员认真判定哪些词和语块可以
省略不录。整洁、逐字抄录并非难事,下面章节将就排噪文本的使用进行具体举例说明,
并详细区分“绝对性逐字抄录”和“排噪式逐字抄录”。

为何需要排噪式抄录?

排噪式抄录既要确保音频中谈话人的有效话语被逐字不落地抄录,又能保证文本的
整洁易读。干净文本(排噪后文本)意指最终文档应为去除谈话人失误性言语(如无实
际意义的口头惯用语和填充词)的文本。典型的干净文本亦指纠正那些非正式的简化语
言(如将方言抄录成普通话,将“唠嗑”抄录成“谈话”或“聊天”)。

习惯性口语连接词、无实意插入语、口吃式言语

干净文本最主要的特征即是去除了口吃式言语、无实意填充式语言和连接式口头惯
用语。说话人因思维延迟或在头脑里构思表达逻辑和方式时,为使语言连贯,往往在句

©TranscribeMe! 2013
子之间加入一些上述无实际意义的语言,而这些语言的加入并不能真正增加句子意义和
语篇连贯。另外,说话人为引出另一位发话人或观众的反馈也常使用此类语言。

所谓口头管用语,包括“嗯”、“啊”,以及短语结构如“你知道的”、“就像”、
“我是说”、“我想”和“大概吧”,准确定义、找出这类口语连接词或填充词对句意
理解很重要。通过上下文语境以及这类口语词的表达方式,很容易将其分辨出来,见下
例:

错误:我的意思,就是说,您还有什么其它想法,比如,嗯,就像,您早期的建议等。
正确:您还有什么其它想法,如您早期的建议等。

错误:对幸福的定义,怎么说呢,这个吧,不同的人有不同的看法。
正确:对幸福的定义,不同的人有不同的看法。

需要注意的是,有些词,“差不多”“就像”、“像”应视情况而定。有时它貌似
是无实际意义的冗余词语,而实际上它可能是强调事物的近似性。例如,“我在床上躺
了,差不多,两周”(有实际意义);“学生们,差不多…嗯…基本都及格了”(冗余)。

言语失误中,口吃易于判定,即非必要的语音、字和词重复,这一类均应在干净文
档中去除。然而,对于为强调目的而有意重复的语言应予以保留。例如:“这个匹萨真的、
真的很好吃”(强调式重复);“这个匹 匹 匹萨真的很好吃”(口吃导致失误,应去除重
复部分)。

反馈式话语

抄录工作经常抄录访谈、会议音频文件,其中涉及二人或多位发话人。音频文件中
经常出现人们用一些反馈式语言回应发话人,如“对”、“是的”、“好的”和“有道
理”。在干净文本中应去除此类语言,以及任何类似的、独立出现的插话语。但不包括
采访中就具体某个问题提问后,要求受访者做出回应的“是的”、“对”。下面例句中,
如S2不必抄录。

错误:
S1:我思索良久,然后决定做个素食主义者。
S2: 哦。
S1: 但想到我不能再吃培根….
©TranscribeMe! 2013
正确:
S1:我思索良久,然后决定做个素食主义者,但想到我不能再吃培根….

如何建构语句

当抄录句子时,何时终止句子以及何时开始下一句是抄录工作的难点。不同于正式
书面文体,其文化性,学术性或报道性较高,抄录文件多为口语,发话人经常不遵循正
式的句子结构,因此,抄录时需确保文档的易读性。无休止的长句或片段式句子,在最
终文本中均应避免。如果需要,可以加入句号断句并开始下一句,尽管发话人并未停顿。

标点符号

在抄录文件中,标点符号的主要作用是标记句子结构和说话人的语调顿挫。当过度
遵守讲话人的表达节奏而引起理解困难时,标点符号的使用可以增加句子的清晰度。当
一个长句子包含太多的主语,宾语和思想时,为了理解清晰起见可以添加逗号,尽管讲
话人实际上并未停顿。

逗号

逗号的使用主要是看,它的添加是否有助于讲话人清晰的表达他的思想。因此,逗
号的使用需依个人的主观判断。尽管如此,有些基本规则仍需遵循。

逗号和句号是抄录文本中最常见的两个符号。注意一下几点:

 避免出现整段的内容由逗号一气呵成。抄录员主要根据讲话人说话的内容,即 意
群,适时断句。还可以根据讲话人的语气、语调,话语停顿来断句。

 话语出现转折时,如有明显的表转折、并列、或因果的词汇,如“但是”、“然
而”、“不料”,为使语句和意义清晰,转折词后加逗号。

o 例:小枫从来不撒谎,学习勤奋,还乐于助人,因此,我们评选他为三好
学生。

 请严格区分逗号 [,] 和顿号 [、] 的使用。英语中没有顿号,因此使用逗号表示

©TranscribeMe! 2013
同类列举,但是,汉语中使用顿号表示同类列举。

o 例:妈妈买了香蕉、苹果、西瓜和梨。(注意,列举最后两项用“和”而
非顿号)

尽管理应用句号的地方,用了逗号后不会对句意理解产生影响,但这是蹩脚语法的一种
展示。应予以避免,因为它会影响语义流畅,并导致不必要的长句子。

冒号和分号

冒号和分号在正式写作中很重要。然而在转写文件中要谨慎使用。因为使用规则不
清晰,分号尤其常被误用。常规是,破折号、逗号和句号的使用要多于冒号和分号,但
也无需对其避而不用。通常情况下,两个独立但语义密切的句子不适合用连词连接的时
候,才使用分号。

有的情况下,尽管去掉分号不影响句子理解,但分号的使用使句子更得体。尤其当
讲话人无停顿地、滔滔不止地表达多个思想时,分号的使用有助于清楚理解句意。简言
之,使用冒号和分号需认真判断,如果不确定,最好不使用。

冒号使用规则易于掌握,当一个主句后面需要列举、解释或引用时,那主句后面需添加
冒号。

需要谨记,只有结构完整的主句后面才可使用冒号,句子片段和个别单词后不能使
用冒号。

引号

引号只能用于直接引用说话内容。当讲话人直接引用自己或他人的讲话内容时,可
以使用逗号将引语和句子其它部分分开,并将引语的首字母大写。如无特殊情况,使用
双引号。

关于非直接引用,或者有多人表达时,引号的使用有具体要求。例如,如果引语是
一群人的说话内容,则无需加引号。

说话人引用自己所思考的内容,无需使用引号,但仍需用逗号将引语内容和句子其它部

©TranscribeMe! 2013
分隔开。

如果说话人表述过长,无法判断引语终止位置,则用破折号将引语和其余对话部分
隔开。

抄录语音文件常会遇到讲话人引用假设性表达,即在某种情境下某人可能会说的话,

例如:当某人回应市场调查问题时,可能会提到消费者可能会问的问题,在这种情况下,

抄录员需要用“单引”[„ ‟]标注这类表达。

当为引用内容添加标点时,句号和逗号均置于引号内部。如果引用本身就是一个问
句,问号也置于引号内。冒号和分号应总是置于引号外。这是美式英语的标准。

破折号和省略号

破折号所表达的语义略强于逗号。正式写作中常避免使用,但在非正式写作中,它
有助于表达,尤其对于抄录文本,它适于捕捉说话人的语意韵,如节奏、强调和语调等。
说话人常停顿下来添加强调、反思、列举或解释。破折号也常用于独立句后面,以引出
词汇或者短语。

破折号用于引出说话者添加的强调成分。

说话人的反思行为常会打破句子语法结构以及说话人的表述,破折号在此种情况下
常被积极使用。

当说话人打断自己以添加相关但非必要信息时,常使用破折号。

以上各例,可以使用长破折号,然而,TranscribeMe的工作平台没有类似微软word
文档的快捷方式用以插入长破折号,因此,抄录员需要使用连词符来代替破折号。

省略号是一个实用性较强的符号,但它的使用应远远少于破折号。抄录的默认模式
是排噪后的、逐字记录式文档,绝大多数的停顿均不应标记。如果说话人停顿几秒后继
续谈话,那么抄录员应忽视停顿直接抄录。

然而有的停顿标志着谈话思路的改变,如果不标记停顿会导致文档语法表述不规范。
在这种情况下,可以使用省略号,前提是停顿时间超过4至5秒。较短的停顿被视为“话语

©TranscribeMe! 2013
发起失误”,详见下节。

省略号还用来标注说话人声音减弱。

抄录指南

音频抄录工作自身存在一些问题,如声音记录效果较差和说话人不可录,有时,还

需记录一些非语言声音。

发话失误和插语

说话人有时会犯错,促使他们重新开始,这被称为发话失误(或误开始)。除此以
外,如果音频是访谈记录,访谈双方会互相打断,这些情况都会增加抄录工作的难度。

TranscribeMe要求用双破折号标记此类非正常开始和谈话打断。添加双破折号的方
式—两次点击连词符键[--]。双破折号需要紧跟说话者停顿然后再重新开始的地方,或者
说话者被另一方打断的地方。

需要注意的是,并非所有的发话失误都要这样标记。如果说话者在误开始后迅速纠
正自己,则无需标记,可以忽略此类错误,直接记录正确句子。当说话者误开始后没有
及时改正,并谈了较长时间后才纠正自己,则需标记。如果不做标记将使抄录文本不合
逻辑难以理解。

两个句子都是在句首出现言语失误。如果言语失误很简短,并且将其删去后不会有
损句子的连贯性,也不会导致大量语言流失,则可以将其忽略不抄录,例如:

我走到办公室--走到教室去上课。

应抄录为:

我走到教室去上课。

上例中,说话者只是说错了词语(教室说成了办公室)并立刻自我纠正过来。排噪
后文档应忽略此种不重要的言语失误。

处理话语打断类问题的方式类似,当说话人被打断的时候,添加双破折号并清除标

©TranscribeMe! 2013
记S1和S2来指示不同的说话人。

S1: 当我在最后一个公司工作的时候,我--
S2: 你当时再哪个公司工作?

如果说话人在提问时被打断,则在被打断处添加双破折号,问号并紧跟其后。例如:

S1:你在当时的公司干了多--?

S2:大概2年

对非语言声音和不可录语言标记

在抄录工作过程中,经常会遇到非语言声音,如笑声和掌声。因为非语言声音对谈
话内容没有影响,所以抄录时可对此忽略不录。但是,掌声和笑声也是抄录工作的重要
部分。抄录时对掌声应加以标记,因为它表明观众的接受度。笑声也应标记,因为它让
读者知道此处在讲一个笑话。

不可录语言也会给抄录工作带来挑战。很多因素会导致语言不可录:说话者的粗重
发音、说话人说话含糊其辞、录音质量差,其它谈话者声音大过另一个说话者等。这类
声音合理标注。

 掌声标记为 [掌声]

 笑声标记为 [笑声]

 音乐标记为 [音乐] 。需要注意的是,此处所标记的音乐为有意同语言一起被记录


的音乐。例如,可能是广告,或是谈话类节目,音乐引介出一位说话人。但如果
是背景音乐则忽略不记录。如果背景音乐声音导致说话者声音不可辨,则用[不可
录]来标记

 如果说话人表述完毕后伴有笑声,标记为[笑声]

 如果录音质量太低而无法听清具体言语,或者背景噪音盖过说话者,则对该部 分
标记 [不可录]

 如果几位说话者的谈话行为交叉进行,抄录员听不清所谈论内容,则标记为 [交叉]

©TranscribeMe! 2013
 如果说话者的部分语言内容不可辨,或者非录音质量导致的内容不清晰,则标记
为[?]

 如果超过10秒钟无人说话,则标记为[无声音]且标记独立占行,需标明S1和S2来
区分说话人。例如:

S1:我需要好好想想。
[无声音]
S2:你需要再长点的时间么?

如果某个词语未能听懂,但是如果抄录员能做出合理猜测,则把猜测的词置于方括
号内,并在后面加上问号。

S1:当我初中的时候我去过 [蓝田?] 。

将所插入标记置于标点符号内。例如,某人对其所说内容感到可笑,则将[笑声]置于
其讲话内容之后。

S1: 年轻的时候大家都爱做傻事 [笑声] 。

重点提示:有些音频文件内含技术术语,或者提及抄录员不熟悉的某种商品,物品
或者地点,这时需要抄录员和校验员尝试google这些词汇。如果在线查询仍然没有答案,
那么猜测这些词汇,并如上文所言,将其置于方括号内并加问号。

在遇到不可录或者无法辩解的语言请努力去听,并根据已知内容猜测。如果某个词
句不符合上下文语境,则可能是个错误。下例中的抄录文字是个明显错误。

S1:你带板子了么?里面记载着本月的销售记录。(板子应该是本子)

上面的错误都是误听导致的,含有如此明显错误的抄录文本是不被接受的,所以首
先请尽力听取不清晰词语,再放回上下文中检验,如果依然不能断定,则按上文所示要
求进行标注。

数字写法

 十以内数字以文字写出(一、二、三、十),大于十的数字则采用阿拉伯数字形
式(11、12、13)。

©TranscribeMe! 2013
 当陈述百分比的时候,可以使用百分号(%),如50%

 当写分数的时候,不要使用数字,如“三分之二”,而非2/3。

一般性原则

抄录员和校验员应确保抄录文本的质量。有时因音频质量问题会影响抄录工作,但
下面一些简单的方法可以帮助抄录员避免一些显而易见的错误:

 在抄录工作中始终保持认真态度,勤于核查,努力做到呈现给顾客的文本具有专
业水平,无主观因素导致的错误。

 认真体会音频文件中发话人的谈话内容和思想,他们所提供的语境可以帮助抄录
员正确辨别和判定某些模糊词汇。

 认真使用标点符号。确保句子的连贯性和文字的书写正确性。
 确保人名、地名等专有名词的书写正确。当不能确定时,请在网络中搜索、验证
或确认。这一方法尤其适合含有大量商品名称或地名的文件。

 最后也是最重要的是,确保抄录文本的精准性。尤其对音频识别有问题的语段不
能含混带过,努力后如果确实无法识别,请用上文中的各种标注方式对其进行标
注。

资源使用

如果遇到本指南中未包含的语法或句法问题,请联系david.liu@transcribeme.com。
众多相关网络资源也可以为抄录员提供更为详尽的解答。如果其它资源所提供的相关知
识与本指南相悖,请以本指南为准。特殊要求除外。

©TranscribeMe! 2013

You might also like