Professional Documents
Culture Documents
后基因组时 代的关键
张 荣 太 ( Young-Tae Chang ) 著
王 莘 亮 (Shenliang Wan
金 泳 秀 (Young-Soo Kim) 设
纽 约 大 学 化 学
文 库 研 究
1. 基因组计划,及后基因组时代
2. 追溯生物学
3. 化学生物学
4. 文库
5. 免疫系统及抗体
6. 生物文库
7. 化学文库
8. 糖文库
9. 高通量筛选
10. 生物芯片
11. 分子进化
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
1. 基因组 计划 , 及后 基因组 时代
DNA 由包含遗传信息的基因组构成 . 四种碱基 A,T, G 和 C 组装成线性高分子 ,
A-T, C-G 配对结合形成螺旋 , 从而构成 DNA 链. 正如计算机系统采用二进制那
样, DNA 采用 4 进制储存信息 . 遗传信息指导蛋白质的合成 , 于是子代遗传了蛋
白质的组成并产生了生理活性 . 因此, 一旦我们已知了一个物种的 DNA 序列, 我
们就可以推断它可以产生的所有蛋白质 , 从而理论推测这个物种的所有生物特征 .
有关蛋白质的遗传信息的单位称作基因, 一个生物的所有基因称作基因组. 由此
创立了一个新兴的学科来研究基因组, 即基因组学(Genomics).
DNA 及 染 色 体 结 构
U.S. Department of Energy Human Genome Program<http://www.ornl.gov/hgmis>
来自法国,德国,日本,中国等六国的科学家自 1990 年组成了一个多国合作小组 开展人类
DNA 测序工作以揭开人类基因组之谜 . 最初他们希望 2005 年前能够获得人类 DNA 序列的图谱 ,
但是到 1997 年, 在耗费了巨额资金和一半预定时间之后,多国合作小组仅完成了 3%的测序工作.
与此同时, 遗传生物学家 Craig Venter 博士, 创立了一个名为“Celera Genomics”的风险投资公司并
宣称他将在无政府投资条件下早于多国合作小组完成人类基因组计划 . 尽管很多科学家表示怀疑,
Celera 采用了如“散弹枪”等一系列新的方法并很快真的追上了多国合作小组 . 看到自己即将失
利, 多国合作小组在 Clinton 总统的撮合下开始与 Celera 合作, 在 2000 年 6 月完成了 90%, 2001 年
初完成了 99%的人类基因组草图 . 有意思的是多国合作小组在英国的自然(Nature)上而 Celera 在
美国的科学(Science)上各自独立的在同一周发表论文, 在 2001 年 2 月 12 日的记者招待会上联合
宣布人类基因组测序工作的完成 . 也许是出于政治原因 ,两大权威科学杂志均在没有 100%检验并
证实结论的情况下刊登了他们的论文 , 而且两个小组由于竞争关于统一课题的成果都没有做足够
的方差检验. 事实上他们的成果中大概有 0.14%(大约 400 万碱基对)序列差异, 还需更完整的检验.
Celera 公 司 标 志 和 Craig Venter 博 士
<http://www.celera.com>
<http://www.ishipress.com/venter.htm>
参 考 文 献 : http://www.chemmate.com/news/n2.htm
基因组学在线辞典: http://www.genomicglossaries.com/
▲ top
::::人类基因组 ::::
Blast 软 件 : http://www.ncbi.nlm.nih.gov/BLAST/
HGP 实 验 室 (350)
GeneBank: www.ncbi.nlm.nih.gov/Genbank
EMBL: www.ebi.ac.uk/embl
DDBJ: www.ddbj.nig.ac.jp
▲ top
::::重复碱基序 列 ::::
尽管通过人类基因组计划(HGP)破译了人类基因组序列, 这才只是能够比较个体差异的单核苷多态
现象(SNP)的开始. 已知每 1000 个序列中会有一个 SNP, 这就是说个体遗传信息差异仅约有 0.1%而
其他 99.9%都是相同的. 人类基因组计划估计人类基因组中大约有 140 万 SNP 位点. Celera 估计大
约有 210 万 SNP 位点. 如果碱基序列因 SNP 而存在差异, 相关氨基酸就会不同 , 这会导致蛋白功能
不 同 .
▲ top
::::其他物种的 基因组研 究 ::::
人类基因组序列当然不是第一个被研究的. 基因组远远短于人类的低等动物的研究早已进行, 如大
肠杆菌 Escherichia coli(460 万碱基对 ), 酿酒酵母 (S. cerevisiae)(120 万 ), 线虫 (1000 万 ), and 果蝇
(1400 万). 自从 1995 年报道了微生物的基因组序列 , 截至 2001 已破译了几十种动物的全基因组序
列而且数量还在迅猛增长 . 尽管小鼠 (330 亿碱基对 )或者玉米(50 亿)的基因组都比人类 (30 亿碱基
对)的大, 并不是每种动物的基因数量与其基因组尺寸成正比 . 总体上说高等动物的基因组大 , 基因
排列得也稀疏, 也就是意味着不必要的重复碱基序列和基因内区的比率更大. 所以大的基因组并不
意味着更多的基因 , 甚至高等动物并不一定比低等动物的基因多 . 例如果蝇比较低等的线虫少
5,000 个基因. 而且, 被认为更高等更复杂的裂殖酵母 (fission yeast)和裂变酵母 (S. pombi) 比芽殖酵
母(budding yeast)和酿酒酵母少 20%的基因. 这就是说, 基因功能比基因数量更重要. 所以裂殖酵母
和裂变酵母含有恰好的核心基因和特异性裂殖酵母基因. 也正因此, 如果去掉与原核细胞共有的基
因 , 就 可 以 发 现 真 核 细 胞 独 有 的 决 定 其 特 异 性 的 基 因 .
现在,日本和美国正因日本水稻和美国小麦而拥有植物供给上的国家尊严 . 尽管看上去基因数量
不相上下, 事实上小麦比水稻多出三倍的基因 , 所以美国的负担较重 . 而且, 国家生物工艺信息中心
与 Celera 在人类基因组之后在小鼠基因组计划上又一次形成竞争. 根据 2001 年的最新报道, Celera
正领导这项计划并宣称他们将对小鼠基因组信息收费.(Science, 2001, 292, 822-823): National Center
for Biotechnology Information and http://www.applera.com/press/prccorp042701.html.
生 物 体 基 因 组 比 较
<http://biotech-adventure.okstate.edu/low/basics/genetics/genomes/>
小 鼠 及 人 类 的 基 因 比 较
U.S. Department of Energy Human Genome Program<http://www.ornl.gov/hgmis>
种物种的基因组尺寸信息 : http://www.genomesize.com/
基 因 组 信 息 网 :
NCBI site: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome
Genome Web: http://www.hgmp.mrc.ac.uk/GenomeWeb/
Eukaryotes: http://iubio.bio.indiana.edu:8089/
Animal Genome size database: http://www.genomesize.com/
Mouse Genome: Mouse Genome Informatics, Mouse Genome Sequencing, Mouse RH Map
Rice Genome: Rice Genome Research, Rice-Research
Yeast Genome: Stanford, Proteome
ZebraFish: http://zfin.org/
物种基因可因突变和杂交而改变, 但是细菌的名为质体(lasmid)的基因可以独立扩增或在菌种内或
种间进行交换. 当细菌具有了抗药性后, 这种特性可以通过质体而传播给其他细菌 . 有趣的是多国
合作小组报告中的 113 个基因被推测来源于细菌 . 这些基因不存在于已完成基因组序列分析的酿
酒酵母, 线虫和果蝇中, 而仅存在于细菌中 . 所以这些基因要么自细菌移入脊椎动物 , 要么被那些动
物删除却仍存留于人体中. 无论怎样, 具体功能仍待研究, 但是关于基因平行传递的假说被强烈支
持 .
▲ top
::::蛋白质组学 ::::
▲ top
::::功能基因组 学 ::::
人类基因组计划已经破译了基因序列 , 下一步将是由功能基因组学研究已破译基因的功能并控制
它们. 正如千岁基因组公司(Millenium Pharmaceutical)的 Robert Tepper 说的那样, “现在我们知道了
词典里面有什么, 我们需要知道每个词的意思.” 尽管基因序列的 99%已经被破译, 只有 10%的全部
基因的机能是已知的 . 一个方法是通过比较未知和已知基因来类推其机能 . 数据库正在建设之中 .
另 一 个 方 法 是 蛋 白 质 组 学 , 但 是 首 先 必 须 能 够 制 得 一 些 溶 液 .
科 学 功 能 生 物 学 网 站 : http://www.sciencemag.org/feature/plus/sfg/
▲ top
::::信息 生物学 ::::
后基因组研究如基因组序列或功能分析以及基因交互识别等如果没有大量数据处理技术是无法进
展的. 因此, 一个名为信息生物学(Bioinformatics), 藉由联合高性能计算机和高效数据处理运算法则
的 新 研 究 领 域 出 现 了 .
▲ top
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
2. 追溯生 物学
何谓生 命 ?
基因和 遗传信 息
传递遗 传信息 至子代
从基因 到蛋白 质
蛋白质 合成
聚合酶 链反应 (PCR, Polymerase Chain Reaction)
定位突 变和 DNA 改组 技术
细胞凋 亡和坏 死
细胞周 期
离子浓 度
细胞亚 显微结 构
病毒
::::何谓生命 ?::::
给生命体下个定义并非易事 . 普遍认同的生命的特征是可以自我繁殖 , 有能量新陈代谢, 可与周围
环境间进行物质交换. 除此以外, 与热力学第二定律截然相反, 生命体纷繁的结构下掩藏着秩序与
协调, 因而生命必须消耗能量以抵消不断增加的熵(entropy), 从而维持热力学平衡 . 一旦生命终结,
生命体的补偿作用就会结束, 于是尸体按照自发臻于最大混乱度的自然定律重新回到大自然之中 .
从这个意义上说, 能量和熵之间的界限成了判断是否具有生命的判据.
然而特例不可避免. 由母马和公驴杂交产生的骡子和雄狮和雌虎杂交所生的狮虎都没有繁殖能力,
难道我们就漠视它们的存在, 或者说它们虽然看上去像活体, 其实不是生物体? 另外, 一些病毒或
植物种子可以在坚固的表皮中存活几百甚至千年而没有新陈代谢 . 从狭隘的生命观很难判定它们
是否具有生命. 二十世纪 70 年代英国科学家 Lovelock 在其 Gaia 理论中提出岩石, 溪流, 山峦甚至
泥土都应当被看作生命. 事实上许多人支持该理论. 这个理论认为地球有自我再生能力, 因而乐观
地认为地球可以自己解决所有人类产生的污染问题. 如果地球认为人类对其生存构成极大威胁,
大地女神就很可能通过诸如厄尔尼诺, 拉莉娜等气候异常变化和地震来根除这些麻烦制造者以维
持地球健康.
在我们现有的观测范围内我们可以发现一些看似生命却无生命的晶体违背熵原理 , 自身繁殖其特
有构型. 它们通过将周围物质转变为其自身以繁殖 . 这些晶体绝大多数是金属氧化物 , 但是也有一
些含碳的有机物自生长 . 尽管不是先决条件 , 我们可以看到的生物都具有碳架结构的含碳有机物 .
之所以是碳而不是地球上含量较丰的硅是因为碳原子之间的键较硅原子间牢固 , 更易形成稳定结
构.
与含碳的生物体相类似, 计算机病毒被称作“硅生物体”. 它们最初是由程序员编制并传染给计算
机的一些程序, 通过磁盘或网络传播, 自我复制, 甚至可以通过变异来抵抗杀毒软件 . 这与<<圣经>
>中"主造万物, 置地上而后观之. 其自复以繁衍."何其相似. 因而有人戏谑说“拂晓骇客造病毒 , 上
传至网络而观之. 其自复以繁衍." 当然这会引起众多非议 . 计算机病毒仅能在计算机上生存 , 一旦
关机或下网, 复制和传播就不可能实现. 那么生物体呢? 它们一旦脱离了地球还能生存么?
从 70 年代 Vikings 到现在 Pathfinder 号宇宙飞船在探索火星生命, 以及最近关于从火星陨石中发现
生命痕迹的争论都很容易证明对生命的定义是如何困难 . 关于生命的定义在科学和哲学上都有重
要意义, 但我之关于生命定义困难的讨论仅是为了辨析生命特征 . 生命的基本单位是细胞, 细胞的
基本成分是酯类, 蛋白和烃, 它们是由核心元素碳与氧氢氮等元素组成的 . 细菌仅有一个细胞 , 随着
物种等级的提高细胞数逐渐增多. 人类有 1000 亿细胞. 如此复杂的有机体是怎样完全相同的自我
复制的呢?
▲ top
::::基因和遗传 信息 ::::
让我们考虑一下子代的繁殖, 这是生命特征之一. 无论生命形式复杂或简单, 从细菌到多细胞生物,
所有的生物体都在基因中包含了他们自己全部的信息 . DNA 分子表达了遗传信息. 正如计算机采
用 0 和 1 的二进制作为存储单位 , DNA 采用 A, T, G, C 的四进制. 神奇之处在于几乎地球上所有的
生物体都将 DNA 作为遗传载体, 其余的采用改性 DNA. 这也就是所我们和植物和病毒在本质上并
没有显著差异.
DNA 分子是一种线形大分子, 由脱氧核糖与作为信息的四种碱基 (腺嘌呤, 鸟嘌呤, 胸腺嘧啶, 胞嘧
啶)联结. 每个含有碳水化合物和碱基的单位与磷酸基相连 . 计算机存储器可有二维或三维结构 , 但
是物种的遗传信息仅选择了一维结构 . 通过 A-T, G-C 配对, DNA 以双链形式存在. 绝大多数情况
下一条链即可储存遗传信息, 另一条链仅是作为互补链用来对遗传信息进行维护和修补. 下一个问
题就是遗传信息如何传递 . 自 Watson 和 Crick 第一次报道 DNA 结构以来, 尽管我们不完全了解每
个细节, 但是关于遗传信息用于指导蛋白质的合成已成定论 . 换句话说, 生物系统内合成的蛋白质
的种类和数量决定了生物体的所有特性, 从我们皮肤的颜色到甚至无意中流露的习惯.
DNA
<SGI, U.S. Department of Energy Human Genome Program>
非 极 性 侧 链
极 性 非 质 子 化 侧 链
极性质子化 侧链
身高和肤色等显性基本是不同遗传组合表达的结果 . 问题是遗传的蓝图 , DNA, 采用四进制而蛋白
质采用 20 进制. 为了解决这个问题大自然采用三个 DNA 密码表达一个蛋白质. 因为三位的密码可
以容纳 4×4×4 = 64 条遗传信息, 大大超过容纳 20 个氨基酸所需要的量因而一些氨基酸可以重复对
应. 因此如果可以破解一个物种的全 DNA 序列, 就可以知道其所有合成的蛋白质并从理论上预言
其所有特性. 正因此现今通过测定完整 DNA 序列来破译人类所有遗传信息的工作很活跃, 这被称
作“基因组计划”. 人类 DNA 序列估计约有 30 亿碱基对, 也就是 300,000 基因. 除了红细胞等, 所
有细胞细胞核中都含有遗传信息. 由于细胞种类不同, 用于合成蛋白质的基因估计约占所有基因的
十分之一. 换句话说, 人类细胞能合成 30,000 种蛋白质, 蛋白质种类的不同决定了不同细胞的特性 ,
如神经, 肌肉, 骨细胞等. 由于 DNA 双链的碱基长度约有 3 埃, 人类细胞整条 DNA 长度约有 1 米.
遗 传 密 码 子
<http://www.discoverbiology.com>
▲ top
::::从基因到蛋 白质 ::::
单细胞生物如细菌通过自身分裂或用芽孢来产生后代 , 在这个过程中染色体复制并传递一个给子
代细胞.所以母体和子代的遗传信息完全相同 . 多细胞生物的体细胞增殖通过有丝分裂 , 遗传信息
同样备份并一分为二. 因此, 就遗传信息传递范畴来说, 体细胞的有丝分裂和细菌的增殖在概念上
是 相 同 的 .
▲ top
::::从基因到蛋 白质 ::::
DNA 上的遗传信息是通过怎样的过程被翻译用以合成蛋白质的 ? 为了表达 DNA 上的一个基因 ,
mRNA 读取 DNA 的遗传信息; 这个过程称作转录 , 转录酶能够催化这个反应 . DNA 上的遗传信息
有内含子和外显子, 所以最初转录的 RNA 分裂以除去内含子. 成熟的 mRNA 是真正的合成蛋白质
的真正模板. RNA 与 DNA 非常类似, 但是在 RNA 的 4 种碱基中使用 U 代替 DNA 中的 T. RNA 中
的糖链 (核糖)较 DNA (脱氧核糖)在 2 位有多余的羟基. 正因这个多余的羟基使 RNA 较 DNA 活泼,
可被用作亲核试剂或酸碱. 这样, 相对较稳定的 DNA 用于信息永久存储, 较不稳定的 RNA 更多用
于合成蛋白质的临时信息存储, 合成后立即被破坏.
转 录
<www.accessexcellence.org/ AE/AEPC/NIH/gene03.html>
▲ top
::::蛋白质合成 ::::
核糖体能识别 mRNA 的信息, 这就是蛋白合成的工具. 核糖体由 2 个大 rRNA (核糖 RNA)和许多小
蛋白质构成. 有趣的是核糖体是蛋白质合成的酶, 但其主要组成却不是蛋白质而是 RNA. 蛋白质合
成需要另一种重要的 RNA, 即 tRNA (转运 RNA). tRNA 与氨基酸通过酯键形成芳氨基-tRNA, 这就
可以向增长的肽链上运输氨基酸. 每个不同氨基酸有其自己的配对 tRNA, 但有时一个氨基酸对应
多个 tRNA. tRNA 与氨基酸的键合受 芳氨基-tRNA 的催化. 核糖体在 mRNA 上滑动产生了多肽链,
每个核糖体有两个与芳氨基-tRNA 的配合位; 一个用以延长肽链一个用以新氨基酸的导入. 核糖体
对芳氨基-tRNA 的序列识别并不依赖氨基酸结构, 而是 mRNA 上密码子和 tRNA 上反密码子间的
互补作用. 这意味着如果采用非自然的氨基酸来化学修饰芳氨基-tRNA 将会产生化学突变.
蛋 白 质 合 成
<http://fairmanstudios.com/als.htm>
▲ top
:::: 聚合酶 链反应 (PCR, Polymerase Chain Reaction)::::
由 Michael Smith 和 Kary Mullis 在 80 年代中期发明的 PCR 技术给生物学和医学带来了一场革命 ,
荣获了 1993 年的诺贝尔化学奖 . PCR 可以在短时间内倍增极微量 DNA (理论上说, 仅有一个足够
了 ) 至 百 万 或 十 亿 倍 , 而 共 作 原 理 却 惊 人 简 单 . 这 是 步 骤 :
这一序列含有高温步骤, 可能会使酶变性. 所以, 自温泉中嗜热细菌体内提取的耐高温的 DNA 聚合
酶是 PCR 的重要部分. 每一个操作循环可以倍增 DNA 数量, 如果有足够的引物和建筑材料, DNA
将成几何级数增长(2#循环数). 仅需几个小时就可足够产生几十亿倍增量 . 由于灵敏度极高, 有时会因
极少量杂质 DNA 的倍增而产生错误结果, 因而必须高度精确操作样品. 一些普通方法耗时且难于
分析的细菌, 可以通过 PCR 技术短时间内鉴别 . 一滴血液或体液甚至一根头发足以被用来鉴别个
体, 因而 PCR 技术在法医学上广泛应用. 在后文中提到的 RNA 催化剂以及分子进化研究都在关键
部分采用了 PCR 技术.
▲ top
::::定位突变和 DNA 改组技 术 ::::
DNA 序列的改变称为突变, 这将导致相关蛋白质的序列变化 . DNA 上特定核苷的取代技术称作基
因定位突变法 (site directed mutagenesis). 通过病酶动物将突变的基因导入微生物体内即可产生非
天然蛋白. 这种方法在研究蛋白质中特定氨基酸的功能上极为有价值.
基 因 定 位 突 变 法
<Nobel e-Museum>
与定位突变不同, 在 PCR 中增加 Mg2+离子可产生随机点突变; 高盐度降低了 DNA 聚合酶的再现精
度. 突变频率可由离子浓度控制. 这种方法称作"易错 PCR".
将突变基因重组在加速产生多样性方面较定位突变效率更高 . 这种方法称作 DNA 改组技术
(shuffling).
DNA 改 组 技 术
▲ top
::::细胞周期 ::::
如果拥有充足养料和适宜环境, 细菌将分裂生殖. 在包括人类在内的多细胞生物中 , 细胞增殖被高
度控制以保持总体平衡. 当高度调控不起作用时, 细胞将变成无限分裂的癌细胞.
在细胞增殖过程中 DNA 复制和细胞分裂有固定规则可循 ; 例如遗传信息均分到两个子代细胞时 ,
DNA 合成必须早于染色体分裂, 等等. 细胞增殖的整个过程称作细胞周期, 分成 4 步: G1, S, G2, M.
细 胞 周 期
▲ top
::::离子浓度 ::::
从拓扑学角度说, 我们的身体可以分为体内和体表空间. 例如皮肤和消化道表皮都是体表; 正如炸
面包圈一样. 穿透皮肤或胃粘膜就到达体内 . 每个细胞个体都是独立的封闭系统 . 所以细胞也被细
胞膜分成截然不同的内外环境. 通常细胞内 K+浓度高, 细胞外 Na+和 Cl-浓度高. 相对高浓度的单价
离子对保持渗透压和膜两侧势能有很重要的作用 . 二价离子如 Ca2+和 Mg2+在细胞外大量存在, 可以
调节酶的活性. 尤其是被称作第二信使的 Ca2+, 特定信号可以引起其从细胞外, 或细胞内贮 Ca2+细
胞器, 到细胞质的转移. 典型离子浓度总结于下表.
离子 细胞内 (mM) 细胞外 (mM)
Na+ ~10 145
K+ 140 5
Mg2+ 0.5 ~1.5
Ca2+ 0.0001 ~1.5
H+ 0.00008 0.00004
Cl- ~10 110
▲ top
::::细胞亚显微 结构 ::::
在真核细胞中, 细胞核周围有很多不同的袋子. 让我们看看下图.
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
回到首页
3. 化学生 物学
基因表 达
化学生 物学
正向法 化学生 物学
逆向法 化学生 物学
通过蛋 白质的 研究
::::基因 表达 ::::
药物处理前的肌肉细胞 肌基质蛋白处理后的肌肉细胞
3. 检查化合物相连的目标蛋白质 : 虽然发现能够诱导需要的现象的化合物是最重要的前步骤 , 对与
化合物反应的目标蛋白质的细致检查然后理解其活性和角色才是真正的辛苦工作 . 如果需要的现
象 定 义 得 好 , 是 否 存 在 活 性 化 合 物 的 研 究 结 果 可 以 在 短 时 间 内 显 示 .
在肌基质蛋白的例子中, 当细胞结构迅速改变时, 预计细胞结构的构建蛋白质受到进攻 , 可以使用
带有荧光标记的抗体观察细胞图像 . 然后是染色的肌球蛋白, 它是体细胞的重要组成部分. 绿色的
是肌球蛋白, 蓝色的是核.
药物处理前的肌细胞 肌基质蛋白处理后的肌细胞
肌基质蛋白处理前后的差异是显而易见的. 在肌基质蛋白处理之前, 细胞被统一连接, 但是处理后,
可以看到细胞相互分离. 然而, 是否肌球蛋白是目标蛋白质还不能确定 . 一些骨骼蛋白质是染色了
的但是结果是相似的. 可是, 当使用微管蛋白使微管染色的时候, 却得到了有趣的数据. 同样, 绿色
是微管蛋白, 蓝色是核.
药物处理前的肌细胞 肌基质蛋白处理后的肌细胞
在被肌基质蛋白处理之前, 与先前的照片类似, 细胞与微管紧密相连, 但是以肌基质蛋白处理过的
细胞表现出破裂的微管. 因此, 一般猜测肌基质蛋白直接的或间接的攻击微管蛋白或微管 . 微管是
个管形结构, 含有 a, b 微管蛋白组合, 它参与了支持细胞结构和染色体运动.
微 管 蛋 白 (Tubulin) 和 微 管 (Microtubule)
<McGill Medical informatics>
微管蛋白有 GTP 连接位点, 也是制造微管过程中 GTP 水解制得 GDP 的 GTP 酶. 微管含有增长+末
端和消除 - 末端 . 在细胞分裂中 , 染色体转移需要良好控制的微管的形成和破坏 . 天然物质 (vinca
alkaloids, cholchicine), 破坏微管或阻止微管蛋白的合成, 干扰正常细胞的分裂. Cholchicine 是被用
于无核西瓜的物质. 从另一方面来说, 紫杉酚(taxol)过度稳定微管并阻止其动力学变化, 也因其停止
正常细胞的分裂而被用于抗癌药 . 为使微管正常工作, 微管联合蛋白(MAP)也非常重要. 所以, 还不
清楚肌基质蛋白直接在微管蛋白还是其它 MAP 上发生功能 . 为了检验这一点 , 从 Cytoskeleton 中
提取了纯净的微管蛋白, 它在特种溶剂中制造微管. 当微管被插入时, 管形结构明显消失. 所以, 这
证实了肌基质蛋白直接在微管蛋白或微管上发生作用.
药物处理前的微管 肌基质蛋白处理后的微管
根据以前的经验 已证明微管蛋白在体外被肌基质蛋白进攻 , 但是在体内怎么样呢? 为了寻找具有
,
生物活性的分子与之成键的蛋白质, 普通大小的固相树脂被用于活性分子的亲和力矩阵, 然后蛋白
质被钓出. 肌基质蛋白上被加以连接分子, 然后与固相树脂相连做成钓索. 然后浸入细胞质混合物
一段时间, 蛋白质与树脂相连并被分析 . 然而, 由于肌基质蛋白的活性和蛋白质合成现在被中止 , 这
项工作不容易. 这是化学生物学方法中众所周知的问题.
修饰了亲和性的肌基质蛋白分子
:::::逆向 法化学 生物学 ::::
在逆向法中, 目标蛋白质受到化学物质进攻 , 首先被分类, 然后可以通过观察插入相关化学物时的
结果作用来分析目标蛋白质的体外功能 . 这里有一个这种方法的实例 : purvalanol 的发展和应用 .
Chem. Biol. 1999, 6, 361-375.
细胞周期和 CDK
2. CDK 抑制剂的发展: 以正向法制得的嘌呤文库被用于在纯净的 CDK1 和 CDK2 上筛选酶抑制剂.
之所以使用嘌呤是为了让嘌呤类物质通过辅酶与 ATP 竞争结合位点. 为了加速筛选过程, 通过使用
放射性标记的 ATP 和组蛋白在 96 圆片上使酶活化, 然后测量磷酸基自用硝基纤维素滤纸过滤出的
蛋白质转移到组蛋白这过程中的所有的放射性 . 由 olomocine 起始, 선도물질 (IC50 7mM), 几步重
复之后我们得到约 1000 倍活化的 purvalanol 系列化合物 . 这些化合物同等程度抑制 CDK1 和
CDK2. 这是因为两种酶都是通过非常相似的路线建立起来的, 它们的 ATP 结合位点也相似.
3. Purvalanol 在有丝分裂中的作用: 如果 CDK1 和 2 被抑制, 将有什么发生呢?由于众所周知的事实,
这些酶在有丝分裂的每一步都扮演了重要角色 , 研究的第一步就是观察对易于观测有丝分裂的青
蛙卵提取物的作用. 在这个实验中, 注入激素以诱发更多排卵 , 从卵中提取出必要的物质 . 当植入从
青蛙精子提取的 DNA 时, 卵细胞误识其为受精, 并模仿细胞分裂. 通过控制中期(metaphase)Ca 的
数量可以中止细胞分裂. 卵细胞对这个实验非常有用 , 因为它们含有大量的蛋白质. 为了使图片清
晰, 核 DNA 染成蓝色而微管蛋白染成红色. 在正常阶段, DNA 折叠以形成染色体并排成一行. 然后
微管连到其上将其分到两边 . 但是, 如果在这个阶段加入 purvalanol, DNA 不会完全折叠, 微管就找
不到它们的连接位点. 这应该是进攻了 G2 到 M 的步骤. 可以说, 对 CDK1 的抑制强于 CDK2. 另外,
如果肌基质蛋白同时被加入 , DNA 一点也不折叠, 而且微管结构完全消失 . 这可能是 G2 阶段后紧
随的 M 阶段的微管受到进攻.
C-Matrix P-Matrix
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
4. 文库
文库初 窥
文库的 定义
文库和 药物工 业
只有肽 吗 ?
文库策 略
::::文库初窥 ::::
到公元 2015 年, 人类基因组计划将在 21 世纪初完成,将引发一场生物学的革命 . 几乎所有人类基因
的功能和表达都已被报道, 有多种基因可以导致遗传疾病. 据 SNP 的研究, 每个个体基因的差异都
被存储起来. 这样个体组成的分析将仅通过简单检测一绺头发而实现 . 比如, 你的内科医生说 , "由
于你有 C 型胰腺基因, 从遗传上分析你的胰腺很弱, 你非常可能在 40 岁时患上糖尿病." 根据在线
数据, A 型胰腺是正常的, B 型胰腺约占突变总数的 30%. 对 B 型的治疗大约自 5 年前开始. C 型是
仅占总人口 0.1% 的罕见变异 , 由于刚刚发现 , 现在还无药可救 . 于是一个人致电制造药物的
pharmarnomix 公司, 定购恰当的新药. Pharmarnomix 的科学家有 C 型胰腺的蛋白表达和晶体结构,
于是查找哪种化合物可以通过分子模型仿真恢复 C 型蛋白受损的功能. 他们选择了几百万种前导
分子, 用计算机设计合成路线, 通过自动合成仪合成. 经过高通量筛选, 选出最好的 10 种, 在临床实
验 后 , 与 你 的 病 最 对 症 的 药 物 最 终 送 到 你 的 门 上 .
尽管历史很短, 现在文库技术已被应用于自生物活性分子到材料科学中寻找超导体的广阔领域, 并
且还在扩大. 随着很多领域开始使用文库方法, 文库的基本概念也在变化甚至有时被赋予了错误含
义. 90 年代初次登场时就被化学界广为关注 , 现在对整个科学界大为影响, 成为 21 世纪后基因组时
代的先锋概念并有成长为范例之势, 文库 , 到底是什么?
▲ top
::::文库的定义 ::::
文库可被定义为所有可能 组合的集 合 或者关于集合 的研究 . 在组合的概念上可以说文库就是组
合化 学 . 组合化学的含义甚广, 但我们仅取其与本章一致的含义. 文库最初的含义是储存文献和艺
术资料以供阅读 , 参考 , 借阅等活动的地方 . 现在很多国家虽在使用这个词却与其本意不同 .
= 12,356,630 个词
我们称这个集合为文库 . 在韦氏英语词典中, 有大约 300,000 词汇, 我们可以发现 1200 万的文库早
已超过了实际使用的英语词汇数 . 然而, 从以上步骤可以看出无论说英语与否 , 每个人都可以编一
本包含全部组合的新英语词典. 当然会有许多诸如 QQQQQ 这样可笑的垃圾词汇, 但是它仍然包含
了全部有用的词汇 . 我们称之为文库词典 . 从没有出现过的词也可以在这本词典中找到 . 多于 5 个
字母的怎么办呢? 很简单. 假设最长的单词含有 40 个字母. 你只需要编一本 40 个字母组合的词典!
26 + 262 + .... + 2639 + 2640…并继续. 你可以肯定的说你编了一本含有全部可能词汇的词典 . 词汇
总量可以通过增加限制而大为缩减 , 比如没有 4 个以上连续相同字母的词. 但这仍然含有很多从没
用 过 的 垃 圾 词 汇 .
现在让我们试着编一本实用的词典. 如果有一些有用的词丢失了怎么办? 没关
系. 可以首先编一本词典 , 然后逐个检查滤出无用词汇 . 有很多检查方法 . 比如
对 100 个英文为母语的人作调查 . 最终的词典可能因他们的种族 , 国籍, 年龄的
不同而有所不同. 英国人和美国人做出来的词典将差异很大 . 我们也可以使用
网络资源或者总结不同的词典 . 经过筛选之后的最终版可能有所不同 , 但至少
可以说没有任何词汇需要添加到最初的词典中 . 精确的说, 如果把全组合库中
的词汇置于特定规则之下 , 至少每个词都有机会通过筛选进入新词典中 . 正如
这个简单的例子一样, 在文库制备和筛选过程中可以应用许多不同的修正方法 .
文库方法的基本概念就是短时间内制造出包含大量候选物的文库并筛选需要
的 部 分 .
▲ top
::::文库和药物 工业 ::::
文库是怎样被实际应用的? 药物工业是文库使用最活跃的领域 , 是一个很好的例子. 自第一个抗生
素青霉素于 1928 年发现以来, 很多药物公司使用从世界各地采集的动植物及土壤来发展新的抗生
素. 几个大的药物公司拥有几百万种样品 . 一旦发现一个新的细菌, 他们即对样品实验并选出未感
染者, 然后从这些样品中寻找新的抗生素. 仅有大的药物公司拥有如此财力人力和精力做这样的实
验. 但是是否这些样品可以检测全部新的细菌 ? 几百万的样品库是否就包含了全部的可能 ? 答案是
“ 绝 不 是 .” 之 所 以 说 样 品 库 不 能 令 人 满 意 , 不 是 由 于 数 量 不 足 , 而 是 覆 盖 面 不 够 广 .
( 青 霉 素 , http://www.latesting.com/body_photo_gallery.html)
<http://www.soton.ac.uk/~chemweb/research/profiles/organic/kilburn/kilburn5.htm>
传统方法是药物化学家一次合成一个化合物然后检验其生物活性 . 据说一个突出的化学家可以每
年合成 50~100 种化合物, 每个耗资 7,500 美元. 与之相比, 如果采用文库技术, 每个月合成上千种化
合物而每个仅耗资 10 美元. 为新药寻找目标细菌或蛋白质曾经是非常慢的工作, 但是自更多采用
了青霉素等抗生素之后, 细菌的抗药性不断频繁且迅速产生, 甚至有预言现在的药物发展速度赶不
上新细菌的产生速度, 人类终将灭亡.
▲ top
::::只有肽吗 ?::::
尽管上面应用的主要是肽, 任何结构单元都可以构建文库, 正如我们可以用希腊字母表代替英文字
母表. 事实上, 早期主要尝试的是核酸文库 , 如 DNA 和 RNA 库. 除了使用 A, C, G, T (或 U)的四字
母表, 其他都与肽文库一样. 如果合成一个 5 元碱基的简单核酸, 其文库有 45 = 1024 种组合. 肽及核
酸都是一维高分子. 例如, A 之后是 C 然后是 G…如此继续. 这样的文库将可能有重复排列的数量.
A-B-B-C-A-D-D-D
如果不是线形而是环形结构呢? 组合数不同所以会产生新型的文库. 糖类较氨基酸或核酸也可以使
用, 合成分子较天然产物也可以使用 . 无需必是线形或环形结构 , 也无需是有机物. 金属氧化物或者
聚合物是否也可以呢? 所以说, 文库的参与单元是没有限制的.
▲ top
::::文库策略 ::::
基本上文库的应用过程是这样的: (1) 选择目标. (2) 定义目标分子的特性. (3) 设计筛选目标分子的
方法. (4) 合成文库. (5) 筛选出前导化合物. (6) 合成前导化合物相似结构的次级文库并再次筛选较
前导化合物性能更好的分子. 重复步骤 (4) 及 (5) 决定最优活性化合物.
选 择 目 标
↓
定 义 目 标 分 子 的 特 性
↓
设 计 筛 选 方 法
↓
合 成 文 库
↓
筛 选
↓
最终活性分子
选择目标分 子
尽管文库应用于快速生产大量化合物, 产物本身并不是最终目标. 如果文库的基本目标是发现新的
特性分子, 我们需要决定找寻什么类型的特性 . 既然药物工业是文库使用最多的领域 ,我们就讨论
新药的开发吧. 我们要尝试什么类型的药? 揭开新纪元的抗癌药物? 或者 20 世纪的杀手, 爱滋病?
有许多疾病可以做文库的目标 . 考虑研究费用是否充足 ,当然还有销售潜力也应该被考虑 , 我们可
能需要读各种不同经济的和医学杂志还有那些惊人的好主意 . 由此产生一个最终目标例如治疗谢
顶 或 汽 油 替 代 品 . 尝 试 无 害 , 我 们 就 说 想 要 发 现 治 疗 爱 滋 病 的 药 吧 .
设计筛选方 法
一旦确定目标分子的某一特性 , 就应设计恰当的筛选方法 . 如果目标分子的特性是对病毒有毒性 ,
就可以培养病毒然后筛选对病毒致命的分子. 因为绝大多数病毒只生长在宿主细胞体内, 必须确认
化合物仅杀死病毒而不影响细胞. 为检查其是否杀死被感染的细胞, 需要测试正常细胞以作为对照
组. 如果要寻找一个增强免疫活性的分子, 就应当采用一个不同的筛选方法. 可以将待测分子注射,
如果可能, 入实验动物或人体内并检查相关的免疫细胞数量是否增加, 或检查免疫细胞的体外活性
甚至仅是检查免疫细胞的活动 , 也可以仅仅使用显微镜数增加细胞的数目 , 或者通过将细胞活动
的生化变化转变为颜色变化而后用分光光度法检测. 即使决定了目标分子的特性, 也可以由各种不
同的感知其特性的筛选方法备选 . 在这一点上, 可能需要相关领域专家的意见. 上述程序与通常的
医 学 化 学 研 究 程 序 相 同 . 让 我 们 看 看 下 一 步 文 库 技 术 是 如 何 应 用 的 .
文库合成
如果筛选方法也确定了 ,下个步骤就是文库合成 , 这与通常的有机合成方法有根本的不同 . 普通合
成化学经过设计,合成和分析等几步 : (1) 首先, 根据待合成的目标分子用反合成分析法设计高效
的合成路线. 由于分子的体积和复杂性全合成可有几十条路线 , 路线是否高效决定了成功与失败 .
如果起始反应物买不到, 通常的办法是在实验室里经过几个步骤合成 . (设计) (2) 根据设计合成目
标分子. 一般的目标分子仅有几个化合物 . 有时需要几十个, 一般只有大工业才可以 . 通常大多数反
应是在溶剂中进行的. (合成) (3) 合成中每一步的副反应产物通过重结晶 , 萃取, 气相色谱等方法去
除, 产物的结构和纯度通过元素分析 , NMR, 质谱, 或红外紫外光谱等技术分析. (分析) 文库合成过
程类似, 包含设计, 生产和查证等步骤.
文库设计
虽未提及, 在普通方法中已经决定了文库的设计 . 换言之, 有关合成目标的信息已经在设计步骤中
给出了. 这样的活性分子是新药的候选物 , 称作前导化合物. 很多时候如青霉素等 , 前导化合物是从
天然产物中发现的, 也有时可在合成另一个目标的过程中偶然被发现 . 抗生素, 重氮化合物的发现
都曾是在合成染料的时候发现的 , 这是非常好的例证 . 此外, 谷氨酸和多种激素也是前导化合物 , 它
们是生化学家研究神经传递素和激素时发现的. 由于前导化合物可以简化合适分子的修正过程, 它
的存在对通常的研究是必需的. 当对目标物没有任何线索的时候寻找前导化合物显得尤为重要. 大
型药物公司耗费大量时间和精力收集各地土壤等天然物就是为了寻找前导化合物.
文库查证
确认正确合成了化合物是必要的 . 通常文库合成一直进行到最终步骤而不除去副产物或确认反应
终结. 所以, 提出和查证终产物是必须的, 这是文库合成的最大弱点. 多数步骤可以同时平行进行,
但是这最后的一步在大多数时候仍需一个一个链式处理得到的产物. 换言之, 提纯和分析通常需要
大量时间和精力. 文库产物分析中也如普通方法那样经常使用 NMR, 但是色谱技术如 HPLC/GC 更
多用于提纯而 质谱用于检验物质结构. 已经做过很多改进和自动化这一步的尝试.
筛选
一旦文库化合物被合成, 就可以使用已设计的筛选方法选择活性分子 . 由于化合物量非常大, 所以
高通量筛选是必需的 . 最终, 第一个前导化合物被发现了 . 如果前导化合物在初期已经发现了 , 这一
步即可省略. 前导化合物一经发现, 下个步骤就是合成与前导化合物结构相似但略有差别的次级文
库. 在这一步与前导化合物的相似性比多样性更重要. 从次级文库中筛选较前导化合物活性更高的
分子是个重复过程 . 关于哪个结构起重要作用的信息是在这一过程中发现的 , 这叫做构效关系
(SAR). 这些重复的文库合成和筛选过程叫做最优化,这与抗体的突变非常相似.
最 终 候 选 物
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
5. 免疫系 统及抗 体
自然课
免疫学
免疫学 历史概 要
催化抗 体
::::自然课 ::::
是谁最早开始使用文库的? 是大自然. 没有人知道是什么时候和怎样开始的. 但是, 在人类心智开启
甚至在人类种族出现之前, 大自然已经开始使用文库合成, 那是在进化过程中.
<http://www.sdix.com/tsd/, http://www.accessexcellence.org/AB/GG/Antibody.html>
为解决这个问题, 活的生物体使用文库方法. 在整个抗体结构中, 与各种抗原结合的位点是最重要
的. 结合位点至少包含 5 段随机肽链其中有重链和轻链 . 它们并不是仅由一个基因编码的 . 如果有
10 个片断, 总组合就是 100,000, 于是这个方法就能够形成多样的结构 . 免疫系统实际上仅使用数
百基因即可建立数十亿抗体来对抗外部物质.
抗 体 攻 击
(http://www.gcarlson.com/method_atc.htm, www.biotech.ufl.edu/~hcl/ antibody_apps.htm)
让我们讨论一下文库方法是如何用于抗体合成的. 抗体是一种称为 免疫球蛋白(Ig)的蛋白质, 被分
为 G,A,M, E, D 等几类. 最典型的抗体是 IgG, 有 Y 型三维结构, 包含两套重链和轻链, 质量约是
150kD. 抗原结合片断(Fab), 也即识别抗原的位置 , 在抗体的末端, 桥型部分称作晶化片断(Fc). 抗原
结合位含 108 个氨基酸, 有三个片断 , 称作 V 区(可变区), D 区(差异区)和 J 区(连接区). 换句话说,
它 是 各 种 不 同 的 V-D-J 组 合 , 一 个 是 V 区 变 化 (V1 ,V2,V3...V250), 一 个 是 D 区 变 化
(D1,D2,D3...D15), 一个是 J 区变化(J1,J2,J3...J5). 因此, 总组合的个数是 250 x 15 x 5 = 18,750, 但这
只适用于重链. 轻链有 V-J 组合但没有 D 区, 这样就是 250(V) x 4(J) = 1,000 种选择. 所以总的重链
和轻链个数是 18,750 x 1,000 = 18,750,000. 另外, 因为 D-J 和 V-J 之间相连的桥不匹配所导致的选
择拼接可以产生额外的多样性, 约为三倍. 这与文库生产有关.
产 生 抗 体
<http://nongae.gsnu.ac.kr/~sykim/body239.jpg>
根据 V-D-K 遗传信息按照这种组合产生的抗体称为胚系抗体(Germline Antibody). 尽管很多种不同
的抗原入侵, 但仅有几种抗体抗原结合相对紧密. 但是, 18,750,000 x 3 (考虑选择拼接)并不是所有
可能的组合. 还有更多呢! 由于结合位点含有 108 个氨基酸, 每个又可能是 20 种氨基酸中的一种,
理 论 上 说 可 产 生 20108 种 抗 体 .
<http://www.biology.arizona.edu/immunology/tutorials/immunology/09t.html>
体 细 胞 突 变
<http://www.srl.cam.ac.uk/tcrg/stem.html>
▲ top
::::免疫学 ::::
既然已经解释了抗体 , 让我们再谈谈免疫学的一些重要的概念 . "免疫学"起源于拉丁文 "immune",
意为"安全". 当一个活的生物被外部物质攻击的时候, 防御功能立刻反应以抵
抗. 免疫反应是防御功能之一. 第一道防线有皮肤, 胃(胃酸: pH2), 黏膜, 泪液,
唾液(溶菌酶, IgA)等可以抵御病毒 , 细菌和霉. 当第一道防御线被穿越 , 下一
道就是免疫反应 , 有先天免疫和后天免疫之分 . 补体, 巨噬细胞, 溶解酵素, 和
干扰素通过非特异性反应参与先天免疫 . 所以, 溶解酵素和干扰素被称作天
然抗体. 后天免疫是一种细胞防卫, 能够识别几种特定的对身体有害的外部物质 . 这种能识别多种
抗原的强大反应, 得益于三种类型的细胞表面感受器的进化 . 每一类都有很多, 分别是 T 细胞, 抗体
和 MHC 分子. 考虑到它们的蛋白质结构类似, 有人推测他们起源于相同的基因. 由于难以判断一种
外部刺激物是否有害, 我们的身体总是假定未知物为有害的入侵者 . 如果免疫反应成功, 身体复原
并产生特定记忆, 引起后天免疫, 所以它下次能处理相同的物质. 然而, 免疫反应并非总是好事. 极
端免疫反应能引起自身免疫性, 移植物对抗宿主疾病和过敏. 因此, 在自身免疫, 过敏症和移植手术
时必须抑制免疫反应. 尤其是如果一个器官接受者在手术之前已输入了器官捐赠人的血, 移植将引
起敏锐的排斥反应, 因为接受者已被免疫. 作为比照, 家鼠有非常强的免疫系统而叙利亚仓鼠一点
也没有移植排斥反应. 人类与鼠类器官构造几乎相同. 人类的四大杀手是外伤, 传染病, 癌症, 衰老
疾病, 都与免疫反应有关.
抵抗抗原
T, B 细胞, 巨噬细胞(在血液中称为单核细胞), 树突状细胞, Langerhans 细胞, 肥大细胞, 和粒细胞都
是免疫细胞. 在 T 淋巴细胞中有辅助性 T 细胞(包含 CD4 并与 MHC II 成键)和杀伤性 T 细胞(包含
CD8 并与 MHC I 成键), 而 B 细胞与抗原成键并表达抗体. 免疫反应可分为通过抗体的体液免疫和
通过杀伤性 T 细胞的细胞中介免疫 . 主要识别系统是 T 淋巴细胞 B 淋巴细胞和免疫系统中的
MHC, 而且一般据推测 T 细胞免疫发生在第一次产生抗体前 . 在产生 T 细胞受体和抗体的 B 细胞
中, DNA 重组并增加了多样性 . 重组过程包括 DNA 限制, 通过 mRNA 步骤中的附加限制在众多可
能 性 中 仅 产 生 一 个 受 体 或 抗 体 .
免 疫 学 参 考 资 料
Playfair, J. H. L., Immunology at a Glance, 5th ed.(1992)
Travers, J., Immunobiology, 2nd ed. (1996)
Roitt, I. Essential Immunology, 7th ed. (1991)
Kimball, J. W. Introduction to Immunology, 3rd ed. (1990)
▲ top
::::免疫学历史 概要 ::::
1798: Jenner 尝 试 接 种 法 从 而 开 启 了 遗 传 学 的 大 门
1881-1885: Pasteur 制 出 抵 御 霍 乱 , 炭 疽 病 , 狂 犬 病 的 疫 苗
1882: Mechnikov 发 现 了 巨 噬 细 胞 的 噬 菌 性
1890: Behring 尝 试 使 用 被 动 免 疫 疗 法 治 疗 破 伤 风
1906: Pirquet 发 现 了 过 敏 症
1910: Dale 发 现 了 组 胺 并 建 立 了 抗 组 胺 剂 工 业
1922: Fleming 发 现 了 溶 菌 酶 和 青 霉 素
1944: Medawar 尝 试 皮 肤 移 植 ( 但 排 斥 反 应 剧 烈 )
1959: Gowans 发 现 了 淋 巴 循 环
1960: 淋 巴 细 胞 修 饰
1961: 发 现 了 免 疫 反 应 和 甲 状 腺 之 间 的 关 系
1966: 发 现 了 T-B 细 胞 关 联 反 应
1971: 发 现 了 T 细 胞 抑 制 效 应
1974: Jerne 推 断 出 免 疫 控 制 的 整 套 理 论 构 架
1980: 官 方 宣 布 天 花 灭 绝 , 但 是 …
1981: 天 花 绝 了 , 爱 滋 来 了
1984: 发 现 T 细 胞 受 体 结 构
1987: 发 现 I 型 MHC 结 构
▲ top
::::催化抗体 ::::
发展高效和选择性的催化抗体对整个化学反应是非常重要的 . 在自然界最杰出的生物催化剂是酶,
酶被于多种化学反应. 然而,酶基本上仅在生物条件下工作而且仅限于生物有关的反应 . 因此, 作
为超越生物催化限制的方法, Schultz 和 Lerner 在 1986 年用设计人造抗体的方法发展了催化抗体技
术, 能够催化一些反应. 催化抗体可用于多种化学反应类型如水解 , 周环反应, 异构化和氧化还原反
应等.
如果通过降低活化能使过渡态更稳定, 包含起始物过渡态的反应的速率将大大提高. 这个假说和推
论自 60 年代即被提出, 但向活体生物中注射不稳定过渡态的抗原以引发产生抗体看起来几乎是不
可能的. 然而, 通过设计化学稳定的过渡态的类似物(它们有相似的结构和电荷分配), 催化抗体成为
一个非常强大和有价值的武器.
<http://www.scripps.edu/research/skaggs97/>
酶为何如此特别? 上述的解释可能过于集中在稳定反应物过渡态上. 反应物于过渡态的自由能之差
非常重要. 怎样能减少它? 因为底物和酶的极性相差不大, 发现酶过渡态较底物过渡态的亲合力高
十亿倍是很怪异的. 如果有隐藏的线索, 那一定是转化为过渡态之前的底物与较易诱导其转变的周
围环境的组合 . 如此的环境结构然后提供模子给반응참여기 的化学反应组合而且固定了水分子 .
与之相对照, 如果相同的反应发生在溶剂中, 溶剂的组合将会打断它与过渡态间的转变.
▲ top
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
6. 生物文 库
<http://www.hhmi.org>
高等动物的蛋白质被蛋白质合成后的磷化作用或糖加成修饰的功能称为翻译修饰翻译修饰. 但是
细菌作为一种原核生物 没有这种功能 , 因而合成了一个蛋白质后要么它由于溶解度低而沉淀 , 要
么失活. 因此, 酿酒酵母, 一种真核细胞就被利用. 尽管酿酒酵母如细菌一般是单细胞, 它有翻译修
饰功能并且能够使合成的蛋白质与原始的极为相似.
酵 母
<news.bbc.co.uk/hi/english/health/ newsid_761000/761884.stm>
与病毒不同, 由于它有微米大小的细胞所以可以使用 FACS(萤光活性细胞分类 )技术. 文库中的蛋
白质在细胞表面表达, 然后经过 FACS 机的细管, 这样萤光标记的目标分子就被加到其上. FACS 根
据萤光颜色和活性强度分类每个细胞 . 分类不同颜色的目标分子并分类不同活性和选择性的细胞
是可能的. 另外的优点是液相筛选 , 它不必分离紧密附着的分子 . 分类后的细胞再一次繁殖 , 然后再
筛选.
::::淘洗 (Biopanning)::::
下面是一个合成的微生物文库的实例. 它的目的是寻找一种能够跟特定分子紧密连接的酶.
<http://www.hort.purdue.edu/CFPESP/Hasegawa/ha00002.htm>
首先,目标分子平均地被置于检光板上. 制备了的微生物文库被加到板上. 只有与目标分子紧密结
合的微生物能够存留 , 其余的都到了溶液中 . 一段时间后, 除去没有结合的微生物 , 然后以恰当的溶
液洗涤弱结合或偶然结合的微生物. 目标分子结合的紧密程度决定了洗涤过程. 仍然存留的微生物
可通过加入低 pH 或高浓度的目标分子而分离 , 通过繁殖增加数量 . 有时结合程度太强时分离它们
而不致死细菌是困难的 . 如果它是噬菌体, 而不是分离, 那就可以直接感染宿主细胞 . 由于存在偶然
未考虑的微生物种类 , 第一次增殖的微生物直接进行重复筛选-增殖的过程以增加含有活性蛋白
质的克隆体数量. 最后在低浓度下培养后, 每个克隆体得以分离 . 通常选出几十个克隆体用于 DNA
序列分析. 如果从 DNA 信息得到的肽结构是可识别的而且大多数克隆体表现出相同的肽序列 , 那
就意味着成功了. 然而, 因为蛋白质可能对多种克隆体表现出毒性而且 DNA 表达率能改变, 总是
有一种可能性存在, 即克隆体增殖速度和表达效果均好于期望的筛选结果 . 因此, 通过测量肽合成
及 键 强 度 的 证 实 步 骤 是 必 需 的 .
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
7. 化学文 库
文库合 成
液相反 应及固 相反应
文库合 成的历 史及发 展
固相载 体
连接分 子
编码及 解码
文库的 前景
文库领 域的论 文 , 杂志 及书籍
如果我们不能从天然产物中找到多样性的来源, 我们就只能人工合成化合物文库. 尽管早期药物是
从天然产物或者经修饰的天然产物中得来, 近期药物都是从合成化合物发展而来. 为了易于穿过细
胞膜或进入生物体内, 药物或生物活性分子不能过于亲水或亲油. 据报道, 如果一个分子的分子量
低于 500, 氢键受体少于 10 个, 氢键给体少于 5 个, 而且 clogP 值小于 5, 那就被称为类药物分子. 考
虑到上述文献, 我们设计并合成所要求的分子.
::::文库合成 ::::
从根本上来说的, 文库化合物的合成方法不同于一般的有机合成 . 根本差异在于化合物的数
量. 通常在有机合成中, 首先选择一个合成目标然后通过反合成分析寻找最优的合成路线. 依
据目标化合物的大小和复杂程度 , 整个合成方案可能经过很多合成步骤, 所以高效的合成路
线称为合成目标化合物的最重要因素 . 然而当同时合成很多化合物的时候 , 试剂能否获得比
发展一条高效的合成路线更为重要 . 为防止试剂买不到, 额外的合成步骤是必需 , 这又需要选
择一条高效的合成路线. 较之传统合成方法允许逐步提纯 , 文库方式要么得到无法分离的混
合物, 要么得到纯净的化合物. 有三种制得化合物的方法, 分别是混合和成, 平行合成和组合
合 成 .
混合和成
通过使用过量试剂使文库化合物以混合物形式存在 . 现有方法是: (1)随机引入多种官能团到
具有多个活性位置的结构上 , (2)使用这个结构自身进行组合 . 尽管这种方法可以合成大量的
化合物, 它也有一些缺点, 一是混合物的纯度及其相对数量的分析 , 另一个是通过筛选检验识
别生物活性的化合物, 这需要附加工作. 而且即使这个方法有同时筛选大量化合物并且减少筛选步
骤的优点, 在处理筛选数据结果的时候仍然要小心 , 因为每化合物的浓度在这个步骤之后会降低 .
通常, 为获得高质量的文库化合物, 混合物中每个化合物的浓度相同是合理的条件 . 为保持这个浓
度, 加入等量的试剂而且在反应期间保持恰当的温度是必需的. 这个方法可被用于液相反应或固相
反 应 .
AB1 A2B1
AB2
AB3
平行合成
平行合成类似一般的有机合成, 每个反应在分别的反应条件下实现 . 简单来说, 它的不同之处在于
许多反应可在许多反应器中同时进行的观点. 为了能够处理许多反应, 必须每个反应的处理步骤很
容易, 因此更为倾向采用固相反应方法 . 对我们来说, 另一个选择是昂贵的自动合成仪 . 如果不用树
脂作固相载体, 也可以使用通过半导体芯片的照相平版合成的芯片形式的载体.
各 种 自 动 仪 器
组合合成
组合合成仅能用于固相反应. 混合-裂分作为一种通用方法, 与基本的固相载体"单珠单化合物"相联
系. 例如, 如果我们尝试利用单体 A, B 和 C 合成所有可能的低聚物, 全部可能的化合物总数为 27 (3
x 3 x 3). 所有可能的固相载体的数量必将远大于 27 所以混合-裂分过程的统计量是相等的.
肽 文 库
<http://www.personal.psu.edu/faculty/n/x/nxp7/bead.html>
▲ top
::::液相反应及 固相反应 ::::
可以通过溶液相和固相合成文库. 据估计固相合成比溶液相合成更有优势, 两种方法都有一些优点
和缺点.
溶液相反应
首先让我们谈谈溶液相合成的优点. 总体来说, 大多数的经典化学反应都是在溶液中进行的. 因此,
(1)在溶液相合成中, 可以使用先前所有的有机合成方法而没有任何的限制 ; (2)反应物均一混合并
且快速移动使得反应机会增加; (3)在加热反应的例子中, 热能通过溶液中的分子分散而被均匀转移;
(4)大量反应可以通过控制反应釜的大小和反应物的数量而实现 ; (5)可以在每个步骤提纯并且分析
反 应 化 合 物 .
固相反应
考虑到溶液相合成的问题 , 固相合成的有的有 (1)起始材料在固相载体上被修饰, 而且反应在固相
载体上通过增加溶液来进行 , 在反应完成后 , 不想要的化合物和过量试剂被恰当的洗涤过程提纯 .
(2)有时过量试剂可用来获得没有附加提纯程序的高产量 . (3)即使分子内的环化反应或多反应位点
的选择性加成或选择性取代通过溶液相合成中的溶剂稀释来反应 , 这些反应类型在固相合成中可
被无特定条件的进行 , 因为固相载体的反应位点保持假溶解的条件 (保存适当的距离彼此 ). (4)即使
在固相载体上的起始材料非常有毒, 我们也能安全地处理固相载体直到反应完成. (5)自动化固相合
成容易实现, 因为简单而且易于重复反应和提纯过程.
但是, 也有一些缺点 (1)通常固相反应速率不快, 因为系统是处于固相和溶液之间的异相系统 . (2)
为构造反应条件, 需要较溶液相反应更多的精力和时间 , 而后者已经发展了很多反应 . (3)在反应物
被附到树脂珠上后, 需要额外的树脂切割反应步骤. (4)由于载体和连接分子的原因, 反应受到限制.
(5)识别反应中间体有些困难. (6)通常, 固相合成是不适于获得大量化合物的. (7)如果副产物被附到
了树脂上, 副产物只能在最后一个步骤被去除.
固相反应最大的优点是过程容易. 通过将试剂与溶剂在树脂上混合而使反应进行, 反应之后树脂以
恰当的溶剂过滤和洗涤 , 构成一个循环步骤 . 反应经过几步完成, 最终产物附到树脂上 , 然后通过树
脂切割反应而获得. 根据对化合物纯度的需要, 需要额外的提纯过程.
固相合成中最常用的载体是直径为数十或数百 μ m 的树脂珠(1000 μm = 1 mm). 树脂是无定形有机
聚合物的通常名字, 举例来说, 松树树脂是一个天然的树脂 , 而合成树脂在固相合成中应用 . 如此体
积(数十或数百 μm)的树脂不能被透过多孔的过滤板, 这样就可以除去试剂和溶剂. 具有微米单位直
径的树脂珠有时难以转移, 因为树脂上产生了静电而被黏附于反应釜的内部. 固相反应因此在有多
孔过滤板的反应装置中进行, 这有利于完成过滤和洗涤等后处理. 玻璃器具或化学惰性材料如聚丙
烯被用来做反应釜. 下图表示了一个固相合成仪器, 可以完全手工进行反应而不需自动化仪器的帮
助.
液相反应
与固相合成有第一个问题是反应在不同的系统中进行导致低产率或慢的反应速率而在溶液相反应
中就容易实现. 一个新的方法尝试解决这个问题然而仍保有固相合成的优点, 这就是使用能够在典
型溶剂中完全溶解的固相载体 , 然后制造一种同种的反应媒介 . 乙烯乙二醇聚合体 , 在 Scripps 被
Kim Janda 发展, 在使用的极性溶剂中同种溶解 . 这个反应, 也就是说, 在极性溶剂中完成, 在反应完
成后, 加入非极溶剂以沉淀固相载体 , 然后固相载体被过滤并洗涤 . 这个方法, 有能够实现所有的可
能反应而且容易提纯的优点. 因为乙烯乙二醇聚合体不能经受强烈的机械震动, 不能有强烈的搅拌
而且并不是所有的固相载体都沉淀了, 过滤时存在一些固相载体的损失.
溶液相反应 和固相反 应的结合
反应中使用固相承载试剂(solid supported reagents)有一些策略, 这将结合溶液相和固相合成的优点 .
很早以前就使用了固相承载的试剂但是在溶剂相合成中很难除去 . 一个经典的例子是用离子交换
树脂除去酸和碱. 在文库中使用固相承载试剂的策略是使用大于普通固相反应量的试剂. 固相承载
反应适用于没产生不需要产物的反应 . 当反应被完成时, 试剂在溶液中溶解然后转变为产物 . 未反
应的固相承载试剂仍留在反应瓶中. 过滤掉固相承载试剂后得到提纯了的产物.
相似的方法是在溶液相反应后使用固相反应物以清除残留的试剂或副产物 . 这种树脂试剂被称为
清道夫树脂.
使用氟化物 的文库合 成
氟-碳键表现出非常独特的性质, 因为 C-F 是强极性键却仍由于氟的高电荷密度而保持着较低的极
化率. 换言之, 高氟烃(取代氢)保持内部极性键, 但是作为分子整体却表现出非极性的性质 , 因而即
不溶于水或醇等极性溶剂也不溶于烃等非极性溶剂 , 而是产生第三层. 应用这种特性, 氟标记的文
库化合物可以被萃取到氟溶剂中而剩下其他的副产物和反应物在水相或有机相中 . 这种方法的优
点是可以享受溶液相化学的优点, 但是如果氟试剂和溶剂的在萃取过程中的复原率不高, 由于氟材
料的高价格这将是不经济的方法 . 使用这种氟文库的先驱是 University of Pittsburgh 的 Dennis P.
Curran 教授.
▲ top
::::文库合成的 历史及发 展 ::::
The Merrifield 的固相肽合成始于 1960 年代 , 在 1980 年代中期在多种平行固相合成中得到复兴 .
Geysen 发展了一种利用多针 和标准 96 孔圆片一次合成 96 种肽的方法 , Houghten 引入了茶袋法.
1990 年代早期 , 提出了单珠单化合物概念 , 合成了一个高度混合文库结合了子文库和重叠合法
(deconvolution). 另一方面, 被用作半导体工业中的标准方法的照相平版技术 也被应用于文库合成.
多针法
96 个聚乙烯针排列于标准 96 孔圆片上, 每个针的末端赋以反应用的官能团. 每个孔包含活化的氨
基酸溶液, 针被浸于溶液中以进行肽偶联反应; 每个反应孔将产生不同的肽产物. 这种方法大约能
产生 0.05-2 mmol 的肽.
微 量 滴 定 圆 片 多 针
<http://www.krict.re.kr/~shhwang/combimd.html>
茶袋法
带有小孔的聚乙烯袋, 与实际的茶袋非常相似, 里面填充树脂珠且每个袋子置于不同的反应器皿中
以完成氨基酸偶联反应. 反应后, 收集所有的袋子一齐做去保护基反应并洗去树脂珠以节省时间 .
在本方法中, 袋子起到了滤纸的作用并防止了不同反应间树脂珠的混和 , 而且通过标记袋子, 合成
的肽结构可被识别. 大约有 500mmol 的 100 种不同的肽可用此法合成, 这是平行合成的实际方法证
明, 尽管合成的肽种类不是很多.
茶 袋 法
<http://www.krict.re.kr/~shhwang/combimd.html>
重叠合法 (Deconvolution)
有几种不同的方法可被用于重叠合法 , 一个例子如下. 如果用 20 种氨基酸制得 5-mer 的肽文库(全
部可能组合数为 205 = 3,200,000), 第一个氨基酸以及其余 4 个都将会从 20 种氨基酸中随机抽取. 在
这些 20 套肽混合物(每个包含 204 = 160,000 种肽)中, 最具活性的混合物将通过筛选而得到 . 在第二
轮中, 肽的 1 位将赋为第一轮筛选出的最具活性的 , 2 位将从 20 种氨基酸中选择 , 其余 3 个位置随
机选择. 这些 20 肽混合物将包含 203 = 8,000 种肽, 第二轮筛选将决定 2 位最具活性的氨基酸 . 按照
类似的过程, 重复 3 遍后找到最有活性的分子. 这种方法将使筛选 100 个反应(20 每轮 x 5 轮)制得
的 300 万余种化合物成为可能. 尽管这种方法对于液相及固相化学都可行 , 因为自动化所带来的易
处使得固相肽合成及从载体上切割下来然后筛选的技术更为广泛应用 . 由于溶液中的分子是自由
的, 可供选择的筛选方式较固相载体束缚的肽更为宽泛 . 虽然如此, 筛选的最初阶段所给出的混合
物(例如 160,000)中含有太多种分子, 因而活性组分的浓度太低而不易与噪声相区别 . 一个改进的方
法是固定以 20 种氨基酸固定一个位置并令其他 4 个位置随机然后筛选 ; 所有的子文库将包含
160,000 种 肽 混 合 物 . 经 过 5 轮 筛 选 , 给 出 最 优 的 选 择 .
照相平版
照相平版术包括光敏保护基和石版印刷术, 在半导体工业中是一个标准的工具, 在平行合成中有所
应用. 在这个方法中, 每个文库化合物被放置在一枚芯片上, 而且反应历程(因此最后的产品结构)将
会依空间的地址识别. 随着半导体技术的进步, 清晰度令人惊异的增加从而在一枚小芯片上提供数
百乃至数千化合物. 现在, 芯片技术被用于肽或核苷低聚物的合成 , 后者发展以至进入 DNA 芯片和
基因芯片.
这里举肽合成为例. 芯片的玻璃表面用化学方法修饰而产生用光敏基团保护的氨基. 预先设计的掩
膜覆盖到芯片上, 然后使光射到需要反应的位置上而除掉保护基从而暴露出氨基. 整个芯片置于反
应釜中然后吸附氨基酸 A 到暴露的区域. 使用不同的掩膜, 暴露光到第二区域, 使氨基酸 B 在那里
偶联. 如被引入的氨基酸也被光敏基团保护 , 在完成第一层合成后, 上层合成可被重复以达到目标
大小.
<http://www.elmhurst.edu/~chm/onlcourse/chm110/outlines/topic5q.html>
PS 价格便宜且吸附量高 (0.5-1.5mmol/g). 其对物理震动的抵御性能使得 PS 用于搅拌或涡流混合条
件. PS 载体上合成的分子没有实际的体积限制, 可以合成多于 100-mer 的肽. 如果需要诸如高温或
有机金属试剂等剧烈条件 , 更硬一些的 2%的交联 PS 性能优于 1%PS. 通常使用的树脂为大约 200-
400 目(73-37 um)或 100-200 目(150-75 um), 而且 99%的反应位点是含于树脂珠内的 , 而仅有 1%的
吸附于树脂珠表面. 所以, 对于高效反应来说, 恰当的膨胀是非常重要的. PS 的憎水性使得它在非
极性溶剂中令人满意的膨胀 , 而又在极性溶剂如醇类等中收缩. 尤其是, 当反应发生在水中或极性
官能团出现在 PS 树脂珠表面时, 树脂珠完全塌陷而使反应停止.
另一方面, 高于 20%交联的 PS 有大孔型(MP)结构, 性质与普通 PS 有着截然差异 . 由于高度交联 ,
MP 有高刚性的不受溶剂影响的结构. 所以, 在 PS 中不能使用的多种溶剂都可以用于 MP 树脂珠上
的反应. 虽然 MP 树脂珠在高压下坚固, 它们很容易因机械震动而破碎; 所以推荐流体穿越方式而
不是搅拌方式. 由于树脂珠内部坚硬, 大分子的合成受到限制; 实践中 8-10 mer 的肽是最大体积. 化
学吸附量相当高(0.5-0.8 mmol/g).
聚乙二醇 (PEG)
为克服 PS 中的溶剂限制, 发展了聚乙二醇(PEG)树脂珠. PEG 可以在包括水在内的极性溶剂中溶解,
反应条件类似液相反应. 反应后, PEG 在非极性溶剂中沉淀 , 通过过滤与其他试剂或副产物分离 .
Scripps 的 Janda 教授及其研究小组发明了这个方法. 缺点是, PEG 在机械震动和反复沉淀-溶解中
产 生 物 料 损 失 , 这 将 限 制 多 步 自 动 化 的 应 用 .
Tentagel (TG)
为了改善 PS 和 PEG 的缺点却保留它们的优点, 发展了一种复合聚合物 tentagel(TG). TG 通过在氯
苯 PS 上与环氧乙烷反应而制得 , 因而在 PS 骨干上嫁接了 PEF. 通常 PS:PEG 的比例是约 30:70. 由
于 PEG 的作用, TG 即使在水溶液中也能较好的膨胀 , 而且树脂珠体积相差不大 , 所以 TG 是单珠单
文库化合物的理想材料. 除了极佳的溶剂膨胀性能, TG 在高压下不易损, 机械强度高. 由于反应发
生于 PEG 末端而且 PEG 间没有交联, 试剂到达反应位点较 PS 容易, 从而使得 TG 反应速率通常高
于 PS. 反应速率还受树脂珠体积影响; 树脂珠越大反应速率越低. 缺点是吸附量低(0.3 mmol/g)而且
树脂珠有吸水性, 还有价格太高.
载体 不同溶剂中的树脂体积(ml/g)
DMF THF MeOH 甲苯 H2O CH2Cl2
PS 3 8 2 7 - 7
TG 5 6 4 5 4 5
PEGA 11 13 13 12 16 13
下面的 NovaBiochem 网站提供了一个有用的固相载体选择表.
click!
▲ top
::::连接分子 ::::
虽然功能性载体可以直接的与基体化合物连接, 为了提高反应效率和剪切的容易程度, 一个连接分
子被插入在载体和基体分子之间. 连接分子应该被定量的装载在载体上, 而且在反应期间直到最后
化合物被切下都是稳定的 . 连接分子可以分类为保护基团型 , 无痕型, 环化型, 安全-捕捉型和光活
化型.
▲ top
::::编码及解码 ::::
编码或解码听起来好像是间谍片中的术语. 在文库操作中, 编码/解码是非常有用的, 甚至可以说是
核心部分. 最简单的方法是把一个空间地址赋予 96 个表面皿或芯片上的单个化合物. 筛选结果将
会直接的给出位置数据, 然后转换为化合物标记.
混合-裂分方法对于增大文库体积是非常有用的. 在单珠单化合物方法中, 每个树脂珠都携带文库
化合物和编码分子 . 筛选过程将会挑选出要选择的珠子 , 而且读出编码分子进而识别文库化合物 .
肽或核苷由于其序列分析技术几十年来的发展变得较为成熟而首先被引入作为编码分子 . 核苷甚
至可以通过 PCR 技术来扩增. Still 教授发展了一种新的方法采用色谱活性化合物作编码分子, 这些
分子可以通过气相色谱.进行分析.
尽管单珠单化合物方法非常诱人 , 从单个珠子上获得的化合物数量是有限的 (<1 nmol). 为了能够增
加化合物的数量 IRORI Inc.发展了包含树脂和微波芯片的反应罐. 微波芯片包含了所有的反应信息,
这些信息可以用电子阅读器阅读. 所以这种技术可以称为单罐单化合物方法.
IRORI
即使没有化学编码过程, 如果可以监测反应并能识别文库化合物的标记 , 那也将是非常方便的. 尽
管现在发展的还不完善, 已经有几种光谱方法可以应用, 这包括质谱, IR, 和 NMR.
▲ top
::::文库的前景 ::::
最近十年, 文库及固相化学领域有了爆炸式的发展 . 但是, 与拥有几百年历史的液相化学相比 , 固相
化学仍是乳臭未干. 尤其是, 固相载体上副产物的去除极为困难因而绝大多数固相反应要求 99%的
产率. 一些反应在以前的液相反应中有 90%的满意产率, 但为了能在固相反应中应用, 还需要重新
考虑. 不止是反应, 还有新连接方法和树脂上分析技术的发展也是必需的.
文库最活跃的应用在于制药工业 . 但是, 自 90 年代末以来新催化剂以及无机材料的发展初露端倪 ,
而且 DNA 芯片也展现了强大的应用能力 . 文库领域的一个令人失望的转变是研究正倾向于从合成
大型文库(几百万)转变到小型文库(几百至几千), 而且从混合物到单一化合物. 这种倾向将会减少
文库的无穷可能性从而让我们拘泥于简单的自动过程 . 尽管如此, 我仍坚信, 人类的创造性思维必
将超越多功能机器人的手臂.
▲ top
::::文库领域的 论文 , 杂志及书籍 ::::
衡量一个领域活跃程度的重要尺度是看其出版的论文和书籍的数量 . 专业杂志的数量是另一关键
标准. 上世纪 90 年在早期之前, 关于文库的论文每年少于 100 篇, 但是这个数量急剧增长为现在每
年多于 1000 篇 . 第一本专论于 1996 年出版而且现今已有 10 余种书籍 . 专业的文库杂志诞生于
1995 年 , 1998 年 又 有 了 另 外 3 种 . 1999 年 , 美 国 化 学 会 开 始 出 版 "Journal of Combinatorial
Chemistry."
综 述 , 书 籍 , 杂 志 ( 请 点 击 !)
▲ top
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
回到首页
8. 糖文库
糖
糖聚合 物的结 构多样 性
活细胞 中的糖 苷
糖聚合 物的生 物作用
糖与蛋 白质的 键合
糖分析
糖文库 的合成
::::糖::::
在体内的高聚物中, 糖是最后一个待发掘的领域. 糖与脂肪和蛋白质并列为三大营养物 , 但是蛋白
质构成酶和骨骼结构 , 脂肪构成细胞膜 , 而糖并没有吸引太多的关注 . 由于其分子式 (CH2O)n 使得
它看起来像是用碳和水做成的 .我们容易注意到它的名字来自 "碳的水和(carbohydrate)". 糖的结构
被发现之前己经有一些混合碳和水以合成糖的尝试 . 葡萄糖, 糖的基本元素之一, 被推测是由光合
作用合成然后以糖原或淀粉形式储存. 然而, 最近发现构成细胞膜的许多脂肪或蛋白质是以糖蛋白
或糖酯类形式存在, 而且糖低聚物在细胞间信号传递中也起了重要的作用 . 另外, 血型抗原也是血
细胞膜表面上的糖. 由于糖在 HIV 或其它致病源与血细胞结合过程中扮演了重要的角色, 它成为免
疫 系 统 控 制 和 癌 症 治 疗 的 最 重 要 的 线 索 之 一 .
▲ top
::::活细胞中的 糖苷 ::::
淀粉和纤维素是在活的细胞中发现的糖苷, 而且它们是葡萄糖 C1 和 C4 连接的聚合物, 仅在 a- 或
b-立体异构连接的构象上有所不同 . 就由于这点不同 , a-连接的淀粉通常解离成葡萄糖被当作营养
物使用, 但是 b-连接的纤维素是重要的构建植物结构的材料, 可被特种微生物消化. 在草食动物腹
中, 有这种微生物以分解纤维素 . 如果能有方法降解纤维素为葡萄糖 , 那将是对食品不足的巨大帮
助 . 已 有 一 些 使 用 纤 维 素 作 为 饲 料 的 实 验 .
<http://www.cchem.berkeley.edu/~crbgrp/>
另一方面, 肽聚糖是与糖蛋白完全相同因为它们的肽或蛋白质都连于糖上, 但是不同的是肽聚糖有
硫酸根等阴离子而且两个糖单体被重复. 肽聚糖中有肝磷脂钠, 软骨素, 透明质酸等.
▲ top
::::糖聚合物的 生物作用 ::::
当科学家试着去识别葡萄糖复合物分子的糖结构时, 它们令人惊异的复杂度和多样性被发现. 最近
有一些关于糖分子具有重要的生物学作用的报道, 但是还没有提出一个理论以解释众多现象. 到目
前为止所发现的糖分子的角色和功能有支持细胞和蛋白质的结构角色, 微生物, 毒素还有抗体的连
接位供体或掩体, 调控蛋白质功能, 以及在细胞间相互功能的中介物 . 然而, 每个研究都是以一种多
聚 糖 或 一 种 功 能 为 基 础 的 , 还 没 有 报 道 统 一 的 理 论 .
为分析糖蛋白类型中糖聚合物的结构必须被首先分离糖和蛋白质, 这需要化学方法和酶方法. 在化
学方法中, 可以通过使用肼迅速分开 O-或 N-连接的糖并控制条件仅分离 O-连接的的糖. 然而, 当
肼被用于反应时, N- 乙酰基在反应中被切割掉于是需要额外的乙酰化步骤 . 如果在一些胺的第一
个位置没有胺上的乙酰基那就没有办法分离. 因为肽结构在肼反应条件下被分解, 还有蛋白质分析
的 问 题 .
<http://www.princeton.edu/~dkahne/index.html>
天然的糖是各种不同的糖被糖苷键连接而成的低聚物. 糖苷键可被看作醚键, 但是实际上它的水解
比醚更容易. 人们早就知道由于产量和 a, b 立体选择性的问题合成糖苷键的反应不容易 . 除此之外,
用 其 保 护 多 个 羟 基 也 是 一 个 争 议 .
Kahns, Wong, Danishefsky, Seeberger
▲ top
back to main page
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
回到首页
9. 高通量 筛选
固相筛 选
使用放 射性染 料筛选
荧光筛 选
闪烁接 近化验 (SPA, Scintillation Proximity Assay)
酶连接 的免疫 吸收剂 化验 (ELISA, Enzyme Linked ImmunoSorbent Assay)
利用细 胞的功 能筛选
利 用 小 鼠 显 型 的 表 型 遗 传 学
::::固相筛选 ::::
如果我们使用混合 -分解方法在每个固体支体上合成一个分子 , 将可以很容易的合成几百万种化合
物. 如果我们可以在这些化合物在固体支体上时就筛选, 选出活性支体, 然后分析活性分子的结构,
这将是一种非常有吸引力的方法 . 唯一的困难是几百万个固体支体混在一起而且要高效筛选的是
其上的仅有 50~200 pmol 的小分子. 过去人们在固相载体上合成肽文库而且使用彩色受体 , 然后逐
个选出染色了的固相载体. 如果受体不能够指示颜色, 也可以染色与它们连接的抗体. 因为可以在
显微镜甚至放大镜下用镊子分离固相载体, 这种方法不仅用于蛋白质受体, 还有筛选成键的配体和
新的金属配体也可以. 这种方法在其本身没有线索条件下搜寻新的前导化合物是有用的, 因为这使
得筛选大量化合物成为可能.
然而, 依据染料强度来决定活性程度的方法是不准确的, 而且大量的固相载体不能逐个处理. 因此,
必须有自动化的 HTS 方法, 因而提出了 FACS( 萤光活化细胞分类仪 )法. 这种机器本来使细胞穿过
毛细管然后据其荧光强度分离细胞 . 相同的方法以固相载体取代了细胞 . 因为它是为细胞设计的 ,
细胞大小的小树脂珠都可以通过 , 但是通常大小的固相载体 (50~200 pmol)需要特殊仪器. 而且, 小
的 细 胞 大 小 的 树 脂 珠 不 能 够 处 理 足 量 的 化 合 物 .
过 滤 膜 法
样 品 荧 光 标 记 法
FRET: 荧 光 共 振 能 转 移
<http://www.ucalgary.ca/~dcramb/>
<http://www.cci.virginia.edu/workshop_fret.html>
50% FRET 作用的 R0 距离与供体的发射域和吸收体的吸收域的重叠以及吸收体的量子产量还有溶
剂有关. 通常 R0 约为 40~50Å. 40Å 约是分子量为 26,000 Da 的球蛋白的直径. 如果两个荧光分子相
互距离小于 R0, 当供体的吸收光被发射的时候 , 理论上吸收体的荧光将会增强 . 如果其距离大于 R0,
当同样的光被发射时, 将会检测到供体的荧光增强. 所以, 如果将荧光分子连接到如蛋白酶那样可
作激酶的小分子酶上, 很容易检测酶的活性. 事实上, 这个想法已被用于 beta-内酰胺激酶, 而且有可
能 应 用 到 新 报 道 的 基 因 上 .
TRF: 与 时 间 相 关 的 荧 光
选 择 性 杀 死 的 策 略
▲ top
::::利用小鼠显 型的表型 遗传学 ::::
早期遗传学研究的向前法之一是对果蝇照射 X 射线以产生随机变异 , 然后识别导致有趣的显型变
化的基因 . 现在 , 相似的研究正在由几个大的基因组研究所转到小鼠上 . 他们以化学诱变剂如
ENU(N-乙基-N-亚硝基脲)等代替 X 射线处理雄鼠 , 在其精子细胞中引入变异 , 然后产出变异了的
后代. 这些计划的结果将大为进步, 因为小鼠较果蝇与人类更近一些 , 而且具有与人类疾病相似的
显型的小鼠变异类型将对其医疗应用以及新基因功能的发现有重要帮助 . 一个技术上的难题是在
显型表现出来后从整个基因组中寻找变异基因的过程太麻烦 . 基因图谱和部分 SNP 看起来是目前
唯一的方法, 而且能够加速这个过程的高通量筛选法还需要改进.
综述: Trends in Mol. Med. 2001, 7, 502-507.
▲ top
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
返回首页
10. 芯片
DNA 芯片
蛋白质 芯片
小分子 芯片
细胞芯 片和组 织芯片
芯片上 的实验 室
::::DNA 芯片 ::::
最近, 在后基因组时代纷繁的信息中 , 生物芯片看起来成了最重要的研究工具之一 . 生物芯片与电
子工程学中的硅半导体芯片非常相似 . 高密度小尺寸的 DNA 和蛋白质芯片被用来筛选生物信息 ,
以 便 于 更 快 更 好 的 研 究 .
纳 米 基 因 芯 片
DNA 芯 片 是 现 代 芯 片 技 术 中 最 成 功 的 案 例 . DNA 技 术 使 用 了
DNA 双螺旋链中 A-T 和 G-C 这样的 Watson-Crick 对的的典型的性
质以及对互补序列识别的性质 . 换句话说 , DNA 芯片上的单链被当
作诱饵 , 而当 加入 DNA 试样时候 , 只有其互补链与之成键 . DNA
芯片能包含数千到数十万种 DNA 诱饵 , 这样就可以筛选任意数量
的 DNA 样品 . 因此审查的速度是令人惊异的 . 因为在一枚芯片上
的 DNA 诱饵的序列都已知 , 重要的是找出要筛选的 DNA 与哪一
位置结合 . 为检测诱饵 -样品 DNA 成键的数量 , 通常样品 DNA 被涂
以萤光染料然后扫描机读取芯片上的荧光强度 . 强荧光度意味着
样品中有许多互补 DNA 链与诱饵 DNA 链成键 . 现在正在发展高
灵敏度的电子筛选法, 但是还没有制造出来.
有二个方法可以植入 DNA 芯片上的诱饵 : 一是使用化学合成 (照相
平版术 ) 逐步累积单个低聚物 , 另一是在芯片上 ( 多针排列 ) 点现成
的样品 . 现在 , Affimetrix 作为领先的 DNA 芯片公司 , 已使用制造
计算机半导体芯片相同的技术 . 他们使用光敏掩膜和光来选择性
的在硅板上显露反应位点 , 然后附上核酸 . 因为核酸由 A, T, C 和 G
组成 , 需要四套掩膜和四次反应 . 现在可购得的 affiy 芯片包含 25
个核酸, 这需要 100 个掩膜和反应. 一种新的芯片布满光活性罩, 当光选择性的通过掩膜时, 反应物
基团被暴露于光线之下然后与下面的个体反应 . Affimetrix 正在生产酵母, 人, 小鼠和其他的 DNA
芯片, 而且这些被用于一次测量所有的基因表达 . 但是, 普通的基因由数以千计的碱基组成 , 使用只
有 25 个碱基的低聚物有试样是否具有代表性的问题 . 因此, Affimetrix 制造每个基因含 20 碱基的
芯片 ( 每个低聚物是 25-mer), 而且判断相关基因的表达要经过一个统计过程以确保达到足够的
DNA 序列量. 这样, 样品 DNA 需要剪切到与诱饵 DNA 体积相当.
Affiy 芯 片
尽管照相平版术是芯片合成的代表性方法, 它对芯片密度和光衍射的限制饱受批评. 1999 年九月期
的 Nature Biotechnology 上, 威斯康辛大学 Madison 分校的 Michael Sussman 博士团队的科学家引入
了一个不要掩膜而使用数码照相处理器的合成方法. 他们使用小的矾土来激发光以代替掩膜, 他们
的方法使本来需要的几周时间缩短到 8 个小时, 大大降低了芯片成本. 新技术当经由威斯康辛校友
研究基金取得专利权, NimbleGen Systems 系统正在购买这项技术.
<http://www.devicelink.com/ivdt/archive/98/09/009.html>
在斯坦福大学的 Patric Brown 发明了多针矩阵方法 . DNA 诱饵探头通过 PCR 等生物技术被合成 ,
然后点到微型玻璃芯片上. 除了对于实验重现性的批评 , 只要有 DNA 诱饵探头, 这种方法就较合成
芯片有更具竞争力的价格. 现在任何人都可以容易地制造芯片 . 因为诱饵 DNA 是生物制得的, 不像
Affy 芯片, DNA 长度没有任何限制 . 甚至数百个碱基的构成的 DNA 也能制得, 这个优点使得较诱
饵-样品成键法有更高的选择性.
多 针 矩 阵
<http://www.bohan.co.kr/html/DNAChip/DNAChip-1.htm>
现在许多芯片正在使用 cDNA 诱饵. 从特定条件下的细胞得来的 mRNA 被取出, 经过几步处理后,
人们研究它们是何种基因, 在给定条件下有多少被表达 .当 mRNA 的量不足的时候, RT-PCR 及体外
传递方法可以用来倍增它. 得到数据和样品较探测蛋白质表达数量要简单 , 这是一大优点, 可是也
有批评指出 mRNA 的量得变化并不精确表明蛋白质数量的变化 . 换句话说, 某蛋白质表达细胞的
尝试能通过 mRNA 的量发现, 但是否真正制得了蛋白质无法核对 . 有道理. 事实上 mRNA 的量和蛋
白质没有很多的相互关系(比 0.5 低). 因为 mRNA 和蛋白质的分解速率不同, 而且蛋白质经过一系
列反应(例如磷酸化作用), 不能说 一个 mRNA 制得一个蛋白质. 如果总的 DNA 被称作基因组, 总
的蛋白质称作蛋白质组 , 那么 DNA 芯片的研究就可以被称为转录组 (transriptome), 因为这其中使
用 了 mRNA.
<http://www.iir.suite.dk/IIR/Genes/geneChipSetup.htm>
<http://www.iir.suite.dk/IIR/Genes/geneChipDK.htm>
然而, 在布朗法中, 试样是用不同荧光染料染色了的 (Cy3 & Cy5), 一起点在一个芯片上, 而且检测
由于 mRNA 表达引起的颜色相对改变 . Cy3 和 Cy5 事实上都是红色染料 , 为了数据分析和表达的
方便 , 它们被当作绿色和红色的 . 举例来说 , 如果控制实验是绿色的而真实实验是红色的 , 没有
mRNA 的基因将会被指定为黄色的, 一种中间色. 另外绿色的基因表示表达的减少, 红色的基因意
味着表达的增加.
<http://www.dkfz-heidelberg.de/kompl_genome/index.html>
因为布朗的方法容易而且便宜, 只用一个点样器和一个检测仪来制造芯片, 许多学校的研究小组正
在使用这种方法. 但是问题集中在重复实验的真实性上. Incyte, 过去一直通过收集来自不同研究小
组的 DNA 诱饵来提供标准 DNA 芯片, 宣布在 2001 年底停止他们的服务 . 这对许多研究小组研究
DNA 的计划来说是一个危机, 据信, 他们正在找寻新的服务供给者(Nature, 2001, 414, 135-136).
▲ top
::::蛋白 质芯片 ::::
由于利用了 DNA 与互补的 DNA 或 RNA 结合的典型性质, DNA 芯片在短时间内就取得了成功. 然
而, 已经有关于 mRNA 和蛋白质之间数量关系上的争论 , 而且实际上在细胞中参与各种不同反应
的都是蛋白质. 因此, 如果能制造出蛋白质芯片而不是 DNA 芯片, 而且如果蛋白质表达强度和键合
物能被发现, 就有可能把研究拓展到 DNA 芯片鞭长莫及的领域. 然而, 要制造一个蛋白质芯片, 每
个蛋白质都需要提纯, 还有, 将蛋白质以某种形式固定到芯片上的技术还不完善 . 也许植入较常规
蛋 白 质 易 于 控 制 的 抗 体 是 个 替 代 方 案 .
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim
回到首页
11. 分子 进化
关于进 化的思 考
RNA 世界
分子进 化
遗传法 则
::::关于进化的 思考 ::::
除了上帝显灵的解释以外, 进化到底是怎样发生的? 什么是进化的主导者? 圣餐? 圣人? 王权? 还是
如达尔文声称的那样, 是 基 因 ? [Richard Dawkins, "Selfish Gene"( 自 私 的 基 因 )]
结论就是, 进化过程使得特定环境中那些含有最适合的品质的物种伴随着物种多样性的稳定发展
和自然选择而存活.
▲ top
::::RNA 世界 ::::
生物系统的进化要求较长时间. 生物自生命第一次出现起就一直在进化. 现存的物种都是几十亿年
来改变和选择的结果, 它们的进化还在继续. 遗传信息基本上包含在 DNA 中. DNA 的四个基本成
份, A, G, T, C 构成了遗传密码. 3 个碱基的组合构成一个密码 , 用于一个特定的氨基酸 . 3 个碱基的
可能组合数是 43, 即 64. 而当为 20 种氨基酸编码的时候, 一些 3 碱基的组合的功能可能有重叠 . 换
句话说, 遗传信息是合成肽的蓝图, 肽由氨基酸组成. 蛋白质是构建活体生物身体结构的基本材料,
而肽则催化了身体内难以胜数的化学反应. 其他的建筑单元例如糖, 脂肪和其他的微量分子可以被
称 作 蛋 白 质 和 酶 的 二 次 产 物 .
为使蛋白质能从 DNA 合成, 首先, 必须从 DNA 制得 mRNA. RNA 有几乎与 DNA 相同的结构, 但是
它由核糖组成 , 在糖环 2 位碳上多了一个羟基 . 这个额外的羟基使 RNA 更高的化学活性 , 导致了
RNA 参与众多反应 ; 但同样 , 这也降低了它的稳定性 , 使得 RNA 不适合长期储存遗传信息 .
Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved
Web Master : Young Soo Kim