蛋白质

Article

December 4, 2021

蛋白质是由一个或多个氨基酸长链形成的一大群生物分子。蛋白质在生物中具有许多功能,包括加速代谢反应、复制 DNA、响应刺激、赋予细胞和身体形状以及将分子从一个位置移动到另一个位置。一种蛋白质与另一种蛋白质的主要区别在于其氨基酸序列,这是由其基因的核苷酸序列决定的,通常会使蛋白质折叠成适合其功能的特殊三维结构。许多氨基酸形成称为多肽的直链。蛋白质由至少一个长多肽组成。短多肽(少于 20-30 个氨基酸)通常不被认为是蛋白质,但被称为肽分子或寡肽。蛋白质中的每个氨基酸都通过肽键与附近的氨基酸结合。蛋白质中氨基酸的顺序由遗传密码中编码的基因的序列决定。一般来说,遗传密码产生 20 个标准氨基酸,尽管一些生物体有额外的氨基酸。在合成后不久甚至在合成过程中,蛋白质中的残基通常会通过翻译后修饰过程进行化学修饰,这些过程会改变蛋白质的物理和化学性质、折叠、稳定性、活性和功能。一些蛋白质具有非肽基团(不是氨基酸),可以称为辅因子和辅基。几种蛋白质也可以协同工作以执行某些功能,这些基团通常会形成稳定的蛋白质复合物。蛋白质一旦形成,只存在一段时间,然后通过蛋白质周转过程在细胞内降解和回收。蛋白质寿命是通过其半衰期来衡量的,范围很广。蛋白质可以在哺乳动物细胞中存活几分钟到几年,平均寿命为 1-2 天。异常或错误折叠的蛋白质降解得更快,要么是因为它们是破坏的目标,要么是因为它们不稳定。与其他巨大的生物分子如多糖和核酸一样,蛋白质是生物体的重要组成部分,几乎参与了细胞的所有过程。一些蛋白质是酶,在生化反应中起催化剂的作用,对新陈代谢至关重要。有些蛋白质具有形成或强化的功能,例如肌肉中的肌动蛋白和肌球蛋白以及细胞骨架中的蛋白质。其他蛋白质在细胞信号、免疫反应、细胞粘附和细胞周期中具有重要作用。动物需要饮食中的蛋白质来获取体内无法合成的必需氨基酸。消化系统分解食物中的蛋白质以用于新陈代谢。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。其他蛋白质在细胞信号、免疫反应、细胞粘附和细胞周期中具有重要作用。动物需要饮食中的蛋白质来获取体内无法合成的必需氨基酸。消化系统分解食物中的蛋白质以用于新陈代谢。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。其他蛋白质在细胞信号、免疫反应、细胞粘附和细胞周期中具有重要作用。动物需要饮食中的蛋白质来获取体内无法合成的必需氨基酸。消化系统分解食物中的蛋白质以用于新陈代谢。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。动物需要饮食中的蛋白质来获取体内无法合成的必需氨基酸。消化系统分解食物中的蛋白质以用于新陈代谢。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。动物需要饮食中的蛋白质来获取体内无法合成的必需氨基酸。消化系统分解食物中的蛋白质以用于新陈代谢。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。可以使用各种技术(例如超速离心、沉淀、电泳和色谱法)从其他细胞成分中纯化蛋白质。基因工程允许使用多种方法来促进这种纯化。通常用于研究蛋白质结构和功能的方法是免疫组织化学、定位诱变、X 射线晶体学、核磁共振和质谱。

历史和词源

蛋白质在 18 世纪被 Antoine Fourcroy 等人认为是一组生物分子,其特点是在加热或酸处理下能够凝结或絮凝。当时记录的例子有来自蛋清的白蛋白、血清中的白蛋白、纤维蛋白和小麦面筋。蛋白质首先由荷兰化学家 Gerardus Johannes Mulder 描述,1838 年由瑞典化学家 Jöns Jacob Berzelius 命名。 Mulder 对常见蛋白质进行元素分析,发现几乎所有蛋白质都具有相同的经验分子式,即 C400H620N100O120P1S1。他得出了错误的结论,即它们可能由一种分子(非常大)组成。描述这些分子的术语“蛋白质”是由穆德的同事提出的,贝采利乌斯;蛋白质来自希腊词 (proteios),意思是“主要的”、“在前面”或“站在前面”,加上结尾 -in。 Mulder 进一步鉴定了蛋白质降解产物,例如他发现的氨基酸亮氨酸,其分子量(几乎正确)为 131 Da。在“蛋白质”之前,曾有其他名称,如“白蛋白”或“白蛋白物质”(Eiweisskörper,德语)。早期的营养学家如德国的Carl von Voit认为蛋白质是维持身体最重要的营养素结构正如人们普遍认为的“肉生肉”。 Karl Heinrich Ritthausen 通过鉴定谷氨酸扩展了已知的蛋白质形式。在康涅狄格农业实验站,托马斯·伯尔·奥斯本 (Thomas Burr Osborne) 收集的植物蛋白的详细评论。他与 Lafayette Mendel 合作,将李比希最小值定律应用于实验室小鼠的喂养,从而了解必需氨基酸的存在。这项工作由威廉·卡明·罗斯 (William Cumming Rose) 继续进行并进行了交流。 Franz Hofmeister 和 Hermann Emil Fischer 在 1902 年的工作中将蛋白质理解为多肽。直到 1926 年,当 James B. Sumner 证明尿素酶实际上是一种蛋白质时,蛋白质作为酶在生物体中的核心作用才得到充分认识. 大量的数量使得早期的蛋白质生物化学家很难研究它们。因此,早期的研究集中在大量纯化的蛋白质上,例如来自屠宰场的血液、蛋清、各种毒素和消化/代谢酶。 1950 年代,Armor Hot Dog Co.从纯牛胰腺中纯化 1 公斤核糖核酸酶 A,并免费提供给科学家;这一运动帮助核糖核酸酶 A 成为未来几十年生化研究的主要目标。 Linus Pauling 因成功估计基于氢键的普通蛋白质的二级结构而受到赞誉,这一想法由 William Astbury 在 1933 年首次提出。 后来,Walter Kauzmann 的变性工作部分基于 Kaj Linderstrøm-Lang 的早期研究,提供了对疏水相互作用介导的蛋白质折叠和结构的深入了解。第一个测序的蛋白质是胰岛素弗雷德里克·桑格 (Frederick Sanger) 于 1949 年发表。桑格精确地确定了胰岛素的氨基酸序列,从而令人信服地表明蛋白质是由氨基酸的线性聚合物组成,而不是支链、胶体或旋风。他因此获得了 1958 年的诺贝尔奖。第一个已知的蛋白质结构是血红蛋白和肌红蛋白,分别由 Max Perutz 和 John Cowdery Kendrew 爵士于 1958 年提出。截至 2017 年,Protein Data Bank 拥有超过 126,060 个蛋白质结构与原子分辨率。最近,大分子组合的冷冻电子显微镜和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。桑格精确地确定了胰岛素的氨基酸序列,从而令人信服地表明蛋白质是由氨基酸的线性聚合物组成,而不是支链、胶体或旋风链。他因此获得了 1958 年的诺贝尔奖。第一个已知的蛋白质结构是血红蛋白和肌红蛋白,分别由 Max Perutz 和 John Cowdery Kendrew 爵士于 1958 年提出。截至 2017 年,Protein Data Bank 拥有超过 126,060 个蛋白质结构与原子分辨率。最近,大分子组合的冷冻电子显微镜和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。桑格精确地确定了胰岛素的氨基酸序列,从而令人信服地表明蛋白质是由氨基酸的线性聚合物组成,而不是支链、胶体或旋风链。他因此获得了 1958 年的诺贝尔奖。第一个已知的蛋白质结构是血红蛋白和肌红蛋白,分别由 Max Perutz 和 John Cowdery Kendrew 爵士于 1958 年提出。截至 2017 年,Protein Data Bank 拥有超过 126,060 个蛋白质结构与原子分辨率。最近,大分子组合的冷冻电子显微镜和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。他因此获得了 1958 年的诺贝尔奖。第一个已知的蛋白质结构是血红蛋白和肌红蛋白,分别由 Max Perutz 和 John Cowdery Kendrew 爵士于 1958 年提出。截至 2017 年,Protein Data Bank 拥有超过 126,060 个蛋白质结构与原子分辨率。最近,大分子组合的冷冻电子显微镜和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。他因此获得了 1958 年的诺贝尔奖。第一个已知的蛋白质结构是血红蛋白和肌红蛋白,分别由 Max Perutz 和 John Cowdery Kendrew 爵士于 1958 年提出。截至 2017 年,Protein Data Bank 拥有超过 126,060 个蛋白质结构与原子分辨率。最近,大分子组合的冷冻电子显微镜和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。大分子组合的低温电子显微镜检查和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。大分子组合的低温电子显微镜检查和蛋白质结构对小蛋白质结构域的计算预测是两种近似原子分辨率的方法。

基因组中编码的蛋白质数量

基因组中编码蛋白质的数量大致对应于基因的数量(尽管可能有大量的基因编码蛋白质RNA,例如核糖体RNA)。病毒通常编码数百种蛋白质,古细菌和细菌通常编码数百至数千种,而真核生物通常编码数千至数万种蛋白质(有关示例列表,请参见基因组大小)。

生物化学

蛋白质是由氨基酸形式的单体组成的非常大的生物分子或大生物聚合物。构成氨基酸的标准氨基酸有 20 种(称为蛋白氨基酸);每个由与氨基 (–NH2)、羧基 (–COOH)、氢原子 (H) 和侧链(称为“R”)键合的 α 碳组成。正是这个“R”基团使每个氨基酸都不同,而这条侧链的性质将影响整个蛋白质。只有脯氨酸与这种基本结构不同,它在 N 端胺基团上包含一个不寻常的环,这迫使 CO-NH 酰胺基团形成固定构象。标准氨基酸侧链在标准氨基酸列表中有详细说明,具有多种结构和化学性质。蛋白质的三维结构和化学反应性是由蛋白质中所有氨基酸侧链的综合作用决定的。多肽链中的所有氨基酸通过脱水合成以肽键连接在一起。一旦连接在蛋白质链中,单个氨基酸称为残基,而碳、氮和氧原子的连接组称为主链或蛋白质骨架。术语蛋白质、多肽和肽有些含糊不清,可能会重叠在意义上。蛋白质通常用于指具有稳定构象的完整生物分子,而肽通常是指通常不具有稳定三维结构的短氨基酸寡聚体。然而,两者之间的界限并不明确,通常在 20-30 个残基之间。多肽可以指单个线性氨基酸链,通常具有任意长度,但通常意味着不具有固定的构象。

相互作用

蛋白质可以与多种类型的分子相互作用,包括与其他蛋白质、脂质、碳水化合物和 DNA 相互作用。

细胞丰度

据估计,一个平均大小的细菌每个细胞含有大约 200 万种蛋白质(例如大肠杆菌和金黄色葡萄球菌)。较小的细菌,例如支原体或螺旋体,所含的蛋白质较少,约为 50,000 至 100 万。真核细胞更大,因此含有更多蛋白质。例如,Saccharomyces cerevisiae 的酵母细胞估计含有大约 5000 万个蛋白质,而人类细胞大约含有 1 到 30 亿个。单个蛋白质拷贝的浓度范围从每个细胞几个分子到每个细胞 2000 万个。并非所有编码蛋白质的基因都在大多数细胞中表达,它们的数量取决于多种因素,例如细胞类型和外部刺激。例如,在人类基因组编码的大约 20,000 种蛋白质中,只有 6 种。在淋巴母细胞中检测到 000。

合成

生物合成

蛋白质是使用基因编码的信息由许多氨基酸组装而成的。每种蛋白质都有自己独特的氨基酸序列,这是由编码该蛋白质的基因的核苷酸序列决定的。遗传密码是一组称为密码子的三个核苷酸,每个三个核苷酸的组合代表一个氨基酸,例如 AUG(腺嘌呤 - 尿嘧啶 - 鸟嘌呤)是蛋氨酸的代码。由于 DNA 包含四个核苷酸,因此可能的密码子总数为 64;因此,遗传密码存在一些冗余,一些氨基酸由多个密码子定义。 DNA 中编码的基因首先被 RNA 聚合酶等蛋白质转录成信使前 RNA (mRNA)。然后,大多数生物体使用各种形式的转录后修饰处理前体 mRNA(也称为初级转录物)以形成成熟的 mRNA,然后将其用作核糖体合成蛋白质的模板。在原核生物中,mRNA 在离开类核细胞后一旦产生或被核糖体结合就可以使用。相比之下,真核生物在细胞核中制造 mRNA,然后将其跨核膜转移到细胞质中,然后在那里进行蛋白质合成。原核生物的蛋白质合成速度高于真核生物,每秒可达到20个氨基酸,以mRNA为模板合成蛋白质的过程称为翻译。此外,将 mRNA 加载到核糖体上,通过将每个密码子与位于转移 RNA (tRNA) 分子上的碱基对反密码子匹配,一次读取三个核苷酸,该分子携带与其识别的密码子对应的氨基酸。 tRNA-氨酰合成酶用正确的氨基酸“填充”tRNA分子。正在形成的多肽通常称为新生链。蛋白质总是从 N 端到 C 端合成。合成蛋白质的大小可以通过它包含的氨基酸数量和总分子质量来衡量,通常以道尔顿报告(与原子质量相同)单位),或千道尔顿 (kDa) 的派生单位。)。蛋白质的平均大小在古细菌、细菌和真核生物中增加(分别为 283、311、438 个氨基酸残基和 31、34 个)。49 kDa),因为在高等生物中有更多的蛋白质结构域构成蛋白质。例如,酵母蛋白的平均长度为 466 个氨基酸,质量为 53 kDa。已知最大的蛋白质是肌联蛋白,它是肌肉肌节的一种成分,分子量接近 3,000 kDa,总长度接近 27,000 个氨基酸。

化学合成

短蛋白也可以通过一组称为肽合成的方法进行化学合成,这些方法依赖于有机合成技术,如化学连接来产生大量的肽。化学合成使得将非天然氨基酸并入多肽链成为可能,例如将荧光探针连接到氨基酸侧链。这种方法在生物化学和细胞生物学实验室中很有用,但通常不适用于商业应用。对于长度超过约 300 个氨基酸的多肽,化学合成效率低下,并且合成的蛋白质可能不容易呈现其原始的三级结构。大多数化学合成方法是从 C 端到 N 端,而不是生物反应。

结构

大多数蛋白质折叠成独特的三维结构。折叠蛋白质的自然形状被称为天然构象。尽管许多蛋白质可以在没有帮助的情况下仅通过其氨基酸的化学性质折叠,但许多其他蛋白质需要伴随蛋白质的帮助才能折叠成原始状态。生物化学家经常提到蛋白质结构的四个不同方面。一级结构是由肽(酰胺)键连接的氨基酸序列。 Frederick Sanger 是一位科学家,他发现了一种确定蛋白质中氨基酸序列的方法,该方法使用几种蛋白酶将某些氨基酸之间的键切割成较短的肽片段,以便在色谱纸的帮助下进一步分离。氨基酸序列决定蛋白质功能,1957年Vernon Ingram发现氨基酸易位会改变蛋白质功能,进而引发基因突变。二级结构,即由氢键稳定的各种氨基酸链的局部三维结构。最常见的例子是α-螺旋,它是氨基酸链的螺旋形螺旋; β-折叠(β-折叠),以宽折叠的形式由许多氨基酸链组成,通过氢键或硫醇键(S-H)相互连接;缩进-β(β-转角);和伽马缩进(γ-转向)。三级结构,是多种二级结构的组合,形成蛋白质分子的整体形态。术语“三级结构”通常用作术语折叠的同义词。正是这种三级结构控制着蛋白质的基本功能。一些蛋白质分子可以在没有共价键的情况下进行物理相互作用以形成稳定的寡聚体(例如二聚体、三聚体或四聚体)并形成四级结构。四级结构,是由几个蛋白质分子(多肽链)形成的结构。在这种情况下,它通常被称为蛋白质亚基,它作为单个蛋白质复合物起作用。众所周知的例子是 Rubisco 酶和胰岛素。奎宁结构,这是控制致密细胞内部的蛋白质表面的特征。奎宁结构取决于发生在活细胞内的瞬态但重要的大分子相互作用。蛋白质的一级结构可以通过几种方法确定:(1) 用强酸(如 6N HCl)水解蛋白质,然后用​​氨基酸分析仪测定氨基酸组成,(2)Edman 降解对 N 端进行序列分析,(3)结合用胰蛋白酶和质谱法消化,以及 (4) 质谱法测定分子质量。二级结构可以通过圆二色性 (CD) 光谱和傅里叶变换红外光谱 (FTIR) 确定。 α 线的 CD 光谱在 208 和 220 nm 处显示两个负吸光度,β 板在 210–216 nm 附近显示一个负峰。可以从 CD 谱计算蛋白质二级结构组成的估计值。在 FTIR 光谱中,α-螺纹的酰胺-I 带与β-板的酰胺-I 带不同。所以,蛋白质的二级结构组成也可以从红外光谱估计。蛋白质并不是完全刚性的分子。除了这一级别的结构,蛋白质在执行其功能时还可以在几个相关结构之间发生变化。在这种功能重排的背景下,三级或四级结构通常被称为“构象”,两者之间的转变称为构象变化。这些变化通常是由底物分子与酶的活性位点或蛋白质的参与化学催化的物理区域结合引起的。在溶液中,蛋白质也会通过热振动和与其他分子的碰撞而发生结构变化。非正式地,蛋白质可以分为三个主要类别,它们与独特的三级结构相关:球状蛋白质、纤维蛋白和膜蛋白。几乎所有的球状蛋白质都是可溶的,其中许多是酶。纤维蛋白通常是结构性的,例如胶原蛋白(结缔组织的主要成分)或角蛋白(头发和指甲的蛋白质成分)。膜蛋白通常充当受体或为极性或带电分子通过细胞膜提供通道。脱水子是蛋白质内分子内氢键的一种特殊情况,它们无法抵御水的攻击,因此会促进自身脱水。膜蛋白通常充当受体或为极性或带电分子通过细胞膜提供通道。脱水子是蛋白质内分子内氢键的一种特殊情况,它们无法抵御水的攻击,因此会促进自身脱水。膜蛋白通常充当受体或为极性或带电分子通过细胞膜提供通道。脱水子是蛋白质内分子内氢键的一种特殊情况,它们无法抵御水的攻击,因此会促进自身脱水。

域蛋白

另一种已知的蛋白质结构是结构域,它是折叠成不同结构单元的蛋白质片段。该结构由 40-350 个氨基酸组成。简单的蛋白质通常只有一个结构域。在更复杂的蛋白质中,涉及多个域。在其中起作用的多肽链的关系会产生不同于其组成成分的新功能。当这个复杂结构中的域结构被分离时,构成域的每个组成部分的生物学功能都不会丢失。这就是域结构与四级结构的区别。在四级结构中,复杂结构分离后,蛋白质没有功能。域通常具有特定的功能,例如酶活性(例如激酶)或作为结合模块起作用(例如 SH3 结构域与其他蛋白质中富含脯氨酸的序列结合)。

序列基序

蛋白质中的短氨基酸序列通常充当其他蛋白质的识别位点。例如,SH3 域通常与一个短的 PxxP 基序结合(即 2 个脯氨酸 [P],由两个未指定的 [x] 氨基酸隔开,尽管周围的氨基酸可能决定了确切的结合特异性)。许多这样的基序已被收集在真核线性基序 (ELM) 数据库中。

移动功能

蛋白质是细胞中的主要参与者,执行由基因编码的信息决定的任务。除了某些类型的 RNA,大多数其他生物分子都是蛋白质起作用的相对惰性的元素。蛋白质占大肠杆菌细胞干重的一半,而其他大分子如 DNA 和 RNA 分别仅占 3% 和 20%。在特定细胞或细胞类型中表达的一组蛋白质被称为蛋白质瘤。蛋白质的一个主要特征也使其具有多种功能,是它们能够与其他分子特异性结合并紧密结合。负责与其他分子结合的蛋白质区域称为结合位点,通常是分子表面上的空洞或“口袋”。这种结合能力是由定义结合位点口袋的蛋白质三级结构和周围氨基酸侧链的化学性质介导的。蛋白质结合可以非常紧密和特异性;例如,核糖核酸酶抑制剂蛋白以亚飞摩尔解离常数 (<10-15 M) 与人血管生成素结合,但根本不与其两栖动物同系物 onconase (>1 M) 结合。微小的化学变化,例如在键对上添加甲基,有时足以几乎消除结合;例如,氨酰-tRNA合成酶,特异于氨基酸缬氨酸,不与异亮氨酸非常相似的氨基酸侧链结合,蛋白质可以与其他蛋白质结合,也可以与小分子底物结合。当蛋白质与同一分子的其他拷贝特异性结合时,它们可以寡聚形成原纤维;这个过程经常发生在由球状单体组成的结构蛋白中,这些单体自连接形成刚性纤维。蛋白质-蛋白质相互作用还调节酶活性,通过细胞周期控制发育,并使大型蛋白质复合物能够进行许多具有相同生物学功能的相似相关反应的组装。蛋白质也可以结合甚至整合到细胞膜中。键对诱导蛋白质构象变化的能力允许构建高度复杂的信号网络。由于蛋白质之间的相互作用是可逆的,并且在很大程度上取决于蛋白质对的可用性以形成能够执行不同功能集的聚集体,因此研究特定蛋白质之间的相互作用是理解细胞功能重要方面的关键,并最终了解区分细胞的特性。类型。确定。

酵素

蛋白质在细胞中最广为人知的作用是作为酶,催化化学反应。酶通常非常专一,只能加速一种或几种化学反应。酶进行代谢中涉及的大部分反应,并在 DNA 复制、DNA 修复和转录等各种过程中操纵 DNA。一些酶作用于其他蛋白质,在称为翻译后修饰的过程中添加或去除化学基团。大约 4,000 个反应由酶催化。酶催化提供的速率加速通常非常大,与乳清酸脱羧酶的未催化反应相比,速率增加高达 1017 倍(没有酶的情况下为 7800 万年,有酶的为 18 毫秒)。与酶结合并受其作用的分子称为底物。虽然酶可能由数百个氨基酸组成,但通常只有一小部分残基与底物接触,甚至更小的部分——平均三到四个残基——直接参与催化。酶与底物结合并含有催化残基的区域称为活性位点。导体蛋白是一组蛋白质的成员,这些蛋白质决定了由其他酶合成的化合物的立体化学。酶与底物结合并含有催化残基的区域称为活性位点。导体蛋白是一组蛋白质的成员,这些蛋白质决定了由其他酶合成的化合物的立体化学。酶与底物结合并含有催化残基的区域称为活性位点。导体蛋白是一组蛋白质的成员,这些蛋白质决定了由其他酶合成的化合物的立体化学。

细胞信号传导和配体结合

许多蛋白质参与细胞信号传导和信号转导过程。一些蛋白质,例如胰岛素,是细胞外蛋白质,可将信号从合成它们的细胞(即胰腺细胞)传输到远处组织中的其他细胞。另一种类型是作为受体的膜蛋白,其主要功能是与信号分子结合并诱导细胞内的生化反应。许多受体具有暴露在细胞表面的结合位点和细胞内的效应结构域,它们可能具有酶活性或可能发生被细胞中其他蛋白质检测到的构象变化。抗体是适应性免疫系统的组成部分,其主要功能是与抗原(体内的外来物质)结合并针对它们进行破坏。抗体可以分泌到细胞外环境中或锚定在称为浆细胞的特化 B 细胞的膜中。虽然酶对其底物的结合亲和力因其进行反应的需要而受到限制,但抗体没有这种限制。抗体与其靶标的结合亲和力非常高,许多配体转运蛋白与某些小生物分子结合,并将它们运送到多细胞生物体内的其他位置。如果配体以高浓度存在,则该蛋白质必须具有高结合亲和力,但在靶组织中以低浓度存在时也必须释放配体。配体结合蛋白的例子是血红蛋白、它们将氧气从肺部输送到所有脊椎动物的其他器官和组织,并且在每个生物界都有相似的同源物。凝集素是糖结合蛋白,对其糖部分具有高度特异性。凝集素通常在涉及细胞和蛋白质的生物识别现象中起作用。受体和激素是高度特异性的结合蛋白。跨膜蛋白还可以作为配体转运蛋白,将细胞膜通透性转化为小分子和离子。膜本身具有疏水中心,因此极性或带电分子不能扩散。膜蛋白包含允许这些分子进入和离开细胞的内部通道。许多离子通道蛋白专门用于仅选择某些离子;例如,钾和钠通道通常只促进特定离子。

结构蛋白

结构蛋白为液体生物成分提供硬度和刚性。大多数结构蛋白是纤维蛋白;例如,胶原蛋白和弹性蛋白是结缔组织(如软骨)的重要组成部分,而角蛋白则存在于硬质或丝状结构中,如头发、指甲、羽毛、胎面和一些动物壳。一些球状蛋白也可以具有结构功能,例如肌动蛋白和微管蛋白是球状的,可以作为单体溶解,但聚合形成构成细胞骨架的长而刚性的纤维,从而使细胞保持其形状和大小。其他在结构上起作用的蛋白质是运动蛋白,例如肌球蛋白、驱动蛋白和动力蛋白,它们能够产生机械力。这些蛋白质对于单细胞生物的细胞运动和许多有性生殖多细胞生物的精子是必不可少的。它们还产生用于肌肉收缩的力,并在细胞内运输中发挥重要作用。

学习方法

可以在体外、体内和计算机中检查蛋白质活性和结构。在受控环境中对纯化蛋白质进行体外研究有助于研究蛋白质如何发挥其功能。例如,酶动力学研究探索了酶催化活性的化学机制及其对各种可能的底物分子的相对亲和力。相比之下,体内实验可以提供有关蛋白质在细胞甚至整个生物体中的生理作用的信息。计算机模拟研究使用计算方法来研究蛋白质。

蛋白质纯化

要进行体外分析,必须从其他细胞成分中纯化蛋白质。该过程通常从细胞裂解开始,此时细胞膜被破坏,其内部内容物被释放到称为粗裂解液的溶液中。得到的混合物可以使用超速离心法进行纯化,将各种细胞成分分馏成可溶的含蛋白质的部分;脂质和蛋白质膜;细胞器和核酸。通过称为盐诱导沉淀的方法进行沉淀可以从这些裂解物中浓缩蛋白质。然后使用不同类型的色谱法根据分子量、净电荷和结合亲和力等特性分离所需的蛋白质。如果所需蛋白质的分子量和等电点已知,则可以使用各种类型的凝胶电泳来监测纯化程度,如果蛋白质具有可区分的光谱特征,则可以通过光谱学,或者如果蛋白质具有酶活性,则可以通过酶分析来监测。此外,蛋白质可以根据它们的电荷使用电聚焦进行分离对于天然蛋白质,可能需要一系列纯化步骤才能获得足够纯的用于实验室应用的蛋白质。为了简化这一过程,通常使用基因工程为蛋白质添加化学特性,使其更容易纯化,而不会影响其结构或活性。这里,一个由特定氨基酸序列组成的“标记”,通常是一系列组氨酸残基(“His-marker”),连接到蛋白质的一端。因此,当裂解液通过含镍色谱柱时,组氨酸残基与镍结合并粘附在色谱柱上,而裂解液中未标记的成分则畅通无阻地通过。已经开发了许多不同的标签来帮助研究人员从复杂的混合物中纯化特定的蛋白质。

移动本地化

体内蛋白质的研究通常涉及蛋白质在细胞内的合成和定位。尽管许多细胞内蛋白是在细胞质中合成的,而膜结合蛋白或分泌蛋白是在内质网 (ER) 中合成的,但蛋白质靶向特定细胞器或结构的具体方式通常尚不清楚。评估细胞定位的一种有用技术是使用基因工程在细胞内表达融合蛋白或嵌合体,该融合蛋白或嵌合体由与“报告基因”相关的天然存在的蛋白质组成,例如绿色荧光蛋白 (GFP)。如图所示,可以使用显微镜干净有效地观察细胞内融合蛋白的位置。描述蛋白质细胞位置的其他方法需要使用区域标记,例如 ER、高尔基体、溶酶体或液泡、线粒体、叶绿体、质膜等。通过使用荧光(荧光)标记物或标记物的抗体,可以更容易地识别所需的蛋白质定位。例如,间接免疫荧光将允许荧光共定位和现场演示。出于相同目的,荧光染料用于标记细胞区室,也存在其他可能性。例如,免疫组织化学通常使用针对一种或多种感兴趣蛋白质的抗体,这些蛋白质与酶结合,产生发光或显色信号,可以在样品之间进行比较,从而启用本地化信息。另一种可以应用的技术是在蔗糖(或其他材料)梯度中使用等径离心进行共分馏。虽然这种技术不能证明具有已知密度和所需蛋白质的隔室的共定位,但它确实增加了可能性,并且更适合大规模研究。细胞定位的金标准方法是免疫电子显微镜。该技术还使用针对目标蛋白质的抗体,使用经典电子显微镜技术。样品准备用于常规电子显微镜检查,然后给予抗所需蛋白质的抗体,该蛋白质与高电密度材料(通常是金)结合。它允许本地化,通过另一种称为定点诱变的基因工程的应用,研究人员能够改变蛋白质序列和结构、细胞定位和对调节的敏感性。该技术甚至允许使用修饰的 tRNA 将非天然氨基酸掺入蛋白质中,并使具有新特性的新蛋白质的合理设计成为可能。并能够合理设计具有新特性的新蛋白质。并能够合理设计具有新特性的新蛋白质。

蛋白质组学

细胞或细胞类型中任何时候存在的补体蛋白的数量被称为蛋白质瘤,对大规模数据集的研究是蛋白质组学,它以其基因组学的基因组学命名。蛋白质组学中的主要实验技术包括允许分离多种蛋白质的二维电泳、允许高速鉴定蛋白质和快速测序肽(最常见的是在凝胶中消化后)的质谱、允许检测数量的蛋白质微排列凝胶中存在的各种蛋白质、相关细胞和允许系统探索蛋白质-蛋白质相互作用的双杂交筛选。这种相互作用的生物学上可能的互补物的数量被称为相互作用瘤。确定代表每个可能折叠的蛋白质结构的系统尝试被称为结构基因组学。

生物信息学

已经开发了各种计算方法来分析蛋白质的结构、功能和进化。这些方法的发展是由可用于广泛生物体(包括人类基因组)的大量基因组和蛋白质组数据驱动的。不可能通过实验研究所有蛋白质,因此只有少数蛋白质进行实验室实验。同时,计算工具被用来推断相似的蛋白质。通过序列并置,可以在密切相关的生物体中有效地鉴定同源蛋白质。可以使用各种工具搜索基因组和基因序列以获取特定属性。序列分析工具可以定位限制酶位点,读取核苷酸序列中的开放框架,并预测蛋白质二级结构。可以使用 ClustalW 等专门软件创建系统发育树并开发进化假设,以找出现代生物的祖先及其表达的基因。生物信息学领域对于基因和蛋白质分析是必不可少的。

结构测定

蛋白质的三级结构或蛋白质复合物的四级结构的发现可以提供关于蛋白质如何发挥其功能以及该功能如何受到影响的重要线索,例如在药物设计中。由于蛋白质太小而无法在光学显微镜下看到,因此必须使用其他方法来确定它们的结构。常见的实验方法包括 X 射线晶体学和核磁共振光谱,这两种方法都可以在原子分辨率下产生结构信息。核磁共振实验能够提供信息,从中可以估计原子对之间的距离子集,并通过解决距离几何问题确定蛋白质的最终可能构象。双偏振干涉测量法是一种定量分析方法,用于测量由于相互作用或其他刺激引起的整体蛋白质构象和构象变化。圆二色性是另一种确定蛋白质内部α-或β-折叠组成的实验室技术。冷冻电子显微镜用于产生关于非常大的蛋白质复合物(包括组装病毒)的低分辨率结构信息;在某些情况下,一种称为电子晶体学的变体也可以产生高分辨率信息,特别是对于二维膜蛋白晶体。完成的结构通常存储在蛋白质数据库(PDB)中,数以千计的蛋白质结构数据的免费可用资源,可以以笛卡尔坐标的形式获得蛋白质中每个原子的基因序列,而不是蛋白质的结构。此外,解析的蛋白质结构集倾向于偏向于易于经受 X 射线晶体学所需条件的蛋白质,X 射线晶体学是蛋白质结构测定的主要方法之一。特别是,球状蛋白质相对容易结晶,作为 X 射线晶体学的准备。相比之下,膜蛋白和大蛋白复合物难以结晶并且在 PDB 中代表性不足。结构基因组学试图通过系统地解决主要折叠类别的代表性结构来弥补这一缺陷。蛋白质结构预测方法试图寻找方法为结构尚未通过实验确定的蛋白质生成合理的结构。

结构预测与模拟

为了补充结构基因组学领域,蛋白质结构预测开发了有效的蛋白质数学模型,以在理论上通过计算预测分子形成,而不是通过实验室观察来检测结构。最成功的结构预测类型,称为同源建模,依赖于与被建模蛋白质序列相似的“模板”结构的存在;结构基因组学的目标是提供解析结构的充分表示,以模拟大部分剩余结构。当只有远程相关的模板结构可用时,生成准确的模型仍然是一个挑战,得出的结论是,序列比对是该过程中的瓶颈,因为如果知道“完美”的序列比对,则可以生成足够准确的模型。许多结构预测方法为蛋白质工程领域提供了信息,当设计了新的蛋白质折叠时,蛋白质工程领域才刚刚出现。一个更复杂的计算问题是分子间相互作用的预测,例如分子连接和蛋白质-蛋白质相互作用的预测。模拟蛋白质折叠和结合动态过程的数学模型涉及分子力学,特别是分子动力学。 Monte Carlo 技术利用并行和分布式计算的进步(例如,在 GPU 上执行分子建模的 Folding@home 项目)促进了计算。计算机模拟发现了小折叠的 alpha 螺纹蛋白结构域,例如 vilin 蛋白的头部部分和 HIV 辅助蛋白。将标准分子动力学与量子力学数学相结合的混合方法探索了视紫红质的电子状态。

蛋白质紊乱和非结构化预测

许多蛋白质(在约 33% 的真核生物中)包含大的非结构化但具有生物学功能的片段,可以归类为本质上无组织的蛋白质。因此,预测和分析蛋白质异常是表征蛋白质结构的重要组成部分。

营养

大多数微生物和植物都可以通过生物合成产生所有 20 种标准氨基酸,而动物(包括人类)必须从食物中获取一些氨基酸。生物体不能合成的氨基酸称为必需氨基酸。合成某些氨基酸的关键酶在动物中不存在,例如天冬氨酸激酶,它催化从天冬氨酸合成赖氨酸、蛋氨酸和苏氨酸的第一步。如果环境中存在氨基酸,微生物可以通过从环境中摄取氨基酸并衍生其生物合成途径来节省能量。在动物中,氨基酸是通过食用含有蛋白质的食物获得的。摄入的蛋白质然后通过消化分解成氨基酸,这通常涉及通过暴露于酸和被称为蛋白酶的酶水解而使蛋白质变性。一些摄入的氨基酸用于蛋白质生物合成,而另一些则通过糖异生转化为葡萄糖,或纳入柠檬酸循环。在饥饿的情况下,使用蛋白质作为燃料非常重要,因为它可以让身体的蛋白质用于维持生命,尤其是肌肉中的蛋白质。皮肤上的恶臭。劣质蛋白质还会增加狗的肠胃胀气和气味化合物的可能性,从而在胃肠道健康中发挥作用,因为当蛋白质以未消化的状态到达大肠时,它们会被发酵产生硫化氢、吲哚和粪臭素气体。狗和猫比植物蛋白更好地消化动物蛋白,但劣质动物产品消化不良,包括皮肤、毛皮和结缔组织。蛋白质缺乏会导致脱发(头发由 97-100% 的角蛋白组成)以饥饿、蛋白质缺乏症。持续的蛋白质缺乏会导致消瘦并导致死亡。美国生物化学家 Thomas Osborne Lafayete Mendel 的研究,耶鲁大学生物化学教授,1914,测试了从肉类和植物到兔子的消耗蛋白质。一组兔子喂食动物蛋白食物,另一组喂食植物蛋白。从他的实验中发现,获得动物蛋白的兔子比获得植物蛋白的兔子增重更快。后来由伯克利大学麦凯进行的一项研究表明,接受植物性蛋白质的兔子更健康,寿命延长一倍。伯克利大学麦凯的研究表明,接受植物性蛋白质的兔子更健康,寿命延长一倍。伯克利大学麦凯的研究表明,接受植物性蛋白质的兔子更健康,寿命延长一倍。

化学分析

有机物的含氮量主要由蛋白质中的氨基构成。总凯氏氮 (TKN) 是一种氮的量度,广泛用于水(废物)、土壤、食品、饲料和一般有机物的分析。顾名思义,应用凯氏定氮法对其进行分析。但是,也可以使用其他更灵敏的方法。

参考

教科书

外部链接

数据库和项目

NCBI 蛋白质数据库 Entrez NCBI 蛋白质结构数据库 人类蛋白质参考数据库 Folding@Home(斯坦福大学)欧洲蛋白质数据库(另见 PDBeQuips,有趣的短文和 GDP 结构指南)结构生物信息学研究合作实验室(另见本月分子存档) 2020 年 7 月 24 日在 Wayback Machine 上,展示了关于从 PDB 中选择的蛋白质的简要说明)Proteopedia – Life in 3D:一个旋转和放大的 3D 模型,带有每个已知蛋白质分子结构的维基注释。UniProt,通用蛋白质资源

教育和指南网站

来自 HOPES(斯坦福大学亨廷顿病教育外展项目)的“蛋白质简介”蛋白质:生物发生到降解 - britannica.com 上的蛋白质生物化学和细胞生物学虚拟图书馆