Cấu trúc bậc một của protein

Cấu trúc bậc một của protein là chuỗi thẳng của các amino acid trong một chuỗi peptide hay protein.[1] Theo quy ước, cấu trúc bậc một của một protein được tính bắt đầu từ đầu amino-tận cùng (N) đến đầu carboxyl-tận cùng (C). Quá trình sinh tổng hợp protein thường được thực hiện bởi ribosome trong tế bào. Peptide cũng có thể được tổng hợp trong phòng thí nghiệm. Cấu trúc bậc một của protein có thể được giải trình tự trực tiếp, hoặc suy ra từ trình tự DNA.

Cấu trúc bậc một là chuỗi trình tự các amino acid. Trên hình là một mẫu trình tự lặp lại của protein sợi

Sự hình thành

sửa

Sinh học

sửa

amino acid được polyme hóa thông qua các liên kết peptide tạo thành một mạch "xương sống" dài, với các chuỗi bên amino acid khác nhau nhô ra dọc theo nó. Trong các hệ thống sinh học, các protein được tạo ra trong quá trình dịch mã bởi các ribosome của tế bào. Một số sinh vật cũng có thể tạo ra các chuỗi peptide ngắn bằng tổng hợp peptide không ribosome, thường sử dụng các amino acid khác với 20 loại tiêu chuẩn, và có thể được vòng hóa, biến đổi hoặc liên kết chéo.

Hóa học

sửa

Peptide có thể được tổng hợp hóa học thông qua một loạt các phương pháp dùng trong phòng thí nghiệm. Các phương pháp hóa học thường tổng hợp peptide theo trình tự ngược lại với tổng hợp protein sinh học (túc là bắt đầu từ đầu cuối C ngược trở lại).

Ký hiệu

sửa

Trình tự protein thường được ký hiệu bằng một chuỗi các chữ cái, liệt kê các amino acid bắt đầu từ đầu cuối thiết bị đầu amino đến đầu tận cùng carboxyl. Có thể sử dụng mã ba chữ cái hoặc mã một chữ cái để thể hiện 20 amino acid tự nhiên, cũng như ký hiệu một tổ hợp hoặc amino acid còn mơ hồ (tương tự ký hiệu axit nucleic).[1][2][3]

Peptide có thể được giải trình tự trực tiếp, hoặc suy ra từ chuỗi DNA. Các cơ sở dữ liệu trình tự lớn được lập ra để lưu và so sánh các chuỗi protein đã biết.

Ký hiệu cho 20 amino acid tự nhiên
amino acid 3 chữ cái[4] 1-chữ cái[4]
Alanine Ala A
Arginine Arg R
Asparagine Asn N
Axit aspartic Asp D
Cysteine Cys C
Axit glutamic Glu E
Glutamine Gln Q
Glycine Gly G
Histidine His H
Isoleucine Ile I
Leucine Leu L
Lysine Lys K
Methionine Met M
Phenylalanine Phe F
Proline Pro P
Serine Ser S
Threonine Thr T
Tryptophan Trp W
Tyrosine Tyr Y
Valine Val V
Ký hiệu cho các amino acid không chắc chắn
Ký hiệu Mô tả amino acid thể hiện
X Bất cứ acid nào, hoặc không biết Tất cả
B Aspartate hoặc Asparagine D, N
Z Glutamate hoặc Glutamine E, Q
J Leucine hoặc Isoleucine I, L
Φ Kỵ nước V, I, L, F, W, Y, M
Ω Hợp chất có vòng F, W, Y, H
Ψ Hợp chất không vòng V, I, L, M
π Nhỏ P, G, A, S
ζ Ưa nước S, T, H, N, Q, E, D, K, R
+ Tích điện dương K, R, H
- Tích điện âm D, E

Chú thích

sửa
  1. ^ a b SANGER F (1952). “The arrangement of amino acids in proteins”. Adv. Protein Chem. 7: 1–67. doi:10.1016/S0065-3233(08)60017-0. PMID 14933251.
  2. ^ Aasland, Rein; Abrams, Charles; Ampe, Christophe; Ball, Linda J.; Bedford, Mark T.; Cesareni, Gianni; Gimona, Mario; Hurley, James H.; Jarchau, Thomas (ngày 20 tháng 2 năm 2002). “Normalization of nomenclature for peptide motifs as ligands of modular protein domains”. FEBS Letters. 513 (1): 141–144. doi:10.1016/S0014-5793(01)03295-1. ISSN 1873-3468.
  3. ^ Aasland R, Abrams C, Ampe C, Ball LJ, Bedford MT, Cesareni G, Gimona M, Hurley JH, Jarchau T, Lehto VP, Lemmon MA, Linding R, Mayer BJ, Nagai M, Sudol M, Walter U, Winder SJ (ngày 1 tháng 7 năm 1968). “A One-Letter Notation for Amino Acid Sequences*”. European Journal of Biochemistry. 5 (2): 151–153. doi:10.1111/j.1432-1033.1968.tb00350.x. ISSN 1432-1033. PMID 11911894.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
  4. ^ a b Hausman, Robert E.; Cooper, Geoffrey M. (2004). The cell: a molecular approach. Washington, D.C: ASM Press. tr. 51. ISBN 0-87893-214-3.