아미노산 서열을 위한 단백질 분자량 계산기

아미노산 서열을 기반으로 단백질의 분자량을 계산합니다. 표준 1자리 코드를 사용하여 단백질 서열을 입력하면 달톤 단위로 정확한 분자량을 얻을 수 있습니다.

단백질 분자량 추정기

아미노산 서열을 기반으로 단백질의 분자량을 계산합니다.

표준 1자리 아미노산 코드 사용 (A, R, N, D, C 등)

이 계산기에 대하여

이 계산기는 아미노산 서열을 기반으로 단백질의 분자량을 추정합니다.

계산은 아미노산의 표준 분자량과 펩타이드 결합 형성 중의 수분 손실을 고려합니다.

정확한 결과를 위해 표준 1자리 코드를 사용하여 유효한 아미노산 서열을 입력하세요.

📚

문서화

단백질 분자량 계산기

소개

단백질 분자량 계산기는 단백질 과학자, 분자 생물학자 및 생화학자에게 필수적인 도구로, 아미노산 서열에 기반하여 단백질의 질량을 결정하는 데 필요합니다. 단백질은 아미노산 사슬로 구성된 복잡한 거대 분자로, 그 분자량을 아는 것은 다양한 실험실 기술, 실험 설계 및 데이터 분석에 중요합니다. 이 계산기는 아미노산 서열을 사용하여 어떤 단백질의 분자량을 신속하고 정확하게 추정할 수 있는 방법을 제공하여 연구자들에게 귀중한 시간을 절약하고 계산 오류의 가능성을 줄입니다.

단백질 분자량은 종종 달톤(Da) 또는 킬로달톤(kDa)으로 표현되며, 이는 단백질 내 모든 아미노산의 개별 질량의 합을 나타내며, 펩타이드 결합 형성 중 손실된 물 분자를 고려합니다. 이 기본 속성은 용액 내 단백질의 행동, 전기영동 이동성, 결정화 특성 및 연구 및 산업 응용에서 중요한 많은 다른 물리적 및 화학적 특성에 영향을 미칩니다.

사용자 친화적인 이 계산기는 단백질의 아미노산 서열을 한 글자 코드로 입력하기만 하면 정확한 분자량 추정치를 생성하므로, 경험이 풍부한 연구자와 단백질 과학에 새로 접하는 학생 모두에게 접근 가능합니다.

단백질 분자량 계산 방법

기본 공식

단백질의 분자량은 다음 공식을 사용하여 계산됩니다:

MWprotein=i=1nMWaminoacidi(n1)×MWwater+MWwaterMW_{protein} = \sum_{i=1}^{n} MW_{amino acid_i} - (n-1) \times MW_{water} + MW_{water}

여기서:

  • MWproteinMW_{protein}은 달톤(Da) 단위의 전체 단백질의 분자량입니다.
  • i=1nMWaminoacidi\sum_{i=1}^{n} MW_{amino acid_i}는 모든 개별 아미노산의 분자량의 합입니다.
  • nn은 서열 내 아미노산의 수입니다.
  • MWwaterMW_{water}는 물의 분자량(18.01528 Da)입니다.
  • (n1)(n-1)은 형성된 펩타이드 결합의 수를 나타냅니다.
  • 마지막 +MWwater+ MW_{water} 항은 말단 그룹(H와 OH)을 고려합니다.

아미노산 분자량

계산은 20개의 일반 아미노산의 표준 분자량을 사용합니다:

아미노산한 글자 코드분자량 (Da)
알라닌A71.03711
아르기닌R156.10111
아스파라긴N114.04293
아스파르트산D115.02694
시스테인C103.00919
글루탐산E129.04259
글루타민Q128.05858
글리신G57.02146
히스티딘H137.05891
이소류신I113.08406
류신L113.08406
라이신K128.09496
메티오닌M131.04049
페닐알라닌F147.06841
프롤린P97.05276
세린S87.03203
트레오닌T101.04768
트립토판W186.07931
티로신Y163.06333
발린V99.06841

펩타이드 결합 형성 시 물 손실

아미노산이 결합하여 단백질을 형성할 때, 펩타이드 결합을 생성합니다. 이 과정에서 결합이 형성될 때마다 물 분자(H₂O)가 방출됩니다. 이 물 손실은 분자량 계산에서 고려해야 합니다.

n개의 아미노산을 가진 단백질의 경우, (n-1)개의 펩타이드 결합이 형성되어 (n-1)개의 물 분자가 손실됩니다. 그러나 우리는 말단 그룹(N-말단의 H와 C-말단의 OH)을 고려하기 위해 하나의 물 분자를 다시 추가합니다.

예제 계산

간단한 트리펩타이드인 Ala-Gly-Ser (AGS)의 분자량을 계산해 보겠습니다.

  1. 개별 아미노산의 질량을 합산합니다:

    • 알라닌 (A): 71.03711 Da
    • 글리신 (G): 57.02146 Da
    • 세린 (S): 87.03203 Da
    • 총합: 215.0906 Da
  2. 펩타이드 결합으로 인한 물 손실을 빼줍니다:

    • 펩타이드 결합의 수 = 3-1 = 2
    • 물 분자량 = 18.01528 Da
    • 총 물 손실 = 2 × 18.01528 = 36.03056 Da
  3. 말단 그룹을 위해 하나의 물 분자를 다시 추가합니다:

    • 18.01528 Da
  4. 최종 분자량:

    • 215.0906 - 36.03056 + 18.01528 = 197.07532 Da

이 계산기를 사용하는 방법

단백질 분자량 계산기를 사용하는 것은 간단합니다:

  1. 단백질 서열을 입력합니다. 표준 한 글자 아미노산 코드를 사용하세요 (A, R, N, D, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V).

  2. 계산기는 자동으로 입력을 검증하여 유효한 아미노산 코드만 포함되어 있는지 확인합니다.

  3. "분자량 계산" 버튼을 클릭하거나 자동 계산이 완료될 때까지 기다립니다.

  4. 결과를 확인합니다. 여기에는 다음이 포함됩니다:

    • 달톤(Da) 단위로 계산된 분자량
    • 서열 길이(아미노산 수)
    • 아미노산 조성의 세부 사항
    • 계산에 사용된 공식
  5. 결과를 복사하려면 "복사" 버튼을 클릭하여 보고서나 추가 분석에 사용할 수 있습니다.

입력 지침

정확한 결과를 위해 단백질 서열을 입력할 때 다음 지침을 따르세요:

  • 표준 한 글자 아미노산 코드만 사용하세요 (대문자 또는 소문자).
  • 공백, 숫자 또는 특수 문자를 포함하지 마세요.
  • 서열 번호와 같은 비아미노산 문자를 제거하세요.
  • 비표준 아미노산이 포함된 서열의 경우, 확장 아미노산 코드를 지원하는 대체 도구를 사용하는 것을 고려하세요.

결과 해석

계산기는 여러 가지 정보를 제공합니다:

  1. 분자량: 단백질의 예상 분자량을 달톤(Da) 단위로 나타냅니다. 더 큰 단백질의 경우, 이는 킬로달톤(kDa)으로 표현될 수 있습니다.

  2. 서열 길이: 서열 내 총 아미노산 수입니다.

  3. 아미노산 조성: 단백질의 아미노산 함량에 대한 시각적 분해로, 각 아미노산의 수와 비율을 보여줍니다.

  4. 계산 방법: 분자량이 계산된 방법에 대한 명확한 설명과 사용된 공식을 포함합니다.

사용 사례

단백질 분자량 계산기는 생명 과학의 다양한 분야에서 수많은 응용 프로그램을 가지고 있습니다:

단백질 정제 및 분석

연구자들은 분자량 정보를 사용하여:

  • 적절한 겔 여과 컬럼을 설정합니다.
  • SDS-PAGE를 위한 적절한 폴리아크릴아마이드 겔 농도를 결정합니다.
  • 질량 분석 데이터 해석합니다.
  • 단백질 발현 및 정제 결과를 검증합니다.

재조합 단백질 생산

생명공학 회사는 정확한 분자량 계산을 통해:

  • 발현 구조를 설계합니다.
  • 단백질 수율을 추정합니다.
  • 정제 전략을 개발합니다.
  • 최종 제품을 특성화합니다.

펩타이드 합성

펩타이드 화학자들은 분자량 계산을 사용하여:

  • 필요한 시작 물질의 양을 결정합니다.
  • 이론적 수율을 계산합니다.
  • 합성된 펩타이드의 정체성을 확인합니다.
  • 품질 관리를 위한 분석 방법을 설계합니다.

구조 생물학

구조 생물학자들은 분자량 정보를 필요로 합니다:

  • 결정화 실험을 설정합니다.
  • X선 회절 데이터 해석합니다.
  • 단백질 복합체 분석합니다.
  • 단백질-단백질 상호작용의 스토이키오메트리를 계산합니다.

제약 개발

약물 개발자는 단백질 분자량을 사용하여:

  • 치료 단백질을 특성화합니다.
  • 제형 전략을 개발합니다.
  • 분석 방법을 설계합니다.
  • 품질 관리 사양을 설정합니다.

학술 연구

학생들과 연구자들은 계산기를 사용하여:

  • 실험실 실험을 수행합니다.
  • 데이터 분석합니다.
  • 실험 설계를 합니다.
  • 교육 목적으로 사용합니다.

대안

우리의 단백질 분자량 계산기가 신속하고 정확한 추정을 제공하지만, 단백질 분자량을 결정하는 대체 접근법도 있습니다:

  1. 실험적 방법:

    • 질량 분석(MS): 매우 정확한 분자량 측정을 제공하며, 번역 후 수정도 감지할 수 있습니다.
    • 크기 배제 크로마토그래피(SEC): 수치적 반경에 기반하여 분자량을 추정합니다.
    • SDS-PAGE: 전기영동 이동성을 기반으로 대략적인 분자량을 제공합니다.
  2. 기타 계산 도구:

    • ExPASy ProtParam: 분자량 외에도 추가 단백질 매개변수를 제공합니다.
    • EMBOSS Pepstats: 단백질 서열에 대한 자세한 통계 분석을 제공합니다.
    • Protein Calculator v3.4: 이소전하점 및 소광 계수와 같은 추가 계산을 포함합니다.
  3. 전문 소프트웨어:

    • 비표준 아미노산 또는 번역 후 수정이 있는 단백질에 대해
    • 복잡한 단백질 조합 또는 다중 단백질에 대해
    • NMR 연구에 사용되는 동위 원소 표지 단백질에 대해

단백질 분자량 결정의 역사

분자량 개념은 19세기 초 존 돌턴이 그의 원자 이론을 제안한 이래 화학의 기본이었습니다. 그러나 단백질에 대한 적용은 더 최근의 역사입니다:

초기 단백질 과학 (1800년대-1920년대)

  • 1838년, 욘스 야콥 베르질리우스는 "단백질"이라는 용어를 그리스어 "proteios"에서 유래하였으며, "1차" 또는 "최우선"을 의미합니다.
  • 프레더릭 생어와 같은 초기 단백질 과학자들은 단백질이 아미노산으로 구성되어 있다는 것을 이해하기 시작했습니다.
  • 단백질이 정의된 분자량을 가진 거대 분자로서의 개념은 점진적으로 등장했습니다.

분석 기술의 발전 (1930년대-1960년대)

  • 1920년대 테오도르 스베르그에 의해 발명된 초원심분리기는 단백질 분자량의 최초의 정확한 측정을 가능하게 했습니다.
  • 1930년대 아르네 티셀리우스에 의해 개발된 전기영동 기술은 단백질 크기를 추정하는 또 다른 방법을 제공했습니다.
  • 1958년, 스탠포드 무어와 윌리엄 H. 스틴은 리보뉴클레이즈의 첫 번째 전체 아미노산 서열을 완성하여 정확한 분자량 계산을 가능하게 했습니다.

현대 시대 (1970년대-현재)

  • 질량 분석 기술의 발전은 단백질 분자량 결정에 혁신을 가져왔습니다.
  • 존 펜과 다나카 코이치는 2002년 생물학적 거대 분자의 질량 분석을 위한 부드러운 탈착 이온화 방법의 개발로 노벨 화학상을 수상했습니다.
  • 단백질 속성을 예측하기 위한 계산 방법은 점점 더 정교해지고 접근 가능해졌습니다.
  • 1990년대와 2000년대의 유전체학 및 단백질체학의 출현은 자동화된 분자량 계산기와 같은 고처리량 단백질 분석 도구에 대한 필요성을 창출했습니다.

오늘날 단백질 분자량 계산은 단백질 과학의 일상적인 부분이 되었으며, 전 세계 연구자들이 이러한 계산을 접근할 수 있도록 하는 도구인 우리의 계산기를 통해 용이해졌습니다.

코드 예제

다양한 프로그래밍 언어로 단백질 분자량을 계산하는 방법에 대한 예제입니다:

1' Excel VBA 단백질 분자량 계산 함수
2Function ProteinMolecularWeight(sequence As String) As Double
3    ' 아미노산 분자량
4    Dim aaWeights As Object
5    Set aaWeights = CreateObject("Scripting.Dictionary")
6    
7    ' 아미노산 질량 초기화
8    aaWeights("A") = 71.03711
9    aaWeights("R") = 156.10111
10    aaWeights("N") = 114.04293
11    aaWeights("D") = 115.02694
12    aaWeights("C") = 103.00919
13    aaWeights("E") = 129.04259
14    aaWeights("Q") = 128.05858
15    aaWeights("G") = 57.02146
16    aaWeights("H") = 137.05891
17    aaWeights("I") = 113.08406
18    aaWeights("L") = 113.08406
19    aaWeights("K") = 128.09496
20    aaWeights("M") = 131.04049
21    aaWeights("F") = 147.06841
22    aaWeights("P") = 97.05276
23    aaWeights("S") = 87.03203
24    aaWeights("T") = 101.04768
25    aaWeights("W") = 186.07931
26    aaWeights("Y") = 163.06333
27    aaWeights("V") = 99.06841
28    
29    ' 물 분자량
30    Const WATER_WEIGHT As Double = 18.01528
31    
32    ' 서열을 대문자로 변환
33    sequence = UCase(sequence)
34    
35    ' 총 질량 계산
36    Dim totalWeight As Double
37    totalWeight = 0
38    
39    ' 개별 아미노산 질량 합산
40    Dim i As Integer
41    For i = 1 To Len(sequence)
42        Dim aa As String
43        aa = Mid(sequence, i, 1)
44        
45        If aaWeights.Exists(aa) Then
46            totalWeight = totalWeight + aaWeights(aa)
47        Else
48            ' 유효하지 않은 아미노산 코드
49            ProteinMolecularWeight = -1
50            Exit Function
51        End If
52    Next i
53    
54    ' 펩타이드 결합으로 인한 물 손실 빼고 말단 물 추가
55    Dim numAminoAcids As Integer
56    numAminoAcids = Len(sequence)
57    
58    ProteinMolecularWeight = totalWeight - (numAminoAcids - 1) * WATER_WEIGHT + WATER_WEIGHT
59End Function
60
61' Excel에서 사용 예:
62' =ProteinMolecularWeight("ACDEFGHIKLMNPQRSTVWY")
63

자주 묻는 질문

단백질 분자량이란 무엇인가요?

단백질 분자량, 즉 분자 질량은 달톤(Da) 또는 킬로달톤(kDa)으로 표현되는 단백질 분자의 총 질량입니다. 이는 단백질 내 모든 원자의 질량의 합을 나타내며, 펩타이드 결합 형성 중 손실된 물 분자를 고려합니다. 이 기본 속성은 단백질 특성화, 정제 및 분석에 매우 중요합니다.

이 단백질 분자량 계산기의 정확도는 얼마나 되나요?

이 계산기는 아미노산 서열을 기반으로 이론적인 분자량을 매우 정확하게 제공합니다. 표준 단백질의 아미노산의 단일 동위체 질량을 사용하고 펩타이드 결합 형성 중 물 손실을 고려합니다. 그러나 번역 후 수정, 비표준 아미노산 또는 실제 단백질에 존재할 수 있는 동위 원소 변화를 고려하지 않습니다.

단백질 분자량의 단위는 무엇인가요?

단백질 분자량은 일반적으로 달톤(Da) 또는 킬로달톤(kDa)으로 표현되며, 1 kDa는 1,000 Da에 해당합니다. 달톤은 수소 원자의 질량(1.66 × 10^-24그램)과 대략 동일합니다. 참고로, 작은 펩타이드는 수백 Da일 수 있으며, 큰 단백질은 수백 kDa에 이를 수 있습니다.

계산된 분자량이 실험 값과 다른 이유는 무엇인가요?

계산된 분자량과 실험된 분자량 간의 불일치는 여러 요인에 의해 발생할 수 있습니다:

  1. 번역 후 수정(인산화, 당화 등)
  2. 이황화 결합 형성
  3. 단백질 분해
  4. 비표준 아미노산
  5. 실험 측정 오류
  6. 동위 원소 변동

수정된 단백질의 정확한 분자량 결정을 위해서는 질량 분석법을 권장합니다.

비표준 아미노산의 분자량을 계산할 수 있나요?

이 계산기는 한 글자 아미노산 코드(A, R, N, D, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V)만 지원합니다. 비표준 아미노산이 포함된 단백질의 경우, 비표준 아미노산 코드를 지원하는 대체 도구를 사용하는 것이 좋습니다.

아미노산 조성 결과를 어떻게 해석하나요?

아미노산 조성은 단백질 서열의 각 아미노산의 수와 비율을 보여줍니다. 이 정보는 다음에 유용합니다:

  • 단백질의 물리적 특성을 이해하기 위해
  • 관심 영역(예: 소수성 패치)을 식별하기 위해
  • 실험 절차 계획을 위해(예: 분광 측정)
  • 종 간 유사 단백질 비교를 위해

평균 분자량과 단일 동위체 분자량의 차이는 무엇인가요?

  • 단일 동위체 분자량은 각 원소의 가장 풍부한 동위체의 질량을 사용합니다(이 계산기가 제공하는 것).
  • 평균 분자량은 자연적으로 발생하는 모든 동위체의 가중 평균을 사용합니다.

작은 펩타이드의 경우 차이는 미미하지만, 더 큰 단백질에서는 더 중요해질 수 있습니다. 질량 분석법은 작은 분자에 대해 단일 동위체 질량을 측정하고, 큰 분자에 대해 평균 질량을 측정하는 경향이 있습니다.

계산기는 N-말단 및 C-말단 그룹을 어떻게 처리하나요?

계산기는 표준 N-말단(NH₂-) 및 C-말단(-COOH) 그룹을 고려하여 펩타이드 결합 형성 중 손실된 물을 빼고 말단 그룹을 위해 하나의 물 분자를 추가합니다. 이는 계산된 분자량이 적절한 말단 그룹을 가진 전체 단백질을 나타내도록 보장합니다.

이황화 결합이 있는 단백질의 분자량을 계산할 수 있나요?

예, 하지만 이 계산기는 이황화 결합을 자동으로 조정하지 않습니다. 각 이황화 결합 형성은 두 개의 수소 원자(2.01588 Da)의 손실을 초래합니다. 이황화 결합을 고려하려면 계산된 분자량에서 각 이황화 결합에 대해 2.01588 Da를 빼야 합니다.

단백질 분자량은 단백질 크기와 어떤 관계가 있나요?

단백질 분자량은 단백질 크기와 상관관계가 있지만, 그 관계는 항상 간단하지 않습니다. 단백질의 물리적 크기에 영향을 미치는 요인은 다음과 같습니다:

  • 아미노산 조성
  • 이차 및 삼차 구조
  • 수화 껍질
  • 번역 후 수정
  • 환경 조건(pH, 염 농도)

대략적으로, 10 kDa의 구형 단백질은 약 2-3 nm의 직경을 가집니다.

참고 문헌

  1. Gasteiger E., Hoogland C., Gattiker A., Duvaud S., Wilkins M.R., Appel R.D., Bairoch A. (2005) ExPASy 서버의 단백질 식별 및 분석 도구. In: Walker J.M. (eds) 단백질체학 프로토콜 핸드북. Humana Press.

  2. Nelson, D. L., & Cox, M. M. (2017). Lehninger 생화학 원리 (7판). W.H. Freeman and Company.

  3. Steen, H., & Mann, M. (2004). 펩타이드 서열 결정의 ABC(및 XYZ). Nature Reviews Molecular Cell Biology, 5(9), 699-711.

  4. Voet, D., Voet, J. G., & Pratt, C. W. (2016). 생화학의 기초: 분자 수준에서의 생명 (5판). Wiley.

  5. Creighton, T. E. (2010). 핵산 및 단백질의 생물물리화학. Helvetian Press.

  6. UniProt Consortium. (2021). UniProt: 2021년의 범용 단백질 지식 기반. Nucleic Acids Research, 49(D1), D480-D489.

  7. Artimo, P., Jonnalagedda, M., Arnold, K., Baratin, D., Csardi, G., de Castro, E., Duvaud, S., Flegel, V., Fortier, A., Gasteiger, E., Grosdidier, A., Hernandez, C., Ioannidis, V., Kuznetsov, D., Liechti, R., Moretti, S., Mostaguir, K., Redaschi, N., Rossier, G., Xenarios, I., & Stockinger, H. (2012). ExPASy: SIB 생물정보학 리소스 포털. Nucleic Acids Research, 40(W1), W597-W603.

  8. Kinter, M., & Sherman, N. E. (2005). 질량 분석을 사용한 단백질 서열 결정 및 식별. Wiley-Interscience.

오늘 단백질 분자량 계산기를 사용하여 단백질 서열의 분자량을 신속하고 정확하게 결정하세요. 실험 계획, 결과 분석 또는 단백질 생화학에 대해 배우는 데 필요한 정보를 몇 초 만에 제공합니다.