アミノ酸配列のためのタンパク質分子量計算機

アミノ酸配列に基づいてタンパク質の分子量を計算します。標準の1文字コードを使用してタンパク質配列を入力し、ダルトン単位で正確な分子量を取得してください。

タンパク質分子量推定器

アミノ酸配列に基づいてタンパク質の分子量を計算します。

標準の1文字アミノ酸コード(A、R、N、D、Cなど)を使用してください

この計算機について

この計算機は、アミノ酸配列に基づいてタンパク質の分子量を推定します。

計算は、アミノ酸の標準分子量とペプチド結合形成中の水の損失を考慮しています。

正確な結果を得るために、標準の1文字コードを使用して有効なアミノ酸配列を入力してください。

📚

ドキュメンテーション

タンパク質分子量計算機

はじめに

タンパク質分子量計算機は、タンパク質のアミノ酸配列に基づいて質量を決定する必要がある生化学者、分子生物学者、タンパク質科学者にとって不可欠なツールです。タンパク質はアミノ酸鎖から構成される複雑な高分子であり、その分子量を知ることは様々な実験室技術、実験設計、データ分析において重要です。この計算機は、アミノ酸配列を使用して任意のタンパク質の分子量を迅速かつ正確に推定する方法を提供し、研究者の貴重な時間を節約し、計算エラーの可能性を減少させます。

タンパク質分子量は通常ダルトン(Da)またはキロダルトン(kDa)で表され、タンパク質内のすべてのアミノ酸の個々の重量の合計を表し、ペプチド結合形成中に失われる水分子を考慮に入れています。この基本的な特性は、溶液中のタンパク質の挙動、電気泳動の移動度、結晶化特性、研究および産業用途において重要な他の多くの物理的および化学的特性に影響を与えます。

私たちのユーザーフレンドリーな計算機は、タンパク質のアミノ酸配列の1文字コードを入力するだけで、正確な分子量の推定値を生成します。これにより、経験豊富な研究者とタンパク質科学に新しく入った学生の両方にアクセス可能です。

タンパク質分子量の計算方法

基本式

タンパク質の分子量は、以下の式を使用して計算されます:

MWprotein=i=1nMWaminoacidi(n1)×MWwater+MWwaterMW_{protein} = \sum_{i=1}^{n} MW_{amino acid_i} - (n-1) \times MW_{water} + MW_{water}

ここで:

  • MWproteinMW_{protein}は、ダルトン(Da)で表される全体のタンパク質の分子量です。
  • i=1nMWaminoacidi\sum_{i=1}^{n} MW_{amino acid_i}は、すべての個々のアミノ酸の分子量の合計です。
  • nnは配列中のアミノ酸の数です。
  • MWwaterMW_{water}は水の分子量(18.01528 Da)です。
  • (n1)(n-1)は形成されたペプチド結合の数を表します。
  • 最後の+MWwater+ MW_{water}項は、末端基(N末端のHおよびC末端のOH)を考慮に入れています。

アミノ酸の分子量

計算には、20種類の一般的なアミノ酸の標準的な分子量が使用されます:

アミノ酸1文字コード分子量 (Da)
アラニンA71.03711
アルギニンR156.10111
アスパラギンN114.04293
アスパラギン酸D115.02694
システインC103.00919
グルタミン酸E129.04259
グルタミンQ128.05858
グリシンG57.02146
ヒスチジンH137.05891
イソロイシンI113.08406
ロイシンL113.08406
リシンK128.09496
メチオニンM131.04049
フェニルアラニンF147.06841
プロリンP97.05276
セリンS87.03203
スレオニンT101.04768
トリプトファンW186.07931
チロシンY163.06333
バリンV99.06841

ペプチド結合形成における水の損失

アミノ酸が結合してタンパク質を形成する際、ペプチド結合が生成されます。この過程で、形成される結合ごとに水分子(H₂O)が放出されます。この水の損失は、分子量の計算において考慮する必要があります。

n個のアミノ酸を持つタンパク質の場合、(n-1)のペプチド結合が形成され、(n-1)の水分子が失われます。しかし、末端基(N末端のHおよびC末端のOH)を考慮するために、1つの水分子を加えます。

例の計算

単純なトリペプチド:アラニン-グリシン-セリン(AGS)の分子量を計算してみましょう。

  1. 各アミノ酸の重量を合計します:

    • アラニン(A):71.03711 Da
    • グリシン(G):57.02146 Da
    • セリン(S):87.03203 Da
    • 合計:215.0906 Da
  2. ペプチド結合からの水の損失を引きます:

    • ペプチド結合の数 = 3-1 = 2
    • 水の分子量 = 18.01528 Da
    • 合計水の損失 = 2 × 18.01528 = 36.03056 Da
  3. 末端基のために1つの水分子を加えます:

    • 18.01528 Da
  4. 最終的な分子量:

    • 215.0906 - 36.03056 + 18.01528 = 197.07532 Da

この計算機の使い方

タンパク質分子量計算機の使用は簡単です:

  1. タンパク質配列を入力します。標準の1文字アミノ酸コード(A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y、V)を使用してください。

  2. 計算機は、入力を自動的に検証し、有効なアミノ酸コードのみを含むことを確認します。

  3. **「分子量を計算」**ボタンをクリックするか、自動計算が完了するのを待ちます。

  4. 結果を表示します。これには以下が含まれます:

    • ダルトン(Da)での計算された分子量
    • 配列の長さ(アミノ酸の数)
    • アミノ酸組成の内訳
    • 計算に使用された式
  5. 結果をクリップボードにコピーするには、「コピー」ボタンをクリックして、レポートやさらなる分析に使用します。

入力ガイドライン

正確な結果を得るために、タンパク質配列を入力する際には以下のガイドラインに従ってください:

  • 標準の1文字アミノ酸コード(大文字または小文字)のみを使用してください。
  • スペース、数字、特殊文字を含めないでください。
  • 配列番号などの非アミノ酸文字を削除してください。
  • 非標準アミノ酸を含む配列の場合は、拡張アミノ酸コードをサポートする別のツールを使用してください。

結果の解釈

計算機は以下の情報を提供します:

  1. 分子量:タンパク質の推定分子量(ダルトン(Da))。大きなタンパク質の場合、これはキロダルトン(kDa)で表されることがあります。

  2. 配列の長さ:配列内のアミノ酸の総数。

  3. アミノ酸組成:タンパク質のアミノ酸含量の視覚的内訳を表示し、各アミノ酸のカウントと割合を示します。

  4. 計算方法:分子量がどのように計算されたかの明確な説明を提供し、使用された式を含みます。

使用例

タンパク質分子量計算機は、ライフサイエンスのさまざまな分野で多数のアプリケーションがあります:

タンパク質の精製と分析

研究者は分子量情報を使用して:

  • 適切なゲルろ過カラムを設定する
  • SDS-PAGEのための適切なポリアクリルアミドゲル濃度を決定する
  • 質量分析データを解釈する
  • タンパク質の発現と精製結果を検証する

再組換えタンパク質の生産

バイオテクノロジー企業は正確な分子量計算に依存して:

  • 発現構造を設計する
  • タンパク質の収量を推定する
  • 精製戦略を開発する
  • 最終製品を特性評価する

ペプチド合成

ペプチド化学者は分子量計算を使用して:

  • 必要な出発材料の量を決定する
  • 理論的収量を計算する
  • 合成されたペプチドの同一性を検証する
  • 品質管理のための分析方法を設計する

構造生物学

構造生物学者は分子量情報を必要とします:

  • 結晶化試験を設定する
  • X線回折データを解釈する
  • タンパク質複合体を分析する
  • タンパク質間相互作用のストイキオメトリーを計算する

製薬開発

薬剤開発者はタンパク質分子量を使用して:

  • 治療用タンパク質を特性評価する
  • 製剤戦略を開発する
  • 分析方法を設計する
  • 品質管理の仕様を確立する

学術研究

学生や研究者は計算機を使用して:

  • 実験室実験を行う
  • データ分析を行う
  • 実験設計を行う
  • 教育目的で使用する

代替手段

私たちのタンパク質分子量計算機は迅速かつ正確な推定を提供しますが、タンパク質分子量を決定するための代替アプローチもあります:

  1. 実験的方法

    • 質量分析(MS):非常に正確な分子量測定を提供し、翻訳後修飾を検出できます。
    • サイズ排除クロマトグラフィー(SEC):水和半径に基づいて分子量を推定します。
    • SDS-PAGE:電気泳動の移動度に基づいておおよその分子量を提供します。
  2. 他の計算ツール

    • ExPASy ProtParam:分子量以外の追加のタンパク質パラメータを提供します。
    • EMBOSS Pepstats:タンパク質配列の詳細な統計分析を提供します。
    • Protein Calculator v3.4:等電点や消失係数などの追加計算を含みます。
  3. 専門ソフトウェア

    • 非標準アミノ酸や翻訳後修飾を持つタンパク質のために
    • 複雑なタンパク質集合体や多量体タンパク質のために
    • NMR研究に使用される同位体標識タンパク質のために

タンパク質分子量決定の歴史

分子量の概念は、19世紀初頭にジョン・ダルトンが原子論を提唱して以来、化学の基本的な要素です。しかし、タンパク質への応用はより最近の歴史を持っています:

初期のタンパク質科学(1800年代-1920年代)

  • 1838年、ヨンス・ヤコブ・ベルツリウスは「タンパク質」という用語を「第一の重要性」を意味するギリシャ語「プロテイオス」から造りました。
  • フレデリック・サンガーのような初期のタンパク質科学者は、タンパク質がアミノ酸から構成されていることを理解し始めました。
  • 定義された分子量を持つ高分子としてのタンパク質の概念は徐々に浮上しました。

分析技術の発展(1930年代-1960年代)

  • テオドール・スヴェルグによる1920年代の超遠心分離機の発明は、タンパク質分子量の初めての正確な測定を可能にしました。
  • アーネ・ティシリウスによる1930年代の電気泳動技術の開発は、タンパク質のサイズを推定する別の方法を提供しました。
  • 1958年、スタンフォード・ムーアとウィリアム・H・スタインはリボヌクレアーゼの最初の完全なアミノ酸配列を決定し、正確な分子量計算を可能にしました。

現代(1970年代-現在)

  • 質量分析技術の発展は、タンパク質分子量決定を革命的に変えました。
  • ジョン・フェンと田中耕一は、2002年に生物高分子の質量分析のためのソフト脱着イオン化法の開発によりノーベル化学賞を受賞しました。
  • タンパク質特性を予測する計算方法は、ますます洗練され、アクセス可能になりました。
  • 1990年代および2000年代のゲノミクスおよびプロテオミクスの出現は、高スループットタンパク質分析ツール、特に自動化された分子量計算機の必要性を生み出しました。

今日、タンパク質分子量の計算はルーチンでありながら、タンパク質科学の重要な部分であり、計算機のようなツールによって、これらの計算が世界中の研究者にアクセス可能になっています。

コード例

以下は、さまざまなプログラミング言語でタンパク質分子量を計算する方法の例です:

1' Excel VBA関数によるタンパク質分子量計算
2Function ProteinMolecularWeight(sequence As String) As Double
3    ' アミノ酸の分子量
4    Dim aaWeights As Object
5    Set aaWeights = CreateObject("Scripting.Dictionary")
6    
7    ' アミノ酸の重量を初期化
8    aaWeights("A") = 71.03711
9    aaWeights("R") = 156.10111
10    aaWeights("N") = 114.04293
11    aaWeights("D") = 115.02694
12    aaWeights("C") = 103.00919
13    aaWeights("E") = 129.04259
14    aaWeights("Q") = 128.05858
15    aaWeights("G") = 57.02146
16    aaWeights("H") = 137.05891
17    aaWeights("I") = 113.08406
18    aaWeights("L") = 113.08406
19    aaWeights("K") = 128.09496
20    aaWeights("M") = 131.04049
21    aaWeights("F") = 147.06841
22    aaWeights("P") = 97.05276
23    aaWeights("S") = 87.03203
24    aaWeights("T") = 101.04768
25    aaWeights("W") = 186.07931
26    aaWeights("Y") = 163.06333
27    aaWeights("V") = 99.06841
28    
29    ' 水の分子量
30    Const WATER_WEIGHT As Double = 18.01528
31    
32    ' 配列を大文字に変換
33    sequence = UCase(sequence)
34    
35    ' 合計重量を計算
36    Dim totalWeight As Double
37    totalWeight = 0
38    
39    ' 各アミノ酸の重量を合計
40    Dim i As Integer
41    For i = 1 To Len(sequence)
42        Dim aa As String
43        aa = Mid(sequence, i, 1)
44        
45        If aaWeights.Exists(aa) Then
46            totalWeight = totalWeight + aaWeights(aa)
47        Else
48            ' 無効なアミノ酸コード
49            ProteinMolecularWeight = -1
50            Exit Function
51        End If
52    Next i
53    
54    ' ペプチド結合からの水の損失を引き、末端の水を加える
55    Dim numAminoAcids As Integer
56    numAminoAcids = Len(sequence)
57    
58    ProteinMolecularWeight = totalWeight - (numAminoAcids - 1) * WATER_WEIGHT + WATER_WEIGHT
59End Function
60
61' Excelでの使用法:
62' =ProteinMolecularWeight("ACDEFGHIKLMNPQRSTVWY")
63

よくある質問

タンパク質分子量とは何ですか?

タンパク質分子量、または分子質量は、ダルトン(Da)またはキロダルトン(kDa)で表されるタンパク質分子の総質量です。これは、タンパク質内のすべての原子の質量の合計を表し、ペプチド結合形成中に失われる水分子を考慮に入れています。この基本的な特性は、タンパク質の特性評価、精製、および分析において重要です。

このタンパク質分子量計算機の精度はどのくらいですか?

この計算機は、アミノ酸配列に基づいて理論的な分子量を高い精度で提供します。標準的な単一同位体のアミノ酸の質量を使用し、ペプチド結合形成中の水の損失を考慮に入れています。ただし、翻訳後修飾、非標準アミノ酸、または実際のタンパク質に存在する同位体の変動は考慮されていません。

タンパク質分子量の単位は何ですか?

タンパク質分子量は通常、ダルトン(Da)またはキロダルトン(kDa)で表されます。1 kDaは1,000 Daに相当します。ダルトンは水素原子の質量(1.66 × 10^-24グラム)にほぼ等しいです。参考までに、小さなペプチドは数百Daである場合があり、大きなタンパク質は数百kDaになることがあります。

計算された分子量が実験値と異なるのはなぜですか?

計算された分子量と実験的な分子量との間に不一致が生じる原因はいくつかあります:

  1. 翻訳後修飾(リン酸化、糖鎖付加など)
  2. ジスルフィド結合の形成
  3. プロテアーゼ処理
  4. 非標準アミノ酸
  5. 実験測定の誤差
  6. 同位体の変動

修飾されたタンパク質の正確な分子量決定には、質量分析が推奨されます。

非標準アミノ酸の分子量を計算できますか?

この計算機は、1文字コード(A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y、V)を使用した20種類の標準アミノ酸のみをサポートしています。非標準アミノ酸を含むタンパク質の場合は、拡張アミノ酸コードをサポートする別のツールや手動計算が必要です。

アミノ酸組成の結果をどのように解釈しますか?

アミノ酸組成は、タンパク質配列内の各アミノ酸のカウントと割合を表示します。この情報は、以下の目的に役立ちます:

  • タンパク質の物理的特性を理解する
  • 興味のある領域を特定する(例:疎水性の部分)
  • 実験手順を計画する(例:分光測定)
  • 種間で類似のタンパク質を比較する

平均分子量と単一同位体分子量の違いは何ですか?

  • 単一同位体分子量は、各元素の最も豊富な同位体の質量を使用します(この計算機が提供するもの)。
  • 平均分子量は、自然に存在するすべての同位体の加重平均を使用します。

小さなペプチドの場合、違いは最小限ですが、大きなタンパク質ではより重要になります。質量分析は、小さな分子に対して単一同位体質量を測定し、大きな分子に対して平均質量を測定することが一般的です。

計算機はN末端およびC末端基をどのように扱いますか?

計算機は、ペプチド結合形成中に失われる水分子を引いた後、末端基のために1つの水分子(18.01528 Da)を加えることによって、標準のN末端(NH₂-)およびC末端(-COOH)基を考慮しています。これにより、計算された分子量が適切な末端基を持つ完全なタンパク質を表すことが保証されます。

ジスルフィド結合を持つタンパク質の分子量を計算できますか?

はい、しかしこの計算機はジスルフィド結合を自動的に調整しません。各ジスルフィド結合の形成は2つの水素原子(2.01588 Da)の損失をもたらします。ジスルフィド結合を考慮するには、計算された分子量から形成されたジスルフィド結合の数に応じて2.01588 Daを引いてください。

タンパク質分子量はタンパク質のサイズとどのように関連していますか?

分子量はタンパク質のサイズと相関関係がありますが、その関係は常に単純ではありません。タンパク質の物理的サイズに影響を与える要因には以下が含まれます:

  • アミノ酸組成
  • 二次および三次構造
  • 水和殻
  • 翻訳後修飾
  • 環境条件(pH、塩濃度)

おおよその推定として、10 kDaの球状タンパク質は直径約2〜3 nmです。

参考文献

  1. Gasteiger E., Hoogland C., Gattiker A., Duvaud S., Wilkins M.R., Appel R.D., Bairoch A. (2005) ExPASyサーバーのタンパク質同定および分析ツール。In: Walker J.M. (eds) The Proteomics Protocols Handbook. Humana Press.

  2. Nelson, D. L., & Cox, M. M. (2017). Lehninger Principles of Biochemistry (7th ed.). W.H. Freeman and Company.

  3. Steen, H., & Mann, M. (2004). ペプチド配列決定のABC(およびXYZ)。Nature Reviews Molecular Cell Biology, 5(9), 699-711.

  4. Voet, D., Voet, J. G., & Pratt, C. W. (2016). Fundamentals of Biochemistry: Life at the Molecular Level (5th ed.). Wiley.

  5. Creighton, T. E. (2010). 核酸およびタンパク質の生物物理化学。Helvetian Press.

  6. UniProt Consortium. (2021). UniProt:2021年のユニバーサルタンパク質知識ベース。Nucleic Acids Research, 49(D1), D480-D489.

  7. Artimo, P., Jonnalagedda, M., Arnold, K., Baratin, D., Csardi, G., de Castro, E., Duvaud, S., Flegel, V., Fortier, A., Gasteiger, E., Grosdidier, A., Hernandez, C., Ioannidis, V., Kuznetsov, D., Liechti, R., Moretti, S., Mostaguir, K., Redaschi, N., Rossier, G., Xenarios, I., & Stockinger, H. (2012). ExPASy:SIBバイオインフォマティクスリソースポータル。Nucleic Acids Research, 40(W1), W597-W603.

  8. Kinter, M., & Sherman, N. E. (2005). タンパク質の配列決定と同定のためのタンデム質量分析。Wiley-Interscience.

タンパク質分子量計算機を今すぐ試して、タンパク質配列の分子量を迅速かつ正確に決定してください。実験を計画したり、結果を分析したり、タンパク質生化学について学んだりする際に、このツールは数秒で必要な情報を提供します。