[Proteomics] Peptide Identification - DB Search
์ด๋ฒ ์๊ฐ์๋ โPeptide identificationโ ์ ๋ํด ์ด์ผ๊ธฐํด๋ณด์. Peptide identification์ ์์ด ๋ฐํ๊ธฐ๋ผ๊ณ ๋ณผ ์ ์๋ค.
Outline
Peptide identification์ ํฌ๊ฒ 3๊ฐ์ง ๋จ๊ณ๋ก ๋๋์ด ์ง๋ค.
Tandem Mass Spectrometry โ Peptide Sequencing โ Database search
์ด ์ค, DB search์์ ๊ฐ์ฅ ๊ธฐ๋ณธ์ด ๋๋ ๋ ผ๋ฌธ์ Sequest์ด๋ฉฐ ์ถํ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ํฌ์คํ ์์ ๋ค์ ํ๋ฒ ์ด์ผ๊ธฐ ํด๋ณด๋๋ก ํ์.
Proteomic Data Analysis Pipeline
๋จ๋ฐฑ์ง ๋ฐ์ดํฐ ๋ถ์์ ์ ์ฒด ํ์ดํ ๋ผ์ธ์ ์๋์ ์ฌ์ง์ ํตํด ์ฝ๊ฒ ์ดํดํ ์ ์๋ค.

๋จผ์ ์ํ์ ํตํด ๋จ๋ฐฑ์ง์ ์ถ์ถํ ๋ค์, ํจ์๋ฅผ ํตํ Protein digestion์ ์งํํ๋ค. ์ด ๊ณผ์ ์์ Protein sequence๋ peptide sequence๋ก ๋ฐ๋๊ฒ ๋๋ฉฐ, ์ด์จํ ๊ณผ์ ์ ํตํด Mass spectrometry (MS) ์ ๋ณด๋ฅผ ์ถ์ถํ์ฌ MS1, ์ฆ precursor ์ด์จ์ ์ ๋ณํ๊ฒ ๋๋ค. ์ดํ, precursor ์ด์จ์ Mass spectrometry๋ฅผ ํตํด MS2 spectra ์ ๋ณด๋ฅผ ์ป๊ณ (์ด๋ฅผ ์ด๋ ํ ๋ฐฉ๋ฒ์ผ๋ก ๋ถ์ํ๋๋์ ๋ฐ๋ผ ๋ถ์๋ฒ์ด ๋๋๋ค.) ๋ถ์์ ํตํด peptide์ ์ ๋ณด๋ฅผ ์ป๊ณ , ์ต์ข ์ ์ผ๋ก ๋ณธ ๋จ๋ฐฑ์ง์ด ๋ฌด์์ธ๊ฐ๋ฅผ ํ๋ณํ๊ฒ ๋๋ค.
๋จ๋ฐฑ์ง ๋ถ์ ๋ฐฉ๋ฒ์ ๋จ๊ณ์ ๋ฐ๋ผ ๋๋์ด ๋ค์ํ๋ฒ ์ด์ผ๊ธฐํด๋ณด์. ์ฐ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ Protein sequence๋ฅผ ๋ถ์ํด์ผ ํ๋ค.

Generate Peptides using Specific Enzyme
Protein complex โ Enzyme โ Peptides
ํน์ ํจ์๋ฅผ ์ฌ์ฉํ์ฌ protein sequence๋ฅผ digest ํ์ฌ peptide๋ฅผ ํ์ฑํ๋ค. ๋ณธ ๊ทธ๋ฆผ์์๋ ์ ๋จ ํจ์๋ก์ Trypsin์ด ์์ฉํ์๋ค. Trypsin์ K์ R์ C-terminal์ ์ ๋จํ๋ค๋ ํน์ง์ ๊ฐ๊ณ ์๋ค.

Mass spectrum
Protein complex โ Enzyme โ Peptides โ Mass spectrometry (MS) โ MS1 spectra
์ดํ ๊ฐ ํฉํ์ด๋์ ์ง๋์ ๋ถ์ํ๊ฒ ๋๋ค. ์ด๋ ์ธก์ ๋๋ ์ง๋์ m/z๋ก (์ง๋/์ ํ๋์ผ๋ก) x์ถ์ ์์นํ๋ค. ๋ฌด๊ฒ๊ฐ ์ ์ ์ชฝ๋ถํฐ ํฐ ์ชฝ์ผ๋ก ํ์ฌ ๊ทธ๋ํ ๋ํ๋ด๊ฒ ๋๋ค. y์ถ์ intensity๋ก ์ผ๋ง๋งํผ์ ํฉํ์ด๋๊ฐ ์กด์ฌํ๋์ง๋ฅผ ๋ณด์ฌ์ค๋ค.
๋ณธ ๊ณผ์ ์ ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํํํ ์ ์์ผ๋ฉฐ, MS1์ด ๋ณธ ๊ณผ์ ์ ํด๋นํ๋ค. ๋ณธ ๊ณผ์ ์ ํตํด protein์ ๊ตฌ์ฑํ๋ peptide์ ์ข ๋ฅ์ ๊ทธ ํฌ๊ธฐ๋ฅผ ํ์ธํ ์ ์๋ค.

Select one peak
Protein complex โ Enzyme โ Peptides โ Mass spectrometry (MS) โ MS1 spectra โ Mass spectrometry (collision energy) โ MS2 spectra
์ด ์ค ํ๋์ peak์ ์ ํํ๊ฒ ๋๋ฉฐ, ์ ํ๋ peak(peptide)๋ precursor๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ ์ดํ ๊ณผ์ ์ ๊ณ์ ์ฐธ์ฌํ๊ฒ ๋๋ค.

Tandem Mass spectrum
Protein complex โ Enzyme โ Peptides โ Mass spectrometry (MS) โ MS1 spectra โ Mass spectrometry (collision energy) โ MS2 spectra
MS1์์ ์ ํ๋ precursor๋ ๋นํ์ฑ๊ธฐ์ฒด์์ ์ถฉ๋์ ํตํด Energy๋ฅผ ๋ถ์ฌ ๋ฐ๊ฒ ๋๋ฉฐ, ์ด์จ์ ํํ(precursor ion)๋ก ์ชผ๊ฐ์ง๊ฒ ๋๋ค (Fragmentation). ์ด๋ side-chain์ ๊ทธ๋๋ก ์๊ณ backbone์ด ์ ๋์ด์ง๋๋ฐ, ๊ทธ๋ฌ๋ ์ด backbone์ ์ด๋๊ฐ ๊นจ์ง๋์ง๋ ๋ชจ๋ฅธ๋ค.

Protein complex โ Enzyme โ Peptides โ Mass spectrometry (MS) โ MS1 spectra โ Mass spectrometry (collision energy) โ MS2 spectra
backbone์ ์ด๋ ๋ถ๋ถ์ด ๊นจ์ง๋์ง ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ๊ฒฝ์ฐ์ ์๋ฅผ ๊ณ ๋ คํ๋ค. Precursor ์ด์จ์ charge์ ๋ฐ๋ผ ์ด๋ ํ ์ชฝ์ ์ด์จ์ด, ๋ค๋ฅธ ํ ์ชฝ์ ์ด์จ์ ํํ๊ฐ ์๋ ์ ์์ผ๋ฉฐ, ๋ ๋ค ์ด์จ์ผ ์๋ ์๋ค. ๋ํ peptide sequence์ K๋ R์ด ์์ผ๋ฉด ์ด์จํ์ ์ ๋ฆฌํ๋ค. ์ด ๋๋ฌธ์ Trypsin์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๋ ์๋ค.
MS๋ถํฐ MS1 spetra ๋ถ์, MS2(collision energy)๊น์ง์ ๊ณผ์ ์ Tandem Mass Spectrometry(MS/MS)๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ ๋ช๊ฐ์ง ํน์ง๋ค์ด ์กด์ฌํ๋ค.
-
Tandem Mass Spectrometry (MS/MS) : mainly generates partial N- and C- terminal peptides.
Fragmentation์ด ๋ฐ์ํ ๋ถ๋ถ์ ๊ธฐ์ค์ผ๋ก ์ ๋ถ๋ถ์ N-term ํน์ prefix๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ,๋ท ๋ถ๋ถ์ C-term ํน์ suffix๋ผ๊ณ ๋ถ๋ฅธ๋ค. -
Spectrum consists of different ion types because peptides can be broken in several places.
์์์ ์ด๋ฏธ ์ธ๊ธํ ๋ฐ์ ๊ฐ์ด, backbone์ ์ด๋๊ฐ ๊นจ์ง๋๋, ์ฆ ์ด๋ ๊ณ ๋ฆฌ๊ฐ ์๋ฆด์ง ๋ชจ๋ฅธ๋ค. ์ด๋ ์ชฝ์ด ์ด์จ์ด ๋ ์ง ๋ชจ๋ฅด๋ฉฐ, ์๋ฏธ๋ ธ์ฐ์ ์์ด์ ๋ฐ๋ผ ์ ๊นจ์ง๋ ๊ณณ์ด ์กด์ฌํ์ง๋ง, ์ด๋ฅผ ํํํ๋ ๊ณ์ฐ์์ ๋ฐ๋ก ์กด์ฌํ์ง ์๋๋ค.
-
Chemical noise often complicates the spectrum.
ํํ์ noise๋ spectrum์ ๋ณต์กํ๊ฒ ํ ์ ์๋ค. ์ฆ ์๋นํ ๋ฏผ๊ฐํ๋ค๋ ๊ฒ์ด๋ค. ์ด๋ฌํ ๋ ธ์ด์ฆ๋ ์ธ๋ถ์ ๋ ธ์ด์ฆ์ผ ์ ์๋๋ฐ, ๋ํ์ ์ผ๋ก ์คํํ๋ ์ฌ๋์ ๋จธ๋ฆฌ์นด๋ฝ protein์ธ ์ผ๋ผํด, ํน์ internal fragment๋ฅผ ์๋ก ๋ค ์ ์๋ค.
-
Represented in 2-D: mass/charge axis vs. intensity axis
2D๋ก ํํ๋๋ฉฐ, MS1์์์ ๊ฐ์ด mass/charge () ์ถ๊ณผ intensity ์ถ์ผ๋ก ๋ํ๋๋ค.
๋ํ ์๋์ ๊ทธ๋ฆผ์ ๋ณด์ด๋ ์คํํธ๋ผ์์ ๊ฐ ๋ถ๋ถ์ ์ง๋์ฐจ์ด๋ ๊ฐ ์๋ฏธ๋ ธ์ฐ์ ์ง๋์ ์๋ฏธํ๋ค๊ณ ๋ณผ ์ ์๋ค. ์์๋ก ์ฃผ์ด์ง ์คํํธ๋ผ(์๋ ์ฌ์ง์ ๋ ธ๋์ ๋ฐ์ค)์ ๋น๊ต์ ๊น๋ํ๊ณ ์์ ์ํ์ด๋, ํ์ค์์๋ ์ด๋ณด๋ค ๋ ์ง์ ๋ถํ ์คํํธ๋ผ์ด ๋์ค๊ฒ ๋๋ค.

์ ๊ทธ๋ฆผ์ peptide์ prefix๋ง ํ์ํด ๋์ ๊ฒ์ด๋ค. Prefix๋ฅผ ์ญ ๋ฐ๋ผ ์ฝ์ผ๋ฉด forward, suffix๋ฅผ ์ญ ๋ฐ๋ผ ์ฝ์ผ๋ฉด reversed๋ผ๊ณ ๋ถ๋ฅธ๋ค. ์ด๋ฌํ ๊ฒฝ์ฐ๋ ์ด์์ ์ธ case๋ก ๋๊ฐ ๋๊ตฐ์ง ์ ์ถ๊ฐ ๊ฐ๋ฅํ๋ค. ๊ทธ๋ฌ๋ ๋๊ฐ prefix์ผ์ง, suffix์ผ์ง ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ์, ๊ฐ์ ์ ํตํด ์ ์ถํ๊ฒ ๋๋ค.
Protein complex โ Enzyme โ Peptides โ Tandem Mass spectrometry (MS/MS) โ MS2 spectra

Tandem Mass Spectrometry์์๋ ๊ฒฐ๊ตญ ์ง๋์ฐจ๋ฅผ ํตํด ๊ตฌ์ฑ ์๋ฏธ๋ ธ์ฐ์ ์ ์ถ๊ฐ๋ฅํ๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด๋ ๊ฒ ์ ์ถํ MS2 spectra๋ฅผ ์ด๋ ํ ๋ฐฉ๋ฒ์ ํตํด ๋ถ์ํ๊ณ , identificationํ๊ฒ ๋ ๊น?
Peptide identification
Peptide idenfication์๋ ํฌ๊ฒ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ด ์กด์ฌํ๋ค.
- Database search (Sequest)
- de Novo interpretation (Sherenga)
DB search๊ฐ ๋์ฒด์ ์ผ๋ก ์ ์ฉํ์ง๋ง, ์กฐ๊ธ๋ ์ฌ๋ ์๋ ๊ฒฝ์ฐ de Novo๋ก ์งํ๋๊ฒ ๋๋ค. ๋ ๋ฐฉ๋ฒ์ ์ฐจ์ด๋ DB์ ์ ๋ฌด์ด๋ค. DB๋ reference์ ๋ถ๊ณผํ๋ฉฐ, ํญ์ฒด์ ๊ฐ์ด ๋ค๋ฅธ ์ด๋ ๋๊ตฐ๊ฐ์ ๊ณ ์ ์ ๋จ๋ฐฑ์ง์ ๋ถ์ํ๋ ๊ฒฝ์ฐ์๋ DB search๋ ๊ทธ ํจ์ฉ์ฑ์ ๋ฐํํ์ง ๋ชปํ๋ค. ์ฆ, DB๊ฐ ์๋ ๊ฒฝ์ฐ, de Novo interpretation์ด ๋ ํจ๊ณผ์ ์ด๋ค.

Peptide identification
Peptide identification์ ๋ชฉํ๋ Find a peptide with maximal match between an experimental and theoretical spectrum. ์ฆ, ์ด๋ก ์ ์ธ(์์ฃผ ๊ธฐ๋ณธ์ ์ธ) ์คํํธ๋ผ๊ณผ ์คํ์ ์ธ ์คํํธ๋ผ ์ฌ์ด์ ์ต๋ ์ผ์นํ๋ ํฉํ์ด๋๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค.
Input์ผ๋ก๋ 4๊ฐ์ง๊ฐ ๋ค์ด๊ฐ๋ค.
- S : experimental spectrum
- โณ : set of possible ion type
- m : precursor
- c : charge
โณ(๋ธํ)๋ ์ด์จ์ด ์ด๋์ ๊นจ์ง๋๊ฐ๋ฅผ ๊ณ ๋ คํ์ฌ input์ผ๋ก ๋ค์ด๊ฐ๋ฉฐ, c(charge)์ ๊ฒฝ์ฐ ์ฃผ์ด์ง์ง ์์ผ๋ฉด ๋ชจ๋ ๊ฒฝ์ฐ์ ์๋ฅผ ๊ณ ๋ คํ๊ฒ ๋๋ค. ๊ทธ๋ฌ๋ ๋ณดํต MS1์์ c์ ๋ํ ๊ฐ์ ์ ์ํด์ค๋ค.
Precursor ๋ Precursor์ neutral mass์ mass์ ํฉ์ charge๋ก ๋๋์ผ๋ก์ ๊ณ์ฐํ๊ฒ ๋๋ค.

์ ์์์ precursor m/z๋ ๊ด์ฐฐ๊ฐ์ด๋ฉฐ, charge * proton mass ๋ถ๋ถ์์ charge๋ก 1~3๊ฐ์ ์ด์จ์ด ๋ค์ด๊ฐ ์ ์๋ค. ๋ํ ์ฌ๊ธฐ์ ๊ณ์ฐ๋ percursor์ neutral mass์ ๋น์ทํ ๊ฐ์ peptide๋ฅผ ์ฐพ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
์ด์ ๋ฐ๋ผ Output์ "A peptide with mass , whose theoretical spectrum matches the experimental spectrum S best." ์ฆ ์ด๋ก ์ ์คํํธ๋ผ์ด ์คํ์ ์คํํธ๋ผ S์ ์ต๊ณ ๋ก ์ผ์นํ๋ ์ง๋ M์ ๊ฐ๋ ํฉํ์ด๋๊ฐ ๋์จ๋ค.
(์์์ผ๋ก ํํํ๋ฉด: )
DB search์ De Novo์ ์ฐจ์ด๋ฅผ DB์ ์ ๋ฌด๋ผ๊ณ ํ๋๋ฐ, ๋ค์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์กฐ๊ธ ๋ ์์ธํ ์ดํดํ ์ ์๋ค.

์ฆ, DB search๋ ์ฃผ์ด์ง DB๋ฅผ ๊ณ ๋ คํ๊ธฐ ๋๋ฌธ์ ์๊ฐ๋ณต์ก๋๊ฐ ๋ก ๊ณ ์ ๋์ด ์์ง๋ง, de Novo์ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฒฝ์ฐ์ ์๋ฅผ ๊ณ ๋ คํ์ฌ ์ต์ ์ ๊ฒฝ๋ก๋ฅผ ์ฐพ๋ D.P.๋ฌธ์ ์ ๊ฐ๊ธฐ์ ์ ์๊ฐ๋ณต์ก๋๋ฅผ ๊ฐ๊ฒ ๋๋ค. ์ด๋ ์ง๋๋ถ์๊ธฐ๊ฐ ์ธ์ํ ์ ์๋ ํฉํ์ด๋์ ๊ธธ์ด๋ ์๋ฏธ๋ ธ์ฐ 6๊ฐ๋ถํฐ 50๊ฐ๊ฐ ์ฐ๊ฒฐ๋ ๊ฒฝ์ฐ๊น์ง์ด๋ค.
Peptide identification by database search
DB search๋ฅผ ์ด์ฉํ peptide identification์ ๋ชฉํ๋ Find a peptide from the database with maximal match between an experimental and a theoretical spectrum.์ฆ, ์ผ๋ฐ์ ์ธ peptide identification๊ณผ ๋์ผํ์ง๋ง database๋ก๋ถํฐ ํฉํ์ด๋๋ฅผ ์ฐพ๋๋ค๋ ๊ฒ์์ ์ฐจ์ด๊ฐ ์กด์ฌํ๋ค.
์ด์ ๋ฐ๋ผ input์๋ ํ๋๊ฐ ๋ ์ถ๊ฐ๋ 5๊ฐ์ง๊ฐ ๋ค์ด๊ฐ๋ค.
- S : experimental spectrum
- P : database of peptides
- โณ : set of possible ion type
- m : precursor
- c : charge
์ด๋ โณ(๋ธํ)๋ ์ด์จ ํ์ ์ ๋ฐ๋ผ ๋ค ๋ค๋ฅด๋ฉฐ, (b, y)๊ฐ majorํ๊ฒ ์ถ๋ ฅ๋๋ค.
์ด์ ๋ฐ๋ผ output ๋ํ A peptide of mass M from the database whose theoretical spectrum matches the experimental spectrum S best. ์ฆ, DB๋ก ๋ถํฐ ๊ตฌํด์ง๊ฒ ๋๋ค.

Database
๊ทธ๋ ๋ค๋ฉด DB search์์ ์ฌ์ฉ๋๋ database๋ ๋ฌด์์ผ๊น? ๋ณดํต UniProtKB๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ค.

UniProtKB๋ Swiss-Prot๊ณผ TrEMBL๊ตฌ์ฑ ๋์ด ์์ผ๋ฉฐ, ์ ๋ฌธ๊ฐ๊ฐ ์๋์ ์ผ๋ก annotationํ๊ณ reviewํ์๋๊ฐ ์๋๋ฉด ์๋ํ์ ๋ฐ๋ฅธ (Automatic) annotation์ผ๋ก review๊ฐ ์๋์๋๋์ ๋ฐ๋ผ ๊ตฌ๋ถ์ด ๋๋ค. ๋ํ ๋ณธ DB๋ ํฌ๊ฒ Human, Bacteria, Virus ๋ฑ 3๊ฐ์ง category๋ก ๋ถ๋ฅ๋๋ค.
Database - protein
Protein DB๋ .fastaํฌ๋งท์ผ๋ก ํ์ผ์ด ์ ์ฅ๋๋ฉฐ, ๋จ๋ฐฑ์ง ์ํ์ค์ ๊ทธ๋ค์ ํค๋ ์ ๋ณด๊ฐ ๋ฆฌ์คํธํ ๋์ด ์ ์ฅ๋์ด ์๋ค.

Database - peptide (In silico digestion)
์์ ๊ฐ์ ๋จ๋ฐฑ์ง ์ํ์ค๊ฐ ๋ค์ด์ค๋ฉด, ํน์ ์กฐ๊ฑด์ ๋ง์ถฐ์ digestion๊ณผ์ ์ ๋ฐ์ํ์ฌ peptide sequence๊ฐ ๊ตฌํด์ง๋ค. ์ด ๊ณผ์ ์ ์ฝ๋๋ก๋ ๊ตฌํํ ์ ์๋๋ฐ ์ถํ ์ ๋ฐ์ดํธ ํ ํฌ์คํ ์์ ์ฝ๋์ ๊ด๋ จํ ๋ถ๋ถ์ ๋ค๋ฃฐ ์์ ์ด๋ค.
๋ด์ฉ๋ง ์ด์ผ๊ธฐํด๋ณด์๋ฉด, input์ผ๋ก protein sequence๊ฐ ๋ค์ด์ฌ ๋, parameter๋ก ์ ๋จ ํจ์์ ์ ๋จ ์์น๋ฅผ ์ด์ผ๊ธฐํ๋ Enzyme rule๊ณผ Number of missed cleavage, **Enzymic site information(fully, semi, none)**์ด ์ฃผ์ด์ง๊ฒ ๋๋ฉฐ, output์ผ๋ก peptide sequence์ ๊ฐ ํ๋ผ๋ฏธํฐ์ ๋ํ ์ ๋ณด๊ฐ ์ถ๋ ฅ๋๋ค. ์ด๋ฌํ ๊ณผ์ ์ ์๋์ ๊ทธ๋ฆผ์ ํตํด์ ํ์ธ์ด ๊ฐ๋ฅํ๋ค.

Basics for theoretical spectrum generation
์ํ์ฑํ ํฉํ์ด๋ DB๋ฅผ ๋ฐํ์ผ๋ก ์ด๋ก ์ ์ธ spectrum์ ๋ง๋๋ ๊ณผ์ ์ ๋ํด ์์๋ณด์.
Glycine์ ์์๋ก ๋ค์ด ์ดํด๋ณด๋ฉด ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค.

Glycine(G)์ ๊ฒฝ์ฐ, ๊ธฐ๋ณธ์ ์ธ backbone์ธ ์ R์์น์ H๊ฐ ๋ถ์ ํํ ๊ตฌ์กฐ๋ฅผ ๊ฐ๋๋ค. Free amino acid๋ G๊ฐ ๋จ๋ ์ผ๋ก ์กด์ฌํ๋ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ด๋ฉฐ, Amino acid residue๋ ํฉํ์ด๋์ G๊ฐ ๊ฒฐํฉ๋์ด ์์ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ธ๋ค. ์ด๋ ์ ํ๋ฅผ ๋์ง ์๋๋ค๋ฉด Neutral ์ํ์ ์๋ค๊ณ ๋งํ ์ ์๋ค. Monoisotopic mass๋ ๋จ์ผ ๋์์์์ ์ง๋์ ๋ํ๋ด๋ฉฐ, ๋ถ์ ๋ด ๊ฐ ์์์ ๊ฐ์ฅ ํ๋ถํ ์์ฐ ๋ฐ์ ์์ ๋์์์์ ์ง๋์ ํฉ์ ์ทจํ์ฌ ๊ณ์ฐ์ด ๋๋ค. (์ด ๋ถ๋ถ์ ๋ํ ์ค๋ช ์ ๋ค์๋ค์ ์ฌ์ง์์ ๋ค์ํ๋ฒ ๋ ๋ค๋ฃฌ๋ค.)

์์ ์ฌ์ง์ ๋ณด๋ฉด, ๊ฐ ์๋ฏธ๋ ธ์ฐ์ residue๋ฅผ ๋ํ๋ด๋ฉฐ, ๋์์์๋ฅผ ๊ณ ๋ คํ Avg. mass์ residue mass์ธ Mono. mass๋ ๊ฐ์ด ํฌํจ๋์ด ์๋ค.
์ด๋ Cysteine(C)์ Methionine(M)์์๋ ์ง์(N) ๋์ ์ ํฉ(S)์ด ํฌํจ๋์ด ์์์ ํ์ธํ ์ ์์ผ๋ฉฐ, ๊ทธ๋ฅผ ์ ์ธํ ๋๋จธ์ง ์๋ฏธ๋ ธ์ฐ๋ค์ ํ์(C)์ ์์(H), ์ง์(N)์ผ๋ก ํํ์์ด ๊ตฌ์ฑ๋์ด ์์ ๋ํ ํ์ธํ ์ ์๋ค.
๋ค์ ๊ทธ๋ฆผ์ MS1 ๊ทธ๋ํ๋ฅผ ๋ํ๋ธ ๊ฒ์ด๋ค. ๋์์์์ ์กด์ฌ๋ก ์ธํด ๋ค์๊ณผ ๊ฐ์ peak๋ค์ด ์ฌ๋ฌ๋ฒ ๋ํ๋๊ฒ ๋๋ฉฐ, ์ฒซ ๋ฒ์งธ peak์ด ์ ์ผ ์์ ์ง๋์์ ํ์ธํ ์ ์๋ค. ๋ ๋ฒ์งธ peak์ +1Da, ์ธ ๋ฒ์งธ peak์ +2Da, ๋ค ๋ฒ์งธ peak์ +3Da์ผ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ด๋ฉฐ, mono์ ๋ค์ peak์ mass ์ฌ์ด์ Da ์ฐจ์ด๋ฅผ ํตํด charge๋ฅผ ๊ณ์ฐํ ์ ์๋ค.

- Monoisotopic mass is the mass determined using the masses of the most abundant isotopes.
- Average mass is the abundance weighted mass of all isotopic components.
Aver. mass๋ ํ์ ๊ฐฏ์์ ๋ฐ๋ผ ์ง๋์ฐจ(0.x_ or 0._)๊ฐ ์ฆ๊ฐํ๊ฒ ๋จ์ ์์๋์.
ํฉํ์ด๋๊ฐ fragmentation๋ ๋ ์ด๋๊ฐ ์๋ฆฌ๋๋์ ๋ฐ๋ผ์ ๋ถ๋ฅด๋ ์ด์จ์ ๋ช ์นญ์ด ๋ฌ๋ผ์ง๋ค.

์๋ฆฐ ๋ถ๋ถ์ ๊ธฐ์ค์ผ๋ก ์ข์ธก๊ณผ ์ฐ์ธก์ (a-ion, x-ion), (b-ion, y-ion), (c-ion, z-ion)๊ณผ ๊ฐ์ด ์์ ์ด๋ฃจ๋ ์ด์จ์ ํํ๋ก ์กด์ฌํ๋ค. ์ด๋ ๊ฐ ์ด์จ์ ์๋ ์ฒจ์๋ residue์ ๊ฐฏ์๋ฅผ ์๋ฏธํ๋ฉฐ, ๋ณธ์ธ์ C์ ๊ฒฐํฉ๋ R์ ๊ฐฏ์๋ก ์๊ฐํ๋ฉด ์ข๊ฒ ๋ค๋ ์๊ฐ์ ํ๋ค. ์์ ์ ์๋ ๊ทธ๋ฆผ์์ ๋ณด์ด๋ฏ์ด, ๋นจ๊ฐ ์ ์ ์ ๋ฐ์ค๊ฐ ์๋ฏธ๋ ธ์ฐ residue mass๋ฅผ ์๋ฏธํ๋ค.
Mass of a neutral peptide๋ residue mass์ ํฉ๊ณผ terminating group์ mass์ ํฉ์ผ๋ก ํํ๋๋ฉฐ, ์ด๋, masses of the terminating groups๋ N-terminus์ H์ C-terminus์ OH๋ฅผ ์๋ก ๋ค ์ ์๋ค.
์๋ฏธ๋ ธ์ฐ์ residue mass list๋ ๋ค์ ๋งํฌ๋ฅผ ํตํด ๋ณด๋ค ์์ธํ ํ์ธํ ์ ์๋ค.
E.g. PEP
PEP๋ฅผ ์์๋ก ํ์ฌ mass๋ฅผ ๊ณ์ฐํ๊ณ , ๊ฐ ์ด์จ์ mass, ๊ฐ ์ด์จ์ ํํ ๊ตฌ์กฐ์๋ค, ์คํํธ๋ผ์ ๊ตฌํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.


์คํํธ๋ผ์ ์ดํด๋ณด๋ฉด, y-ion์ด ์๋์ ์ผ๋ก mass๊ฐ ํผ์ ํ์ธํ ์ ์๋ค. ํน์ fragment ion์ ์ด์จํ ํจ์จ์ ํํ์ ํน์ฑ, ์ ํ ์ํ ๋ฐ ์ด์จํ์ ์ฌ์ฉ๋๋ ์คํ ์กฐ๊ฑด์ ๋น๋กฏํ ๋ค์ํ ์์ธ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์๋ค. ๊ทธ ์ค, y-ion์ ์ผ๋ฐ์ ์ผ๋ก peptide fragmentation ์ค ํ์ฑ๋๋ ๋ฐฉ์ ๋๋ฌธ์ b-ion๋ณด๋ค ์๋์ ์ผ๋ก ๋ฌด๊ฒ๊ฒ ๋๋ค. ์ด์ ๋ฅผ ํ์
ํ๊ธฐ ์ํด์๋ ๋จผ์ y-ion๊ณผ b-ion์ ํ์ฑ๊ณผ์ ์ ์ดํดํด์ผ ํ๋ค.
y-ion์ ํฉํ์ด๋ ๊ฒฐํฉ์ C-terminal์ ์๋ฏธ๋ ธ์ฐ์ ์๊ธฐ๋ก ์ ๋จํ์ฌ ํ์ฑ์ด ๋๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ ํฉํ์ด๋์ N-terminal์ ํฌํจํ๋ fragment ion์ด ์์ฑ๋๋ค. ์ด์๋ ๋์กฐ์ ์ผ๋ก, b-ion์ ์๋ฏธ๋ ธ์ฐ ์๊ธฐ์ ๋ํ ํฉํ์ด๋ ๊ฒฐํฉ N-terminal์ ์ ๋จํจ์ผ๋ก์จ ํ์ฑ์ด ๋๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ ํฉํ์ด๋์ C-terminal์ ํฌํจํ๋ fragment ion์ ์์ฑํ๋ค. C-terminal์์ N-terminal๋ก ์ด๋ํจ์ ๋ฐ๋ผ peptide backbone์ mass๊ฐ ์ฆ๊ฐํ๊ธฐ ๋๋ฌธ์ peptide์ N-terminal์ ํฌํจํ๋ y-ion์ ์ผ๋ฐ์ ์ผ๋ก C-terminal์ ํฌํจํ๋ b-ion๋ณด๋ค ๋ฌด๊ฑฐ์ด ๊ฒ์ด๋ค.
์คํํธ๋ผ์์ ๋ค์ํ ์ ํ์ fragment ion์ ์๋์ ์กด์ฌ๋น๋ ์ฌ์ฉ๋ ํน์ fragmentation์ ๋ฐฉ๋ฒ, peptide ์์ด ๋ฐ ๋ค์ํ ์ ํ์ ์ด์จ์ ionization ํจ์จ์ ๋น๋กํ ๋ค์ํ ์์ธ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์๋ค. ์ผ๋ฐ์ ์ผ๋ก collision-induced dissociation(CID) fragmentation์ ์ํด ์์ฑ๋ ์คํํธ๋ผ์์ y-ion์ด b-ion๋ณด๋ค ๋ ํ๋ถํ ๊ฒฝํฅ์ด ์๋ค.
๋ง์ ๊ฒฝ์ฐ์์ Trypsin์ ์ ๋จํจ์๋ก ํ์ฌ ์ํ์ค์ C-terminal๋ฅผ ์ ๋จํ๊ธฐ ๋๋ฌธ์ ๊ทธ ๊ฒฐ๊ณผ y์ด์จ์ ์ด์จํ ๊ฒฝ์ฐ์ ์๊ฐ ๋ง๋ค๊ณ ์๊ฐํ ์ ์๋ค.

๊ฐ ํฉํ์ด๋์ ๋ํ ์คํํธ๋ผ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด๋๋ฉด ๋์์ด ๋์ง ์๋๊ฐ๋ผ๋ ์๊ฐ์ ํ ์ ์๋ค. ๊ทธ๋ฌ๋ ๋งค๋ฒ ๋น๊ตํ๋ DB๊ฐ ๋ฐ๋๊ธฐ ๋๋ฌธ์ ๋ฏธ๋ฆฌ ๋ง๋ค์ด๋๋ค๊ณ ํ๋๋ผ๋ ์ธ๋ชจ๊ฐ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ค๋ฐ์์ด๋ฉฐ, ์ ์ฉ๋๋ parameter์ ๋ฐ๋ผ ์คํํธ๋ผ์ ๋ค๋ฅด๊ฒ ๋ํ๋๋ค.
์์ ์ฒซ ๋ฒ์งธ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ํน์ ๋จ๋ฐฑ์ง ์ํ์ค DB์์ ๋จ๋ฐฑ์ง์ ๋ถ๋ฌ์ค๋ฉด, ์ ๋จํจ์์ ๋ฐ๋ฅธ Fragment๋ฅผ ๊ตฌํ๊ณ , ๊ทธ ์ดํ MS/MS Spectrum์ ๊ณ์ฐํ๊ฒ ๋๋ฉฐ ์ด๋ฅผ ํตํด ์คํ๊ฐ์ ์ํ spectrum๊ณผ ๋น๊ต๋ฅผ ํ๊ฒ ๋๋ค.
๋ ๋ฒ์งธ ๊ทธ๋ฆผ์ ์ต๊ทผ ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ๋ณํ๋ ์คํํธ๋ผ ์์ธก์ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋ค. PROSIT์ ๊ฒฝ์ฐ 550,000๊ฐ์ tryptice peptides์ 2,100๋ง๊ฐ์ high-quality tandem mass specta๋ฅผ ํ์ต์ํจ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ก, ๋ฏธ๋ฆฌ ๋ฐ์ดํฐ๋ฅผ ํฉ์ฑ ํ ๋น๊ต๋ฅผ ํตํด ํ์ตํ์๋ค๊ณ ์๋ ค์ ธ์๋ค. ์ฆ, ํ์ต์ ์ํด dataset์ ๋ค์ ์๋ก ๋ง๋ค์์ผ๋ฉฐ, b-ion๊ณผ y-ion์ ์๋์ ์ธ ์์ ๊ธฐ๋ฐ์ผ๋ก ์์น๋ฅผ ์์ธกํ๋ค.
prosit ๋ํ ์ถํ paper review์์ ๋ค๋ฃฐ ์์ ์ด๋ค.
Match between spectra
๊ทธ๋ ๋ค๋ฉด ์คํ์ ์ํ spectrum๊ณผ DB์์ ๊ตฌํ spectrum์ ๋น๊ต๋ ์ด๋ป๊ฒ ์ด๋ฃจ์ด์ง๊น?
์๋์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด Query Spectrum, ์ฆ ์คํ spectrum์ด ์ฃผ์ด์ง๋ฉด ์ด๋ฅผ Spectral Database์ ๊ฒฐ๊ณผ์ ๋น๊ต๋ฅผ ํตํด ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ๋ค. ์ด๋ ๋น๊ตํ๋ ๋ฐฉ๋ฒ๋ ๋ค์ํ๊ฒ ์กด์ฌํ๋ค.

Match between spectra - SPC
์ฒซ๋ฒ์งธ๋ก SPC, Shared Peak Count์ด๋ค. SPC๋ ๋ ์คํํธ๋ผ ์ฌ์ด์์ ๊ณต์ ๋(๋์ผํ) peaks(=masses)์ ๊ฐฏ์๋ฅผ ์ธ๋ ๋ฐฉ๋ฒ์ด๋ค. โ# of ๊ณตํต๋ peakโ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
- The match between two spectra is the number of masses (peaks) they share (Shared Peak Count of SPC)
- In practice mass-spectrometrists use the weighted SPC that reflects intensities of the peaks
- Match between experimental and theoretical spectra is defined similarly
Match between spectra - SEQUEST
๋ค์์ผ๋ก SEQUEST์ด๋ค. SEQUEST๋ paper๋ก๋ ๋์์ผ๋ฉฐ, Cross correlation๋ฐฉ๋ฒ์ ์ฌ์ฉํ์๋ค๋ ํน์ง์ ๊ฐ๋๋ค. Cross correlation์ ๋ ๊ณ์ด์ ์ ์ฌ์ฑ์ ๋ค๋ฅธ ๊ณ์ด์ ๋ํ ํ ์ชฝ ๋ณ์์ ํจ์๋ก ๋ํ๋ด๋ ์ธก๋๋ฅผ ๋งํ๋๋ฐ, ์ ์ด ํํ์ ๋๋ฌด ๋ฒ์ญํ ๋๋์ด ๋ ๋ค.
์ฝ๊ฒ ๋งํ์๋ฉด, ์ ์ฌํ ํน์ง์ ๊ฐ๋๋ก ๋ ์คํํธ๋ผ์ ํธ๋ฆฌ์ ๋ณํ ๋ฑ๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ผ๋ก ๋น์ทํ๊ฒ ๋ณํํ๋ ๊ฒ์ด๋ค. ์ด ๋ถ๋ถ์ด SEQUEST ๋ ผ๋ฌธ์์์ ํต์ฌ์ด์๊ธฐ ๋๋ฌธ์ ์ถํ paper review์์ ์์ธํ ๋ค๋ฃจ์ด๋ณด๋๋ก ํ๊ฒ ๋ค.

Match between spectra - SEQUEST/Comet
SEQUEST๊ฐ ์์ ํ๋จ์ ๋ฐ๋ผ ์ ์ฌํ ๋ฐฉ๋ฒ์ ์ด์ฉํ์ฌ ๋ง๋ tool์ด ๋ฐ๋ก Comet์ด๋ค. ์ฌ๊ธฐ์๋ Cross correlation์ ํตํด์ ์๋์ ์ผ์น๋ฅผ ํ๊ฐํ๊ณ ์ ํ์๋๋ฐ, Auto correlation ๋ถ๋ถ์ ๋ฐฐ๊ฒฝ ๋ถ๋ถ์ด๋ผ Cross correlation์ ๋นํด ์ง์ ์ ์ธ ํ๊ฐ๋ฅผ ํ์ง ์๋๋ค. Sequest์ Comet ๋๋ค XCorr ์ ์๋ฅผ ํตํด ์๋์ ์ธ ๊ฐ์ผ๋ก match(์ผ์น)๋ฅผ ํ๊ฐํ๊ฒ ๋๋ค.

Match between spectra - X!Tandem score
๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก X!Tandem score๊ฐ ์๋ค. ์ฌ๊ธฐ์ ๊ด์ฌ๋๋ ์ ์๋ก by-score์ Hyperscore๊ฐ ์๋ค. by-score๋ b- ํน์ y-ion์ ์ผ์น peaks์ intensities์ ํฉ์ผ๋ก ๋ํ๋๊ฒ ๋๋ฉฐ, Hyperscore๋ by-score์ y์ด์จ์ ๊ฐฏ์!์ b์ด์จ์ ๊ฐฏ์! ์ ๊ณฑ์ผ๋ก ๋ํ๋๋ค. ์๋์ ๊ทธ๋ฆผ์ ํตํด ์ฝ๊ฒ ์ดํดํ ์ ์์ ๊ฒ์ด๋ค. ์ด๋ฌํ ์ ์๋ฅผ ๊ณต์ํ ํ๋ฉด ์๋ ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค.

์ด๋ฌํ ์ ์๋ค์ ํตํด ์๋์ ๊ฐ์ด โHyperscore-axisโ์ โ# of Matches -axisโ ๊ทธ๋ํ๋ฅผ ์ป์ ์ ์๋ค. ์ฒซ ๋ฒ์งธ ๊ทธ๋ํ์์๋ ๋น์ ํ์ ์ธ ์์์ ๋ณด์ฌ best hot์ ๊ณ์ฐํ๊ธฐ ์ด๋ ต์ง๋ง, ๋ ๋ฒ์งธ ๊ทธ๋ํ์์ ๋ณผ ์ ์๋ฏ์ด โ# of Matches -axisโ์ log๋ฅผ ์ทจํ์ฌ ์ฃผ๋ฏ๋ก์จ ์ ํ์ฑ์ ๋๋๋ก ๋ง๋ค ์ ์๋ค. ์ดํ Best hit์ ํด๋นํ๋ ๋ถ๋ถ์ ๊ตฌํ ์ ์๊ฒ ๋๋ค.

๋ด์ฉ ์์ฝ ๋ฐ ์ ๋ฆฌ
์ด๋ฒ ํฌ์คํ
์์๋ ํฉํ์ด๋์ ์์ด์ ๋ฐํ๋ ๋ฐฉ๋ฒ์ ์ค์ฌ์ผ๋ก ํ์ฌ Tandem Mass Spectrometry[MS/MS]์ peptide sequencing, Database search ๊ธฐ๋ฒ์ ๋ํด ์์๋ณด์๋ค.
ํนํ SEQUEST์ ๊ฒฝ์ฐ DB search์ ๊ฐ์ฅ ๊ธฐ๋ณธ์ด, ๊ธฐ์ด๊ฐ ๋๋ ๋
ผ๋ฌธ์ผ๋ก ์ถํ paper review๋ก ์
๋ก๋ ํ ์์ ์ด๋ฉฐ, Sequest๊ฐ ์์
์ ์ธ ํด์ด๋ผ๋ฉด, X!Tandem์ publicํ ํด๋ก์ ๊ทธ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณผ ์ ์์๋ค.
๋ณธ ๋ด์ฉ์ ํ์๋ํ๊ต ์ปดํจํฐ์ํํธ์จ์ดํ๊ณผ ๋ฐ ์ธ๊ณต์ง๋ฅํ๊ณผ ๋ฐฑ์์ฅ ๊ต์๋์ ๊ฐ์์๋ฃ์ ๋ฐํ์ผ๋กํ์ฌ ์์ฑ๋์์ต๋๋ค!
PS. ์ถ๊ฐ ๋ฌธ์์ฌํญ ๋ฐ ์ง๋ฌธ์ ํ์ํฉ๋๋ค. ๊ทธ๋ฅผ ํตํด ์ ๋ ๋ ์ฑ์ฅํ ์ ์์ํ ๋๊น์. :)
