[Proteomics] Peptide Identification - De novo sequencing

โ€ขProteomics

์ €๋ฒˆ ์‹œ๊ฐ„์—๋Š” Peptide identification์˜ DB Search์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์•˜๋‹ค. Peptide identification์—๋Š” ๋‘๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด ์žˆ๋Š”๋ฐ, ์ด๋ฒˆ ์‹œ๊ฐ„์—๋Š” ๋˜ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์ธ De novo sequencing์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด๋ณด๋ ค ํ•œ๋‹ค.

์งง๊ฒŒ ์ •๋ฆฌํ•ด์„œ ์ด์•ผ๊ธฐ ํ•ด๋ณด์ž๋ฉด, De novo sequencing์€ DB search์™€ ๋‹ฌ๋ฆฌ ๋น„๊ตํ•  ๋Œ€์ƒ์ด ์—†์ด ์‹คํ—˜ data๋งŒ ๊ฐ€์ง€๊ณ  ํŽฉํƒ€์ด๋“œ๋ฅผ ์‹๋ณ„ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ๋น„์œ ํ•˜์ž๋ฉด ๋งจ๋•…์— ํ—ค๋”ฉํ•˜๋Š” ๋А๋‚Œ์ด๋ž„๊นŒ?

Tandem mass spectrum

์•ž์„œ ์„œ๋‘์™€ ์ด์ „ ํฌ์ŠคํŒ…์—์„œ ์ด์•ผ๊ธฐํ•˜์˜€๋“ฏ์ด, MS2 spectrum์„ ๋ถ„์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€๋กœ ๋‚˜๋‰œ๋‹ค.

  • Database search (SEQUEST)
  • de Novo interpretation (SHERENGA)

MS2 spectrum์„ ๋ถ„์„ํ•˜์—ฌ ์šฐ๋ฆฌ๋Š” ์ตœ์ข…์ ์œผ๋กœ ๋ณธ ๋‹จ๋ฐฑ์งˆ์ด ์–ด๋–ค ๋‹จ๋ฐฑ์งˆ์ธ์ง€ ๋ฐํžˆ๊ณ , ๊ทธ ์‹œํ€€์Šค ์ •๋ณด๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์— ๋ชฉ์ ์„ฑ์„ ๋‘๊ณ  ์žˆ๋‹ค.

Untitled

De novo VS Database search

Database search๋Š” ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ data์™€์˜ ๋น„๊ต๋ฅผ ํ†ตํ•ด ์–ด๋–ค ๋‹จ๋ฐฑ์งˆ์ด ๋ฐœํ˜„๋˜์—ˆ๋Š”๊ฐ€์™€ ๊ด€๋ จ๋œ ์„œ์—ด์„ ๋ฐํžˆ๋Š”๋ฐ ์ง‘์ค‘ํ•˜์˜€๋‹ค๋ฉด, De novo๋Š” Graph๋ฅผ ๋งŒ๋“ค๊ณ  ๊ทธ์™€ ๊ด€๋ จํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ค์–ด ํ•ด๊ฒฐํ•œ๋‹ค. ๊ฒฐ๋ก ์ ์œผ๋กœ non-guess path ์ฐพ๊ธฐ๋ผ๊ณ  ์ด์•ผ๊ธฐ ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด ๊ณผ์ •์—์„œ DP(Dynamic Programming) ๋ฅผ ์ด์šฉํ•˜๊ฒŒ ๋œ๋‹ค.

Untitled 1

Basic principle of de novo sequencing

De novo sequencing์˜ main idea๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • Use the mass difference between two fragment ions to calculate the mass of an amino acid residue on the peptide backbone.
  • E.g. mass difference between y6y_6 and y7y_7 = 129 ~> residue E.

์ฆ‰, ๋‘ fragment ion ์‚ฌ์ด์˜ mass ์ฐจ์ด๋ฅผ ์ด์šฉํ•˜์—ฌ peptide backbone์— ์œ„์น˜ํ•œ ์•„๋ฏธ๋…ธ์‚ฐ residue์˜ mass๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋“  ์ด์˜จ์„ ๊ณ ๋ คํ•˜๋ฉด, ๋‚˜ํƒ€๋‚˜์ง€ ์•Š๋Š” ๊ฒƒ๋“ค๋„ ๋Œ€๋‹ค์ˆ˜ ์กด์žฌํ•œ๋‹ค.

Untitled 2

De novo sequencing workflow

De novo sequencing์˜ workflow๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ๋จผ์ € spectrum graph๋ฅผ ๋งŒ๋“ค๊ณ , ์ดํ›„ ์ตœ์ ์˜ ๊ฒฝ๋กœ๋ฅผ ์ฐพ์•„ sequence๋ฅผ ์ถ”์ •ํ•˜๊ฒŒ ๋œ๋‹ค.

Untitled 3

์œ„ ๊ทธ๋ฆผ์—์„œ ๋ณผ ์ˆ˜ ์žˆ๋“ฏ์ด, ์ฒ˜์Œ ์ถœ๋ฐœ ์ง€์ ์„ mass๊ฐ€ 0์ผ ๋•Œ๋กœ, ๋งˆ์ง€๋ง‰ ์ง€์ ์„ peptide mass ์ผ ๋•Œ๋กœ ์ง€์ •ํ•ด ์ค€๋‹ค. ์ดํ›„ DP๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ ์ˆ˜๊ฐ€ ๋†’์€, ์ตœ์ ์˜ path๋ฅผ ์ฐพ์•„ sequence๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค.

์ด๋Ÿฌํ•œ ์ตœ์ ์˜ path๋ฅผ ์ฐพ๋Š” ๋ถ€๋ถ„์— ์žˆ์–ด ๊ณ ๋ คํ•ด์•ผํ•˜๋Š” ์‚ฌํ•ญ์€ Fragment peak ๋‹ค๋ฃจ๊ธฐ์ด๋‹ค. ๋‹ค์Œ๊ณผ ๊ฐ™์ด 4๊ฐœ์˜ ์•„๋ฏธ๋…ธ์‚ฐ์ด ์žˆ๋Š” ์ŠคํŽ™ํŠธ๋Ÿผ์ด ์ฃผ์–ด์กŒ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด๋ณด์ž

De novo sequencing

Untitled 4

์ด๋•Œ์˜ b-ions๋Š” neutral mass (=mass of Amino Acid) + proton์„ ํ†ตํ•ด ๊ณ„์‚ฐ์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, y-ions์€ neutral mass + 19๋ฅผ ํ†ตํ•ด ๊ณ„์‚ฐ๋œ๋‹ค. b-ion์—์„œ 88๊ณผ 145๋Š” ๊ฐ๊ฐ b1b_1๊ณผ b2b_2๋ฅผ, y-ions์—์„œ 147๊ณผ 276์€ ๊ฐ๊ฐ y1y_1๊ณผ y2y_2์˜ mass๋ฅผ ์˜๋ฏธํ•œ๋‹ค. b์™€ y ์ด์˜จ์ด semetricํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์œ„์˜ ์ŠคํŽ™ํŠธ๋Ÿผ์€ KEGS๊ฐ€ ์•„๋‹Œ SGEK๋กœ ํŒŒ์•…์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ์ฆ‰, ๊ฒฐ๊ตญ b์ด์˜จ๊ณผ y์ด์˜จ์€ ๊ตฌ๋ณ„์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

์—ฌ๊ธฐ์„œ y์ด์˜จ์— 19๊ฐ€ ๋”ํ•˜์—ฌ์ง„ ์ด์œ ๋ฅผ ์‚ดํŽด๋ณด์ž๋ฉด ์›๋ž˜์˜ ์•„๋ฏธ๋…ธ์‚ฐ์ด โˆ’NHโˆ’CHโˆ’COโˆ’-NH-CH-CO-์— R์ด ๋ถ™์€ ๊ตฌ์กฐ๋ฅผ ๊ฐ–๋Š”๋ฐ, y์ด์˜จ์˜ ๊ฒฝ์šฐ โˆ’OH-OH๋ฅผ ๊ฐ–์œผ๋ฉฐ H2H_{2}๊ฐ€ ๋ถ™์€ ํ˜•ํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด H3O+H_{3}O^{+}์˜ mass ๊ฐ’์„ ๋”ํ•˜์—ฌ ์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋Š” ์•„๋ฏธ๋…ธ์‚ฐ S์˜ ์›๋ž˜ mass๋Š” 87์ด์ง€๋งŒ ์ด์˜จ์˜ ํ˜•ํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์— 1์„ ๋”ํ•ด์„œ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ์ด์น˜์ด๋‹ค.

์‚ฌ์‹ค ์ด์™€ ๊ฐ™์ด b์ด์˜จ๊ณผ y์ด์˜จ์ด ์„ž์—ฌ์„œ ๊ฒ€์ถœ๋˜๊ธฐ ๋•Œ๋ฌธ์— ์šฐ๋ฆฌ๊ฐ€ ์„œ์—ด์„ ํŒŒ์•…ํ•˜๋Š”๋ฐ ์žˆ์–ด ์–ด๋ ค์›€์„ ๊ฒช์„ ์ˆ˜ ์žˆ๊ณ , ์งˆ๋Ÿ‰ ์ฐจ์ด๋กœ๋งŒ ์ด๋ฅผ ํŒ๋ณ„ํ•˜๋Š” ๊ณผ์ •์—์„œ ๋˜ํ•œ ์–ด๋ ค์›€์„ ๊ฒช์„ ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ b์ด์˜จ๊ณผ y์ด์˜จ์ด ๊ฒฐ๊ตญ์€ ๊ตฌ๋ณ„๋˜๊ธฐ ๋•Œ๋ฌธ์— ์ „์ฒด๋ฅผ ๋†“๊ณ  ์šฐ๋ฆฌ๊ฐ€ ์ด ์นœ๊ตฌ๊ฐ€ ์–ด๋А ๋ฐฉํ–ฅ์˜ ์„œ์—ด์ด ๋งž๋Š” ๊ฒƒ์ธ์ง€ ๊ฒฐ์ • ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ์„œ์—ด์—์„œ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ์ด์˜จ๋“ค์ด ๊ด€์ฐฐ๋˜์ง€ ์•Š๋”๋ผ๋„, ์„œ์—ด์„ ์™„๋ฒฝํ•˜๊ฒŒ ๋ณต์›ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ๊ฐ€ ์ข…์ข… ์žˆ๋‹ค.

์ด์ œ๊ป b์ด์˜จ๊ณผ y์ด์˜จ์ด ์„ž์—ฌ์„œ ๋‚˜์˜ค๊ธฐ ๋•Œ๋ฌธ์— ํ•ด์„์— ์žˆ์–ด ์–ด๋ ค์›€์ด ์กด์žฌํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ด์•ผ๊ธฐ๋ฅผ ํ–ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ํ•œ ์ชฝ์˜ ์ด์˜จ๋งŒ ๋‚˜์˜จ๋‹ค๋ฉด ์–ด๋– ํ• ๊นŒ?

Untitled 5

์—ฌ๊ธฐ์„œ prefix ions๋ž€? N-terminal ์ด์˜จ๋“ค๋กœ a, b, c์ด์˜จ๋“ค์„ ํ†ต์นญํ•œ๋‹ค. ์ด์ „ ํฌ์ŠคํŒ…์—์„œ ์ด์™€ ๊ด€๋ จํ•œ ์ด์•ผ๊ธฐ๋ฅผ ๋‹ค๋ฃจ์—ˆ์—ˆ๋‹ค.

์ฆ‰, ์œ„ ์‚ฌ์ง„์—์„œ์˜ prefix ions์€ b-ion๋“ค๋กœ S, SG, SGE, SGEK๋ฅผ ์˜ˆ๋กœ ๋“ค ์ˆ˜ ์žˆ๋‹ค. ์ด์™€ ๊ฐ™์ด ํ•œ ์ชฝ์œผ๋กœ ๋‹ค ๋ชฐ๋ฉด ์ข‹๊ฒ ๋Š”๋ฐ, ์ฒ˜์Œ์—๋Š” ๋ชจ๋ฅธ๋‹ค. b์™€ y ์ด์˜จ๋งŒ ๊ฒ€์ถœ๋œ๋‹ค๊ณ  ํ•˜๋”๋ผ๋„, ์„ž์—ฌ ์žˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๊ธฐ ๋•Œ๋ฌธ์— ์ŠคํŽ™ํŠธ๋Ÿผ ์•ˆ์˜ ์ด ์นœ๊ตฌ๋“ค์„ ์–ด๋–ป๊ฒŒ ๊ตฌ๋ณ„ํ•˜๋А๋ƒ๊ฐ€ ์ค‘์š”ํ•˜์ง€๋งŒ. ๊ฒฐ๋ก ์ ์œผ๋กœ ๊ตฌ๋ณ„ ํ•  ์ˆ˜ ์—†๋‹ค. ๋”ฐ๋ผ์„œ ์ด ๋‘ ๊ฐ€์ง€ ๊ฐ€๋Šฅ์„ฑ์„ ๋‹ค ๋†“๊ณ  ์ฒ˜๋ฆฌ๋ฅผ ํ•˜๋Š” ์ผ์ด ์ค‘์š”ํ•˜๋‹ค.

forbidden pairs

์ด๋•Œ forbidden pairs๋ผ๋Š” ๊ฐœ๋…์— ์ฃผ๋ชฉํ•ด์•ผ ํ•œ๋‹ค. ๊ฒฝ๋กœ๋ฅผ ์ฐพ์„ ๋•Œ, ํ•œ ๊ฒฝ๋กœ์—์„œ, ์ฆ‰ ํ•œ peak์— 2๊ฐœ์˜ node ๋™์‹œ์— ์‚ฌ์šฉ ๋ถˆ๊ฐ€ํ•˜๋‹ค๋Š” ์ ์ด๋‹ค. ๋‹ค์Œ ์‚ฌ์ง„๊ณผ ๋™์‹œ์— ๋ณด๋ฉด์„œ ์ดํ•ดํ•ด๋ณด์ž.

Untitled 6

๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ŠคํŽ™ํŠธ๋Ÿผ์—์„œ 4๊ฐœ์˜ fragment ions peak์ด ๊ด€์ฐฐ๋˜์—ˆ๋Š”๋ฐ ๊ทธ๊ฒŒ ์ด๋ ‡๊ฒŒ ์ „๋ถ€ prefix ion๋งŒ ๋‚˜์˜ค๋ฉด sequencing์ด ๊ต‰์žฅํžˆ ๊ฐ„๋‹จํ•ด์ง„๋‹ค. ๋ญ”๊ฐ€ ํ•œ ์ชฝ์œผ๋กœ ๋ชฐ๋ฉด ์ข‹๊ฒ ๋‹ค! ์ด๋Ÿฐ ์ƒ๊ฐ์„ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ด์™€ ๊ฐ™์ด ํ•œ ์ชฝ์œผ๋กœ ๋ชฐ๊ณ  ์‹ถ์€๋ฐ ํ•œ ์ชฝ์œผ๋กœ ๋ชฐ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ๊ฐ์˜ fragment ion์ด b ion์ผ ๊ฒฝ์šฐ, y ion์ผ ๊ฒฝ์šฐ ๋‘ ๊ฐ€์ง€๋ฅผ ๋‹ค ๊ณ ๋ ฅํ•ด์„œ ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ž˜ํ”„์—๋‹ค๊ฐ€ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค์–ด ๊ทธ๋ž˜ํ”„๋ฅผ ๋งŒ๋“ค ๋•Œ ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ž˜ํ”„์˜ ๋…ธ๋“œ๋Š” ๊ฒฐ๊ตญ ์งˆ๋Ÿ‰ ์ŠคํŽ™ํŠธ๋Ÿผ์— ์žˆ๋Š” fragment ion peak์— ํ•ด๋‹นํ•˜๋Š” ์• ๊ฐ€ node๊ฐ€ ๋œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํ•˜๋‚˜๋งŒ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ์•„๋‹Œ ๋…ธ๋“œ๋ฅผ b ์ด์˜จ์ผ ๊ฒฝ์šฐ์˜ ๋…ธ๋“œ, y ์ด์˜จ์ผ ๊ฒฝ์šฐ์˜ ๋…ธ๋“œ ์ด๋ ‡๊ฒŒ 2๊ฐœ๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค.

์ด๋•Œ ํ•œ peak์„ ๊ฐ€์ง€๊ณ  ๋‘ ๊ฐœ์˜ node๋ฅผ ๋งŒ๋“ค์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์–ด๋–ค ์กฐ๊ฑด์ด ๊ฑธ๋ ค์•ผ ํ•˜๋ƒ๋ฉด, ์ด ๋‘ ๊ฐœ์˜ ๋…ธ๋“œ๋Š” ๋™์‹œ์— ์‚ฌ์šฉ๋˜๋ฉด ์•ˆ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰ b ion์ด๋ฉด์„œ ๋™์‹œ์— y ion์ด๋ฉด ์•ˆ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฅธ ๊ฒฝ์šฐ์—๋Š” ๊ดœ์ฐฎ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ด์ชฝ์œผ๋กœ ๋ณด๋ฉด ์ด ์นœ๊ตฌ๊ฐ€ b ion์ฒ˜๋Ÿผ ๋ณด์ด๊ณ , ์ €์ชฝ์—์„œ ๋ณด๋ฉด y ion์ฒ˜๋Ÿผ ๋ณด์ด๋Š” ๊ฑด ๊ดœ์ฐฎ์€ ๊ฒƒ์ด๋‹ค. ๋‹จ, ์ด ์นœ๊ตฌ๋ฅผ ํ•ด์„ํ•จ์— ์žˆ์–ด ๋™์‹œ์— b ion์ด๊ณ  y ion์ธ ๊ฒƒ์ฒ˜๋Ÿผ ์ƒ๊ฐํ•ด์„œ ์„œ์—ด์„ ํ•ด์„ํ•˜๋Š” ๊ฒƒ์€ ์•ˆ๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ forbidden pairs๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค.

์ด์ œ ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ด๊ฒŒ ๊ทธ๋Ÿฌ๋ฉด ๋‘˜ ์ค‘์— ์–ด๋А ๊ฒŒ ๋งž๋А๋ƒ ํ•˜๋Š” ๊ฑฐ๋Š” ์ด์ œ ๋ฌธ์ œ๋ฅผ ๋‹ค ํ’€๊ณ  ๋‚˜์„œ ๊ฒฝ๋กœ๊ฐ€ ๊ฒฐ์ •๋˜๋ฉด, ์–˜๊ฐ€ b ion์ด์—ˆ๋„ค ํ˜น์€ ์–˜๊ฐ€ y ion์ด์—ˆ๋„ค ๊ฐ€ ๋งˆ์ง€๋ง‰์— ๊ฒฐ์ •๋˜๋Š” ๊ฒƒ์ด๋‹ค. ๋ฌธ์ œ๋ฅผ ํ’€๊ณ  ๋‚˜์„œ์•ผ ๋น„๋กœ์†Œ ๊ฒฐ์ •์ด ๋˜๋Š” ๊ฒƒ์ด๊ณ , ํ‘ธ๋Š” ๊ณผ์ •์—์„œ๋Š” ๊ณ„์† ๋ชจ๋ฅธ ์ฑ„๋กœ ์—ฌ๋Ÿฌ ๊ฐ€๋Šฅ์„ฑ์„ ๋†“๊ณ  ๊ณ ๋ ค๋ฅผ ํ•˜๋Š” ๊ฒƒ์ด๊ณ , ๊ทธ ์ค‘์— ๊ฐ€์žฅ ์–ด๋–ค ์˜๋ฏธ์—์„œ ์ข‹๋‹ค๊ณ  ์ƒ๊ฐ๋˜๋Š” ์• ๋ฅผ ๊ณ ๋ฅด๋Š” ๋ฌธ์ œ์ธ ๊ฒƒ์ด๋‹ค.

Computing possible prefixes

๋‹ค์‹œ ์ฒ˜์Œ์— ๋ดค๋˜ ๋ฌธ์ œ๋กœ ๋Œ์•„๊ฐ€์„œ ์‚ดํŽด๋ณด๋ฉด, b ion์€ prefix์— ํ•ด๋‹นํ•˜๋Š” ์„œ์—ด์˜ ์งˆ๋Ÿ‰, neutral mass(charge๋ฅผ ๊ณ ๋ คํ•˜์ง€ ์•Š๋Š”, N-terminal๊ณผ C-terminal์— ํ•ด๋‹นํ•˜์ง€ ์•Š๋Š” ์งˆ๋Ÿ‰)์— 1๋งŒํผ ๋”ํ•ด์ค€๋‹ค. (๊ฐ„๋‹จํ•˜๊ฒŒ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•ด์„œ integer๋กœ, ์ •์ˆ˜๋กœ ๋ฐ”๊ฟ”์„œ ์ด์•ผ๊ธฐ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. proton์€ ๊ทธ๋ƒฅ ์งˆ๋Ÿ‰์ด 1์ด๋‹ค ์ด๋ ‡๊ฒŒ ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.) ๋˜ํ•œ y ion์˜ ์งˆ๋Ÿ‰์€ surffix์— ํ•ด๋‹นํ•˜๋Š” ์•„๋ฏธ๋…ธ์‚ฐ๋“ค์˜ neutral mass์—๋‹ค๊ฐ€ 19๋งŒํผ ๋”ํ•œ ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๊ฐ€ prefix์™€ surfix๋ฅผ ๋”ํ•˜๋ฉด ๊ทธ๊ฒŒ ์ „์ฒด peptide์˜ neutral mass๊ฐ€ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ฒฐ๊ตญ (์•„๋ž˜ ๊ทธ๋ฆผ์˜ Ion Offsets) Surffix๋Š” ์ „์ฒด ์งˆ๋Ÿ‰์—์„œ Prefix ๋งŒํผ์˜ ์งˆ๋Ÿ‰์„ ๋นผ์ค€ ๊ฐ’์ด๋‹ค๋ผ๊ณ  ์šฐ๋ฆฌ๋Š” ์ƒ๊ฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

Untitled 6

์˜ˆ๋ฅผ ๋“ค์–ด์„œ 88์ด๋ผ๋Š” ์งˆ๋Ÿ‰์„ ๋ณด์•˜๋‹ค๋ฉด, ์ด ์นœ๊ตฌ๊ฐ€ b์ผ์ง€ y์ผ์ง€ ๋ชจ๋ฅธ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ๋Š” ์ง€๊ธˆ ์ „์ฒด peptide์˜ ์งˆ๋Ÿ‰์„ ์•Œ๊ณ  ์žˆ๋Š” ์ƒํƒœ์ด๋‹ค. ์™œ๋ƒํ•˜๋ฉด MS1์—์„œ ๊ณจ๋ผ์„œ ์™”๊ธฐ ๋•Œ๋ฌธ์—, ์–ธ์ œ๋“ ์ง€ precursor mass๋Š” ์•„๋Š” ๊ฒƒ์ด๋‹ค. ์›๋ž˜๋Š” precursor์˜ m/z ๊ฐ’์„ ์•„๋Š”๋ฐ, charge๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— precursor์˜ mass ๋˜ํ•œ ๊ตฌํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋ž˜์„œ ์ „์ฒด ์งˆ๋Ÿ‰์„ ์•Œ๊ณ  88์ด๋ผ๋Š” ๊ฐ’์„ ๋ณด๋ฉด, ์ด ์นœ๊ตฌ๊ฐ€ b ion์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ์ด๊ฑฐ์— ํ•ด๋‹นํ•˜๋Š” prefix์˜ residue mass๋Š” 87์ด๋‹ค. 1๋งŒํผ ์›๋ž˜ ๋”ํ•ด์•ผ b ion์ด ๋˜๋Š” ๊ฑฐ๋‹ˆ๊นŒ ์ด๊ฒƒ์— ํ•ด๋‹นํ•˜๋Š” prefix residue๋Š” 87์ธ ๊ฒƒ์ด๋‹ค.

์ด ์นœ๊ตฌ๊ฐ€ ๋ฐ˜๋Œ€๋กœ y ion์ด๋ผ๊ณ  ์ƒ๊ฐํ•ด๋ณด์ž. ์šฐ๋ฆฌ๋Š” surffix mass์— ๊ด€์‹ฌ์žˆ๋Š” ๊ฒƒ์ด ์•„๋‹Œ ๊ทธ๊ฑฐ์— ๋Œ€์‘๋˜๋Š” prefix mass๋กœ ๋ฐ”๊พธ๊ณ  ์‹ถ์€ ๊ฒƒ์ด๋‹ค. ์ฆ‰ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋‹ค ํ•œ ์ชฝ์œผ๋กœ ๋ฐ”๊ฟ€ ๊ฒƒ์ด๋‹ค. ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ž˜ํ”„์— ๋“ค์–ด๊ฐ€๋Š” ๋…ธ๋“œ๋“ค์€ ๋‹ค ํ•œ ํƒ€์ž…์˜ ion๋“ค ์ธ ๊ฒƒ์ด๋‹ค. prefix ion๋“ค์˜ ์งˆ๋Ÿ‰๋“ค์„ ๋‚˜ํƒ€๋‚ด๋Š”๊ฒŒ ๊ทธ๋ž˜ํ”„์˜ ๋…ธ๋“œ๋กœ ๋“ค์–ด๊ฐˆ ๊ฒƒ์ด๋‹ค.

prefixํ•˜๊ณ  surffix๊ฐ€ ์„ž์—ฌ ์žˆ์œผ๋ฉด ์ฒ˜๋ฆฌํ•˜๊ธฐ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์— ์–˜๋ฅผ b ion์œผ๋กœ ๋ดค์„ ๋•Œ์˜ prefix mass, y ion์ด๋ผ๊ณ  ์ƒ๊ฐํ–ˆ์„ ๋•Œ์˜ ๊ทธ๊ฑฐ์— ๋Œ€์‘๋˜๋Š” ์ €์ชฝ prefix mass๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ ‡๊ฒŒ ํ•ด์•ผ ์ „์ฒด์ ์œผ๋กœ ์ฒ˜๋ฆฌ๊ฐ€ ๊ฐ„๋‹จํ•  ๊ฒƒ์ด๋‹ค. ๊ทธ๋ž˜์„œ ์˜ˆ๋ฅผ ๋“ค์–ด์„œ ๋‚ด๊ฐ€ ๊ด€์ฐฐํ•œ ๊ฒŒ ํ•ด๋‹น peak์ธ๋ฐ, ์–˜๊ฐ€ surffix๋‹ค ๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ์ด๊ฑฐ์— ๋Œ€์‘ํ•˜๋Š” ๋‚˜๋จธ์ง€ prefix mass๋ฅผ ๊ตฌํ•ด์„œ spectrum ๊ทธ๋ž˜ํ”„์— ๋„ฃ๊ณ  ์‹ถ์€ ๊ฒƒ์ด๋‹ค. ๊ทธ๋ž˜์•ผ ์ „์ฒด์ ์œผ๋กœ ์„œ์—ด์„ ๊ตฌํ•˜๋Š” ๊ฒŒ ์‰ฌ์›Œ์ง„๋‹ค.

์ด์™€ ๊ฐ™์ด ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ์ด์˜จ๋“ค์˜ prefix residue๋ฅผ Prefix Residue Masses(PRM) ์ด๋ผ๊ณ  ํ•œ๋‹ค.

Untitled 7

์œ„์˜ ๊ทธ๋ฆผ์„ ํ†ตํ•ด ์‚ดํŽด๋ณด๋ฉด, ์šฐ์„  ์ „์ฒด peptide์˜ mass๋Š” 401์ด๋‹ค. ๋˜ํ•œ ์—ฌ๊ธฐ์„œ ๋‚˜ํƒ€ ๋‚  ์ˆ˜ ์žˆ๋Š”, ๊ด€์ธก๋œ 4๊ฐœ์˜ peak์ด y์ด์˜จ์ผ ๋•Œ์™€ b ์ด์˜จ์ผ ๋•Œ๋ฅผ ๋ชจ๋‘ ๊ตฌํ•ด๋ณด๋ฉด, (8๊ฐ€์ง€ ์ค‘ ๊ฒน์น˜๋Š” 2๊ฐ€์ง€๋ฅผ ์ œ์™ธ) ์ด 6๊ฐ€์ง€์˜ mass๋“ค์ด ๋‚˜ํƒ€๋‚˜๊ฒŒ ๋œ๋‹ค. ์ด ๋“ค์ด ์•„๋ฏธ๋…ธ์‚ฐ์˜ ์งˆ๋Ÿ‰์— ํ•ด๋‹นํ•˜๋Š”๊ฐ€๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. ๊ณ„์‚ฐ์„ ํ•ด์„œ ๊ทธ ์•„๋ฏธ๋…ธ์‚ฐ์˜ ์งˆ๋Ÿ‰ํ•˜๋Š” ๊ฒฝ์šฐ์—๋งŒ ๊ทธ ๋…ธ๋“œ๋“ค์„ edge๋ฅผ ํ†ตํ•ด ์—ฐ๊ฒฐํ•˜๊ฒŒ ๋œ๋‹ค. prefix์ค‘ ๊ทนํžˆ ์ผ๋ถ€๋งŒ ์ด์— ๋งž๊ฒŒ ๋‚˜ํƒ€๋‚˜๋ฉฐ, ์˜ฌ๋ฐ”๋ฅผ ๊ฒฝ์šฐ ์•„๋ฏธ๋…ธ์‚ฐ ๋งŒํผ์˜ ์งˆ๋Ÿ‰ ์ฐจ์ด๋ฅผ ๊ฐ€์ง€๊ณ  ๋‚˜ํƒ€๋‚  ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹นํ•˜๋Š” ๋…ธ๋“œ๊ฐ€ ๊ทธ๋ž˜ํ”„์— ๋‚˜ํƒ€๋‚˜๊ฒŒ ๋œ๋‹ค. 87๊ณผ 144์˜ ์ฐจ์ด๋Š” 57Da์œผ๋กœ ์ด๋Š” ์•„๋ฏธ๋…ธ์‚ฐ ์ค‘์— ์ œ์ผ ์ž‘์€ ๊ธ€๋ผ์ด์‹ (G)์— ํ•ด๋‹นํ•˜๋ฉด์„œ ์—ฌ๊ธฐ์— edge๊ฐ€ ๋“ค์–ด๊ฐ€๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

Spectral graph

์‹ค์ œ ํ˜„์‹ค์ ์œผ๋กœ de novo sequencing ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ค ๋•Œ๋Š” ์•„๋ฏธ๋…ธ์‚ฐ ํ•œ๊ฐœ ํ•œ ๊ฐœ, ๊ทธ ์–ด๋””์—์„ ๊ฐ€ ๋‹ค ์—ฐ๊ฒฐ์ด ๋  ๋งŒํผ์˜ ์ •๋ณด๊ฐ€ ์ŠคํŽ™ํŠธ๋Ÿผ ์•ˆ์— ๋‹ค ์žˆ์–ด์•ผ ํ•œ๋‹ค. ํ•˜๋‚˜๋ผ๋„ ๋น ์ง€๋ฉด edge ์—ฐ๊ฒฐ์ด ์•ˆ๋˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋”ฐ๋ผ์„œ ์‹ค์ œ๋กœ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ตฌํ˜„ํ•  ๋•Œ๋Š” ์ด edge๋ฅผ ์–ธ์ œ ์ถ”๊ฐ€ํ•˜๋ƒ๋ฉด, ์•„๋ฏธ๋…ธ์‚ฐ ํ•œ ๊ฐœ์˜ ์งˆ๋Ÿ‰์ด ์•„๋‹ˆ๋ผ ๋‘ ๊ฐœ๊นŒ์ง€๋Š” ๋‹น์—ฐํžˆ ํ—ˆ์šฉํ•˜๊ณ , ๊ทธ๋ž˜๋ด์•ผ ์ข…๋ฅ˜๋Š” 400๊ฐœ ์ •๋„์ด๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ€๋”์€ 3๊ฐœ ์ด๋Ÿฐ ๊ฒƒ๋„ ๊ณ ๋ คํ•œ๋‹ค. ์ฆ‰ ์–ผ๋งˆ ๋งŒํผ์„ tolerance๋ฅผ ๊ฐ€์งˆ ๊ฒƒ์ด๋ƒ, ์ค‘๊ฐ„์— ๋น ์ง€๋Š” prefix์˜ residue mass๋ฅผ ํ•œ ๊ฐœ ํ—ˆ์šฉํ•  ๊ฒƒ์ธ๊ฐ€ ๋‘ ๊ฐœ ํ—ˆ์šฉํ•  ๊ฒƒ์ธ๊ฐ€ ์ด๋Ÿฐ ๊ฒƒ๋“ค์ด ์ด์ œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ complexity๋ฅผ ๋†’์ด๋Š” ํ•˜๋‚˜์˜ ์š”์ธ์œผ๋กœ ์ž‘์šฉํ•œ๋‹ค.

Untitled 8

์ด์ œ๊ป ์•ž์—์„œ ์ด์•ผ๊ธฐํ•œ ๊ฒƒ ์ฒ˜๋Ÿผ prefix์˜ residue mass๋ฅผ ๋‹ค ๊ตฌํ•˜๋ฉด ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๋…ธ๋“œ๋“ค์ด ์ด๋ ‡๊ฒŒ ์ƒ์„ฑ์ด ๋œ๋‹ค. ์ฒซ ๋…ธ๋“œ๋Š” 0์ด๊ณ  ๋งˆ์ง€๋ง‰ ๋…ธ๋“œ๋Š” precursor์˜ mass์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์„ ๊ฐ–๋Š”๋‹ค. ์ด ๋‘ ๋…ธ๋“œ๋Š” ํŠน๋ณ„ํžˆ ๋“ค์–ด๊ฐ€๋Š” ๊ฒƒ์ด๋ฉฐ, ์•ž์—์„œ ๋ณด์•˜๋˜ ํ‘œ์—์„œ ์„ ์ •๋œ 6๊ฐœ์˜ ๊ฐ’๋“ค์ด ํŒŒ๋ž€์ƒ‰์œผ๋กœ ํ‘œ์‹œ๋œ ๋…ธ๋“œ๋“ค๋กœ ํ‘œ์‹œ๋œ๋‹ค.

๋‘ ๋…ธ๋“œ๋“ค ์‚ฌ์ด์˜ ์งˆ๋Ÿ‰ ์ฐจ์ด๋ฅผ ํ†ตํ•ด ์•„๋ฏธ๋…ธ์‚ฐ์„ ์œ ์ถ”ํ•˜๊ฒŒ ๋˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์งˆ๋Ÿ‰ ์ฐจ์ด์— ํ•ด๋‹นํ•˜๋ฉด edge๋ฅผ ๋„ฃ๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฐ ์‹์œผ๋กœ ๊ฒฝ๋กœ 0์—์„œ ์‹œ์ž‘ํ•ด์„œ precursor mass์— ํ•ด๋‹นํ•˜๋Š” ๋งˆ์ง€๋ง‰ ๊ฑฐ์—์„œ ๋๋‚˜๋Š” ๊ฒฝ๋กœ๋ฅผ ์ฐพ๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค. ๊ทธ ๊ฒฝ๋กœ์— ํ•ด๋‹นํ•˜๋Š” ์ด ์•„๋ฏธ๋…ธ์‚ฐ๋“ค์ด ๊ฒฐ๊ตญ ์„œ์—ด์ด ๋˜๊ณ  ๊ทธ๊ฒŒ ์ด ์ŠคํŽ™ํŠธ๋Ÿผ์— ๋Œ€ํ•œ ํ•ด์„์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋•Œ ์•ž์„œ ์ˆ˜ ์—†์ด ์ด์•ผ๊ธฐํ•œ forbidden pair์˜ ์œ ๋ฌด๋ฅผ ํ™•์ธํ•ด์•ผ ํ•˜๋ฏ€๋กœ ๊นŒ๋‹ค๋กœ์šด ์กฐ๊ฑด์ด๋ฉด์„œ ๋˜ ๊ทธ๋ž˜์„œ ์œ ๋ฆฌํ•œ ์กฐ๊ฑด์œผ๋กœ ์ž‘์šฉํ•˜๊ฒŒ ๋œ๋‹ค.

Untitled 9

Re-defining de novo interpretation

๋ฌธ์ œ๋ฅผ ๋‹ค์‹œ ์ •์˜ํ•˜์ž๋ฉด, ์‹œ์ž‘ ๋…ธ๋“œ์™€ ๋งˆ์ง€๋ง‰ ๋…ธ๋“œ์— 0๊ณผ MM(precursor mass)๊ฐ€ ๋“ค์–ด๊ฐ€๋ฉฐ ์ŠคํŽ™ํŠธ๋Ÿผ์˜ ๊ฐ๊ฐ์˜ ํ”ฝ์€ ์ตœ๋Œ€ ํ•˜๋‚˜์˜ ๋…ธ๋“œ์—๋งŒ ๊ธฐ์—ฌํ•ด์•ผ ํ•œ๋‹ค. ์ฆ‰, ๋งจ ๋งˆ์ง€๋ง‰ ํ•ด์„์—๋Š” ๊ฐ๊ฐ์˜ ํ”ฝ์ด ๋งŒ๋“  ๋…ธ๋“œ๋“ค ์ค‘์— ํ•˜๋‚˜๋งŒ, ์ตœ๋Œ€ ํ•˜๋‚˜๋งŒ ๋“ค์–ด๊ฐˆ ์ˆ˜ ์žˆ๋‹ค. ์ธ์ ‘ํ•œ ๋…ธ๋“œ๋“ค์€ edge๋ฅผ ํ†ตํ•ด ์—ฐ๊ฒฐ๋˜์–ด ์žˆ์–ด์•ผ ํ•˜๋ฉฐ, ๊ทธ ๋‹ค์Œ ์ด์ œ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฒฝ๋กœ ์ค‘์— ๊ฐ€์žฅ ์ข‹์€ ๊ฒƒ์„ ๊ณ ๋ฅผ ์ˆ˜ ์žˆ๋Š” ์ ์ ˆํ•œ ๋ชฉ์ ํ•จ์ˆ˜๊ฐ€ ์žˆ์–ด์•ผํ•œ๋‹ค. ์ด ๋ชฉ์ ํ•จ์ˆ˜๊ฐ€ ๋ฌด์—‡์ธ์ง€๋Š” ๋‚˜์ค‘์— ์ƒ๊ฐํ•˜๊ณ , ์ผ๋‹จ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋จผ์ € ์ดํ•ดํ•˜๊ณ  ๊ทธ ๋‹ค์Œ์— ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ์ •ํ•ด์•ผ ํ•˜๋Š”์ง€ ์ด์•ผ๊ธฐ ํ•˜๋„๋ก ํ•˜์ž.

Untitled 10

Two problems

์ „์ฒด ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ž˜ํ”„์—์„œ ์‹ค์ œ b-ion, y-ion์— ํ•ด๋‹นํ•˜๋Š” ์• ๋“ค์€ ๊ทนํžˆ ์ผ๋ถ€์ด๊ณ , ๊ทธ ๋‹ค์Œ์— ์šฐ๋ฆฌ๊ฐ€ forbidden pair๋ฅผ ํ”ผํ•˜๋Š” ๊ฒฝ๋กœ๋ฅผ ์ฐพ๋Š” ๋ฌธ์ œ๋ฅผ ํ’€์–ด์•ผ๋˜๋Š” ๊ฑด๋ฐ ์ด๋ฅผ NP-hard๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. NP-hard๋ž€, ์šฐ๋ฆฌ๊ฐ€ Pํ•˜๊ณ , NP๋Š” ์•Œ๊ณ , (NP ์ค‘์— ์ œ์ผ ์–ด๋ ค์šด ๊ฒƒ = NP conflict๋ผ๊ณ  ํ•˜๋ฉฐ, NP conflict๋Š” NP-hard ์ค‘์— ์ œ์ผ ์‰ฌ์šด ๋ฌธ์ œ๋“ค์— ํ•ด๋‹น) ์ผ๋ฐ˜์ ์œผ๋กœ NP-conflict ๋ณด๋‹ค ๋” ์–ด๋ ต๋‹ค๊ณ  ์ƒ๊ฐ๋˜๋Š” ๋ฌธ์ œ(์–ด๋ ต๋‹ค = ๋ณต์žก๋„๊ฐ€ ๋†’๋‹ค)๋ฅผ ์˜๋ฏธํ•œ๋‹ค.

Untitled 11

๊ทธ๋Ÿฐ๋ฐ ์ด์ œ ํ•œ๊ฐ€์ง€ ์žฌ๋ฏธ์žˆ๋Š” ํŠน์ง•์ด b-ion, ๊ทธ๋Ÿฌ๋‹ˆ๊นŒ prefix์™€ surffix, (์ด๋ ‡๊ฒŒ ์ง์„ ์ƒ๊ฐํ•  ์ˆ˜ ์žˆ๋‹ค.) b-ion๊ณผ ๊ทธ๊ฒƒ์— ๋Œ€์‘๋˜๋Š” ์ด์ชฝ surffix์˜ y-ion, ์ „์ฒด peptide์˜ ๊ธธ์ด๊ฐ€ N์ด๋ผ๊ณ  ์ด์•ผ๊ธฐ ํ•˜๋ฉด, bib_{i}๊ฐ€ ์žˆ์œผ๋ฉด, ynโˆ’iy_{n-i}๊ฐ€ ์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

์ฆ‰ ์Œ์œผ๋กœ ์กด์žฌ๋ฅผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๋‘˜์ด complementaryํ•˜๋ฏ€๋กœ ๋‘˜์ด ํ•ฉ์น˜๋ฉด ์ „์ฒด๊ฐ€ ๋˜๊ณ , ์„œ๋กœ ํ•œ ์ชฝ์„ ์•Œ๋ฉด ๋‚˜๋จธ์ง€๋ฅผ ์•Œ ์ˆ˜ ์žˆ๋Š” ์ด๋Ÿฐ ๊ด€๊ณ„์ธ ๊ฒƒ์ด๋‹ค.

Untitled 12

๋งŒ์•ฝ์— bib_{i}๊ฐ€ yjy_{j}๋ณด๋‹ค ์ž‘์œผ๋ฉด, yiy_{i}๋Š” ๋ฐ˜๋“œ์‹œ yjy_{j}๋ณด๋‹ค ํฌ๋‹ค. ํ•ฉํ•ด์„œ ์ „์ฒด M์ด ๊ฐ™์€๋ฐ, ํ•œ ์ชฝ์ด ํฌ๋ฉด ๋ฐ˜๋Œ€์ชฝ์€ ์ž‘์•„์•ผ ํ•œ๋‹ค. ๊ทธ๋ฆผ์œผ๋กœ ๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ์ด pair๊ฐ€ b-y pair๋ผ๊ณ  ์ƒ๊ฐ์„ ํ•˜๊ณ , ๊ทธ ์นœ๊ตฌ๋“ค์ด ์ด๋ ‡๊ฒŒ ์„ ์„ ํ†ตํ•ด ์—ฐ๊ฒฐ์„ ํ•ด๋†“๊ณ ์„œ๋Š”, ๋‘˜์ด complementary pair๋‹ค ์ด๋ ‡๊ฒŒ ์ด์•ผ๊ธฐ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. (0๊ณผ precursor mass M๋„ complementary pair์ด๋‹ค.)

์•„๋ž˜ ๊ทธ๋ฆผ์€ surffix mass๋ฅผ prefix mass๋กœ ๋ฐ”๊ฟ”๋†“์•„ ๋”ํ•˜๋ฉด precursor mass๊ฐ€ ๋˜์ง€๋Š” ์•Š์ง€๋งŒ, surffix๋ผ๋ฉด ๋”ํ•˜๋ฉด M์ด ๋œ๋‹ค. ์ด์™€ ๊ฐ™์ด ์Œ์œผ๋กœ ์กด์žฌํ•˜๋Š”๋ฐ ๊ทธ๋ฆผ์„ ๊ทธ๋ ค๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ์„œ๋กœ ๊ต์ฐจํ•˜๋Š” ์ผ์€ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค. ๋”ฐ๋ผ์„œ forbidden node pair๋“ค์„ ์ƒ๊ฐํ•ด๋ณด๋ฉด ์ด ์นœ๊ตฌ๋“ค์€ ์ ˆ๋Œ€๋กœ ์„œ๋กœ interceptํ•˜์ง€ ์•Š๊ณ  ๋Š˜ ์ด๋ ‡๊ฒŒ ํฌํ•จ๊ด€๊ณ„๋กœ ์กด์žฌํ•œ๋‹ค.

Untitled 13

์ด๋Ÿฌํ•œ ์กฐ๊ฑด์„ ์šฐ๋ฆฌ๊ฐ€ DP(Dynamic Programing)๋ฅผ ํ•ด์„œ ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒŒ ๋‹ค์Œ๋ถ€ํ„ฐ ์ด์•ผ๊ธฐํ•  ๋‚ด์šฉ์ด๋‹ค.

The forbidden pairs method

๊ฒฐ๊ตญ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๊ฒƒ์€ forbidden pair๋ฅผ ํ”ผํ•˜๋Š” path์ค‘์— ์–ด๋–ค ๊ฐ’์„ maximizeํ•˜๋Š” path๋ฅผ ๊ตฌํ•  ๊ฒƒ ์ธ๋ฐ, ์–ด๋–ค ๊ฐ’์„ maximize ํ• ๊ฑฐ๋ƒ ํ•˜๋Š” ๊ฒƒ์€ ์ผ๋‹จ์€ ๊ทธ๋ƒฅ ๋ˆ„๊ตฐ๊ฐ€๊ฐ€ ์คฌ๋‹ค๊ณ  ์น˜๊ณ , ๊ทธ ์ค€ ๊ฐ’์„ ๋ธํƒ€๋ผ๊ณ  ์นญํ•˜์ž. ๋ธํƒ€๋ผ๋Š” ํ•จ์ˆ˜๊ฐ€ ์žˆ์–ด์„œ ๊ทธ ๋ธํƒ€๋Š” node์— ์ฃผ์–ด์ง€๋Š” ๊ฐ’์ด๋‹ค. (node = ion peak = PRM)

PRM์ด ์ฃผ์–ด์ง€๋ฉด ๋„ˆ๋Š” ๋ช‡ ์ ์งœ๋ฆฌ๋ผ๊ณ  ์ฃผ๋Š” ์–ด๋– ํ•œ ํ•จ์ˆ˜๊ฐ€ ์žˆ๋‹ค๊ณ  ์น˜์ž. ๊ทธ ํ•จ์ˆ˜๊ฐ€ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์€ ๊ทธ PRM์ด ์‹ค์ œ๋กœ ์˜ฌ๋ฐ”๋ฅธ ๊ฒƒ์ด๊ณ  ๊ฑ”๊ฐ€ ์˜ฌ๋ฐ”๋ฅด๋‹ค๋Š” ๊ฑฐ๋Š” ํ•ด์„์— ํฌํ•จ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์„œ์—ด์„ ์„ค๋ช…ํ•˜๋Š” ํ•ด์„์— ํฌํ•จ๋˜๋Š” ๊ฒƒ์„ ์ด์•ผ๊ธฐํ•˜๋Š” ์ •๋ณด๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์–ด๋– ํ•œ ํ•จ์ˆ˜๊ฐ€ ์žˆ๊ณ , ๊ทธ ํ•จ์ˆ˜๊ฐ€ ์ด๋ฏธ ์šฐ๋ฆฌ์—๊ฒŒ ์ฃผ์–ด์ ธ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. ์•Œ๊ณ ๋ฆฌ์ฆ˜๋งŒ ๋จผ์ € ์‚ดํŽด๋ณด์ž.

Untitled 14

์ผ๋‹จ ๊ทธ๋ž˜ํ”„ ์•ˆ์— ์žˆ๋Š” ๋ชจ๋“  PRM๋“ค์„ ๋‹ค sortingํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์œ„์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์ˆœ์„œ๋Œ€๋กœ ๋‚˜์—ด์ด ๋œ๋‹ค. ๊ทธ ๋‹ค์Œ์— ์ด์ œ notation ์ƒ์œผ๋กœ ์–ด๋–ค ๊ทธ๋ž˜ํ”„์— ์žˆ๋Š” node u์— ๋Œ€ํ•ด์„œ ๊ทธ๊ฑฐ์— ๋Œ€์‘๋˜๋Š” ์ €์ชฝ ๋‚˜๋จธ์ง€ forbidden pair์˜, u์— ๋Œ€์‘ํ•˜๋Š” ์ง์ด ๋˜๋Š” ์นœ๊ตฌ๋ฅผ f(u)f(u)๋ผ๊ณ  ์“ฐ๋Š” ๊ฒƒ์ด๋‹ค.(์ด์™€ ๊ฐ™์ด ์Œ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค.)

๊ทธ ๋‹ค์Œ, ์ด์ œ ์ด ๋…ธ๋“œ์˜ ์‹ค์ œ mass๊ฐ€ ์–ผ๋งˆ๋ƒ ๋ผ๊ณ  ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์ด m(s)์ด๋‹ค. ์ด๊ฒƒ์€ ๋‹จ์ง€ notation์— ๋ถˆ๊ณผํ•˜๋‹ค. ๊ฐ๊ฐ์˜ ๋…ธ๋“œ๋Š” ์–ด๋–ค prefix residue mass๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ  ์žˆ๋Š”์ง€ ๋‹น์—ฐํžˆ ์ ํ˜€ ์žˆ๋‹ค.

D.P. for forbidden pairs

์ด ์ดํ›„ ์šฐ๋ฆฌ๊ฐ€ ํ•  ๊ฑฐ๋Š”, ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ prefix residue mass์— ํ•ด๋‹นํ•˜๋Š” ์ด node pair๋“ค์— ๋Œ€ํ•ด์„œ ๋ญ”๊ฐ€๋ฅผ ๊ณ„์‚ฐํ•  ๊ฒƒ์ด๋‹ค. ๊ทธ node๋“ค์— ๋Œ€ํ•ด์„œ ๋‚ด๊ฐ€ ์–ด๋–ค pair๋งŒ ๊ณ„์‚ฐ์„ ํ•  ๊ฑฐ๋ƒ๋ฉด, ์ด pair u์™€ v๋ผ๊ณ  ํ•˜๋Š” ๋‘๊ฐœ์˜ ํ•œ ์Œ์˜ node๋ฅผ ์ƒ๊ฐํ•  ๋•Œ, u๋Š” ์ „์ฒด peptide ์งˆ๋Ÿ‰์˜ ์ ˆ๋ฐ˜๋ณด๋‹ค ์ž‘๊ฑฐ๋‚˜ ๊ฐ™๊ณ , v๋Š” ์ ˆ๋ฐ˜๋ณด๋‹ค ํฌ๊ฑฐ๋‚˜ ๊ฐ™์€ ๊ฒฝ์šฐ๋งŒ ๋‚ด๊ฐ€ ๊ณ ๋ คํ•˜๊ฒ ๋‹ค ์ด ๋ง์ด๋‹ค. ์ด๊ฑด ์ด์ œ ์ด forbidden pair๊ฐ€ m/2m/2๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋Š˜ ์–‘์ชฝ์œผ๋กœ ์žˆ๋‹ค๋Š” ์ด ์„ฑ์งˆ์„ ์ž˜ ํ™œ์šฉํ•˜๊ณ  ์‹ถ์–ด์„œ ์ด๋ ‡๊ฒŒ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

๋‹ค์ด๋‚˜๋ฏน ํ”„๋กœ๊ทธ๋ž˜๋ฐ(DP, Dynamic Programing)์€ ๊ฒฐ๊ตญ ์–ด๋–ค ํ…Œ์ด๋ธ”์„ ์ฑ„์šฐ๋Š” ๊ฒƒ์ด๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์ฑ„์šธ ํ…Œ์ด๋ธ”์˜ ์ด๋ฆ„์€ S์ด๋‹ค. ๊ทธ S๋ผ๊ณ  ํ•˜๋Š” ํ…Œ์ด๋ธ”์„ ์ฑ„์šธ ๊ฒƒ์ด๊ณ , ๊ทธ ํ…Œ์ด๋ธ” ์•ˆ์—์„œ ์šฐ๋ฆฌ๊ฐ€ ์–ด๋–ค ๊ฐ€์žฅ ์ข‹์€ ๊ฐ’์„ ๊ฐ–๋Š” ๊ฒƒ์„ ์ฐพ๋Š” ๋ฌธ์ œ๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฑด๋ฐ ๊ทธ S๋ผ๊ณ  ํ•˜๋Š” ํ…Œ์ด๋ธ”์ด ๋‚˜ํƒ€๋‚ด๋Š” ๊ฑฐ๋Š”(์—ฌ๊ธฐ์„œ๋Š” 2-dimensionํ•œ ์ƒํƒœ), PRM node 2๊ฐœ(ํ•œ ์ชฝ์€ u, ๋‹ค๋ฅธ ํ•œ ์ชฝ์€ v)๋ฅผ ๋†“๊ณ  ๋‘˜ ์‚ฌ์ด์— ์–ด๋–ค ๊ฒฝ๋กœ๋ฅผ ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋•Œ DP๊ฐ€ ๋‚˜ํƒ€๋‚ด๋Š” path๋Š” uํ•˜๊ณ  v๋ฅผ ํฌํ•จํ•˜๋Š”, forbidden pair๋ฅผ ์ž˜ ํ”ผํ•˜๋Š” path์ด๋‹ค. ์ž˜ ํ”ผํ•˜๋Š” path๋ฅผ validํ•œ path๋กœ ๋ณผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, validํ•œ path ์ค‘์— ๊ฐ€์žฅ ์ข‹์€ score๋ฅผ ์ด ํ…Œ์ด๋ธ” s๊ฐ€ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ, ์ด ํ…Œ์ด๋ธ”์€ ๊ณ„์† ์—…๋ฐ์ดํŠธ ๋œ๋‹ค.

๊ณ„์† ์—…๋ฐ์ดํŠธ ๋˜๋Š” ์ด์œ ๋Š” ์ง€๊ธˆ๊นŒ์ง€ ๋ณธ ๊ฑฐ๋ณด๋‹ค ๋” ์ข‹์€ ๊ฒŒ ๋‚˜์˜ค๋ฉด ์ด์ œ ์—…๋ฐ์ดํŠธ๊ฐ€ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. DP๋ฅผ ์ฑ„์šฐ๋Š” ๋™์•ˆ์—๋Š” path๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ ์ง€ ๋ชจ๋ฅธ๋‹ค. 0์—์„œ u๋กœ, v์—์„œ M์œผ๋กœ ๊ฐ€๋ฉด์„œ ํ…Œ์ด๋ธ”์„ ๋‹ค ์ฑ„์šฐ๊ณ , ๊ฒฐ๊ตญ u์™€ v๋ฅผ ํ†ต๊ณผํ•ด์„œ ์‹œ์ž‘์—์„œ ๋๊นŒ์ง€ ๊ฐ€๋Š” ์ด forbidden pair๋ฅผ ์ž˜ ํ”ผํ•˜๋Š” ์ด๋Ÿฐ ๊ฒฝ๋กœ์˜ ์—ฌ๋Ÿฌ ๊ฐ€๋Šฅ์„ฑ ์ค‘์— ๊ฐ€์žฅ ์ข‹์€ ๊ฒƒ์„ ์–˜๊ฐ€ ๊ธฐ๋กํ•˜๊ณ  ์žˆ๋‹ค.(์ด๋•Œ u์™€ v๋Š” ์•ž์„œ ์ด์•ผ๊ธฐํ•œ ๊ฒƒ ์ฒ˜๋Ÿผ, u๋Š” m/2m/2์˜ ์™ผ์ชฝ, v๋Š” m/2m/2์˜ ์˜ค๋ฅธ์ชฝ์—์„œ ๋”ฐ์ง€๊ฒŒ ๋œ๋‹ค.)

์ด ๊ณ„์‚ฐ์ด ์ œ๋Œ€๋กœ ์ด๋ฃจ์–ด์กŒ๋‹ค๋ฉด, ์ด๋Ÿฐ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ๋ชจ๋“  u์™€ v์— ๋Œ€ํ•ด์„œ ์–˜๋ฅผ ๋‹ค ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด ์‹ค์ œ๋กœ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, ๊ทธ๊ฑธ๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋‹ต์„ ์–ป์„ ์ˆ˜ ์žˆ๋Š”๊ฒŒ ๋งž๋Š”๊ฐ€ ์ƒ๊ฐํ•ด๋ณด์ž.

Untitled 15

DP๋ฅผ ๋‹คํ•˜๊ณ  ๋‚ฌ๋”๋‹ˆ, ์‹คํ–‰์„ ๋งˆ์ง€๋ง‰๊นŒ์ง€ ํ•˜๊ณ  ๋‚ฌ๋”๋‹ˆ ์ด ํ…Œ์ด๋ธ”์— ์ด ์œ„์น˜์— ์ ํ˜€์žˆ๋‹ค ๊ทธ๋Ÿฌ๋ฉด ์›ํ•˜๋Š” ๋‹ต์„ ๊ตฌํ•œ ๊ฒƒ์ด๋‹ค. ๊ฒฝ๋กœ๋ฅผ ๋ณต์›ํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•œ๋ฐ, ์–ด๋–ป๊ฒŒ ๋‚˜์ค‘์— ๊ฒฝ๋กœ๋ฅผ ๋ณต์›ํ•˜๋Š”๊ฐ€ ๊ทธ ๋ฐฉ๋ฒ•์„ ๋…ผํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ฒฐ๊ตญ ๋ฐ–์—์„œ ๋ถ€ํ„ฐ ์ฑ„์›Œ๋“ค์–ด๊ฐ€์•ผ ํ•œ๋‹ค.

Untitled 16

The complete algorithm

์ด๋ฅผ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ ์ธ ์ธก๋ฉด์—์„œ ์‚ดํŽด๋ณด๋ฉด, case๋ฅผ ๋‘ ๊ฐ€์ง€๋กœ ๋‚˜๋ˆ ์„œ ์ ‘๊ทผํ•˜๊ฒŒ ๋œ๋‹ค. ์šฐ์„  ๋ชจ๋“  u์— ๋Œ€ํ•ด์„œ 0๋ถ€ํ„ฐ ์‹œ์ž‘ํ•ด์„œ m/2m/2๊นŒ์ง€ ์ฆ๊ฐ€ํ•˜๋ฉด์„œ ์ง„ํ–‰์„ ํ•˜๊ณ , ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฐ˜๋Œ€์ชฝ์—์„œ v์— ๋Œ€ํ•ด์„œ m๋ถ€ํ„ฐ m/2m/2๊นŒ์ง€ ๊ฐ์†Œํ•˜๋ฉด์„œ ์ง„ํ–‰์„ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋‘ ๊ฐ€์ง€ ์ผ€์ด์Šค์— ๋Œ€ํ•ด์„œ forbidden pair๊นŒ์ง€ ๊ณ ๋ คํ•˜์—ฌ u์™€ f(v)f(v)๋ฅผ ๋น„๊ตํ•˜์—ฌ edge๋ฅผ ์—ฐ๊ฒฐํ•˜๊ณ , ์ ์  ์ขํ˜€๋‚˜๊ฐ€์„œ ์ตœ์ ์˜ path๋ฅผ ์ฐพ๊ฒŒ๋œ๋‹ค.

Untitled 17

De novo : second issue

node์˜ score๋ฅผ ์–ด๋–ป๊ฒŒ ์ •ํ•  ๊ฒƒ์ธ๊ฐ€์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐ๋ฅผ ํ•ด๋ณด์ž. ์•ž์„œ ๋ณธ DP๋Š” bํ•˜๊ณ  y์ด์˜จ๋งŒ ์žˆ๋‹ค๋ฉด ์ฐธ ์ข‹๊ฒ ์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ๊ทธ๋ ‡์ง€ ์•Š๋‹ค. spectrum์—๋Š” ๋‹ค๋ฅธ type์˜ ion๋“ค๋„ ๋งŽ์ด ์กด์žฌํ•œ๋‹ค. (e.g, a-ion, neutral loss, isotopic, etc) ์ด๋Ÿฌํ•œ ๊ฒƒ๋“ค์„ ์ž˜ ํ™œ์šฉํ•ด์„œ node์˜ score๋ฅผ ์ž˜ ์ •ํ•˜๊ณ  ์‹ถ๋‹ค๋Š” ๊ฒƒ์ด ๋ณธ ๋ฌธ์ œ์˜ ํฌ๋ง์‚ฌํ•ญ์ด๋‹ค.

Untitled 18

weighting nodes in spectrum graph

๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๊ฐ€ ์กฐ๊ธˆ ๋” ์‰ฝ๊ฒŒ DP๋ฅผ ์ด์šฉํ•˜์—ฌ ์กฐ๊ธˆ ๋” ์ข‹์€ ๊ฐ’์„ ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ทผ๊ฑฐ๋กœ ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์˜ˆ๋ฅผ ๋“ค ์ˆ˜ ์žˆ๋‹ค.

Untitled 19

์ฒซ ๋ฒˆ์งธ๋กœ intensity. ์ฆ‰, ํฌ๊ธฐ๊ฐ€ ํฌ๋ฉด ๋ฌด์กฐ๊ฑด ๋‹ค ์ข‹์€ ๊ฒƒ์ธ๊ฐ€์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ด๋ด์•ผ ํ•œ๋‹ค. ํฌ๊ธฐ๊ฐ€ ํฌ๋‹ค๊ณ  ๋ฌด์กฐ๊ฑด ์ข‹์€ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. ์œ„์˜ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด, x์ถ•์ด intensity rank์ด๋‹ค. ๊ฒ€์€ ์ ์ด b-ion์„, ํฐ ์ ์ด y-ion์„ ๋‚˜ํƒ€๋‚ด๋Š”๋ฐ, 1๋“ฑ์œผ๋กœ ๋‚˜์˜ค๋Š” ๊ฒƒ์ด y-ion์ด 70%, b-ion์ด ํ•œ 10%, ์ด๋ ‡๊ฒŒ ๋‚˜์˜จ๋‹ค. ์ฆ‰, intensity rank์—์„œ 1~3๋“ฑ๊ณผ ๊ฐ™์ด rank๊ฐ€ ๋†’์€ ๋ถ€๋ถ„์€ y-ion์ด, rank๊ฐ€ ๋‚ฎ์€ ๋ถ€๋ถ„์—์„œ๋Š” b-ion์ด ๋” ๋งŽ์€ %๋ฅผ ์ฐจ์ง€ํ•˜๊ณ  ์žˆ๋‹ค. ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” ๊ทธ๋ž˜ํ”„๋Š” ๊ฐ™์€๋ฐ ์žฅ๋น„๊ฐ€ ๋‹ค๋ฅธ case์ด๋‹ค. (์žฅ๋น„๊ฐ€ ๋‹ค๋ฅด๋‹ค = fragment ๋ฐฉ๋ฒ•์ด ๋‹ค๋ฅด๋‹ค.) ๊ทธ๋Ÿฌ๋‚˜, ๋น„์Šทํ•œ ๊ฒฝํ–ฅ์„ ๋ณด์ธ๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์ •๋ฆฌํ•˜์ž๋ฉด, intensity๋ฅผ ํ†ตํ•ด ์ด๊ฒŒ b-ion์ผ์ง€, y-ion์ผ์ง€ ๊ทธ ๊ฐ€๋Šฅ์„ฑ์„ ์šฐ๋ฆฌ๊ฐ€ ์กฐ๊ธˆ ๋” ์ž˜ ์•Œ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์„ ์ด์•ผ๊ธฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

๋‹ค์Œ์œผ๋กœ support ions์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด๋ณด์ž. ์•ž์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ์ด, b๋‚˜ y-ion์ด H2OH_{2}O๋‚˜ NH3NH_{3}๋ฅผ ์ถ”๊ฐ€์ ์œผ๋กœ ์žƒ์–ด๋ฒ„๋ ค์„œ ๋งŒ๋“ค์–ด์ง„ ์ด์˜จ์„ Neutral loss ion์ด๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. ์ด๋Ÿฌํ•œ ์ด์˜จ๋“ค์ด ๊ด€์ฐฐ๋˜๋Š” ๊ฒฝ์šฐ ๋˜ํ•œ ๋งŽ์€๋ฐ, ๊ฒฐ๊ตญ fragmentation์„ ์ง„ํ–‰ํ•˜๋ ค๋ฉด ์—๋„ˆ์ง€๋ฅผ ์ฃผ์–ด์•ผ ํ•˜๋Š”๋ฐ (์ด๋•Œ ์—๋„ˆ์ง€๋Š” ์ถฉ๋Œ์—๋„ˆ์ง€, ํ˜น์€ ๋‹ค๋ฅธ ์—๋„ˆ์ง€), ์—๋„ˆ์ง€๋ฅผ ํ†ตํ•ด ionํ™”๊ฐ€ ๋œ ๋‹ค์Œ, ๋˜ ๋‚จ์€ ์—๋„ˆ์ง€๊ฐ€ ์˜ํ–ฅ์„ ๋ฏธ์ณ, neutral loss ion์ด ๋ฐœ์ƒํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฌํ•œ ์ด์˜จ๋“ค์ด ํ•ด์„์ด ์ž˜ ๋˜์—ˆ๋‹ค๋ฉด, ๋‹ค์Œ๊ณผ ๊ฐ™์€ spectrum์„ ๋ณด์ธ๋‹ค.

Untitled 20

์œ„์˜ spectrum์„ ๋ณด๋ฉด, N-term, charge 1์˜ ๊ฒฝ์šฐ H2OH_{2}O ํ˜น์€ NH3NH_{3}๊ฐ€ ๋งŽ์ด ๋น ์ง„ ๋ชจ์Šต์„ ๋ณด์ธ๋‹ค. ์ด์ฒ˜๋Ÿผ, ์ž๊ธฐ ์ž์‹ ๊ณผ ์—ฐ๊ด€๋œ ๋‹ค๋ฅธ ๋” ๋งŽ์€ neutral loss๊ฐ€ ์žˆ๋Š” peak๋“ค์ด ๋งŽ์ด ๊ด€์ฐฐ์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ ์–‘์ƒ์ด b๋ƒ y๋ƒ์— ๋”ฐ๋ผ ๋‹ค๋ฅด๊ฒŒ ๋‚˜ํƒ€๋‚˜๋ฉฐ, ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, fragment ion์˜ charge๊ฐ€ +1์ด๋ƒ +2์ด๋ƒ์— ๋”ฐ๋ผ์„œ๋„ ๋˜ ๋‹ค๋ฅด๊ฒŒ ๋‚˜ํƒ€๋‚œ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ isotopic์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด๋ณด๋ฉด, ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์•ž์„œ ์ด์•ผ๊ธฐํ–ˆ๋“ฏ์ด, precursor์˜ charge๋ฅผ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์ด์œ ๋Š” isotopic์— ํ•ด๋‹นํ•˜๋Š” peak๋“ค(+1, +2) ์‚ฌ์ด์˜ ๊ฐ„๊ฒฉ์„ ํ†ตํ•ด ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. fragment ion์—์„œ๋Š” isotopic์ด ๋Š˜ ๋ณด์ด์ง€ ์•Š๋Š”๋ฐ, ๊ทธ ์ด์œ ๋Š” ๊ด€์ธก๋˜๋Š” fragment ion์˜ ์งˆ๋Ÿ‰์ด ๋งค์šฐ ์ž‘๊ธฐ ๋•Œ๋ฌธ์— 1%์˜ isotopic์ด ์กด์žฌํ•  ํ™•๋ฅ ์ด ๊ทธ๋ ‡๊ฒŒ ํฌ์ง€ ์•Š๋Š” ๊ฒƒ์ด๋‹ค(๋ฝํ•ด์•ผ 2~3๊ฐœ ์žˆ๋Š” ์ •๋„). ๊ทผ๋ฐ ์ด์ œ fragment ion์˜ ์งˆ๋Ÿ‰์ด ์ปค์ง€๋ฉด isotopic๋“ค๋„ ์ž˜ ๋ณด์ด๊ฒŒ ๋œ๋‹ค. ๋”ฐ๋ผ์„œ isotopic ๋˜ํ•œ noise๋กœ ์ž‘์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

๊ฒฐ๊ตญ ์œ„ 3๊ฐœ์˜ factor๋“ค์ด ์ด ion์ด b๋ƒ y๋ƒ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ธํƒ€ํ•จ์ˆ˜๋ฅผ ์ •ํ•  ๋•Œ ์ข‹์€ ๊ทผ๊ฑฐ๋“ค์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

A simple example of a Bayesian scoring model

ํ•˜๋‚˜์˜ ๋ฐฉ๋ฒ•๋ก ์„ ์‚ดํŽด๋ณด์ž. Pep Novo์—์„œ ์ œ์‹œํ–ˆ๋˜ ๋ฐฉ๋ฒ•์ด๋‹ค. Bayesian network๋ฅผ ์ด์šฉํ•ด์„œ scoringํ•˜๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰ ํ•™์Šต์„ ํ†ตํ•ด์„œ scoring model์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค. ์—ฌ๊ธฐ์„œ ๊ณ ๋ ค๋˜๋Š” intensity๋Š” ์ •๋ฐ€ํ•œ ๊ฐ’์ด ์•„๋‹Œ, ๊ทธ๋ƒฅ 1. ํฌ๋ƒ 2. ์ž‘๋ƒ, 3. ์•„์˜ˆ ๊ด€์ฐฐ์ด ์•ˆ๋˜์—ˆ๋Š”๊ฐ€ ์ •๋„๋กœ๋งŒ ๋‚˜๋ˆ ์ ธ์žˆ๋‹ค.

Untitled 21

์–ด๋–ค ์งˆ๋Ÿ‰ ๊ฐ’์„ ๋„ฃ๊ณ , ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ž˜ํ”„์—์„œ prefix residue mass์— ํ•ด๋‹นํ•˜๋Š” ๋…ธ๋“œ์˜ ์„ฑ์งˆ์„ ๊ฐ€์ ธ์•ผ ๋ธํƒ€๋ฅผ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ ์„ฑ์งˆ์„ ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„ํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๊ฒƒ์€ supporting peak๋“ค, ์•ž์„œ ์ด์•ผ๊ธฐํ•œ neutral loss๋‚˜ isotopic์ด๋‚˜ ๋‹ค๋ฅธ ์—ฌ๋Ÿฌ๊ฐ€์ง€ ์„ฑ์งˆ๋“ค, ์„ ์ด์šฉํ•ด์„œ ์•„๋ž˜์˜ ์‹์—์„œ์˜ m, prefix residue mass์— ํ•ด๋‹นํ•˜๋Š” ์–˜๊ฐ€ ์‹ค์ œ๋กœ ์˜๋ฏธ ์žˆ๋Š” fragment์ผ ๊ฐ€๋Šฅ์„ฑ (=b ๋˜๋Š” y์ด์˜จ ์ผ ๊ฐ€๋Šฅ์„ฑ)์ด ์–ผ๋งˆ๋ƒํ•˜๋Š” ๊ฒƒ์„ ์ถ”์ •ํ•ด๋ณด๊ณ  ์‹ถ์€ ๊ฒƒ์ด๋‹ค. ์ด ํ™•๋ฅ ์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ด์ œ Bayesian theorem์„ ์‚ฌ์šฉํ•˜๋ฉด ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.

Bayesian Network๋Š” ๋ณดํ†ต ๊ทธ ํ™•๋ฅ  ๋ณ€์ˆ˜๋“ค ์‚ฌ์ด์— ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์žˆ๋Š” ๊ฒฝ์šฐ์— ์ข…์ข… ์‚ฌ์šฉํ•œ๋‹ค. ์ธ๊ณผ๊ด€๊ณ„์ด๊ธฐ ๋•Œ๋ฌธ์— ์„ฑ๋ฆฝํ•˜๋Š” ์–ด๋–ค conditional independent๋ฅผ ๊ฐ€์ •ํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์ธ๋ฐ, ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— bayesian network๋ฅผ ์•„๋ฌด๋ ‡๊ฒŒ๋‚˜ ๊ฐ–๋‹ค๊ฐ€ ์“ฐ๋ฉด ์•ฝ๊ฐ„ ๋ง์ด ์•ˆ๋œ๋‹ค. ํŠน๋ณ„ํžˆ ์ด์ œ ํ™•๋ฅ  ๋ณ€์ˆ˜๋“ค ์‚ฌ์ด์— ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์žˆ์„ ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์˜๋ฏธ์žˆ๋‹ค.

Untitled 22

์˜ˆ๋ฅผ ๋“ค์–ด ์œ„์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด a์—์„œ b๋กœ ๊ฐ€๋Š” edge๊ฐ€ ์žˆ๋‹ค ๊ทธ๋Ÿฌ๋ฉด์€ a๊ฐ€ ์›์ธ์ด ๋˜๊ณ , b๊ฐ€ ์–ด๋–ค ๊ฒฐ๊ณผ๊ฐ€ ๋˜๋Š” ์ด๋Ÿฐ ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ์ด์•ผ๊ธฐํ•œ๋‹ค. ๋ฌผ๋ก  ์œ„์˜ ๊ทธ๋ฆผ์ด ์—‰ํ„ฐ๋ฆฌ์ธ ์ด์œ ๋Š”, a-ion์ด ๊ด€์ฐฐ๋˜๋ฉด b-ion์ด ๊ด€์ฐฐ๋œ๋‹ค๋Š” ์ด๋Ÿฐ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š”๊ฑฐ๋ผ ์‹ค์ œ๋กœ๋Š” ๋ง์ด ์•ˆ๋œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์œ„ ๊ทธ๋ฆผ์— ์ ์–ด๋‘์—ˆ๋“ฏ์ด, beyesian network์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ƒํ™ฉ์€ ๊ฐ๊ฐ์˜ ๊ทธ๋ž˜ํ”„๋ฅผ ์ด์šฉํ•ด์„œ ์–ด๋–ค ํ™•๋ฅ  ๊ฐ’์„ ์ถœ์›ํ•˜๋Š” ๊ฑด๋ฐ ๊ฐ๊ฐ์˜ node๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜์ด๊ณ , node๋“ค ์‚ฌ์ด์— edge๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์€ ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ๋ณด์—ฌ์ค€๋‹ค. edge์˜ ์‹œ์ž‘์€ ์›์ธ์ด๊ณ  ๋์ ์— ํ•ด๋‹นํ•˜๋Š” node๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋˜๋Š” ์ด๋Ÿฐ ๊ด€๊ณ„๊ฐ€ ์–ด๋–ค graph์˜ topology๊ฐ€ ๋œ๋‹ค. ๊ทธ ๋‹ค์Œ์— ๊ทธ๋ž˜ํ”„์˜ ๊ฐ๊ฐ์˜ node๋Š” ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์ด ๋ถ™์–ด ์žˆ์–ด์•ผ ํ•œ๋‹ค.

์ด ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์„ ๊ตฌํ•ด์•ผํ•˜๋Š”๋ฐ, ์–ด๋–ป๊ฒŒ ๊ตฌ์„ฑ์ด ๋˜์–ด ์žˆ๋ƒ๋ฉด ์œ„ ๊ทธ๋ฆผ์˜ y๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ณด๋ฉด node์— ๋“ค์–ด์˜ค๋Š” edge๊ฐ€ 2๊ฐœ์ด๋‹ค. ์ฆ‰, y๋Š” b์™€ yโˆ’H2Oy-H_{2}O์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ๋‹ค ๊ฐ€์ง€๊ณ  ์žˆ์–ด์•ผ ํ•œ๋‹ค. ๋˜ํ•œ ๊ฐ๊ฐ์˜ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•ด์„œ ์ด์ต์˜ ํ™•๋ฅ ์ด ์–ด๋–ป๊ฒŒ ๋˜๋Š”์ง€๋ฅผ ์ด ๋…ธ๋“œ๋“ค์— ์ ์–ด๋†”์•ผ ํ•œ๋‹ค. ๊ทธ๋ž˜์„œ Bayesian network์—์„œ ์ด ๊ตฌ์„ฑ ์ž์ฒด๋Š” pose and effect๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์–ด๋–ค ๋„คํŠธ์›Œํฌ์—๋‹ค๊ฐ€ ๊ฐ๊ฐ์˜ node์— ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์ด ์žˆ์–ด์•ผ ๊ฑฐ๊ธฐ์— ์•Œ๋งž์€ ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

๋˜ํ•œ ์ด๋Ÿฌํ•œ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ๋“ค์€ chain rule์„ ์„ฑ๋ฆฝํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ง์ ‘์ ์ธ ์›์ธ์ด ์žˆ์„ ๋•Œ๋Š” ๋…๋ฆฝ์ ์ธ case๋Š” ๋‚ ๋ ค๋ฒ„๋ ค๋„ ๋œ๋‹ค. ์ฆ‰ ์ธ๊ณผ๊ด€๊ณ„์ด๊ธฐ ๋•Œ๋ฌธ์— ์„ฑ๋ฆฝํ•˜๋Š” ๋…๋ฆฝ์˜ ์กฐ๊ฑด๋“ค์„ ํ™œ์šฉํ•˜์—ฌ ์ด ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์„ ๊ฐ„๋‹จํ™” ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ indirectํ•œ ๊ฒƒ๋“ค๋„ ๊ด€์ฐฐ๋  ์ˆ˜ ์žˆ์œผ๋‚˜ ๊ทธ๋ƒฅ ๋ฌด์‹œํ•ด๋„ ๊ดœ์ฐฎ๋‹ค๋Š” ๊ฒƒ์ด ๊ธฐ๋ณธ์ ์ธ ๊ณ„์‚ฐ์ด๋‹ค.

PepNovo : Weighting nodes

์•ž์„œ ์„ค๋ช…ํ•œ bayesian network๋ฅผ ์ด์šฉํ•ด์„œ scoring์„ ์ง„ํ–‰ํ•œ ๊ฒƒ์ด PepNovo์˜ ๊ธฐ๋ณธ ๊ฐœ๋…์ด๋‹ค. ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด nodeํ•˜๋‚˜๋งŒ ๋ณธ ๊ฒƒ์ด ์•„๋‹Œ, ์ธ์ ‘ํ•œ ์•„๋ฏธ๋…ธ์‚ฐ๋„ ๊ฐ™์ด ๋ณธ ๊ฒƒ์ด๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ๊ด€์‹ฌ์„ ๊ฐ–๋Š” ์•„๋ฏธ๋…ธ์‚ฐ์€ N-terminal๊ณผ C-terminal์˜ ์•„๋ฏธ๋…ธ์‚ฐ์ด ๋ฌด์—‡์ด๋ƒ์— ๋”ฐ๋ผ์„œ๋„ ์˜ํ–ฅ์„ ๋ฐ›์„ ๊ฒƒ์ด๋‹ค. ๋˜ํ•œ ์ด node๊ฐ€ b-ion์ธ์ง€, y-ion์ธ์ง€, b์ด๋ฉด intensity๊ฐ€ ํฌ๋ƒ ์ž‘๋ƒ ์•„์˜ˆ ๊ด€์ฐฐ์ด ์•ˆ๋˜๋Š”๊ฐ€, b-ion์˜ intensity์— ์˜ํ•ด์„œ neutral loss์˜ intensity๊ฐ€ ๊ฒฐ์ •์ด ๋ ๊บผ๊ณ  ๋“ฑ๋“ฑ ์ด๋ ‡๊ฒŒ ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‚˜๋ฆ„ ๊ทธ๋ž˜ํ”„ ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ์ด ๊ทธ๋ž˜ํ”„ ๋ชจ๋ธ์— ๊ฐ๊ฐ์˜ ๋…ธ๋“œ์—๋‹ค๊ฐ€ ์•ž์„œ ๋งํ•œ conditional ํ™•๋ฅ ์„ ๊ตฌํ•ด์„œ ๋ถ™์˜€๋Š”๋ฐ ์ด๋ฏธ ์กด์žฌํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์—ฌ ์ผ์ผํžˆ ์ง„ํ–‰ํ•œ ๊ฒƒ์ด๊ณ , ์ด๋Ÿฌํ•œ score๋Š” ์•„๋ž˜์˜ ๊ทธ๋ฆผ์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋“ฏ์ด log ratio๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜์—ฌ ๊ตฌํ•ด์กŒ๋‹ค.

๋žœ๋ค์œผ๋กœ ๊ทธ ์ •๋„๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ์€ ์–ผ๋งˆ๋ƒ๋ฅผ ๊ตฌํ•ด์„œ ๋žœ๋ค ๋Œ€๋น„ ๊ด€์ฐฐ๋œ ์• ๊ฐ€ ์ด ์ •๋„ ํฌ๊ธฐ๋กœ ๋‚˜์˜ฌ ํ™•๋ฅ ์ด ์–ผ๋งˆ์ธ์ง€๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋•Œ m์€ prefix residue mass์ด๊ณ , S๊ฐ€ ์ŠคํŽ™ํŠธ๋Ÿผ ๊ทธ๋ฆฌ๊ณ  ๊ทธ๊ฒŒ ์ฃผ์–ด์กŒ์„ ๋•Œ ์ด intensity๊ฐ€ ์ž‘๋ƒ ํฌ๋ƒ ์—†๋ƒ ์ด๊ฑฐ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’์ธ ๊ฒƒ์ด๋‹ค.

Untitled 23

๊ฐœ๋…์ ์œผ๋กœ๋Š” ํฌ๊ฒŒ ์–ด๋ ค์šด ๊ฒƒ์€ ์•„๋‹ˆ๋ฉฐ, ๊ทธ๋ƒฅ ์†Œ๊ฐœํ•˜๋Š”๋ฐ ์˜๋ฏธ๊ฐ€ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐ๋œ๋‹ค.

Ion types and probabilities

ํŽฉํƒ€์ด๋“œ P๋Š” ํŠน์ •ํ•œ ์ŠคํŽ™ํŠธ๋Ÿผ์ด ์•„๋‹ˆ๊ณ , ์ŠคํŽ™ํŠธ๋Ÿผ์ด ์žˆ๋Š” ํ•œ peak์ด๋‹ค. ๋Œ€๋ฌธ์ž S๋กœ ์“ด๊ฒŒ ์ŠคํŽ™ํŠธ๋Ÿผ์ด๊ณ , ์†Œ๋ฌธ์ž๋กœ ์“ด s๊ฐ€ peak์„ ์˜๋ฏธํ•œ๋‹ค. ํ•˜๋‚˜์˜ fragment ion peak๋“ค์ธ ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์ด peptide๊ฐ€ ์ธก์ •ํ•œ peak์„ ์ƒ์‚ฐํ•  ํ™•๋ฅ ์ด, s์— ๋Œ€ํ•œ ํ™•๋ฅ ์ด๋ผ๊ณ  ํ•˜๋ฉด, ๊ฒฐ๊ตญ์€ ์ด ์ „์ฒด peptide๊ฐ€ ์ด ์ŠคํŽ™ํŠธ๋Ÿผ์„ ๋งŒ๋“ค์—ˆ์„ ํ™•๋ฅ ์€ ๊ฒฐ๊ตญ ๊ทธ ์ŠคํŽ™ํŠธ๋Ÿผ ์•ˆ์— ์žˆ๋Š” ๊ฐ๊ฐ์˜ peak์„ ์ด ํŽฉํƒ€์ด๋“œ๊ฐ€ ์ƒ์‚ฐํ–ˆ์„ ํ™•๋ฅ ๋“ค์˜ ํ•ฉ์œผ๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ด๊ฒŒ ์ด์ œ ๊ฐ๊ฐ์˜ ํ”ฝ์ด ๋‚˜์˜ค๋Š” ์ด์œ ๊ฐ€ ๋‹ค independentํ•  ๋•Œ ์ด๋ ‡๊ฒŒ ๋‚˜ํƒ€๋‚  ๊ฒƒ์ด๊ณ , ๊ต‰์žฅํžˆ ํฐ ๊ฐ€์ •์ด๋‹ค. ๊ทธ๋ ‡์ง€ ์•Š์„ ๊ฑฐ๋ผ๋Š” ์‚ฌ์‹ค์„ ์šฐ๋ฆฌ๋Š” ์ด๋ฏธ ์•Œ๊ณ  ์žˆ๋‹ค. ์–ด๋А ํ•œ ์ชฝ์ด ion์ด ๋˜๋ฉด ๋‚˜๋จธ์ง€ ํ•œ ์ชฝ์€ ์˜คํžˆ๋ ค ion์ด ์ž˜ ์•ˆ๋œ๋‹ค. ์„œ๋กœ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ๋Š”๋ฐ correlation์ด ์ „ํ˜€ ์—†๋Š” ๊ฑฐ๋กœ ์ƒ๊ฐํ•˜๊ณ  ์™„์ „ํžˆ independentํ•˜๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ  ์ง€๊ธˆ ํ™•๋ฅ ์„ ์ด์•ผ๊ธฐํ•˜๊ณ  ์žˆ๋Š”๋ฐ, ์‹ค์€ ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

์•ž์„œ ์ด์•ผ๊ธฐํ•œ ๊ฒƒ์ฒ˜๋Ÿผ neutral loss ion ๊ฐ™์€ ์• ๋“ค์€ ๋‹ค๋ฅธ b๋‚˜ y ion์ด ๋‚˜์˜ค์ง€ ์•Š์„ ๋•Œ๋Š” ๊ฑฐ์˜ ๊ด€์ฐฐ์ด ์•ˆ๋˜๋Š” ์ด๋Ÿฐ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ํ‹€๋ฆผ์—†์ด ์žˆ๋Š”๋ฐ ๊ทธ๋Ÿฐ๊ฑธ ๋‹ค ๋ฌด์‹œํ•˜๊ณ  ๊ทธ๋ƒฅ ๋…๋ฆฝ์ด๋‹ค, ๊ฐ๊ฐ์˜ peak๋“ค์ด ์ด peptide๋กœ ๋‚˜์˜ฌ ํ™•๋ฅ ์€ ๊ทธ๋ƒฅ ๊ทธ ํ”ฝ ํ•˜๋‚˜์—๋งŒ ๊ด€๋ จ์ด ์žˆ์ง€ ์ŠคํŽ™ํŠธ๋Ÿผ์˜ ๋‚˜๋จธ์ง€ ํ”ฝํ•˜๊ณ ๋Š” ์ƒ๊ด€์ด ์—†๋‹ค ๋ผ๋Š” ๊ฐ€์ •์„ ํ•œ ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฌํ•œ ๊ฐ€์ •๋“ค์€ ์‚ฌ์‹ค ํ˜„์‹ค๊ณผ๋Š” ๊ต‰์žฅ์ด ๋จผ ์ด์•ผ๊ธฐ์ด์ง€๋งŒ, ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ทธ๋Ÿฐ ๊ฐ€์ •์„ ํ•˜์ง€ ์•Š์œผ๋ฉด ๊ณ„์‚ฐ์„ ํ•  ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ๋ž˜์„œ ์ด๋ ‡๊ฒŒ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.. ๊ทธ๋‚˜๋งˆ ์ด๋Ÿฐ ๊ณผ์ •์„ ์ข€ ํ’€์–ด์„œ, ์ด ์นœ๊ตฌ๋“ค์ด ๋ญ”๊ฐ€ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ๋Š”๋ฐ, ๊ทธ๊ฑธ ์ตœ๋Œ€ํ•œ ๊ณ ๋ คํ•ด๋ณด๊ฒ ๋‹ค๊ณ  ํ•˜๋Š”๊ฒŒ ์•ž์—์„œ ์ด์•ผ๊ธฐํ•œ PepNovo ๋ชจ๋ธ์ด๋‹ค.

Untitled 24

์™„์ „ํžˆ ๋…๋ฆฝ์ด ์•„๋‹ˆ๊ณ  ์‚ฌ์‹ค์€ neutral loss๋ž‘ ์ด๋Ÿฐ supporting peak์ด๋ž‘ b๋‚˜ y ion์‚ฌ์ด์—๋Š” ์ƒ๋‹นํžˆ ์ƒ๊ด€ ๊ด€๊ณ„๊ฐ€ ์žˆ์œผ๋ฉฐ, ์›์ธ๊ณผ ๊ฒฐ๊ณผ๊ฐ€ ๋˜๋Š” ๊ด€๊ณ„๊ฐ€ ์žˆ๋‹ค ์ด๋Ÿฐ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๊ณ  ์žˆ๋Š”๊ฑด๋ฐ, ์ด๊ฑฐ์— ๋น„ํ•ด ์‚ฌ์‹ค ์ด ๋’ค์—์„œ ์ด์•ผ๊ธฐํ•˜๋Š” ๋ชจ๋ธ์„ ์ƒ๋‹นํžˆ ๋‹จ์ˆœํ™” ํ•ด๋†“์€ ๋ชจ๋ธ์ธ ๊ฒƒ์ด๋‹ค.

formulation์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ด๋ ‡๊ฒŒ ๋ชจ๋ธ๋ง์„ ํ•˜๋Š” ๊ฑด๋ฐ ion type์€ ๋ธํƒ€๋กœ ํ‘œ์‹œํ•  ์ˆ˜ ์žˆ๋‹ค. b ion์€ neutral mass์— 1์„ ๋”ํ•œ ๊ฒƒ์ด๋ฉฐ, y ion์€ neutral mass์— 19๋ฅผ ๋”ํ–ˆ๋‹ค๊ณ  ์ด์•ผ๊ธฐ ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ์•„์˜ˆ ion type์„ ์ด๋Ÿฐ ์ˆซ์ž๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋„๋ก ํ•œ ๊ฒƒ์ด๋‹ค.(๋ธํƒ€ ์ด์˜จ)

์ด์ œ ๋ธํƒ€ ์ด์˜จ๋“ค์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์„ ๊ฐ๊ฐ ์˜ˆ๋ฅผ ๋“ค์–ด์„œ q๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž. ๋ธํƒ€ 1์ด ๋‚˜์˜ฌ ํ™•๋ฅ ์„ q1q_1, ๋ธํƒ€ 2๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ์„ q2q_2, ์ด๋ ‡๊ฒŒ ์จ๋ฒ„๋ฉด, ์ด ๋ธํƒ€ ์ด์˜จ๋“ค์ด ๋‚˜์˜ค๋Š” ์ด ion type๋“ค๋„ ๋…๋ฆฝ์ด๋‹ค ๋ผ๊ณ  ๊ฐ€์ •ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

Untitled 25

์•ž์—์„œ ํ•œ ๊ฑฐ๋ž‘ ๊ฐ™๋‹ค. ๊ทธ๋ƒฅ ๊ฐ ์ด์˜จ์ด ๋‚˜์˜ฌ ํ™•๋ฃฐ์„ ๋…๋ฆฝ์ด๋ผ๊ณ  ์ƒ๊ฐ์„ ํ•˜์ž. peak์ด ์žˆ๋Š” ๊ฒฝ์šฐ, ์—†๋Š” ๊ฒฝ์šฐ๋กœ ๋‚˜๋ˆ ์„œ ๋ณด๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ ์œ„์น˜์— peak์ด ์‹ค์ œ ์ด peptide๋กœ๋ถ€ํ„ฐ ๋งŒ๋“ค์–ด์กŒ์„ ํ™•๋ฅ ์€ ์žˆ์œผ๋ฉด $q$, ์—†์œผ๋ฉด $1-q$๋ผ๊ณ  ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ด ๊ณผ์ •์€ ์—ฌ์ „ํžˆ node scoring์„ ํ•˜๊ณ  ์žˆ๋Š” ๊ณผ์ •์ด๋‹ค.

Untitled 26

์–ด๋–ค ํŠน์ •ํ•œ ์œ„์น˜๋ผ๊ณ  ํ•˜๋Š”๊ฑฐ๋Š” ์ด์ œ node์— ํ•ด๋‹นํ•˜๋Š” mass๋ฅผ ์ด์•ผ๊ธฐํ•˜๋Š” ๊ฒƒ์ด๋ฉฐ, ๊ทธ node์™€ ๊ด€๋ จ๋œ ion type๋“ค์ด ์—ฌ๋Ÿฌ๊ฐœ ์žˆ์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, supporting peak์„ ์ด์šฉํ•ด์„œ ํŠน์ •ํ•œ ๋…ธ๋“œ๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋ฏฟ์„ ๋งŒํ•˜๋ƒ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š”๊ฒŒ ๋ชฉํ‘œ์ด๋‹ค. node์˜ score๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒŒ ๋ชฉํ‘œ์ด๊ณ , node์˜ score๋ฅผ ๊ตฌํ•  ๋•Œ ๋‹ค๋ฅธ ion type๋“ค node์™€ ๊ด€๋ จ๋œ ๋‹ค๋ฅธ ion type๋“ค์˜ ํฌ๊ธฐ๊ฐ€ ๋ญ๊ฐ€ ๋ ์ง€๋Š” ๋ชจ๋ฅด๊ฒ ์ง€๋งŒ ๊ทธ๊ฑธ ์ด์šฉํ•ด์„œ ์ด node๊ฐ€ ์‹ค์ œ๋กœ peptide๋กœ ๋ถ€ํ„ฐ ์ƒ์‚ฐ๋˜์—ˆ์„๊ฑฐ๋ƒ๋ฅผ ์•Œ์•„๋ณด๋Š” ๊ฒŒ ๋ชฉํ‘œ์ด๋‹ค.

์–ด๋–ค ์œ„์น˜๋ผ๊ณ  ํ•˜๋Š” ๊ฒƒ์€ ๊ฒฐ๊ตญ์€ spectrum graph์— ์žˆ๋Š” ํŠน์ •ํ•œ node์— ํ•ด๋‹นํ•˜๋Š” mass์˜ ์œ„์น˜๋ฅผ ์ด์•ผ๊ธฐํ•œ๋‹ค. ๊ทธ node์— ๋Œ€ํ•ด์„œ ํ•ด๋‹นํ•˜๋Š” peak์ด ์šฐ๋ฆฌ๊ฐ€ ์ƒ๊ฐํ•˜๋Š” peptide๋กœ๋ถ€ํ„ฐ ์™”์„ ํ™•๋ฅ ์€ q๋ผ๊ณ  ์ฃผ์–ด์ ธ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

Untitled 27

์ด๋•Œ ๋‚˜์™€์•ผ ํ• ๊ฒŒ ๋‚˜์˜ค๋ฉด, ์•ˆ ๋‚˜์™€์•ผ ํ• ๊ฒŒ ๋‚˜์˜ค๋ฉด ์ข‹์€ ๊ฒƒ์ด๋ฉฐ, ๋ฐ˜๋Œ€๋กœ ๋‚˜์™€์•ผ ํ•˜๋Š”๋ฐ ์•ˆ๋‚˜์˜ค๊ฑฐ๋‚˜, ์•ˆ๋‚˜์™€์•ผํ•˜๋Š”๋ฐ ๋‚˜์˜ค๋ฉด ์—„์ฒญ ๋‚˜์œ ๊ฒƒ์ด๋‹ค. ๋‹น์—ฐํ•œ ๋ง์ด๋‹ค. ๋‚˜์œ ๊ฒฝ์šฐ์—๋Š” penalty๋ฅผ ์ฃผ๋Š” ๊ฑฐ๋‹ค. ์•ž์„œ ์ด์•ผ๊ธฐํ•œ ๊ฒƒ์ฒ˜๋Ÿผ likelihood ratio๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ randomํ•œ ๊ฒฝ์šฐ์˜ ํ™•๋ฅ ์„ ๊ตฌํ•ด์„œ ๋น„๊ต๋ฅผ ํ•ด์„œ ์“ฐ๊ฒ ๋‹ค๋Š” ๊ฒƒ์ด๋ฉฐ, randomํ•œ noise๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ๋„ ์œ„์น˜์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ๋‹ค ๊ฐ™๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ๊ณ ๋ คํ•˜๊ณ  ์žˆ๋Š” ์œ„์น˜์— peak์ด ์žˆ์œผ๋ฉด ๊ทธ random ํ™•๋ฅ ์„ ์“ฐ๊ณ , ์—†์œผ๋ฉด 1-random ํ™•๋ฅ ์„ ๊ทธ๋ƒฅ ์“ฐ๊ฒ ๋‹ค. ์ด๊ฒƒ์ด๋‹ค.

Untitled 28

Ratio test scoring for partial peptides

๊ทธ๋ ‡๊ฒŒ ํ•œ ๋‹ค์Œ ์žˆ์–ด์•ผ ํ• ๊ฒŒ ์žˆ์œผ๋ฉด ์ ์ˆ˜๋ฅผ ๋”ํ•ด์ฃผ๊ณ , ์—†์œผ๋ฉด ํŒจ๋„ํ‹ฐ๋ฅผ ์ฃผ๊ฒ ๋‹ค๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ด๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด ์„ค๋ช…์„ ํ•ด๋ณด์ž. ion type์ด 4์ข…๋ฅ˜์ด๋ฉฐ ๊ด€์ฐฐ๋œ๊ฒŒ ๊ทธ ์ค‘ 3๊ฐœ ์ธ ๊ฒƒ์ด๋‹ค. ์ด๋Ÿฌํ•œ ์ผ€์ด์Šค์— ๋Œ€ํ•ด 1, 2, 4๋ฒˆ์— ๋Œ€ํ•ด์„œ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์•Œ๊ณ  ์žˆ๋Š” ํ™•๋ฅ ์„ ์“ฐ๊ณ , 3๋ฒˆ์€ 1โˆ’q31-q_3์˜ ํ™•๋ฅ ์„ ์“ฐ๊ฒ ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ๋˜‘๊ฐ™์ด ๋žœ๋คํ•œ ๋ถ€๋ถ„๋„ ๋˜‘๊ฐ™์ด ๊ณ„์‚ฐํ•ด์„œ ๋‘˜ ์‚ฌ์ด์˜ ratio๋ฅผ ๊ฐ€์ง€๊ณ  score๋ฅผ ์“ฐ๊ณ˜๋‹ค๋Š” ๊ฒƒ์ด ๊ธฐ๋ณธ ์ ์ธ ์ƒ๊ฐ์ด๋‹ค. ์ด๋Ÿฐ ๋ชจ๋ธ๋„ ๊ฐ€๋Šฅํ•˜๋‹ค๋ผ๊ณ  ์ด์•ผ๊ธฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

Untitled 29

Finding optimal paths in the spectrum graph

๊ทธ๋Ÿฐ๋ฐ ์ด์ œ ์œ„ ๋ชจ๋ธ์€ ๊ฐ๊ฐ์˜ supporting ion๋“ค์ด ๋‹ค ๋…๋ฆฝ์ ์œผ๋กœ ์ƒ์‚ฐ๋œ๋‹ค๋Š” ์—„์ฒญ๋‚œ ๊ฐ€์ •์„ ํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๋˜ ๊ทธ ์‚ฌ์ด ๋ชจ๋“  edge๋“ค์— ๋Œ€ํ•ด์„œ ์ด ๊ณ„์‚ฐ์„ ๋‹ค ํ•  ๊ฒƒ์ด๊ณ , ๊ณ„์‚ฐ๋Ÿ‰์ด ์ฆ๊ฐ€ํ•˜๊ฒŒ ๋œ๋‹ค. ๋„ˆ๋ฌด ๋ณต์žกํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋งค์šฐ ๋‹จ์ˆœํ™”ํ•ด์„œ ์‚ฌ์šฉ์„ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. Bayesian network๋„ ํ•™์Šตํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์ด ๋งŽ์ด ๊ฑธ๋ฆฌ์ง€๋งŒ ์ผ๋‹จ ํ•™์Šต์„ ํ•ด๋†“๊ณ ๋‚˜๋ฉด, ์ถ”๋ก ํ•˜๋Š” ๊ฑฐ๋Š” ์ƒ๋Œ€์ ์œผ๋กœ ์‹œ๊ฐ„์ด ๋นจ๋ผ์„œ ๊ทธ๋ ‡๊ฒŒ ์จ๋„ ๋œ๋‹ค๊ณ  ์ƒ๊ฐ์„ ํ•˜๋Š” ๊ฒƒ ๊ฐ™๋‹ค.

๊ธฐ๋ณธ์ ์œผ๋กœ DP๋ฅผ ํ•˜๋ฉด์„œ ์‚ฌ์šฉํ•˜๋Š” node์˜ score๋Š” ๋น„๊ต์  ๋‹จ์ˆœํ•œ ๊ฒƒ๋“ค์„ ์“ด๋‹ค. ์‹ค์ œ๋กœ ๊ทธ๊ฑธ ์•„๋ฌด๋ฆฌ ๋ณต์žกํ•˜๊ฒŒ ํ•ด๋ด์•ผ ๊ฒฐ๊ณผ์ ์œผ๋กœ score์— ํฌ๊ฒŒ ์˜ํ–ฅ์„ ์•ˆ ์ฃผ๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ๋Ÿฐ ๋ถ€๋ถ„์—์„œ ์ƒ๋‹นํžˆ ๋‹จ์ˆœํ•œ ๊ฒƒ์„ ์“ฐ๋Š” ํŽธ์ด๋‹ค.

Untitled 30

De novo interpretation summary

์š”์•ฝํ•ด๋ณด๋ฉด, ์‚ฌ์‹ค ์ œ์ผ ์–ด๋ ค์› ๋˜ ๊ฒƒ์€, b ion๊ณผ y ion์„ ์–ด๋–ป๊ฒŒ ์ž˜ ๊ตฌ๋ถ„ํ•ด๋‚ด๋А๋ƒ ํ•˜๋Š”๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๊ธฐ ์œ„ํ•ด์„œ ์‚ฌ์‹ค 2๊ฐ€์ง€๋ฅผ ํ•œ ๊ฒƒ์ด๋‹ค.

  1. PRM node๋ฅผ ๋งŒ๋“ค๋ฉด์„œ ์ด ์นœ๊ตฌ๋“ค์ด forbidden-pair๋‹ค๋ผ๋Š” ๊ฒƒ์„ ์ž˜ ๊ธฐ์–ตํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ
  2. supporting ion์„ ์ด์šฉํ•ด์„œ supporting ion์ด ์—†๋Š”, ๋žœ๋คํ•˜๊ฒŒ ๋‚˜์˜ค๋Š” ์นœ๊ตฌ๋“ค๋ฅผ ๊ณ ๋ คํ•ด์„œ node์— weighting์„ ํ–ˆ๋‹ค(node์˜ score๋ฅผ ์ฃผ์—ˆ๋‹ค).

Untitled 31

์ด๋ก ์ ์œผ๋กœ๋Š” ์ด๋ ‡๊ฒŒ ๊น”๋”ํ•˜๊ฒŒ ๋˜์ง€๋งŒ ์‹ค์ œ ๋ฐ์ดํ„ฐ์— ๊ฐ€๋ฉด noise๋„ ๋งŽ๊ณ , fragmentation์ด ๋˜์–ด์•ผํ•  ์œ„์น˜์— ๋‹ค ๋˜๋Š”๊ฒŒ ์ „ํ˜€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฒฐ๊ณผ๊ฐ€ ๊ทธ๋ ‡๊ฒŒ ๋งŒ์กฑ์Šค๋Ÿฝ์ง€ ์•Š๋‹ค. ์‹ค์ œ๋กœ DBSearch์—์„œ DeNovo๋ฅผ ์‹œํ–‰ํ•˜๋ฉด 2/3์ •๋„ ๋ฐ–์— ๋ชป์–ป๋Š”๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ƒˆ๋กœ์šด ๋ฌด์–ธ๊ฐ€๋ฅผ ์ฐพ๋Š”๋ฐ ์žˆ์–ด์„œ๋Š” ์ž˜ ํ™œ์šฉํ•ด๋ณด๋Š” ๊ฒƒ์ด ์˜๋ฏธ๊ฐ€ ์žˆ๋‹ค.

๋˜๋‹ค๋ฅธ ๋‹จ์ ์€, protein modification์— ์žˆ์–ด PRM์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, modification์ด ํฌํ•จ๋œ ์„œ์—ด์— De Novo๋ฅผ ์ ์šฉํ•˜๊ธฐ์— ๋น„์ ํ•ฉํ•˜๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์—ฌ์ „ํžˆ ํŠน์ •์˜์—ญ์—์„œ๋Š” ์œ ์šฉํ•˜๊ฒŒ ์ž‘๋™ํ•œ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ๋ฐ”๋กœ De Novo ๊ธฐ๋ฒ•์ด๋‹ค.


๋ณธ ๋‚ด์šฉ์€ ํ•œ์–‘๋Œ€ํ•™๊ต ์ปดํ“จํ„ฐ์†Œํ”„ํŠธ์›จ์–ดํ•™๊ณผ ๋ฐ ์ธ๊ณต์ง€๋Šฅํ•™๊ณผ ๋ฐฑ์€์˜ฅ ๊ต์ˆ˜๋‹˜์˜ ๊ฐ•์˜์ž๋ฃŒ์„ ๋ฐ”ํƒ•์œผ๋กœํ•˜์—ฌ ์ž‘์„ฑ๋˜์—ˆ์Šต๋‹ˆ๋‹ค!

PS. ์ถ”๊ฐ€ ๋ฌธ์˜์‚ฌํ•ญ ๋ฐ ์งˆ๋ฌธ์€ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฅผ ํ†ตํ•ด ์ €๋„ ๋” ์„ฑ์žฅํ•  ์ˆ˜ ์žˆ์„ํ…Œ๋‹ˆ๊นŒ์š”. :)

Share