Sequence coupled model

Introduction

It is a residue-coupled model to predict ß-turns in proteins. A tetrapeptide can be generally expressed as

R iRi+1Ri+2Ri+3

where Ri represents the amino acid at position i, Ri+1 represents the amino acid at position i+1, and so forth. Since there are 20 different amino acids, the number of possible tetrapeptides would be 204=1.6 x 105. Tetrapeptides can be classified into two categories: the ß-turn set denoted as S+, and non-ß-turn set denoted by S-.

Given a tetrapeptide, its attribute to the ß-turn set S+ or the non-ß-turn set S- can be expressed, respectively, by an attribute function ø. If the amino acid at each of the tetrapeptide subsites can be treated as an independent element, i.e. there is no coupling at all among these subsites, then its attribute to the ß-turn set S+ and that to the non-ß-turn set S- can be expressed, respectively, as

ø0+(RiRi+1Ri+2Ri+3)=Pi+(Ri)Pi+1+(Ri+1)Pi+2+(Ri+2)Pi+3+(Ri+3)

and

ø0-(RiRi+1Ri+2Ri+3)=Pi-(Ri)Pi+1-(Ri+1)Pi+2-(Ri+2)Pi+3-(Ri+3)

where Pi+u+(Ri+u)(u=0,1,2,3) is the probability of amino acid Ri+u occurring at subsite u in the ß-turn set S+, and its value can be derived from a training dataset consisting of only ß-turn tetrapeptides. Pi+u-(Ri+u) has the same meaning as Pi+u+(Ri+u), except that it is associated with the non-ß-turn set S- and its valueshould be derived from a training dataset consisting only of non-ß-turn tetrapeptides. The attribute function thus formulated for a tetrapeptide actually corresponds to the zero-order Markov chain.

Turn prediction

If the coupling effect of a residue with those adjacent to it must be taken into account, then the probability functions as described above will be modified, i.e. substituted by the first-order conditional probabilities. Since given a tetrapeptide, its attribute to the ß-turn set S+ or non-ß-turn set S- can be expressed, respectively by an attribute function ø. In this model, the coupling effect of a residue with its adjacent residue is taken into account. So, according to the first-order markov chain, the attribute function ø is given as

ø+(RiRi+1Ri+2 Ri+3)=g Pi+(Ri) P+ i+1(Ri+1|Ri) P+i+2(Ri+2|Ri+1) P+i+3 (Ri+3|Ri+2)

where g=104 is the amplifying factor used for making the data in a range easier to handle. Pi+(Ri) is the probability of amino acid Ri occurring at subsite i in the ß-turn tetrapeptide set S+, and it is independent of the other subsites because Ri is located at the first position of the 4 subsite sequence. Pi+1+(Ri+1|Ri) is the probability of amino acid Ri+1 occurring at the subsite i+1, given that Ri has occurred at position i; Pi+2+(Ri+2|Ri+1 ) is the probability of amino acid Ri+2 occurring at the subsite i+2, given that Ri+1 has occurred at position i+1, and so forth. Similarly, for non-ß-turns, the attribute function ø will be

ø-(RiRi+1Ri+2 Ri+3)=g P-i(Ri) P-i+1 (Ri+1 |Ri) P-i+2(Ri+2|Ri+1) P-i+3(Ri+3|Ri+2)

For a given tetrapeptide RiRi+1Ri+2Ri+3 if its attribute function to the ß-turn set S+ is greater than that to the non-ß-turnset S-, i.e. ø+-, then the tetrapeptide is predicted to be a ß-turn; otherwise, it is predicted to be a non-ß-turn. A discrimination function D is given as

D(RiRi+1Ri+2R i+3)=w+ø+(RiRi+1 Ri+2Ri+3)-w- ø-(RiRi+1Ri+2Ri+3)

where w + and w- are the weight factors for the probabilities derived from the ß-turn and non-ß-turn training sets respectively. If there is no special reason, they are generally set to be one, i.e. w+=w- =1. Thus, the criterion of the ß-turn prediction for a given tetrapeptide in proteins can be formulated as :

the tetrapeptide forms a ß-turn if its D>0;

the tetrapeptide forms a non-ß-turn otherwise.

Turn Type Prediction

Here we use S1, S1', S2, S2', S6, S8, and S- to represent the tetrapeptide sets of type I ß-turn, type I' ß-turn, type II ß-turn, type II' ß-turn, type VI ß-turn, type VIII ß-turn and non-ß-turn. Given a tetrapeptide, its attribution to the sets S1, S1', S2, S2', S6, S8 and S- can be expressed by ø1, ø1', ø2, ø2', ø6, ø8, and ø-, respectively. These attribute functions can be calculted for each turn type in the same way as they are calculated for turns and non-turns sets (as given above)

For a given tetrapeptide RiRi+1Ri+2Ri+3, if its attribute function to the ß-turn set S1 is greater than that to the ß-turn set S2, i.e.,ø1 > ø2, then the tetrapeptide would have a greater propensity for the ß-turn type I than for the ß-turn type II. Based on such a rationale, the tetrapeptide RiRi+1Ri+2Ri+3 can be logically predicted to be the structural type for which ø has the maximum value, as can be formulated as follows. Suppose

ø× = max {ø1, ø1', ø2, ø2', ø6, ø8, ø-}

where the operator max means taking the maximum of the quantities in the braces; then the superscript will give the corresponding S× (× = 1, 1', 2, 2', 6, 8, or -) to which the predicted tetrapeptide RiRi+1Ri+2Ri+3 should belong.

The probabilities for the subsite i: P+i(Xi)

A C D E F G H I K L M N P Q R S T V W Y
0.06 0.04 0.10 0.04 0.03 0.11 0.04 0.03 0.04 0.05 0.01 0.09 0.05 0.03 0.02 0.11 0.05 0.05 0.01 0.04

The conditional probabilities for the subsite i+1: P+i+1(Xi+1|Xi) for turns ,where Xi+1 represents the amino acids along the row and Xi represents the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.19 0.00 0.11 0.00 0.00 0.11 0.07 0.00 0.07 0.00 0.00 0.07 0.07 0.04 0.00 0.19 0.04 0.04 0.00 0.00
C 0.19 0.00 0.06 0.00 0.00 0.06 0.00 0.00 0.19 0.00 0.06 0.00 0.19 0.19 0.00 0.00 0.06 0.00 0.00 0.00
D 0.18 0.00 0.02 0.02 0.05 0.07 0.00 0.02 0.07 0.00 0.00 0.05 0.16 0.07 0.05 0.16 0.05 0.02 0.00 0.02
E 0.06 0.00 0.12 0.06 0.00 0.06 0.00 0.12 0.24 0.06 0.00 0.06 0.06 0.00 0.06 0.12 0.00 0.00 0.00 0.00
F 0.21 0.00 0.14 0.00 0.00 0.00 0.00 0.00 0.21 0.00 0.00 0.00 0.21 0.00 0.00 0.00 0.07 0.00 0.00 0.14
G 0.00 0.06 0.06 0.10 0.02 0.02 0.00 0.04 0.08 0.02 0.02 0.02 0.10 0.02 0.06 0.16 0.08 0.10 0.00 0.02
H 0.00 0.11 0.00 0.00 0.00 0.05 0.00 0.05 0.21 0.00 0.00 0.00 0.42 0.00 0.00 0.11 0.00 0.00 0.00 0.05
I 0.07 0.00 0.13 0.00 0.00 0.07 0.00 0.00 0.07 0.00 0.07 0.07 0.13 0.00 0.07 0.13 0.07 0.13 0.00 0.00
K 0.17 0.00 0.17 0.00 0.00 0.06 0.00 0.00 0.06 0.00 0.00 0.17 0.22 0.00 0.06 0.06 0.00 0.00 0.00 0.06
L 0.04 0.00 0.13 0.00 0.09 0.04 0.09 0.00 0.17 0.09 0.00 0.00 0.13 0.04 0.00 0.09 0.09 0.00 0.00 0.00
M 0.00 0.00 0.00 0.33 0.00 0.17 0.00 0.00 0.00 0.00 0.00 0.17 0.00 0.00 0.00 0.17 0.00 0.00 0.00 0.17
N 0.00 0.00 0.03 0.05 0.00 0.10 0.00 0.05 0.05 0.08 0.00 0.03 0.05 0.03 0.05 0.18 0.18 0.05 0.00 0.08
P 0.17 0.00 0.17 0.26 0.00 0.13 0.00 0.00 0.04 0.00 0.04 0.04 0.04 0.00 0.04 0.04 0.00 0.00 0.00 0.00
Q 0.13 0.00 0.13 0.00 0.00 0.13 0.00 0.00 0.13 0.00 0.00 0.13 0.13 0.07 0.07 0.07 0.00 0.00 0.00 0.00
R 0.10 0.00 0.00 0.00 0.00 0.10 0.00 0.00 0.10 0.00 0.00 0.10 0.10 0.20 0.00 0.00 0.10 0.20 0.00 0.00
S 0.06 0.02 0.00 0.02 0.02 0.06 0.02 0.02 0.04 0.06 0.04 0.06 0.04 0.04 0.08 0.10 0.16 0.06 0.00 0.08
T 0.04 0.00 0.12 0.04 0.00 0.16 0.04 0.00 0.12 0.04 0.00 0.04 0.16 0.04 0.00 0.04 0.08 0.08 0.00 0.00
V 0.09 0.05 0.09 0.00 0.05 0.05 0.00 0.00 0.14 0.00 0.00 0.05 0.09 0.00 0.00 0.18 0.14 0.05 0.05 0.00
W 0.00 0.00 0.17 0.00 0.00 0.50 0.00 0.00 0.00 0.00 0.00 0.00 0.33 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Y 0.06 0.00 0.06 0.06 0.00 0.28 0.00 0.00 0.11 0.00 0.00 0.00 0.22 0.00 0.11 0.11 0.00 0.00 0.00 0.00

The conditional probabilities for the subsite i+2: P+i+2(Xi+2|Xi+1), where Xi+2 represents the amino acids along the row and Xi+1 the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.08 0.03 0.18 0.00 0.00 0.28 0.03 0.03 0.08 0.00 0.00 0.10 0.00 0.00 0.03 0.10 0.03 0.03 0.03 0.00
C 0.14 0.00 0.00 0.00 0.00 0.14 0.00 0.00 0.00 0.14 0.00 0.29 0.00 0.00 0.14 0.00 0.00 0.14 0.00 0.00
D 0.09 0.00 0.06 0.18 0.00 0.15 0.00 0.06 0.06 0.00 0.00 0.15 0.00 0.03 0.06 0.12 0.03 0.03 0.00 0.00
E 0.05 0.00 0.15 0.05 0.00 0.05 0.05 0.00 0.05 0.10 0.00 0.05 0.05 0.00 0.10 0.10 0.10 0.05 0.05 0.00
F 0.14 0.00 0.00 0.14 0.00 0.43 0.00 0.00 0.14 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.14
G 0.05 0.03 0.20 0.03 0.05 0.08 0.03 0.00 0.05 0.03 0.03 0.03 0.03 0.05 0.05 0.17 0.05 0.03 0.03 0.03
H 0.00 0.33 0.00 0.00 0.00 0.33 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.33
I 0.00 0.00 0.22 0.00 0.00 0.11 0.11 0.11 0.11 0.11 0.00 0.11 0.00 0.00 0.00 0.00 0.00 0.11 0.00 0.00
K 0.02 0.00 0.16 0.02 0.00 0.27 0.09 0.02 0.07 0.02 0.00 0.09 0.04 0.00 0.02 0.00 0.04 0.02 0.00 0.11
L 0.00 0.09 0.00 0.00 0.09 0.09 0.00 0.00 0.00 0.00 0.00 0.18 0.18 0.00 0.00 0.00 0.09 0.00 0.00 0.27
M 0.00 0.00 0.17 0.00 0.00 0.17 0.17 0.00 0.17 0.00 0.00 0.17 0.00 0.00 0.00 0.17 0.00 0.00 0.00 0.00
N 0.05 0.00 0.00 0.10 0.10 0.29 0.00 0.00 0.00 0.00 0.00 0.10 0.05 0.00 0.05 0.10 0.14 0.00 0.00 0.05
P 0.02 0.03 0.12 0.10 0.00 0.24 0.02 0.00 0.05 0.02 0.00 0.10 0.02 0.02 0.03 0.12 0.02 0.03 0.02 0.03
Q 0.00 0.06 0.19 0.06 0.06 0.25 0.00 0.00 0.06 0.06 0.00 0.12 0.00 0.00 0.00 0.00 0.12 0.00 0.00 0.00
R 0.00 0.00 0.06 0.17 0.06 0.11 0.00 0.00 0.00 0.22 0.00 0.22 0.00 0.00 0.06 0.00 0.00 0.00 0.06 0.06
S 0.02 0.04 0.10 0.02 0.08 0.16 0.02 0.02 0.06 0.02 0.00 0.08 0.02 0.02 0.04 0.10 0.10 0.04 0.02 0.06
T 0.03 0.00 0.15 0.00 0.00 0.12 0.03 0.00 0.15 0.00 0.00 0.09 0.00 0.06 0.06 0.18 0.03 0.00 0.00 0.09
V 0.11 0.11 0.16 0.00 0.00 0.05 0.05 0.00 0.00 0.05 0.00 0.11 0.00 0.00 0.05 0.26 0.05 0.00 0.00 0.00
W 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00
Y 0.07 0.00 0.07 0.07 0.00 0.21 0.00 0.00 0.07 0.00 0.00 0.07 0.14 0.00 0.07 0.14 0.00 0.00 0.00 0.07

The conditional probabilities for the subsite i+3: P+i+3(Xi+3|Xi+2), where Xi+3 represents the amino acids along the row and Xi+2 the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.05 0.00 0.11 0.11 0.00 0.26 0.05 0.00 0.11 0.05 0.05 0.00 0.05 0.00 0.00 0.00 0.05 0.00 0.05 0.05
C 0.08 0.00 0.00 0.00 0.00 0.25 0.17 0.00 0.08 0.08 0.00 0.17 0.00 0.00 0.00 0.08 0.00 0.08 0.00 0.00
D 0.07 0.04 0.07 0.07 0.04 0.16 0.00 0.05 0.11 0.05 0.00 0.05 0.02 0.02 0.02 0.09 0.02 0.07 0.02 0.02
E 0.04 0.04 0.04 0.08 0.08 0.08 0.00 0.00 0.04 0.12 0.00 0.08 0.08 0.04 0.00 0.04 0.00 0.12 0.08 0.00
F 0.00 0.00 0.00 0.09 0.00 0.09 0.00 0.00 0.09 0.18 0.09 0.09 0.00 0.18 0.00 0.09 0.00 0.00 0.00 0.09
G 0.06 0.01 0.07 0.02 0.02 0.10 0.02 0.04 0.12 0.07 0.01 0.01 0.00 0.08 0.02 0.10 0.10 0.06 0.01 0.06
H 0.08 0.08 0.00 0.08 0.08 0.00 0.00 0.08 0.08 0.08 0.00 0.08 0.08 0.00 0.08 0.15 0.00 0.00 0.08 0.00
I 0.00 0.00 0.00 0.00 0.00 0.33 0.00 0.00 0.00 0.17 0.00 0.00 0.00 0.17 0.00 0.00 0.17 0.00 0.00 0.17
K 0.07 0.00 0.07 0.00 0.04 0.22 0.00 0.07 0.11 0.07 0.00 0.00 0.00 0.00 0.04 0.11 0.04 0.00 0.00 0.15
L 0.00 0.07 0.00 0.00 0.07 0.29 0.00 0.00 0.00 0.07 0.00 0.00 0.00 0.07 0.07 0.00 0.07 0.14 0.07 0.07
M 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
N 0.07 0.02 0.04 0.02 0.00 0.16 0.00 0.02 0.04 0.02 0.00 0.04 0.09 0.02 0.07 0.11 0.07 0.04 0.09 0.07
P 0.00 0.00 0.00 0.09 0.00 0.18 0.00 0.00 0.00 0.18 0.00 0.27 0.00 0.00 0.00 0.00 0.00 0.18 0.00 0.09
Q 0.29 0.00 0.00 0.00 0.14 0.00 0.00 0.14 0.00 0.00 0.14 0.14 0.00 0.00 0.00 0.00 0.14 0.00 0.00 0.00
R 0.05 0.00 0.00 0.05 0.05 0.32 0.00 0.00 0.05 0.11 0.00 0.05 0.00 0.05 0.00 0.11 0.05 0.00 0.05 0.05
S 0.09 0.07 0.11 0.09 0.02 0.07 0.04 0.07 0.02 0.02 0.04 0.02 0.00 0.04 0.00 0.09 0.09 0.09 0.02 0.02
T 0.09 0.05 0.00 0.00 0.09 0.14 0.00 0.05 0.14 0.00 0.00 0.00 0.05 0.00 0.05 0.18 0.00 0.05 0.00 0.14
V 0.00 0.00 0.27 0.09 0.00 0.27 0.00 0.09 0.00 0.00 0.00 0.09 0.00 0.00 0.00 0.00 0.09 0.00 0.00 0.09
W 0.00 0.00 0.00 0.00 0.00 0.17 0.00 0.00 0.17 0.00 0.00 0.00 0.17 0.17 0.00 0.00 0.00 0.17 0.17 0.00
Y 0.00 0.04 0.04 0.00 0.00 0.35 0.00 0.00 0.04 0.00 0.00 0.04 0.09 0.04 0.04 0.04 0.09 0.04 0.04 0.09

The probabilities for the subsite i: P-i(Xi)

A C D E F G H I K L M N P Q R S T V W Y
0.09 0.02 0.05 0.05 0.04 0.08 0.03 0.05 0.08 0.08 0.02 0.04 0.04 0.04 0.03 0.07 0.06 0.08 0.02 0.04

The conditional probabilities for the subsite i+1: P-i+1(Xi+1|Xi), where Xi+1 represents the amino acids along the row, and Xi the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.12 0.02 0.07 0.03 0.04 0.08 0.03 0.05 0.07 0.09 0.02 0.03 0.02 0.05 0.03 0.05 0.05 0.10 0.03 0.04
C 0.08 0.01 0.03 0.04 0.00 0.17 0.03 0.06 0.07 0.11 0.01 0.10 0.00 0.01 0.06 0.10 0.01 0.06 0.01 0.03
D 0.09 0.04 0.07 0.05 0.06 0.08 0.01 0.06 0.07 0.09 0.01 0.06 0.04 0.03 0.02 0.05 0.04 0.10 0.02 0.03
E 0.09 0.01 0.04 0.07 0.05 0.06 0.03 0.03 0.07 0.12 0.02 0.04 0.04 0.05 0.04 0.04 0.09 0.06 0.03 0.02
F 0.06 0.01 0.05 0.09 0.06 0.09 0.02 0.04 0.06 0.09 0.02 0.04 0.02 0.02 0.04 0.07 0.09 0.07 0.01 0.05
G 0.07 0.03 0.06 0.05 0.03 0.06 0.02 0.07 0.07 0.07 0.01 0.04 0.03 0.04 0.03 0.09 0.06 0.10 0.02 0.04
H 0.10 0.05 0.01 0.04 0.05 0.09 0.03 0.05 0.07 0.12 0.01 0.04 0.02 0.01 0.02 0.07 0.08 0.04 0.04 0.05
I 0.08 0.02 0.05 0.04 0.05 0.07 0.02 0.08 0.08 0.07 0.01 0.07 0.04 0.03 0.03 0.05 0.05 0.08 0.01 0.04
K 0.10 0.01 0.07 0.03 0.04 0.08 0.04 0.07 0.09 0.08 0.03 0.04 0.01 0.01 0.03 0.06 0.06 0.08 0.01 0.07
L 0.06 0.02 0.04 0.06 0.03 0.07 0.05 0.06 0.07 0.07 0.02 0.04 0.04 0.04 0.04 0.10 0.06 0.08 0.01 0.04
M 0.09 0.00 0.09 0.06 0.03 0.05 0.02 0.06 0.17 0.03 0.03 0.05 0.00 0.02 0.03 0.06 0.06 0.12 0.02 0.00
N 0.07 0.02 0.03 0.04 0.06 0.11 0.01 0.04 0.05 0.05 0.02 0.08 0.05 0.07 0.04 0.05 0.07 0.07 0.04 0.02
P 0.05 0.04 0.08 0.08 0.01 0.12 0.02 0.04 0.04 0.09 0.01 0.08 0.01 0.01 0.02 0.07 0.04 0.11 0.02 0.06
Q 0.10 0.02 0.07 0.04 0.04 0.09 0.04 0.04 0.07 0.08 0.02 0.04 0.04 0.04 0.04 0.05 0.06 0.07 0.00 0.06
R 0.06 0.02 0.03 0.06 0.02 0.10 0.03 0.06 0.06 0.12 0.02 0.07 0.03 0.06 0.00 0.10 0.04 0.05 0.02 0.05
S 0.10 0.02 0.04 0.06 0.04 0.09 0.04 0.05 0.06 0.07 0.02 0.04 0.01 0.04 0.01 0.08 0.07 0.08 0.04 0.05
T 0.07 0.02 0.07 0.04 0.06 0.07 0.04 0.04 0.07 0.07 0.01 0.04 0.04 0.03 0.03 0.07 0.06 0.06 0.03 0.07
V 0.10 0.03 0.08 0.04 0.02 0.10 0.05 0.04 0.05 0.09 0.01 0.05 0.02 0.05 0.03 0.07 0.04 0.07 0.01 0.03
W 0.12 0.03 0.04 0.03 0.01 0.10 0.03 0.09 0.06 0.03 0.01 0.06 0.00 0.03 0.04 0.10 0.09 0.12 0.01 0.00
Y 0.09 0.01 0.07 0.02 0.03 0.14 0.01 0.05 0.04 0.06 0.01 0.05 0.06 0.03 0.03 0.07 0.09 0.07 0.03 0.04

The conditional probabilities for the subsite i+2: P-i+2(Xi+2|Xi+1), where Xi+2 represents the amino acids along the row, and Xi+1 the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.13 0.02 0.05 0.03 0.04 0.05 0.03 0.05 0.08 0.09 0.02 0.03 0.03 0.05 0.02 0.07 0.05 0.11 0.02 0.04
C 0.10 0.01 0.04 0.04 0.00 0.13 0.02 0.05 0.10 0.08 0.02 0.06 0.04 0.05 0.05 0.08 0.04 0.06 0.01 0.02
D 0.13 0.03 0.05 0.02 0.06 0.07 0.01 0.06 0.07 0.09 0.00 0.04 0.06 0.03 0.02 0.07 0.05 0.09 0.02 0.02
E 0.10 0.01 0.04 0.10 0.05 0.04 0.03 0.04 0.08 0.12 0.02 0.04 0.04 0.05 0.04 0.04 0.07 0.05 0.02 0.02
F 0.07 0.01 0.07 0.08 0.05 0.07 0.02 0.05 0.07 0.08 0.02 0.04 0.04 0.02 0.05 0.07 0.09 0.06 0.01 0.05
G 0.08 0.03 0.06 0.06 0.03 0.06 0.02 0.07 0.06 0.06 0.01 0.04 0.04 0.04 0.03 0.08 0.07 0.11 0.01 0.05
H 0.09 0.04 0.01 0.03 0.05 0.08 0.03 0.05 0.09 0.10 0.01 0.03 0.11 0.01 0.02 0.08 0.06 0.04 0.03 0.03
I 0.09 0.02 0.05 0.04 0.05 0.07 0.01 0.08 0.08 0.06 0.02 0.06 0.04 0.03 0.04 0.07 0.05 0.07 0.01 0.04
K 0.10 0.01 0.05 0.02 0.04 0.05 0.03 0.07 0.09 0.10 0.04 0.04 0.03 0.01 0.03 0.07 0.06 0.08 0.01 0.07
L 0.06 0.01 0.05 0.06 0.03 0.06 0.04 0.07 0.10 0.07 0.02 0.04 0.04 0.05 0.04 0.10 0.06 0.08 0.01 0.03
M 0.10 0.00 0.08 0.08 0.03 0.05 0.00 0.06 0.13 0.03 0.03 0.05 0.00 0.03 0.03 0.06 0.06 0.14 0.02 0.02
N 0.07 0.02 0.03 0.04 0.05 0.08 0.01 0.05 0.06 0.07 0.02 0.05 0.05 0.06 0.04 0.08 0.08 0.08 0.04 0.03
P 0.08 0.04 0.07 0.11 0.02 0.07 0.02 0.04 0.03 0.11 0.02 0.06 0.02 0.00 0.03 0.05 0.05 0.12 0.02 0.06
Q 0.13 0.01 0.05 0.03 0.02 0.07 0.04 0.05 0.09 0.09 0.02 0.03 0.05 0.04 0.05 0.05 0.04 0.07 0.00 0.05
R 0.08 0.03 0.03 0.04 0.02 0.08 0.04 0.07 0.07 0.09 0.02 0.04 0.04 0.06 0.00 0.12 0.05 0.07 0.01 0.04
S 0.11 0.02 0.02 0.06 0.03 0.06 0.04 0.05 0.06 0.08 0.03 0.03 0.02 0.04 0.03 0.07 0.08 0.08 0.03 0.06
T 0.07 0.02 0.06 0.05 0.06 0.07 0.04 0.04 0.06 0.09 0.01 0.03 0.06 0.03 0.02 0.06 0.06 0.07 0.03 0.05
V 0.11 0.03 0.08 0.05 0.03 0.09 0.04 0.04 0.07 0.08 0.01 0.05 0.02 0.05 0.03 0.07 0.05 0.08 0.01 0.03
W 0.11 0.03 0.05 0.03 0.01 0.13 0.03 0.08 0.07 0.03 0.01 0.05 0.03 0.03 0.04 0.08 0.08 0.11 0.01 0.00
Y 0.09 0.01 0.06 0.03 0.03 0.15 0.01 0.04 0.05 0.06 0.01 0.05 0.06 0.04 0.04 0.07 0.09 0.06 0.03 0.04

The conditional probabilities for the subsite i+3: P-i+3(Xi+3|Xi+2),where Xi+3 represents the amino acids along the row and Xi+2 the amino acid along the column.

A C D E F G H I K L M N P Q R S T V W Y
A 0.14 0.02 0.07 0.03 0.04 0.06 0.02 0.04 0.08 0.08 0.01 0.05 0.03 0.05 0.03 0.08 0.05 0.09 0.02 0.03
C 0.10 0.01 0.04 0.04 0.00 0.12 0.00 0.04 0.09 0.08 0.03 0.06 0.04 0.05 0.06 0.09 0.04 0.06 0.01 0.03
D 0.14 0.03 0.05 0.04 0.06 0.04 0.01 0.06 0.05 0.07 0.01 0.04 0.06 0.04 0.02 0.09 0.04 0.09 0.02 0.03
E 0.09 0.01 0.05 0.08 0.05 0.05 0.04 0.04 0.08 0.10 0.02 0.05 0.03 0.04 0.05 0.05 0.09 0.05 0.02 0.03
F 0.07 0.01 0.07 0.07 0.06 0.08 0.02 0.05 0.09 0.08 0.01 0.03 0.03 0.01 0.05 0.04 0.10 0.06 0.01 0.06
G 0.07 0.03 0.06 0.07 0.04 0.04 0.02 0.07 0.05 0.05 0.01 0.04 0.05 0.03 0.04 0.10 0.06 0.10 0.02 0.03
H 0.09 0.05 0.01 0.03 0.05 0.12 0.02 0.04 0.09 0.11 0.01 0.03 0.11 0.01 0.01 0.06 0.07 0.05 0.03 0.05
I 0.08 0.02 0.07 0.04 0.05 0.07 0.02 0.08 0.09 0.07 0.02 0.07 0.04 0.03 0.04 0.07 0.04 0.08 0.01 0.03
K 0.10 0.01 0.07 0.02 0.04 0.06 0.04 0.06 0.08 0.08 0.03 0.05 0.04 0.01 0.03 0.06 0.05 0.08 0.01 0.07
L 0.07 0.02 0.05 0.06 0.03 0.06 0.05 0.07 0.10 0.07 0.02 0.04 0.05 0.05 0.04 0.10 0.05 0.06 0.01 0.03
M 0.09 0.00 0.09 0.07 0.03 0.06 0.01 0.06 0.15 0.03 0.03 0.04 0.00 0.03 0.03 0.07 0.06 0.12 0.01 0.01
N 0.07 0.02 0.03 0.06 0.06 0.06 0.01 0.06 0.06 0.06 0.02 0.08 0.04 0.07 0.03 0.06 0.10 0.06 0.02 0.01
P 0.08 0.04 0.08 0.11 0.01 0.11 0.01 0.03 0.05 0.06 0.01 0.07 0.02 0.01 0.03 0.08 0.04 0.09 0.02 0.05
Q 0.10 0.02 0.06 0.04 0.03 0.09 0.04 0.05 0.08 0.08 0.01 0.04 0.05 0.04 0.05 0.04 0.04 0.06 0.00 0.06
R 0.07 0.03 0.03 0.06 0.02 0.05 0.03 0.07 0.06 0.13 0.02 0.08 0.03 0.06 0.01 0.10 0.04 0.08 0.01 0.04
S 0.09 0.01 0.02 0.05 0.05 0.09 0.03 0.04 0.06 0.07 0.02 0.04 0.03 0.02 0.03 0.08 0.08 0.07 0.03 0.06
T 0.06 0.02 0.08 0.05 0.05 0.07 0.05 0.03 0.06 0.09 0.01 0.05 0.05 0.03 0.02 0.08 0.06 0.07 0.03 0.05
V 0.13 0.03 0.08 0.04 0.02 0.08 0.04 0.04 0.07 0.08 0.01 0.05 0.02 0.05 0.03 0.07 0.05 0.07 0.01 0.03
W 0.12 0.03 0.06 0.03 0.01 0.12 0.03 0.09 0.06 0.03 0.01 0.06 0.01 0.01 0.06 0.09 0.09 0.10 0.00 0.00
Y 0.10 0.01 0.06 0.03 0.03 0.13 0.02 0.05 0.05 0.06 0.01 0.05 0.07 0.03 0.05 0.08 0.07 0.05 0.03 0.03

Back to submission form