NCBI Conserved Domain Search

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

280-342

9.80e-10

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) have been identified in several proteins of the complement system; SUSHI repeats (short complement-like repeat, SCR) are abundant in complement control proteins. The complement control protein (CCP) modules (also known as short consensus repeats SCRs or SUSHI repeats) contain approximately 60 amino acid residues and have been identified in several proteins of the complement system. Typically, 2 to 4 modules contribute to a binding site, implying that the orientation of the modules to each other is critical for function.

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 54.78 E-value: 9.80e-10

                         10        20        30        40        50        60
                 ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 224994201 280 CSDLGGPVNGYKKITEGPgllnerhVKIGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:cd00033    1 CPPPPVPENGTVTGSKGS-------YSYGSTVTYSCNEGYTLVGSSTITCTENGGWSPPPPTC 56

EGF_CA

cd00054

Calcium-binding EGF-like domain, present in a large number of membrane-bound and extracellular ...

240-272

4.66e-06

Calcium-binding EGF-like domain, present in a large number of membrane-bound and extracellular (mostly animal) proteins. Many of these proteins require calcium for their biological function and calcium-binding sites have been found to be located at the N-terminus of particular EGF-like domains; calcium-binding may be crucial for numerous protein-protein interactions. Six conserved core cysteines form three disulfide bridges as in non calcium-binding EGF domains, whose structures are very similar. EGF_CA can be found in tandem repeat arrangements.

Pssm-ID: 238011 Cd Length: 38 Bit Score: 43.78 E-value: 4.66e-06

                         10        20        30
                 ....*....|....*....|....*....|...
gi 224994201 240 SSSPCFHDGTCLlDTTGSFKCACLAGYTGQRCE 272
Cdd:cd00054    7 SGNPCQNGGTCV-NTVGSYRCSCPPGYTGRNCE 38

CCP

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

408-443

5.27e-05

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 41.29 E-value: 5.27e-05

                         10        20        30
                 ....*....|....*....|....*....|....*.
gi 224994201 408 TQVQYECiSPFYRRLGSSRRTCLRTGKWSGRAPSCI 443
Cdd:cd00033   23 STVTYSC-NEGYTLVGSSTITCTENGGWSPPPPTCE 57

Name

Accession

Description

Interval

E-value

Tryp_SPc

cd00190

Trypsin-like serine protease; Many of these are synthesized as inactive precursor zymogens ...

461-718

7.73e-44

Pssm-ID: 238113 [Multi-domain] Cd Length: 232 Bit Score: 157.82 E-value: 7.73e-44

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 461 RWPWQAAIYRRTSGVHdgglhkgawflvCSGALVNERTVVVAAHCVTElgkatiIKTADLKVVLGKFYRDddRDEKSIQN 540
Cdd:cd00190   11 SFPWQVSLQYTGGRHF------------CGGSLISPRWVLTAAHCVYS------SAPSNYTVRLGSHDLS--SNEGGGQV 70

                         90       100       110       120       130       140       150       160
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 541 LRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDlsTSFQESHITVAGWnilADVRSPGFKNDTLHYG 620
Cdd:cd00190   71 IKVKKVIVHPNYNPSTYDNDIALLKLKRPVTLSDNVRPICLPSSGY--NLPAGTTCTVSGW---GRTSEGGPLPDVLQEV 145

                        170       180       190       200       210       220       230       240
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 621 MVRVVDPMLCEEQHEDHGIpvsVTDNMFCASkDPSTPSDICTAETGGIAALSFPGraspepRWHLVGLVSWSYDktC-SN 699
Cdd:cd00190  146 NVPIVSNAECKRAYSYGGT---ITDNMLCAG-GLEGGKDACQGDSGGPLVCNDNG------RGVLVGIVSWGSG--CaRP 213

                        250
                 ....*....|....*....
gi 224994201 700 GLSTAFTKVLPFKDWIERN 718
Cdd:cd00190  214 NYPGVYTRVSSYLDWIQKT 232

Tryp_SPc

smart00020

Trypsin-like serine protease; Many of these are synthesised as inactive precursor zymogens ...

461-715

1.50e-41

Trypsin-like serine protease; Many of these are synthesised as inactive precursor zymogens that are cleaved during limited proteolysis to generate their active forms. A few, however, are active as single chain molecules, and others are inactive due to substitutions of the catalytic triad residues.

Pssm-ID: 214473 Cd Length: 229 Bit Score: 151.29 E-value: 1.50e-41

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   461 RWPWQAAIYRRTsgvhdgglhkgaWFLVCSGALVNERTVVVAAHCVTELGKAtiiktaDLKVVLGKFYRDDDRDEksiQN 540
Cdd:smart00020  12 SFPWQVSLQYGG------------GRHFCGGSLISPRWVLTAAHCVRGSDPS------NIRVRLGSHDLSSGEEG---QV 70

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   541 LRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDlsTSFQESHITVAGWNILADvrSPGFKNDTLHYG 620
Cdd:smart00020  71 IKVSKVIIHPNYNPSTYDNDIALLKLKEPVTLSDNVRPICLPSSNY--NVPAGTTCTVSGWGRTSE--GAGSLPDTLQEV 146

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   621 MVRVVDPMLCEEQHEDHGIpvsVTDNMFCAsKDPSTPSDICTAETGGiaALsfpgrASPEPRWHLVGLVSWSYDktCSN- 699
Cdd:smart00020 147 NVPIVSNATCRRAYSGGGA---ITDNMLCA-GGLEGGKDACQGDSGG--PL-----VCNDGRWVLVGIVSWGSG--CARp 213

                          250
                   ....*....|....*.
gi 224994201   700 GLSTAFTKVLPFKDWI 715
Cdd:smart00020 214 GKPGVYTRVSSYLDWI 229

Trypsin

pfam00089

Trypsin;

457-715

1.04e-36

Trypsin;

Pssm-ID: 459667 [Multi-domain] Cd Length: 219 Bit Score: 137.19 E-value: 1.04e-36

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  457 TQGTRWPWQAAIYRRTSGvhdgglhkgawfLVCSGALVNERTVVVAAHCVTELGkatiiktaDLKVVLGKfyRDDDRDEK 536
Cdd:pfam00089   7 AQPGSFPWQVSLQLSSGK------------HFCGGSLISENWVLTAAHCVSGAS--------DVKVVLGA--HNIVLREG 64

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  537 SIQNLRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDLSTsfQESHITVAGWNILADVRSPgfknDT 616
Cdd:pfam00089  65 GEQKFDVEKIIVHPNYNPDTLDNDIALLKLESPVTLGDTVRPICLPDASSDLP--VGTTCTVSGWGNTKTLGPS----DT 138

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  617 LHYGMVRVVDPMLCEEQHedhgiPVSVTDNMFCASkdpSTPSDICTAETGGIAALSFPgraspeprwHLVGLVSWSYdKT 696
Cdd:pfam00089 139 LQEVTVPVVSRETCRSAY-----GGTVTDTMICAG---AGGKDACQGDSGGPLVCSDG---------ELIGIVSWGY-GC 200

                         250
                  ....*....|....*....
gi 224994201  697 CSNGLSTAFTKVLPFKDWI 715
Cdd:pfam00089 201 ASGNYPGVYTPVSSYLDWI 219

COG5640

Secreted trypsin-like serine protease [Posttranslational modification, protein turnover, ...

462-719

3.04e-36

Secreted trypsin-like serine protease [Posttranslational modification, protein turnover, chaperones];

Pssm-ID: 444365 [Multi-domain] Cd Length: 262 Bit Score: 137.47 E-value: 3.04e-36

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 462 WPWQAAIYRRTsgvhdgglhkGAWFLVCSGALVNERTVVVAAHCVTELGkatiikTADLKVVLGkfyrDDDRDEKSIQNL 541
Cdd:COG5640   42 YPWMVALQSSN----------GPSGQFCGGTLIAPRWVLTAAHCVDGDG------PSDLRVVIG----STDLSTSGGTVV 101

                         90       100       110       120       130       140       150       160
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 542 RVSAIILHPNYDPILLDTDIAVLKLldkARISTRVQPICLATTRDLSTSFQEshITVAGWNilADVRSPGFKNDTLHYGM 621
Cdd:COG5640  102 KVARIVVHPDYDPATPGNDIALLKL---ATPVPGVAPAPLATSADAAAPGTP--ATVAGWG--RTSEGPGSQSGTLRKAD 174

                        170       180       190       200       210       220       230       240
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 622 VRVVDPMLCEeqhedhGIPVSVTDNMFCASkDPSTPSDICTAETGGiaalsfPGRASPEPRWHLVGLVSWSYDkTCSNGL 701
Cdd:COG5640  175 VPVVSDATCA------AYGGFDGGTMLCAG-YPEGGKDACQGDSGG------PLVVKDGGGWVLVGVVSWGGG-PCAAGY 240

                        250
                 ....*....|....*...
gi 224994201 702 STAFTKVLPFKDWIERNM 719
Cdd:COG5640  241 PGVYTRVSAYRDWIKSTA 258

CUB

cd00041

CUB domain; extracellular domain; present in proteins mostly known to be involved in ...

128-234

1.45e-34

CUB domain; extracellular domain; present in proteins mostly known to be involved in development; not found in prokaryotes, plants and yeast.

Pssm-ID: 238001 [Multi-domain] Cd Length: 113 Bit Score: 127.14 E-value: 1.45e-34

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 128 CGQVLRASKGQILL-----ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNE 202
Cdd:cd00041    1 CGGTLTASTSGTISspnypNNYPNNLNCVWTIEAPPGYRIRLTFEDFDLESSPNCSYDYLEIYDGPSTSSPLLGRFCGST 80

                         90       100       110
                 ....*....|....*....|....*....|..
gi 224994201 203 RPAPIRSTGSSLHVLFHSDGSKNFDGFHAVFE 234
Cdd:cd00041   81 LPPPIISSGNSLTVRFRSDSSVTGRGFKATYS 112

CUB

pfam00431

CUB domain;

128-233

2.23e-30

CUB domain;

Pssm-ID: 395345 [Multi-domain] Cd Length: 110 Bit Score: 115.47 E-value: 2.23e-30

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  128 CGQVLRASKGQILL----ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNER 203
Cdd:pfam00431   1 CGGVLTDSSGSISSpnypNPYPPNKDCVWLIRAPPGFRVKLTFQDFELEDHDECGYDYVEIRDGPSASSPLLGRFCGSGI 80

                          90       100       110
                  ....*....|....*....|....*....|
gi 224994201  204 PAPIRSTGSSLHVLFHSDGSKNFDGFHAVF 233
Cdd:pfam00431  81 PEDIVSSSNQMTIKFVSDASVQKRGFKATY 110

CUB

smart00042

Domain first found in C1r, C1s, uEGF, and bone morphogenetic protein; This domain is found ...

142-233

3.57e-29

Domain first found in C1r, C1s, uEGF, and bone morphogenetic protein; This domain is found mostly among developmentally-regulated proteins. Spermadhesins contain only this domain.

Pssm-ID: 214483 [Multi-domain] Cd Length: 102 Bit Score: 111.71 E-value: 3.57e-29

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   142 ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNERPAP-IRSTGSSLHVLFHS 220
Cdd:smart00042  10 QSYPNNLDCVWTIRAPPGYRIELQFTDFDLESSDNCEYDYVEIYDGPSASSPLLGRFCGSEAPPPvISSSSNSLTLTFVS 89

                           90
                   ....*....|...
gi 224994201   221 DGSKNFDGFHAVF 233
Cdd:smart00042  90 DSSVQKRGFSARY 102

CCP

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

280-342

9.80e-10

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 54.78 E-value: 9.80e-10

                         10        20        30        40        50        60
                 ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 224994201 280 CSDLGGPVNGYKKITEGPgllnerhVKIGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:cd00033    1 CPPPPVPENGTVTGSKGS-------YSYGSTVTYSCNEGYTLVGSSTITCTENGGWSPPPPTC 56

CCP

Domain abundant in complement control proteins; SUSHI repeat; short complement-like repeat ...

280-342

2.25e-09

Domain abundant in complement control proteins; SUSHI repeat; short complement-like repeat (SCR); The complement control protein (CCP) modules (also known as short consensus repeats SCRs or SUSHI repeats) contain approximately 60 amino acid residues and have been identified in several proteins of the complement system. A missense mutation in seventh CCP domain causes deficiency of the b subunit of factor XIII.

Pssm-ID: 214478 [Multi-domain] Cd Length: 56 Bit Score: 53.68 E-value: 2.25e-09

                           10        20        30        40        50        60
                   ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 224994201   280 CSDLGGPVNGYKKITEGPgllnerhVKIGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:smart00032   1 CPPPPDIENGTVTSSSGT-------YSYGDTVTYSCDPGYTLIGSSTITCLENGTWSPPPPTC 56

Sushi

Sushi repeat (SCR repeat);

307-342

1.28e-08

Sushi repeat (SCR repeat);

Pssm-ID: 459664 [Multi-domain] Cd Length: 56 Bit Score: 51.73 E-value: 1.28e-08

                          10        20        30
                  ....*....|....*....|....*....|....*.
gi 224994201  307 IGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:pfam00084  21 YGASVSYECDPGYRLVGSPTITCQEDGTWSPPFPEC 56

EGF_CA

cd00054

Calcium-binding EGF-like domain, present in a large number of membrane-bound and extracellular ...

240-272

4.66e-06

Pssm-ID: 238011 Cd Length: 38 Bit Score: 43.78 E-value: 4.66e-06

                         10        20        30
                 ....*....|....*....|....*....|...
gi 224994201 240 SSSPCFHDGTCLlDTTGSFKCACLAGYTGQRCE 272
Cdd:cd00054    7 SGNPCQNGGTCV-NTVGSYRCSCPPGYTGRNCE 38

CCP

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

408-443

5.27e-05

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 41.29 E-value: 5.27e-05

                         10        20        30
                 ....*....|....*....|....*....|....*.
gi 224994201 408 TQVQYECiSPFYRRLGSSRRTCLRTGKWSGRAPSCI 443
Cdd:cd00033   23 STVTYSC-NEGYTLVGSSTITCTENGGWSPPPPTCE 57

CCP

Domain abundant in complement control proteins; SUSHI repeat; short complement-like repeat ...

408-442

1.13e-04

Pssm-ID: 214478 [Multi-domain] Cd Length: 56 Bit Score: 40.59 E-value: 1.13e-04

                           10        20        30
                   ....*....|....*....|....*....|....*
gi 224994201   408 TQVQYECISPfYRRLGSSRRTCLRTGKWSGRAPSC 442
Cdd:smart00032  23 DTVTYSCDPG-YTLIGSSTITCLENGTWSPPPPTC 56

EGF_CA

smart00179

Calcium-binding EGF-like domain;

240-272

1.96e-04

Calcium-binding EGF-like domain;

Pssm-ID: 214542 [Multi-domain] Cd Length: 39 Bit Score: 39.15 E-value: 1.96e-04

                           10        20        30
                   ....*....|....*....|....*....|....
gi 224994201   240 SSSPCFHDGTCLlDTTGSFKCACLAGYT-GQRCE 272
Cdd:smart00179   7 SGNPCQNGGTCV-NTVGSYRCECPPGYTdGRNCE 39

Sushi

Sushi repeat (SCR repeat);

407-442

4.54e-04

Sushi repeat (SCR repeat);

Pssm-ID: 459664 [Multi-domain] Cd Length: 56 Bit Score: 38.63 E-value: 4.54e-04

                          10        20        30
                  ....*....|....*....|....*....|....*.
gi 224994201  407 HTQVQYECISPfYRRLGSSRRTCLRTGKWSGRAPSC 442
Cdd:pfam00084  22 GASVSYECDPG-YRLVGSPTITCQEDGTWSPPFPEC 56

EGF

pfam00008

EGF-like domain; There is no clear separation between noise and signal. pfam00053 is very ...

239-270

5.84e-04

EGF-like domain; There is no clear separation between noise and signal. pfam00053 is very similar, but has 8 instead of 6 conserved cysteines. Includes some cytokine receptors. The EGF domain misses the N-terminus regions of the Ca2+ binding EGF domains (this is the main reason of discrepancy between swiss-prot domain start/end and Pfam). The family is hard to model due to many similar but different sub-types of EGF domains. Pfam certainly misses a number of EGF domains.

Pssm-ID: 394967 Cd Length: 31 Bit Score: 37.75 E-value: 5.84e-04

                          10        20        30
                  ....*....|....*....|....*....|..
gi 224994201  239 CSSSPCFHDGTClLDTTGSFKCACLAGYTGQR 270
Cdd:pfam00008   1 CAPNPCSNGGTC-VDTPGGYTCICPEGYTGKR 31

PHA02639

EEV host range protein; Provisional

306-349

6.51e-04

EEV host range protein; Provisional

Pssm-ID: 165022 [Multi-domain] Cd Length: 295 Bit Score: 42.34 E-value: 6.51e-04

                         10        20        30        40
                 ....*....|....*....|....*....|....*....|....*...
gi 224994201 306 KIGTVVSFFCNGSYVLSGNEKRTC---QQNGEWSGKQPVCM-KACREP 349
Cdd:PHA02639  41 EIGKLIEYTCNTDYALIGDRFRTCikdKNNAIWSNKAPFCMlKECNDP 88

Name

Accession

Description

Interval

E-value

Tryp_SPc

cd00190

Trypsin-like serine protease; Many of these are synthesized as inactive precursor zymogens ...

461-718

7.73e-44

Pssm-ID: 238113 [Multi-domain] Cd Length: 232 Bit Score: 157.82 E-value: 7.73e-44

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 461 RWPWQAAIYRRTSGVHdgglhkgawflvCSGALVNERTVVVAAHCVTElgkatiIKTADLKVVLGKFYRDddRDEKSIQN 540
Cdd:cd00190   11 SFPWQVSLQYTGGRHF------------CGGSLISPRWVLTAAHCVYS------SAPSNYTVRLGSHDLS--SNEGGGQV 70

                         90       100       110       120       130       140       150       160
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 541 LRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDlsTSFQESHITVAGWnilADVRSPGFKNDTLHYG 620
Cdd:cd00190   71 IKVKKVIVHPNYNPSTYDNDIALLKLKRPVTLSDNVRPICLPSSGY--NLPAGTTCTVSGW---GRTSEGGPLPDVLQEV 145

                        170       180       190       200       210       220       230       240
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 621 MVRVVDPMLCEEQHEDHGIpvsVTDNMFCASkDPSTPSDICTAETGGIAALSFPGraspepRWHLVGLVSWSYDktC-SN 699
Cdd:cd00190  146 NVPIVSNAECKRAYSYGGT---ITDNMLCAG-GLEGGKDACQGDSGGPLVCNDNG------RGVLVGIVSWGSG--CaRP 213

                        250
                 ....*....|....*....
gi 224994201 700 GLSTAFTKVLPFKDWIERN 718
Cdd:cd00190  214 NYPGVYTRVSSYLDWIQKT 232

Tryp_SPc

smart00020

Trypsin-like serine protease; Many of these are synthesised as inactive precursor zymogens ...

461-715

1.50e-41

Pssm-ID: 214473 Cd Length: 229 Bit Score: 151.29 E-value: 1.50e-41

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   461 RWPWQAAIYRRTsgvhdgglhkgaWFLVCSGALVNERTVVVAAHCVTELGKAtiiktaDLKVVLGKFYRDDDRDEksiQN 540
Cdd:smart00020  12 SFPWQVSLQYGG------------GRHFCGGSLISPRWVLTAAHCVRGSDPS------NIRVRLGSHDLSSGEEG---QV 70

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   541 LRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDlsTSFQESHITVAGWNILADvrSPGFKNDTLHYG 620
Cdd:smart00020  71 IKVSKVIIHPNYNPSTYDNDIALLKLKEPVTLSDNVRPICLPSSNY--NVPAGTTCTVSGWGRTSE--GAGSLPDTLQEV 146

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   621 MVRVVDPMLCEEQHEDHGIpvsVTDNMFCAsKDPSTPSDICTAETGGiaALsfpgrASPEPRWHLVGLVSWSYDktCSN- 699
Cdd:smart00020 147 NVPIVSNATCRRAYSGGGA---ITDNMLCA-GGLEGGKDACQGDSGG--PL-----VCNDGRWVLVGIVSWGSG--CARp 213

                          250
                   ....*....|....*.
gi 224994201   700 GLSTAFTKVLPFKDWI 715
Cdd:smart00020 214 GKPGVYTRVSSYLDWI 229

Trypsin

pfam00089

Trypsin;

457-715

1.04e-36

Trypsin;

Pssm-ID: 459667 [Multi-domain] Cd Length: 219 Bit Score: 137.19 E-value: 1.04e-36

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  457 TQGTRWPWQAAIYRRTSGvhdgglhkgawfLVCSGALVNERTVVVAAHCVTELGkatiiktaDLKVVLGKfyRDDDRDEK 536
Cdd:pfam00089   7 AQPGSFPWQVSLQLSSGK------------HFCGGSLISENWVLTAAHCVSGAS--------DVKVVLGA--HNIVLREG 64

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  537 SIQNLRVSAIILHPNYDPILLDTDIAVLKLLDKARISTRVQPICLATTRDLSTsfQESHITVAGWNILADVRSPgfknDT 616
Cdd:pfam00089  65 GEQKFDVEKIIVHPNYNPDTLDNDIALLKLESPVTLGDTVRPICLPDASSDLP--VGTTCTVSGWGNTKTLGPS----DT 138

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  617 LHYGMVRVVDPMLCEEQHedhgiPVSVTDNMFCASkdpSTPSDICTAETGGIAALSFPgraspeprwHLVGLVSWSYdKT 696
Cdd:pfam00089 139 LQEVTVPVVSRETCRSAY-----GGTVTDTMICAG---AGGKDACQGDSGGPLVCSDG---------ELIGIVSWGY-GC 200

                         250
                  ....*....|....*....
gi 224994201  697 CSNGLSTAFTKVLPFKDWI 715
Cdd:pfam00089 201 ASGNYPGVYTPVSSYLDWI 219

COG5640

Secreted trypsin-like serine protease [Posttranslational modification, protein turnover, ...

462-719

3.04e-36

Secreted trypsin-like serine protease [Posttranslational modification, protein turnover, chaperones];

Pssm-ID: 444365 [Multi-domain] Cd Length: 262 Bit Score: 137.47 E-value: 3.04e-36

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 462 WPWQAAIYRRTsgvhdgglhkGAWFLVCSGALVNERTVVVAAHCVTELGkatiikTADLKVVLGkfyrDDDRDEKSIQNL 541
Cdd:COG5640   42 YPWMVALQSSN----------GPSGQFCGGTLIAPRWVLTAAHCVDGDG------PSDLRVVIG----STDLSTSGGTVV 101

                         90       100       110       120       130       140       150       160
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 542 RVSAIILHPNYDPILLDTDIAVLKLldkARISTRVQPICLATTRDLSTSFQEshITVAGWNilADVRSPGFKNDTLHYGM 621
Cdd:COG5640  102 KVARIVVHPDYDPATPGNDIALLKL---ATPVPGVAPAPLATSADAAAPGTP--ATVAGWG--RTSEGPGSQSGTLRKAD 174

                        170       180       190       200       210       220       230       240
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 622 VRVVDPMLCEeqhedhGIPVSVTDNMFCASkDPSTPSDICTAETGGiaalsfPGRASPEPRWHLVGLVSWSYDkTCSNGL 701
Cdd:COG5640  175 VPVVSDATCA------AYGGFDGGTMLCAG-YPEGGKDACQGDSGG------PLVVKDGGGWVLVGVVSWGGG-PCAAGY 240

                        250
                 ....*....|....*...
gi 224994201 702 STAFTKVLPFKDWIERNM 719
Cdd:COG5640  241 PGVYTRVSAYRDWIKSTA 258

CUB

cd00041

CUB domain; extracellular domain; present in proteins mostly known to be involved in ...

128-234

1.45e-34

CUB domain; extracellular domain; present in proteins mostly known to be involved in development; not found in prokaryotes, plants and yeast.

Pssm-ID: 238001 [Multi-domain] Cd Length: 113 Bit Score: 127.14 E-value: 1.45e-34

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 128 CGQVLRASKGQILL-----ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNE 202
Cdd:cd00041    1 CGGTLTASTSGTISspnypNNYPNNLNCVWTIEAPPGYRIRLTFEDFDLESSPNCSYDYLEIYDGPSTSSPLLGRFCGST 80

                         90       100       110
                 ....*....|....*....|....*....|..
gi 224994201 203 RPAPIRSTGSSLHVLFHSDGSKNFDGFHAVFE 234
Cdd:cd00041   81 LPPPIISSGNSLTVRFRSDSSVTGRGFKATYS 112

CUB

pfam00431

CUB domain;

128-233

2.23e-30

CUB domain;

Pssm-ID: 395345 [Multi-domain] Cd Length: 110 Bit Score: 115.47 E-value: 2.23e-30

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201  128 CGQVLRASKGQILL----ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNER 203
Cdd:pfam00431   1 CGGVLTDSSGSISSpnypNPYPPNKDCVWLIRAPPGFRVKLTFQDFELEDHDECGYDYVEIRDGPSASSPLLGRFCGSGI 80

                          90       100       110
                  ....*....|....*....|....*....|
gi 224994201  204 PAPIRSTGSSLHVLFHSDGSKNFDGFHAVF 233
Cdd:pfam00431  81 PEDIVSSSNQMTIKFVSDASVQKRGFKATY 110

CUB

smart00042

Domain first found in C1r, C1s, uEGF, and bone morphogenetic protein; This domain is found ...

142-233

3.57e-29

Domain first found in C1r, C1s, uEGF, and bone morphogenetic protein; This domain is found mostly among developmentally-regulated proteins. Spermadhesins contain only this domain.

Pssm-ID: 214483 [Multi-domain] Cd Length: 102 Bit Score: 111.71 E-value: 3.57e-29

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201   142 ESYPLNAHCEWTIHARPGFIIQLRFGMLSLEFDYMCQYDYVEVRDGDNSDSPIIKRFCGNERPAP-IRSTGSSLHVLFHS 220
Cdd:smart00042  10 QSYPNNLDCVWTIRAPPGYRIELQFTDFDLESSDNCEYDYVEIYDGPSASSPLLGRFCGSEAPPPvISSSSNSLTLTFVS 89

                           90
                   ....*....|...
gi 224994201   221 DGSKNFDGFHAVF 233
Cdd:smart00042  90 DSSVQKRGFSARY 102

CCP

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

280-342

9.80e-10

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 54.78 E-value: 9.80e-10

                         10        20        30        40        50        60
                 ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 224994201 280 CSDLGGPVNGYKKITEGPgllnerhVKIGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:cd00033    1 CPPPPVPENGTVTGSKGS-------YSYGSTVTYSCNEGYTLVGSSTITCTENGGWSPPPPTC 56

CCP

Domain abundant in complement control proteins; SUSHI repeat; short complement-like repeat ...

280-342

2.25e-09

Pssm-ID: 214478 [Multi-domain] Cd Length: 56 Bit Score: 53.68 E-value: 2.25e-09

                           10        20        30        40        50        60
                   ....*....|....*....|....*....|....*....|....*....|....*....|...
gi 224994201   280 CSDLGGPVNGYKKITEGPgllnerhVKIGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:smart00032   1 CPPPPDIENGTVTSSSGT-------YSYGDTVTYSCDPGYTLIGSSTITCLENGTWSPPPPTC 56

Sushi

Sushi repeat (SCR repeat);

307-342

1.28e-08

Sushi repeat (SCR repeat);

Pssm-ID: 459664 [Multi-domain] Cd Length: 56 Bit Score: 51.73 E-value: 1.28e-08

                          10        20        30
                  ....*....|....*....|....*....|....*.
gi 224994201  307 IGTVVSFFCNGSYVLSGNEKRTCQQNGEWSGKQPVC 342
Cdd:pfam00084  21 YGASVSYECDPGYRLVGSPTITCQEDGTWSPPFPEC 56

eMpr

COG3591

V8-like Glu-specific endopeptidase [Posttranslational modification, protein turnover, ...

488-600

2.08e-06

V8-like Glu-specific endopeptidase [Posttranslational modification, protein turnover, chaperones];

Pssm-ID: 442810 [Multi-domain] Cd Length: 194 Bit Score: 48.90 E-value: 2.08e-06

                         10        20        30        40        50        60        70        80
                 ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 224994201 488 VCSGALVNERTVVVAAHCVTELGKATIIKtaDLKVVLGkfyRDDDRDEKSiqnlRVSAIILHPNYDP-ILLDTDIAVLKL 566
Cdd:COG3591   13 VCTGTLIGPNLVLTAGHCVYDGAGGGWAT--NIVFVPG---YNGGPYGTA----TATRFRVPPGWVAsGDAGYDYALLRL 83

                         90       100       110
                 ....*....|....*....|....*....|....
gi 224994201 567 ldKARISTRVQPICLATTRDLSTsfqESHITVAG 600
Cdd:COG3591   84 --DEPLGDTTGWLGLAFNDAPLA---GEPVTIIG 112

EGF_CA

cd00054

Calcium-binding EGF-like domain, present in a large number of membrane-bound and extracellular ...

240-272

4.66e-06

Pssm-ID: 238011 Cd Length: 38 Bit Score: 43.78 E-value: 4.66e-06

                         10        20        30
                 ....*....|....*....|....*....|...
gi 224994201 240 SSSPCFHDGTCLlDTTGSFKCACLAGYTGQRCE 272
Cdd:cd00054    7 SGNPCQNGGTCV-NTVGSYRCSCPPGYTGRNCE 38

CCP

Complement control protein (CCP) modules (aka short consensus repeats SCRs or SUSHI repeats) ...

408-443

5.27e-05

Pssm-ID: 153056 [Multi-domain] Cd Length: 57 Bit Score: 41.29 E-value: 5.27e-05

                         10        20        30
                 ....*....|....*....|....*....|....*.
gi 224994201 408 TQVQYECiSPFYRRLGSSRRTCLRTGKWSGRAPSCI 443
Cdd:cd00033   23 STVTYSC-NEGYTLVGSSTITCTENGGWSPPPPTCE 57

CCP

Domain abundant in complement control proteins; SUSHI repeat; short complement-like repeat ...

408-442

1.13e-04

Pssm-ID: 214478 [Multi-domain] Cd Length: 56 Bit Score: 40.59 E-value: 1.13e-04

                           10        20        30
                   ....*....|....*....|....*....|....*
gi 224994201   408 TQVQYECISPfYRRLGSSRRTCLRTGKWSGRAPSC 442
Cdd:smart00032  23 DTVTYSCDPG-YTLIGSSTITCLENGTWSPPPPTC 56

EGF_CA

smart00179

Calcium-binding EGF-like domain;

240-272

1.96e-04

Calcium-binding EGF-like domain;

Pssm-ID: 214542 [Multi-domain] Cd Length: 39 Bit Score: 39.15 E-value: 1.96e-04

                           10        20        30
                   ....*....|....*....|....*....|....
gi 224994201   240 SSSPCFHDGTCLlDTTGSFKCACLAGYT-GQRCE 272
Cdd:smart00179   7 SGNPCQNGGTCV-NTVGSYRCECPPGYTdGRNCE 39

Sushi