NCBI Conserved Domain Search

Conserved domains on [gi|149054851|gb|EDM06668|]

View

similar to hypothetical protein DKFZp434P0316 (predicted), isoform CRA_a [Rattus norvegicus]

Protein Classification

DUF4795 domain-containing protein( domain architecture ID 11240481)

DUF4795 domain-containing protein similar to Mus musculus glutamine-rich protein 2

Graphical summary

Zoom to residue level

show extra options »

Show site features Horizontal zoom: ×

List of domain hits

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

662-816

1.16e-56

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria and eukaryotes. Proteins in this family are typically between 285 and 978 amino acids in length.

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 193.67 E-value: 1.16e-56

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   662 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIE-------------------------KADKSALASKV 716
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEalyqqieklekvkadkevveeeldeKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   717 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQTLEDRWKSLRQQLKERSPLYQADEA 796
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 149054851   797 AAMRRQLLAHFHCLSCDRPL 816
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Atrophin-1 super family

cl38111

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian ...

51-268

1.03e-04

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian atrophy (DRPLA) gene. DRPLA OMIM:125370 is a progressive neurodegenerative disorder. It is caused by the expansion of a CAG repeat in the DRPLA gene on chromosome 12p. This results in an extended polyglutamine region in atrophin-1, that is thought to confer toxicity to the protein, possibly through altering its interactions with other proteins. The expansion of a CAG repeat is also the underlying defect in six other neurodegenerative disorders, including Huntington's disease. One interaction of expanded polyglutamine repeats that is thought to be pathogenic is that with the short glutamine repeat in the transcriptional coactivator CREB binding protein, CBP. This interaction draws CBP away from its usual nuclear location to the expanded polyglutamine repeat protein aggregates that are characteriztic of the polyglutamine neurodegenerative disorders. This interferes with CBP-mediated transcription and causes cytotoxicity.

The actual alignment was detected with superfamily member pfam03154:

Pssm-ID: 460830 [Multi-domain] Cd Length: 991 Bit Score: 46.30 E-value: 1.03e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851    51 SETDSQMHARRdEQLPGQTQQDRYQRGGM--PGMEPLGMDQAGSTHPVVPLTmgqlgVMPPEMHDQRAEPPYQVQSGVQP 128
Cdd:pfam03154  154 NESDSDSSAQQ-QILQTQPPVLQAQSGAAspPSPPPPGTTQAATAGPTPSAP-----SVPPQGSPATSQPPNQTQSTAAP 227

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   129 SGADREPETLSPAQLGTALPlsaPQQGMMLPGPdqqgmeqaavygsgqgPWATAQQGLTPVSIDLQGLPIQGTGQQGP-- 206
Cdd:pfam03154  228 HTLIQQTPTLHPQRLPSPHP---PLQPMTQPPP----------------PSQVSPQPLPQPSLHGQMPPMPHSLQTGPsh 288

                          170       180       190       200       210       220
                   ....*....|....*....|....*....|....*....|....*....|....*....|..
gi 149054851   207 IAHQVDGQGLVMPGQDQRAVPPSLPDqrrlASLGLTQKSTDQQDFRQSSLASRfvQPGSEQP 268
Cdd:pfam03154  289 MQHPVPPQPFPLTPQSSQSQVPPGPS----PAAPGQSQQRIHTPPSQSQLQSQ--QPPREQP 344

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

662-816

1.16e-56

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 193.67 E-value: 1.16e-56

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   662 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIE-------------------------KADKSALASKV 716
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEalyqqieklekvkadkevveeeldeKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   717 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQTLEDRWKSLRQQLKERSPLYQADEA 796
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 149054851   797 AAMRRQLLAHFHCLSCDRPL 816
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Atrophin-1

pfam03154

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian ...

51-268

1.03e-04

Pssm-ID: 460830 [Multi-domain] Cd Length: 991 Bit Score: 46.30 E-value: 1.03e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851    51 SETDSQMHARRdEQLPGQTQQDRYQRGGM--PGMEPLGMDQAGSTHPVVPLTmgqlgVMPPEMHDQRAEPPYQVQSGVQP 128
Cdd:pfam03154  154 NESDSDSSAQQ-QILQTQPPVLQAQSGAAspPSPPPPGTTQAATAGPTPSAP-----SVPPQGSPATSQPPNQTQSTAAP 227

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   129 SGADREPETLSPAQLGTALPlsaPQQGMMLPGPdqqgmeqaavygsgqgPWATAQQGLTPVSIDLQGLPIQGTGQQGP-- 206
Cdd:pfam03154  228 HTLIQQTPTLHPQRLPSPHP---PLQPMTQPPP----------------PSQVSPQPLPQPSLHGQMPPMPHSLQTGPsh 288

                          170       180       190       200       210       220
                   ....*....|....*....|....*....|....*....|....*....|....*....|..
gi 149054851   207 IAHQVDGQGLVMPGQDQRAVPPSLPDqrrlASLGLTQKSTDQQDFRQSSLASRfvQPGSEQP 268
Cdd:pfam03154  289 MQHPVPPQPFPLTPQSSQSQVPPGPS----PAAPGQSQQRIHTPPSQSQLQSQ--QPPREQP 344

PHA03418

hypothetical E4 protein; Provisional

108-228

4.01e-04

hypothetical E4 protein; Provisional

Pssm-ID: 177646 [Multi-domain] Cd Length: 230 Bit Score: 43.19 E-value: 4.01e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851  108 PPEMHDQRAEPPYQVQSGVQPSGADREPETLSPAQLGTALPLSAPQQgmmlPGPDQQGMEQAAVYGSGQGPwATAQQGLT 187
Cdd:PHA03418   48 PDKNPSPPPDPPLTPRPPAQPNGHNKPPVTKQPGGEGTEEDHQAPLA----ADADDDPRPGKRSKADEHGP-APGRAALA 122

                          90       100       110       120
                  ....*....|....*....|....*....|....*....|.
gi 149054851  188 PVSIDLQGLPIQGTGQQGPIAhqVDGQGLVMPGQDQRAVPP 228
Cdd:PHA03418  123 PFKLDLDQDPLHGDPDPPPGA--TGGQGEEPPEGGEESQPP 161

Mplasa_alph_rch

TIGR04523

helix-rich Mycoplasma protein; Members of this family occur strictly within a subset of ...

638-787

1.31e-03

helix-rich Mycoplasma protein; Members of this family occur strictly within a subset of Mycoplasma species. Members average 750 amino acids in length, including signal peptide. Sequences are predicted (Jpred 3) to be almost entirely alpha-helical. These sequences show strong periodicity (consistent with long alpha helical structures) and low complexity rich in D,E,N,Q, and K. Genes encoding these proteins are often found in tandem. The function is unknown.

Pssm-ID: 275316 [Multi-domain] Cd Length: 745 Bit Score: 42.70 E-value: 1.31e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   638 QRYEQLQDMVTGLAASRPS-KKAKLQGQDEelLGHVQSAILQVQgdcEKLNITTSNLIEDHRQ---KQKDIEKADKsala 713
Cdd:TIGR04523  211 QKNKSLESQISELKKQNNQlKDNIEKKQQE--INEKTTEISNTQ---TQLNQLKDEQNKIKKQlseKQKELEQNNK---- 281

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   714 skvsriQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLE---------LDPLKQTLEDRWK------ 778
Cdd:TIGR04523  282 ------KIKELEKQLNQLKSEISDLNNQKEQDWNKELKSELKNQEKKLEEIQnqisqnnkiISQLNEQISQLKKeltnse 355

                          170
                   ....*....|...
gi 149054851   779 ----SLRQQLKER 787
Cdd:TIGR04523  356 sensEKQRELEEK 368

Name

Accession

Description

Interval

E-value

DUF4795

pfam16043

Domain of unknown function (DUF4795); This family of proteins is functionally uncharacterized. ...

662-816

1.16e-56

Pssm-ID: 464990 [Multi-domain] Cd Length: 181 Bit Score: 193.67 E-value: 1.16e-56

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   662 QGQDEELLGHVQSAILQVQGDCEKLNITTSNLIEDHRQKQKDIE-------------------------KADKSALASKV 716
Cdd:pfam16043    2 KVEDAELLDQLQALILDLQEELEKLSETTSELSERLQQRQKHLEalyqqieklekvkadkevveeeldeKADKEALASKV 81

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   717 SRIQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLELDPLKQTLEDRWKSLRQQLKERSPLYQADEA 796
Cdd:pfam16043   82 SRDQFDETLEELNQMLQELLDKLEGQEDAWKKALETLSEELDTKLDRLELDPLKELLERRIKALQKLLQEGSEELDEAEA 161

                          170       180
                   ....*....|....*....|
gi 149054851   797 AAMRRQLLAHFHCLSCDRPL 816
Cdd:pfam16043  162 AGFRKKLLERFHCISCDRPV 181

Atrophin-1

pfam03154

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian ...

51-268

1.03e-04

Pssm-ID: 460830 [Multi-domain] Cd Length: 991 Bit Score: 46.30 E-value: 1.03e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851    51 SETDSQMHARRdEQLPGQTQQDRYQRGGM--PGMEPLGMDQAGSTHPVVPLTmgqlgVMPPEMHDQRAEPPYQVQSGVQP 128
Cdd:pfam03154  154 NESDSDSSAQQ-QILQTQPPVLQAQSGAAspPSPPPPGTTQAATAGPTPSAP-----SVPPQGSPATSQPPNQTQSTAAP 227

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   129 SGADREPETLSPAQLGTALPlsaPQQGMMLPGPdqqgmeqaavygsgqgPWATAQQGLTPVSIDLQGLPIQGTGQQGP-- 206
Cdd:pfam03154  228 HTLIQQTPTLHPQRLPSPHP---PLQPMTQPPP----------------PSQVSPQPLPQPSLHGQMPPMPHSLQTGPsh 288

                          170       180       190       200       210       220
                   ....*....|....*....|....*....|....*....|....*....|....*....|..
gi 149054851   207 IAHQVDGQGLVMPGQDQRAVPPSLPDqrrlASLGLTQKSTDQQDFRQSSLASRfvQPGSEQP 268
Cdd:pfam03154  289 MQHPVPPQPFPLTPQSSQSQVPPGPS----PAAPGQSQQRIHTPPSQSQLQSQ--QPPREQP 344

PHA03418

hypothetical E4 protein; Provisional

108-228

4.01e-04

hypothetical E4 protein; Provisional

Pssm-ID: 177646 [Multi-domain] Cd Length: 230 Bit Score: 43.19 E-value: 4.01e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851  108 PPEMHDQRAEPPYQVQSGVQPSGADREPETLSPAQLGTALPLSAPQQgmmlPGPDQQGMEQAAVYGSGQGPwATAQQGLT 187
Cdd:PHA03418   48 PDKNPSPPPDPPLTPRPPAQPNGHNKPPVTKQPGGEGTEEDHQAPLA----ADADDDPRPGKRSKADEHGP-APGRAALA 122

                          90       100       110       120
                  ....*....|....*....|....*....|....*....|.
gi 149054851  188 PVSIDLQGLPIQGTGQQGPIAhqVDGQGLVMPGQDQRAVPP 228
Cdd:PHA03418  123 PFKLDLDQDPLHGDPDPPPGA--TGGQGEEPPEGGEESQPP 161

Glutenin_hmw

pfam03157

High molecular weight glutenin subunit; Members of this family include high molecular weight ...

64-362

1.17e-03

High molecular weight glutenin subunit; Members of this family include high molecular weight subunits of glutenin. This group of gluten proteins is thought to be largely responsible for the elastic properties of gluten, and hence, doughs. Indeed, glutenin high molecular weight subunits are classified as elastomeric proteins, because the glutenin network can withstand significant deformations without breaking, and return to the original conformation when the stress is removed. Elastomeric proteins differ considerably in amino acid sequence, but they are all polymers whose subunits consist of elastomeric domains, composed of repeated motifs, and non-elastic domains that mediate cross-linking between the subunits. The elastomeric domain motifs are all rich in glycine residues in addition to other hydrophobic residues. High molecular weight glutenin subunits have an extensive central elastomeric domain, flanked by two terminal non-elastic domains that form disulphide cross-links. The central elastomeric domain is characterized by the following three repeated motifs: PGQGQQ, GYYPTS[P/L]QQ, GQQ. It possesses overlapping beta-turns within and between the repeated motifs, and assumes a regular helical secondary structure with a diameter of approx. 1.9 nm and a pitch of approx. 1.5 nm.

Pssm-ID: 367362 [Multi-domain] Cd Length: 786 Bit Score: 43.01 E-value: 1.17e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851    64 QLPGQTQQ-DRYQRGGMPGM-EPLGMDQAGST--HPVVPLTMGQLGVMPPEMHDQRAEPPYQVQSGVQPSGADREPETLS 139
Cdd:pfam03157  231 QQPGQGQQpGQGQQGQQPGQpQQLGQGQQGYYpiSPQQPRQWQQSGQGQQGYYPTSLQQPGQGQSGYYPTSQQQAGQLQQ 310

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   140 PAQLGTALPLSAPQQGMML--PGPDQQGMEQAAVYGSGQGpwataQQGLTPVSIDLQGLPIQG---TGQQGPIAHQVDGQ 214
Cdd:pfam03157  311 EQQLGQEQQDQQPGQGRQGqqPGQGQQGQQPAQGQQPGQG-----QPGYYPTSPQQPGQGQPGyypTSQQQPQQGQQPEQ 385

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   215 GLV-----------------MPGQDQRAVPPSLPDQRRLASLGltQKSTDQQDFRQSSLASRFVQPGSEQPGVEQRdver 277
Cdd:pfam03157  386 GQQgqqqgqgqqgqqpgqgqQPGQGQPGYYPTSPQQSGQGQPG--YYPTSPQQSGQGQQPGQGQQPGQEQPGQGQQ---- 459

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   278 PGLDRRSSMPVRTERRTslQTAADRRLSVPIeaerlSLAQSRAGQEDSV--QPEAGQYGLVQPRADQYDFVQPGDSQLGL 355
Cdd:pfam03157  460 PGQGQQGQQPGQPEQGQ--QPGQGQPGYYPT-----SPQQSGQGQQLGQwqQQGQGQPGYYPTSPLQPGQGQPGYYPTSP 532


                   ....*..
gi 149054851   356 MQPGVGQ 362
Cdd:pfam03157  533 QQPGQGQ 539

Mplasa_alph_rch

TIGR04523

helix-rich Mycoplasma protein; Members of this family occur strictly within a subset of ...

638-787

1.31e-03

Pssm-ID: 275316 [Multi-domain] Cd Length: 745 Bit Score: 42.70 E-value: 1.31e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   638 QRYEQLQDMVTGLAASRPS-KKAKLQGQDEelLGHVQSAILQVQgdcEKLNITTSNLIEDHRQ---KQKDIEKADKsala 713
Cdd:TIGR04523  211 QKNKSLESQISELKKQNNQlKDNIEKKQQE--INEKTTEISNTQ---TQLNQLKDEQNKIKKQlseKQKELEQNNK---- 281

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   714 skvsriQFDATTEQLNHMMQELVAKMSGQEQDWQKLLDKLLAEMDSKLDRLE---------LDPLKQTLEDRWK------ 778
Cdd:TIGR04523  282 ------KIKELEKQLNQLKSEISDLNNQKEQDWNKELKSELKNQEKKLEEIQnqisqnnkiISQLNEQISQLKKeltnse 355

                          170
                   ....*....|...
gi 149054851   779 ----SLRQQLKER 787
Cdd:TIGR04523  356 sensEKQRELEEK 368

PHA03378

EBNA-3B; Provisional

90-334

1.49e-03

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 42.75 E-value: 1.49e-03

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851   90 AGSTHPVVPLTMGQLGVMPPEMHDQRAEPPYQVQSGVQPSGADREPETLSPAQLGTALPLSAPQQGmmlPGPDQQGMeqa 169
Cdd:PHA03378  718 AAATGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGRARPPAAAPGAPTPQPPPQAP---PAPQQRPR--- 791

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851  170 avygSGQGPWATAQQGLTPVsidlQGLPIQGTGQQGPIAHQVDGqglVMPGQDQRAVPPSlpdqrRLASLGLTQKSTDQQ 249
Cdd:PHA03378  792 ----GAPTPQPPPQAGPTSM----QLMPRAAPGQQGPTKQILRQ---LLTGGVKRGRPSL-----KKPAALERQAAAGPT 855

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 149054851  250 DFRQSSLASRFVQ-----PGSEQPGVEQRDVERPgldrrSSMPVRTERRTSLQTAADRRLSVPIEAERLsLAQSRAGQED 324
Cdd:PHA03378  856 PSPGSGTSDKIVQapvfyPPVLQPIQVMRQLGSV-----RAAAASTVTQAPTEYTGERRGVGPMHPTDI-PPSKRAKTDA 929

                         250
                  ....*....|
gi 149054851  325 SVQPEAGQYG 334
Cdd:PHA03378  930 YVESQPPHGG 939

Blast search parameters

Data Source:	Precalculated data, version = cdd.v.3.21
Preset Options:	Database: CDSEARCH/cdd Low complexity filter: no Composition Based Adjustment: yes E-value threshold: 0.01