NCBI Conserved Domain Search

Conserved domains on [gi|133903455|ref|NP_492661|]

View

MUTator [Caenorhabditis elegans]

Protein Classification

PAT1 family protein( domain architecture ID 1001013)

PAT1 family protein similar to Saccharomyces cerevisiae DNA topoisomerase 2-associated protein PAT1, an activator of decapping that functions as a general and active mechanism of translational repression and required for P-body formation

Gene Ontology: GO:0003723

Graphical summary

Zoom to residue level

show extra options »

Show site features Horizontal zoom: ×

List of domain hits

Name

Accession

Description

Interval

E-value

PAT1 super family

cl37801

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

697-882

2.93e-08

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

The actual alignment was detected with superfamily member pfam09770:

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 58.12 E-value: 2.93e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   697 PSHPAPPPVNQSQPANQPMQT-----------AVYQNSHPGAPYIPQQPtyqpqlpVQQPQphqyAPQPIHHQQPIHQPM 765
Cdd:pfam09770  170 AAAPAPAPQPAAQPASLPAPSrkmmsleeveaAMRAQAKKPAQQPAPAP-------AQPPA----APPAQQAQQQQQFPP 238

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   766 HGQQYPPVNQQQPIYQQPAPQYPPYnSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNgyQNSYNPNQGP 845
Cdd:pfam09770  239 QIQQQQQPQQQPQQPQQHPGQGHPV-TILQRPQSPQPDPAQPSIQPQAQQFHQQPPPVPVQPTQILQN--PNRLSAARVG 315

                          170       180       190
                   ....*....|....*....|....*....|....*..
gi 133903455   846 TSSDPNYGCNPQFNHYGSRSVYHEDHSSQRRRSPDQF 882
Cdd:pfam09770  316 YPQNPQPGVQPAPAHQAHRQQGSFGRQAPIITHPQQL 352

PHA03247 super family

cl33720

large tegument protein UL36; Provisional

446-899

1.07e-07

large tegument protein UL36; Provisional

The actual alignment was detected with superfamily member PHA03247:

Pssm-ID: 223021 [Multi-domain] Cd Length: 3151 Bit Score: 56.49 E-value: 1.07e-07

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  446 RP--PRAPTSPVNRVMETDPLMGQGTSSGAPQRSAIPNPfggaPALSRSTITNGNRGPSYGDRGERVQDvgdttsdseit 523
Cdd:PHA03247 2588 RPdaPPQSARPRAPVDDRGDPRGPAPPSPLPPDTHAPDP----PPPSPSPAANEPDPHPPPTVPPPERP----------- 2652

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  524 segsysDEDPEQKEIKRQRRKDKLkkkqerelrSREKHTKSKQQPPSKIETRfntykkKSESSATDTSNTPPVDTVNVAL 603
Cdd:PHA03247 2653 ------RDDPAPGRVSRPRRARRL---------GRAAQASSPPQRPRRRAAR------PTVGSLTSLADPPPPPPTPEPA 2711

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  604 PTPVVessSTTAAPSIPVSTRPEVVVPPENPAPlREVGNFYSKSNHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLK 683
Cdd:PHA03247 2712 PHALV---SATPLPPGPAAARQASPALPAAPAP-PAVPAGPATPGGPARPARPPTTAGPPAPAPPAAPAAGPPRRLTRPA 2787

                         250       260       270       280       290       300       310       320
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  684 ERPSANGFINRRLPSHPAPPPVNQSQPAnqpmqTAVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQ--------PI 755
Cdd:PHA03247 2788 VASLSESRESLPSPWDPADPPAAVLAPA-----AALPPAASPAGPLPPPTSAQPTAPPPPPGPPPPSLPLggsvapggDV 2862

                         330       340       350       360       370       380       390       400
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  756 HHQQPIHQPMhgqQYPPVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNGY 835
Cdd:PHA03247 2863 RRRPPSRSPA---AKPAAPARPPVRRLARPAVSRSTESFALPPDQPERPPQPQAPPPPQPQPQPPPPPQPQPPPPPPPRP 2939

                         410       420       430       440       450       460
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 133903455  836 QNSYNPNQGPTSSDPNYGC--NPQFNHYGSRSVyhedhSSQRRRSPDQFPPNP-PEYDPHGNFKLAD 899
Cdd:PHA03247 2940 QPPLAPTTDPAGAGEPSGAvpQPWLGALVPGRV-----AVPRFRVPQPAPSREaPASSTPPLTGHSL 3001

Name

Accession

Description

Interval

E-value

PAT1

pfam09770

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

697-882

2.93e-08

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 58.12 E-value: 2.93e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   697 PSHPAPPPVNQSQPANQPMQT-----------AVYQNSHPGAPYIPQQPtyqpqlpVQQPQphqyAPQPIHHQQPIHQPM 765
Cdd:pfam09770  170 AAAPAPAPQPAAQPASLPAPSrkmmsleeveaAMRAQAKKPAQQPAPAP-------AQPPA----APPAQQAQQQQQFPP 238

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   766 HGQQYPPVNQQQPIYQQPAPQYPPYnSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNgyQNSYNPNQGP 845
Cdd:pfam09770  239 QIQQQQQPQQQPQQPQQHPGQGHPV-TILQRPQSPQPDPAQPSIQPQAQQFHQQPPPVPVQPTQILQN--PNRLSAARVG 315

                          170       180       190
                   ....*....|....*....|....*....|....*..
gi 133903455   846 TSSDPNYGCNPQFNHYGSRSVYHEDHSSQRRRSPDQF 882
Cdd:pfam09770  316 YPQNPQPGVQPAPAHQAHRQQGSFGRQAPIITHPQQL 352

PHA03247

large tegument protein UL36; Provisional

446-899

1.07e-07

large tegument protein UL36; Provisional

Pssm-ID: 223021 [Multi-domain] Cd Length: 3151 Bit Score: 56.49 E-value: 1.07e-07

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  446 RP--PRAPTSPVNRVMETDPLMGQGTSSGAPQRSAIPNPfggaPALSRSTITNGNRGPSYGDRGERVQDvgdttsdseit 523
Cdd:PHA03247 2588 RPdaPPQSARPRAPVDDRGDPRGPAPPSPLPPDTHAPDP----PPPSPSPAANEPDPHPPPTVPPPERP----------- 2652

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  524 segsysDEDPEQKEIKRQRRKDKLkkkqerelrSREKHTKSKQQPPSKIETRfntykkKSESSATDTSNTPPVDTVNVAL 603
Cdd:PHA03247 2653 ------RDDPAPGRVSRPRRARRL---------GRAAQASSPPQRPRRRAAR------PTVGSLTSLADPPPPPPTPEPA 2711

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  604 PTPVVessSTTAAPSIPVSTRPEVVVPPENPAPlREVGNFYSKSNHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLK 683
Cdd:PHA03247 2712 PHALV---SATPLPPGPAAARQASPALPAAPAP-PAVPAGPATPGGPARPARPPTTAGPPAPAPPAAPAAGPPRRLTRPA 2787

                         250       260       270       280       290       300       310       320
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  684 ERPSANGFINRRLPSHPAPPPVNQSQPAnqpmqTAVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQ--------PI 755
Cdd:PHA03247 2788 VASLSESRESLPSPWDPADPPAAVLAPA-----AALPPAASPAGPLPPPTSAQPTAPPPPPGPPPPSLPLggsvapggDV 2862

                         330       340       350       360       370       380       390       400
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  756 HHQQPIHQPMhgqQYPPVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNGY 835
Cdd:PHA03247 2863 RRRPPSRSPA---AKPAAPARPPVRRLARPAVSRSTESFALPPDQPERPPQPQAPPPPQPQPQPPPPPQPQPPPPPPPRP 2939

                         410       420       430       440       450       460
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 133903455  836 QNSYNPNQGPTSSDPNYGC--NPQFNHYGSRSVyhedhSSQRRRSPDQFPPNP-PEYDPHGNFKLAD 899
Cdd:PHA03247 2940 QPPLAPTTDPAGAGEPSGAvpQPWLGALVPGRV-----AVPRFRVPQPAPSREaPASSTPPLTGHSL 3001

PRK10263

DNA translocase FtsK; Provisional

697-852

1.78e-05

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 48.93 E-value: 1.78e-05

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  697 PSHPAPPPVNQSQPANQPM---QTAvyQNSHPGAPYIPQQPtyqpqlpvqqpqpHQYAPQPIHHQQPIHQPMHGQQ-YPP 772
Cdd:PRK10263  339 PVTQTPPVASVDVPPAQPTvawQPV--PGPQTGEPVIAPAP-------------EGYPQQSQYAQPAVQYNEPLQQpVQP 403

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  773 VNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPfnysqVPQPAYNHVGQQPSHMSNQPHINQNGYQNSYNPNQGPTSSDPNY 852
Cdd:PRK10263  404 QQPYYAPAAEQPAQQPYYAPAPEQPAQQPYY-----APAPEQPVAGNAWQAEEQQSTFAPQSTYQTEQTYQQPAAQEPLY 478

Atrophin-1

pfam03154

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian ...

488-829

2.73e-05

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian atrophy (DRPLA) gene. DRPLA OMIM:125370 is a progressive neurodegenerative disorder. It is caused by the expansion of a CAG repeat in the DRPLA gene on chromosome 12p. This results in an extended polyglutamine region in atrophin-1, that is thought to confer toxicity to the protein, possibly through altering its interactions with other proteins. The expansion of a CAG repeat is also the underlying defect in six other neurodegenerative disorders, including Huntington's disease. One interaction of expanded polyglutamine repeats that is thought to be pathogenic is that with the short glutamine repeat in the transcriptional coactivator CREB binding protein, CBP. This interaction draws CBP away from its usual nuclear location to the expanded polyglutamine repeat protein aggregates that are characteriztic of the polyglutamine neurodegenerative disorders. This interferes with CBP-mediated transcription and causes cytotoxicity.

Pssm-ID: 460830 [Multi-domain] Cd Length: 991 Bit Score: 48.22 E-value: 2.73e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   488 ALSRSTITNGNRGPSYGDRGErvqdvGDTTSDSEITSEGSYSDEDPEQKEiKRQRRKDKLKKKQERELRSREKHTKSKQQ 567
Cdd:pfam03154   97 ATAKKSKTQEISRPNSPSEGE-----GESSDGRSVNDEGSSDPKDIDQDN-RSTSPSIPSPQDNESDSDSSAQQQILQTQ 170

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   568 PPSKietrfntykkKSESSATDTSNTPPVDTVNVALPTPVVESSSTTAAPSIPVSTRPEVVVPPENPAPLREVGnfysKS 647
Cdd:pfam03154  171 PPVL----------QAQSGAASPPSPPPPGTTQAATAGPTPSAPSVPPQGSPATSQPPNQTQSTAAPHTLIQQT----PT 236

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   648 NHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLKERPSANGFINRRLPS---HPAPPpvnqsQPANQPMQTAVYQNSH 724
Cdd:pfam03154  237 LHPQRLPSPHPPLQPMTQPPPPSQVSPQPLPQPSLHGQMPPMPHSLQTGPShmqHPVPP-----QPFPLTPQSSQSQVPP 311

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   725 PGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIHHQQPIHQPMHGQQYPPVNqqqPIYQQPAPQ---YPPYNSiqnnpqhGP 801
Cdd:pfam03154  312 GPSPAAPGQSQQRIHTPPSQSQLQSQQPPREQPLPPAPLSMPHIKPPPTT---PIPQLPNPQshkHPPHLS-------GP 381

                          330       340       350
                   ....*....|....*....|....*....|
gi 133903455   802 SPF--NYSQVPQPAYNHVGQQPSHMSNQPH 829
Cdd:pfam03154  382 SPFqmNSNLPPPPALKPLSSLSTHHPPSAH 411

KLF1_2_4_N-like

cd22056

N-terminal domain of Kruppel-like factors with similarity to the N-terminal domains of ...

692-825

1.06e-04

N-terminal domain of Kruppel-like factors with similarity to the N-terminal domains of Kruppel-like factor (KLF)1, KLF2, and KLF4; Kruppel/Krueppel-like transcription factors (KLFs) belong to a family of proteins called the Specificity Protein (SP)/KLF family, characterized by a C-terminal DNA-binding domain of 81 amino acids consisting of three Kruppel-like C2H2 zinc fingers. These factors bind to a loose consensus motif, namely NNRCRCCYY (where N is any nucleotide; R is A/G, and Y is C/T), such as the recurring motifs in GC and GT boxes (5'-GGGGCGGGG-3' and 5-GGTGTGGGG-3') that are present in promoters and more distal regulatory elements of mammalian genes. Members of the KLF family can act as activators or repressors of transcription depending on cell and promoter context. KLFs regulate various cellular functions, such as proliferation, differentiation, and apoptosis, as well as the development and homeostasis of several types of tissue. In addition to the C-terminal DNA-binding domain, each KLF also has a unique N-terminal activation/repression domain that confers specifity and allows it to bind specifically to a certain partner, leading to distinct activities in vivo. This model represents the N-terminal domains of an unknown subfamily of KLFs, predominantly found in fish, related to the N-terminal domains of KLF1, KLF2, and KLF4.

Pssm-ID: 409231 [Multi-domain] Cd Length: 339 Bit Score: 45.81 E-value: 1.06e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  692 INRRLPSHPAPPPV----------NQSQP---ANQPMQT--AVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIH 756
Cdd:cd22056   165 LPTAPPAHQPATSPpplgykiktePVEQScmmAAGGGGFmgQQKPKHQMHSVHPQAFTHHQAAGPGALQGRGGRGGPDCH 244

                          90       100       110       120       130       140
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....
gi 133903455  757 HQQPIHQPMHGQQYPPVNQQQPIYQQPAPQYPPynsiqnnPQHGPspfnYSQVPQPAynHVGQQPSHMS 825
Cdd:cd22056   245 LLHSSHHHHHHHHLQYQYMNAPYPPHYAHQGAP-------QFHGQ----YSVFREPM--RVHHQGHPGS 300

Amelogenin

smart00818

Amelogenins, cell adhesion proteins, play a role in the biomineralisation of teeth; They seem ...

704-812

2.45e-04

Amelogenins, cell adhesion proteins, play a role in the biomineralisation of teeth; They seem to regulate formation of crystallites during the secretory stage of tooth enamel development and are thought to play a major role in the structural organisation and mineralisation of developing enamel. The extracellular matrix of the developing enamel comprises two major classes of protein: the hydrophobic amelogenins and the acidic enamelins. Circular dichroism studies of porcine amelogenin have shown that the protein consists of 3 discrete folding units: the N-terminal region appears to contain beta-strand structures, while the C-terminal region displays characteristics of a random coil conformation. Subsequent studies on the bovine protein have indicated the amelogenin structure to contain a repetitive beta-turn segment and a "beta-spiral" between Gln112 and Leu138, which sequester a (Pro, Leu, Gln) rich region. The beta-spiral offers a probable site for interactions with Ca2+ ions. Muatations in the human amelogenin gene (AMGX) cause X-linked hypoplastic amelogenesis imperfecta, a disease characterised by defective enamel. A 9bp deletion in exon 2 of AMGX results in the loss of codons for Ile5, Leu6, Phe7 and Ala8, and replacement by a new threonine codon, disrupting the 16-residue (Met1-Ala16) amelogenin signal peptide.

Pssm-ID: 197891 [Multi-domain] Cd Length: 165 Bit Score: 42.85 E-value: 2.45e-04

                            10        20        30        40        50        60        70        80
                    ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455    704 PVNQSQPANQPMQTAVYQNS-HPGAPYIPQQPtyqpqlpvQQPQPHQYAPQPIHHQQPIHQPMHGQQYPPVNQQQPIYQQ 782
Cdd:smart00818   41 PVSQQHPPTHTLQPHHHIPVlPAQQPVVPQQP--------LMPVPGQHSMTPTQHHQPNLPQPAQQPFQPQPLQPPQPQQ 112

                            90       100       110
                    ....*....|....*....|....*....|
gi 133903455    783 PAPQYPPYNSIQNNPQHGPSPFNYSQVPQP 812
Cdd:smart00818  113 PMQPQPPVHPIPPLPPQPPLPPMFPMQPLP 142

PABP-1234

TIGR01628

polyadenylate binding protein, human types 1, 2, 3, 4 family; These eukaryotic proteins ...

750-821

8.04e-03

polyadenylate binding protein, human types 1, 2, 3, 4 family; These eukaryotic proteins recognize the poly-A of mRNA and consists of four tandem RNA recognition domains at the N-terminus (rrm: pfam00076) followed by a PABP-specific domain (pfam00658) at the C-terminus. The protein is involved in the transport of mRNA's from the nucleus to the cytoplasm. There are four paralogs in Homo sapiens which are expressed in testis, platelets, broadly expressed and of unknown tissue range.

Pssm-ID: 130689 [Multi-domain] Cd Length: 562 Bit Score: 40.18 E-value: 8.04e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   750 YAPQPIHHqqPIHQPMHGQQYP------------PVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYS-QVPQPAYNH 816
Cdd:TIGR01628  409 FNGQPLGW--PRMSMMPTPMGPggplrpnglapmNAVRAPSRNAQNAAQKPPMQPVMYPPNYQSLPLSQDlPQPQSTASQ 486


                   ....*
gi 133903455   817 VGQQP 821
Cdd:TIGR01628  487 GGQNK 491

Name

Accession

Description

Interval

E-value

PAT1

pfam09770

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

697-882

2.93e-08

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 58.12 E-value: 2.93e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   697 PSHPAPPPVNQSQPANQPMQT-----------AVYQNSHPGAPYIPQQPtyqpqlpVQQPQphqyAPQPIHHQQPIHQPM 765
Cdd:pfam09770  170 AAAPAPAPQPAAQPASLPAPSrkmmsleeveaAMRAQAKKPAQQPAPAP-------AQPPA----APPAQQAQQQQQFPP 238

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   766 HGQQYPPVNQQQPIYQQPAPQYPPYnSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNgyQNSYNPNQGP 845
Cdd:pfam09770  239 QIQQQQQPQQQPQQPQQHPGQGHPV-TILQRPQSPQPDPAQPSIQPQAQQFHQQPPPVPVQPTQILQN--PNRLSAARVG 315

                          170       180       190
                   ....*....|....*....|....*....|....*..
gi 133903455   846 TSSDPNYGCNPQFNHYGSRSVYHEDHSSQRRRSPDQF 882
Cdd:pfam09770  316 YPQNPQPGVQPAPAHQAHRQQGSFGRQAPIITHPQQL 352

PHA03247

large tegument protein UL36; Provisional

446-899

1.07e-07

large tegument protein UL36; Provisional

Pssm-ID: 223021 [Multi-domain] Cd Length: 3151 Bit Score: 56.49 E-value: 1.07e-07

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  446 RP--PRAPTSPVNRVMETDPLMGQGTSSGAPQRSAIPNPfggaPALSRSTITNGNRGPSYGDRGERVQDvgdttsdseit 523
Cdd:PHA03247 2588 RPdaPPQSARPRAPVDDRGDPRGPAPPSPLPPDTHAPDP----PPPSPSPAANEPDPHPPPTVPPPERP----------- 2652

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  524 segsysDEDPEQKEIKRQRRKDKLkkkqerelrSREKHTKSKQQPPSKIETRfntykkKSESSATDTSNTPPVDTVNVAL 603
Cdd:PHA03247 2653 ------RDDPAPGRVSRPRRARRL---------GRAAQASSPPQRPRRRAAR------PTVGSLTSLADPPPPPPTPEPA 2711

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  604 PTPVVessSTTAAPSIPVSTRPEVVVPPENPAPlREVGNFYSKSNHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLK 683
Cdd:PHA03247 2712 PHALV---SATPLPPGPAAARQASPALPAAPAP-PAVPAGPATPGGPARPARPPTTAGPPAPAPPAAPAAGPPRRLTRPA 2787

                         250       260       270       280       290       300       310       320
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  684 ERPSANGFINRRLPSHPAPPPVNQSQPAnqpmqTAVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQ--------PI 755
Cdd:PHA03247 2788 VASLSESRESLPSPWDPADPPAAVLAPA-----AALPPAASPAGPLPPPTSAQPTAPPPPPGPPPPSLPLggsvapggDV 2862

                         330       340       350       360       370       380       390       400
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  756 HHQQPIHQPMhgqQYPPVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHMSNQPHINQNGY 835
Cdd:PHA03247 2863 RRRPPSRSPA---AKPAAPARPPVRRLARPAVSRSTESFALPPDQPERPPQPQAPPPPQPQPQPPPPPQPQPPPPPPPRP 2939

                         410       420       430       440       450       460
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*..
gi 133903455  836 QNSYNPNQGPTSSDPNYGC--NPQFNHYGSRSVyhedhSSQRRRSPDQFPPNP-PEYDPHGNFKLAD 899
Cdd:PHA03247 2940 QPPLAPTTDPAGAGEPSGAvpQPWLGALVPGRV-----AVPRFRVPQPAPSREaPASSTPPLTGHSL 3001

PHA03247

large tegument protein UL36; Provisional

395-817

6.35e-06

large tegument protein UL36; Provisional

Pssm-ID: 223021 [Multi-domain] Cd Length: 3151 Bit Score: 50.71 E-value: 6.35e-06

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  395 GPQQRRNVIVPDPNYQPSTFAGGISNNADDDGSLQPTTSShfnrntdRSTSRPPRAPTSPVNRVMEtdpLMGQGTSSGAP 474
Cdd:PHA03247 2579 EPAVTSRARRPDAPPQSARPRAPVDDRGDPRGPAPPSPLP-------PDTHAPDPPPPSPSPAANE---PDPHPPPTVPP 2648

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  475 QRSAIPNPFGGAPALSRSTITNGN-RGPSYGDRGERVQDVGDTtsdseITSEGSYSDEDPeqkeikrqrrkdklkkkQER 553
Cdd:PHA03247 2649 PERPRDDPAPGRVSRPRRARRLGRaAQASSPPQRPRRRAARPT-----VGSLTSLADPPP-----------------PPP 2706

                         170       180       190       200       210       220       230       240
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  554 ELRSREKHTKSK-QQPPSKIETRFNTYKKKSESSATDTSNTPPVDTVNVALPTPVVESSSTTAAPSIPVSTRPEVVVPPE 632
Cdd:PHA03247 2707 TPEPAPHALVSAtPLPPGPAAARQASPALPAAPAPPAVPAGPATPGGPARPARPPTTAGPPAPAPPAAPAAGPPRRLTRP 2786

                         250       260       270       280       290       300       310       320
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  633 NPAPLREVGNFYSKSNHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLKERPSANGFINRRLPSHPAPPP---VNQSQ 709
Cdd:PHA03247 2787 AVASLSESRESLPSPWDPADPPAAVLAPAAALPPAASPAGPLPPPTSAQPTAPPPPPGPPPPSLPLGGSVAPggdVRRRP 2866

                         330       340       350       360       370       380       390       400
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  710 PANQPmqtavyqnshPGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIHHQQPIHQPMHGQQ-YPPVNQQQPIYQQPAPQYP 788
Cdd:PHA03247 2867 PSRSP----------AAKPAAPARPPVRRLARPAVSRSTESFALPPDQPERPPQPQAPPPpQPQPQPPPPPQPQPPPPPP 2936

                         410       420       430
                  ....*....|....*....|....*....|.
gi 133903455  789 PYNSIQNNPQHGPSPFNYSQ--VPQPAYNHV 817
Cdd:PHA03247 2937 PRPQPPLAPTTDPAGAGEPSgaVPQPWLGAL 2967

PRK10263

DNA translocase FtsK; Provisional

697-852

1.78e-05

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 48.93 E-value: 1.78e-05

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  697 PSHPAPPPVNQSQPANQPM---QTAvyQNSHPGAPYIPQQPtyqpqlpvqqpqpHQYAPQPIHHQQPIHQPMHGQQ-YPP 772
Cdd:PRK10263  339 PVTQTPPVASVDVPPAQPTvawQPV--PGPQTGEPVIAPAP-------------EGYPQQSQYAQPAVQYNEPLQQpVQP 403

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  773 VNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPfnysqVPQPAYNHVGQQPSHMSNQPHINQNGYQNSYNPNQGPTSSDPNY 852
Cdd:PRK10263  404 QQPYYAPAAEQPAQQPYYAPAPEQPAQQPYY-----APAPEQPVAGNAWQAEEQQSTFAPQSTYQTEQTYQQPAAQEPLY 478

Atrophin-1

pfam03154

Atrophin-1 family; Atrophin-1 is the protein product of the dentatorubral-pallidoluysian ...

488-829

2.73e-05

Pssm-ID: 460830 [Multi-domain] Cd Length: 991 Bit Score: 48.22 E-value: 2.73e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   488 ALSRSTITNGNRGPSYGDRGErvqdvGDTTSDSEITSEGSYSDEDPEQKEiKRQRRKDKLKKKQERELRSREKHTKSKQQ 567
Cdd:pfam03154   97 ATAKKSKTQEISRPNSPSEGE-----GESSDGRSVNDEGSSDPKDIDQDN-RSTSPSIPSPQDNESDSDSSAQQQILQTQ 170

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   568 PPSKietrfntykkKSESSATDTSNTPPVDTVNVALPTPVVESSSTTAAPSIPVSTRPEVVVPPENPAPLREVGnfysKS 647
Cdd:pfam03154  171 PPVL----------QAQSGAASPPSPPPPGTTQAATAGPTPSAPSVPPQGSPATSQPPNQTQSTAAPHTLIQQT----PT 236

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   648 NHDEDRRNVQLPFTPADTHKPIKVAPKEPVRNPLLKERPSANGFINRRLPS---HPAPPpvnqsQPANQPMQTAVYQNSH 724
Cdd:pfam03154  237 LHPQRLPSPHPPLQPMTQPPPPSQVSPQPLPQPSLHGQMPPMPHSLQTGPShmqHPVPP-----QPFPLTPQSSQSQVPP 311

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   725 PGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIHHQQPIHQPMHGQQYPPVNqqqPIYQQPAPQ---YPPYNSiqnnpqhGP 801
Cdd:pfam03154  312 GPSPAAPGQSQQRIHTPPSQSQLQSQQPPREQPLPPAPLSMPHIKPPPTT---PIPQLPNPQshkHPPHLS-------GP 381

                          330       340       350
                   ....*....|....*....|....*....|
gi 133903455   802 SPF--NYSQVPQPAYNHVGQQPSHMSNQPH 829
Cdd:pfam03154  382 SPFqmNSNLPPPPALKPLSSLSTHHPPSAH 411

PAT1

pfam09770

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

697-827

6.29e-05

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 46.95 E-value: 6.29e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   697 PSHPAPPPVNQSQPANQPMQTAVYQNSHPGAPYIPQQP----------TYQPQLPVQQPQPHQYAPQPIHHQQPIHQPMH 766
Cdd:pfam09770  219 AQPPAAPPAQQAQQQQQFPPQIQQQQQPQQQPQQPQQHpgqghpvtilQRPQSPQPDPAQPSIQPQAQQFHQQPPPVPVQ 298

                           90       100       110       120       130       140
                   ....*....|....*....|....*....|....*....|....*....|....*....|.
gi 133903455   767 GQQYPPVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYSQVPQPAYNHvGQQPSHMSNQ 827
Cdd:pfam09770  299 PTQILQNPNRLSAARVGYPQNPQPGVQPAPAHQAHRQQGSFGRQAPIITH-PQQLAQLSEE 358

KLF1_2_4_N-like

cd22056

N-terminal domain of Kruppel-like factors with similarity to the N-terminal domains of ...

692-825

1.06e-04

Pssm-ID: 409231 [Multi-domain] Cd Length: 339 Bit Score: 45.81 E-value: 1.06e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  692 INRRLPSHPAPPPV----------NQSQP---ANQPMQT--AVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIH 756
Cdd:cd22056   165 LPTAPPAHQPATSPpplgykiktePVEQScmmAAGGGGFmgQQKPKHQMHSVHPQAFTHHQAAGPGALQGRGGRGGPDCH 244

                          90       100       110       120       130       140
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....
gi 133903455  757 HQQPIHQPMHGQQYPPVNQQQPIYQQPAPQYPPynsiqnnPQHGPspfnYSQVPQPAynHVGQQPSHMS 825
Cdd:cd22056   245 LLHSSHHHHHHHHLQYQYMNAPYPPHYAHQGAP-------QFHGQ----YSVFREPM--RVHHQGHPGS 300

PRK10263

DNA translocase FtsK; Provisional

675-789

2.35e-04

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 45.46 E-value: 2.35e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  675 EPVRNPLLKERPSANGFINRRLPSH-----PAPPPVNQSQPANQPMQTAVYQNSHPGAPYIPQQPTYQPQLPVQQPQPHQ 749
Cdd:PRK10263  370 EPVIAPAPEGYPQQSQYAQPAVQYNeplqqPVQPQQPYYAPAAEQPAQQPYYAPAPEQPAQQPYYAPAPEQPVAGNAWQA 449

                          90       100       110       120
                  ....*....|....*....|....*....|....*....|
gi 133903455  750 YAPQPIHHQQPIHQPMhgQQYPPVNQQQPIYQQPAPQYPP 789
Cdd:PRK10263  450 EEQQSTFAPQSTYQTE--QTYQQPAAQEPLYQQPQPVEQQ 487

Amelogenin

smart00818

Amelogenins, cell adhesion proteins, play a role in the biomineralisation of teeth; They seem ...

704-812

2.45e-04

Pssm-ID: 197891 [Multi-domain] Cd Length: 165 Bit Score: 42.85 E-value: 2.45e-04

                            10        20        30        40        50        60        70        80
                    ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455    704 PVNQSQPANQPMQTAVYQNS-HPGAPYIPQQPtyqpqlpvQQPQPHQYAPQPIHHQQPIHQPMHGQQYPPVNQQQPIYQQ 782
Cdd:smart00818   41 PVSQQHPPTHTLQPHHHIPVlPAQQPVVPQQP--------LMPVPGQHSMTPTQHHQPNLPQPAQQPFQPQPLQPPQPQQ 112

                            90       100       110
                    ....*....|....*....|....*....|
gi 133903455    783 PAPQYPPYNSIQNNPQHGPSPFNYSQVPQP 812
Cdd:smart00818  113 PMQPQPPVHPIPPLPPQPPLPPMFPMQPLP 142

PAT1

pfam09770

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate ...

702-930

3.27e-04

Topoisomerase II-associated protein PAT1; Members of this family are necessary for accurate chromosome transmission during cell division.

Pssm-ID: 401645 [Multi-domain] Cd Length: 846 Bit Score: 44.64 E-value: 3.27e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   702 PPPVNQSQPANQPMQTAVYQNSHPGAPYIPQQP------TYQPQL--------------PVQQPQPHQYAPQPIHHQQPI 761
Cdd:pfam09770  107 PAARAAQSSAQPPASSLPQYQYASQQSQQPSKPvrtgyeKYKEPEpipdlqvdaslwgvAPKKAAAPAPAPQPAAQPASL 186

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   762 HQP-------------MHGQQYPPVNQQQPIYQQPaPQYPPYnSIQNNPQHGPSPFNYSQVPQPAYNHVGQQPSHmSNQP 828
Cdd:pfam09770  187 PAPsrkmmsleeveaaMRAQAKKPAQQPAPAPAQP-PAAPPA-QQAQQQQQFPPQIQQQQQPQQQPQQPQQHPGQ-GHPV 263

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   829 HInqngyqnsynpNQGPTSSDPnygcNPQFNHYGSRSVYHEDHSSQRRRSPDQFPPNPPEYDPHgnfkLADYERDRMTVG 908
Cdd:pfam09770  264 TI-----------LQRPQSPQP----DPAQPSIQPQAQQFHQQPPPVPVQPTQILQNPNRLSAA----RVGYPQNPQPGV 324

                          250       260
                   ....*....|....*....|..
gi 133903455   909 YSQNPHQFDHHGSHMPHQSQPQ 930
Cdd:pfam09770  325 QPAPAHQAHRQQGSFGRQAPII 346

PRK10263

DNA translocase FtsK; Provisional

593-789

3.56e-04

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 44.69 E-value: 3.56e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  593 TPPVDTVNVALPTPVVESSSttaAPSiPVSTRPEVVVPPENPAPLREVGNfysksnhdedrrnvqlPFTPADTHKPIKVA 672
Cdd:PRK10263  343 TPPVASVDVPPAQPTVAWQP---VPG-PQTGEPVIAPAPEGYPQQSQYAQ----------------PAVQYNEPLQQPVQ 402

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  673 PKEPVRNPLLKERPSANGFINRRLPSHPAPPPVNQSQpanQPMQTAVYQNSHPGAPYIPQqPTYQPQLPVqqpqphqyaP 752
Cdd:PRK10263  403 PQQPYYAPAAEQPAQQPYYAPAPEQPAQQPYYAPAPE---QPVAGNAWQAEEQQSTFAPQ-STYQTEQTY---------Q 469

                         170       180       190
                  ....*....|....*....|....*....|....*..
gi 133903455  753 QPIHHQQPIHQPMHGQQyPPVNQQQPIYQQPAPQYPP 789
Cdd:PRK10263  470 QPAAQEPLYQQPQPVEQ-QPVVEPEPVVEETKPARPP 505

PRK10263

DNA translocase FtsK; Provisional

697-798

3.81e-04

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 44.69 E-value: 3.81e-04

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  697 PSHP--APPPVNQSQPANQPMQTAvyQNSHPGAPYIPQQPTYQPQLPVQQPQPHQYAPQPIH--HQQPIHQPMHGQQYPP 772
Cdd:PRK10263  381 PQQSqyAQPAVQYNEPLQQPVQPQ--QPYYAPAAEQPAQQPYYAPAPEQPAQQPYYAPAPEQpvAGNAWQAEEQQSTFAP 458

                          90       100
                  ....*....|....*....|....*...
gi 133903455  773 VNQQQP--IYQQPAPQYPPYNSIQNNPQ 798
Cdd:PRK10263  459 QSTYQTeqTYQQPAAQEPLYQQPQPVEQ 486

YppG

pfam14179

YppG-like protein; The YppG-like protein family includes the B. subtilis YppG protein, which ...

750-805

4.31e-04

YppG-like protein; The YppG-like protein family includes the B. subtilis YppG protein, which is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 115 and 181 amino acids in length. There are two completely conserved residues (F and G) that may be functionally important.

Pssm-ID: 372950 [Multi-domain] Cd Length: 101 Bit Score: 40.56 E-value: 4.31e-04

                           10        20        30        40        50
                   ....*....|....*....|....*....|....*....|....*....|....*.
gi 133903455   750 YAPQPIHHQQPIHQPMHgQQYPPVNQQQPIYQQPAPQYPPYNSIQNNPQHgPSPFN 805
Cdd:pfam14179    5 SQPYPYFSQQVYQQPVQ-PQYPPFAPQQYMPQPPMPYMNPYPKQQPQQQQ-PSQFQ 58

PRK10263

DNA translocase FtsK; Provisional

666-789

1.14e-03

DNA translocase FtsK; Provisional

Pssm-ID: 236669 [Multi-domain] Cd Length: 1355 Bit Score: 43.15 E-value: 1.14e-03

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  666 HKPIKVAPKEPVRNPLLKERPSANgfinRRLPSHPAPPPVNQSQPaNQPMQTAvYQNSHPGAPYIPQqptyqpqlpvqqp 745
Cdd:PRK10263  741 HEPLFTPIVEPVQQPQQPVAPQQQ----YQQPQQPVAPQPQYQQP-QQPVAPQ-PQYQQPQQPVAPQ------------- 801

                          90       100       110       120
                  ....*....|....*....|....*....|....*....|....*
gi 133903455  746 qphqyaPQPIHHQQPIH-QPMHGQQYPPVNQQQPiYQQPAPQYPP 789
Cdd:PRK10263  802 ------PQYQQPQQPVApQPQYQQPQQPVAPQPQ-YQQPQQPVAP 839

DUF6643

pfam20348

Family of unknown function (DUF6643); This family of proteins is functionally uncharacterized. ...

676-800

1.61e-03

Family of unknown function (DUF6643); This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 144 and 171 amino acids in length.

Pssm-ID: 466498 [Multi-domain] Cd Length: 150 Bit Score: 40.35 E-value: 1.61e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   676 PVRNPLLKERPSANGFINRRLPSHPAPPPVNQSQPANQPMQTAVYQNSHPgAPYIPQQptyqpqlpVQQPQPHQYAPQPI 755
Cdd:pfam20348   38 PIRVPAAYDTGSHLPALPSALPALPAAPSAPTPQYGYPQAPQPAPLQQAP-APYIPQQ--------QPMPGPRGYPPQPQ 108

                           90       100       110       120
                   ....*....|....*....|....*....|....*....|....*
gi 133903455   756 HHQQpihQPMHGQQYppvNQQQPIYQQPAPQYPPYNSIQNNPQHG 800
Cdd:pfam20348  109 PQQP---RPAPGTGY---EAMRPAAPRPVAAPPGYDDPYNRPYQG 147

dnaA

PRK14086

chromosomal replication initiator protein DnaA;

663-858

3.52e-03

chromosomal replication initiator protein DnaA;

Pssm-ID: 237605 [Multi-domain] Cd Length: 617 Bit Score: 41.35 E-value: 3.52e-03

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  663 ADTHKPIKVAPKEPVRNPLLKERPSANGFINRRLPSHPAPPPVNQSQ--------PANQPMQTAVYQNSHPGA------P 728
Cdd:PRK14086   85 AITVDPSAGEPAPPPPHARRTSEPELPRPGRRPYEGYGGPRADDRPPglprqdqlPTARPAYPAYQQRPEPGAwpraadD 164

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  729 YIPQQPTYQPQLPVQQPQPHQYAPQPIHHQQPihqpmHGQQYPPVNQQQPIYQQPAPQY-PPYNSIQNNPQhgpspfnys 807
Cdd:PRK14086  165 YGWQQQRLGFPPRAPYASPASYAPEQERDREP-----YDAGRPEYDQRRRDYDHPRPDWdRPRRDRTDRPE--------- 230

                         170       180       190       200       210
                  ....*....|....*....|....*....|....*....|....*....|....*..
gi 133903455  808 qvPQPAYNHV---GQQPSHMSNQPHINQNGYQNSY---NPNQGPTSSDPNYGCNPQF 858
Cdd:PRK14086  231 --PPPGAGHVhrgGPGPPERDDAPVVPIRPSAPGPlaaQPAPAPGPGEPTARLNPKY 285

PHA03378

EBNA-3B; Provisional

604-813

5.57e-03

EBNA-3B; Provisional

Pssm-ID: 223065 [Multi-domain] Cd Length: 991 Bit Score: 40.82 E-value: 5.57e-03

                          10        20        30        40        50        60        70        80
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  604 PTPVVESSSTTAAPS----IPVSTRPEVVVPPENPAPLREVGNFYSKSNHDEDRRNVQLPFTPADTHKPIKVAPKEPVRN 679
Cdd:PHA03378  596 PWPVPHPSQTPEPPTtqshIPETSAPRQWPMPLRPIPMRPLRMQPITFNVLVFPTPHQPPQVEITPYKPTWTQIGHIPYQ 675

                          90       100       110       120       130       140       150       160
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  680 PL-----LKERPSANGFINRRLPSHPAP------PPVNQSQPAN-----QPMQTAVYQNSHPGAPYIPQQPTYQPQLPVQ 743
Cdd:PHA03378  676 PSptganTMLPIQWAPGTMQPPPRAPTPmrppaaPPGRAQRPAAatgraRPPAAAPGRARPPAAAPGRARPPAAAPGRAR 755

                         170       180       190       200       210       220       230
                  ....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455  744 QPQPHQYAPQPIHHQQPIHQPMHGQQYPPVNQQQPiYQQPAPQYPpynsiqnnPQHGPSPFNYSqVPQPA 813
Cdd:PHA03378  756 PPAAAPGRARPPAAAPGAPTPQPPPQAPPAPQQRP-RGAPTPQPP--------PQAGPTSMQLM-PRAAP 815

PABP-1234

TIGR01628

polyadenylate binding protein, human types 1, 2, 3, 4 family; These eukaryotic proteins ...

750-821

8.04e-03

Pssm-ID: 130689 [Multi-domain] Cd Length: 562 Bit Score: 40.18 E-value: 8.04e-03

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 133903455   750 YAPQPIHHqqPIHQPMHGQQYP------------PVNQQQPIYQQPAPQYPPYNSIQNNPQHGPSPFNYS-QVPQPAYNH 816
Cdd:TIGR01628  409 FNGQPLGW--PRMSMMPTPMGPggplrpnglapmNAVRAPSRNAQNAAQKPPMQPVMYPPNYQSLPLSQDlPQPQSTASQ 486


                   ....*
gi 133903455   817 VGQQP 821
Cdd:TIGR01628  487 GGQNK 491

Blast search parameters

Data Source:	Precalculated data, version = cdd.v.3.21
Preset Options:	Database: CDSEARCH/cdd Low complexity filter: no Composition Based Adjustment: yes E-value threshold: 0.01