Biochimica et Biophysica Acta 910 (1987) 89-92 89 Elsevier
B B A 90104 BBA Report
C l o n i n g a n d s e q u e n c i n g o f a c a r p fls-crystallin c D N A
T s c h i n i n g C h a n g a n d W e n - C h a n g C h a n g
Institute of Biochemical Sciences, National Taiwan Unioersity and Institute of Biological Chemistry, Academia Sinica, Taipei (Taiwan, China)
(Received 9 February 1987)
Key words: cDNA cloning; Nucleotide sequence; fl¢Crystallin; (Carp lens)
The mRNAs were extracted from common carp
(Cyprinus carpio)
lenses, purified, reverse transcribed, dC tailed and cloned intoEscherichia coli
with pBR322 as vector. The cloning efficiency was around 1 • 1 0 7 colonies per/tg of mRNA. A clone (pC20) was found by hybrid-arrested translation to contain the cDNA related to carp crystailins. However, comparison of the derived amino-acid sequence with bovine V-II and fls-crystallins indicates that this carp crystallin sequence resembles closely the bovine fls-crystallin and should be better classified as such except that this fish sequence does not contain the N-terminal 'arm' of four amino-acid residues present in bovine fls-crystallin.There are four major families of structural pro- teins in the lens of vertebrate, known as a, fl, "/ and 8 crystallins. The crystallins of each class are expressed at a precise stage of lens development [1]. In rat and newt, ~/-crystallin is the latest expressed one in the embryonic lens epithelium but the most abundant in the fiber cells [2]. In various forms of cataract, "t-crystallin was found to be reduced in amounts [3]. Sequencing studies of y-crystallin D N A from rat [4,5], mouse [6,7], frog [8], and man [9] have shown that the y-crys, tallins are evolutionally well conserved. Recently another monomeric variant closely related to "t- crystallin has been reported as the fls type [10]. Although considerable progress has been made as indicated above, little is known about the struc- ture of crystallins of the fish, which is the most primitive class in the vertebrate. Here, we report the nucleotide sequence of a c D N A corresponding to a fls-crystallin from the lens of the carp
C o r r e s p o n d e n c e : W.-C. Chang, Institute of Biological Chem- istry, Academia Sinica, P.O. Box 23-106, Taipei, Taiwan, China.
(Cyprinus carpio).
As far as we know, this is the first reported crystallin c D N A sequence of the fish.The m R N A s of
carp (C. carpio)
lenses were purified and identified as described previously [11]. The c D N A library was constructed following the method of Gubler and H o f f m a n n [12] with pBR322 as vector. Positive clones were selected by the method of hybrid-arrested translation [13].One clone (hereafter named as pC20) was able to abolish the in vitro translation of carp crystal- lins almost completely when its plasmid D N A was denatured and allowed to hybridize with the m R N A of carp lenses. Therefore this pC20 must contain a c D N A corresponding to one of the carp crystallins. The c D N A contained in pC20 was then subjected to sequence determination [14] as shown in Fig. 1. The complete nucleotide se- quence with those of other known y-crystallins are shown in Fig. 2. Excluding the d G . d C homopoly- mer, which was introduced during cloning, the length of the c D N A is 700 nucleotide pairs. The longest open reading frame in the c D N A encodes a polypeptide with 174 amino acids. The size of
90
(A)
A{ul Horl Morl Norl Atul
3655
Psf/ PStl xhol PSf~
. "- L j "
tB)
X m o I Xh~ I Hind
PstI P~fI PsII
Fig. 1. The sequencing strategy and restriction map for pC20. (a) cDNA with poly dC tailing was inserted at the PstI site of pBR322. (b) The same cDNA was subcloned at Pstl site of pUC 19. The solid (for the pBR system) and open circles (for the pUC system) are the sites for (a-32p]nucleotide labelling
by DNA polymerase I Klenow fragment.
this protein is similar to the k n o w n fls and "r-¢rys- tallins [4-10]. T h e 5 ' - e n d n o n c o d i n g region up- stream f r o m the initiator A T G c o d o n of this o p e n reading frame consists of 30 nucleotides. In 3 ' - e n d n o n c o d i n g region, we f o u n d t h e p o l y a d e n y l a t i o n signal, A A T A A A , a n d a stretch of 36 A residues following this signal. Fig. 3 shows the c o m p a r i s o n o f the derived a m i n o - a c i d sequence with bovine fl, a n d ?-crystallins. It reveals 68% and 56% overall h o m o l o g y when the carp sequence is c o m p a r e d with bovine fl~ a n d 7-II, respectively. Even when the respective motif 3 sequences are c o m p a r e d , the h o m o l o g y is as high as 63% between carp a n d ox. T h e four-fold h o m o l o g y also shows that Gly-13 a n d Ser-34 are absolutely conserved at the topol- o g y equivalent positions in all motifs in the three proteins while an a r o m a t i c residue is always pre-
~ e es ( G ) ~ ~ C T T : A T A BoviKe es T6:A:CM~:TGTCTJW~CT fame es AT66~6AT:ATTTT~TAC6A66AcAA6M~T~:A666CC~TC~TAT~GC6ACA6~6~T~T~C66AcTTC~AT6CCT~C~iT~T~T~T~ BOVINE BS : ~ A C : A ~ : : T : C : : : : : T T : : A : : : : : A : : : : : T : : A ~ : : : : C | A C ~ : ~ z ~ C ~ : : : A T T | ~ : : : : : : ~ A : : T : : : : : ~ 4 ~ T ~ | A ~ : : : : ~ | : ~ C z : ~ i ~ : : : : : : : A | A : : : FRo6 v-2 ::::::::::::::::::::::::::•::•:::::•:::A•:•:•::::::::•::••::::CT:•:•:•:•:::::•::•::•::•z::•M::• RAT v-2 :::•::::::::::::••A••::::::::::::CA•::::::::::::::::::::••:CA::•:•::•A:::•:•:•:•::::z::::::::•::::•::: RAt v-] : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : ~A~A~C~6~CTT~T~AT~TAC~A~6CCCAACTTCAT66~CTACCA~TAT~TTCTGACTCC~:~C~A~TATCC~A~AT~AC~1~T~T~T~CTC : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : T~CT~CT~CA/~T~A1g.CACTTT~TA/~T~6TT~TGA~TACAA~ATCCAACTCTAT~ACAA~`~`TTTCAC~GGCCAGGTGTAC~AET~T~TCCA~CC~T~ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : C::::::::CTCC:C::C:C:CG:AC:G::TCC . . . -C=::G:::G:G=::G=====G:=A=A:====A:======TCA:=AT=:==C==:E=========:=:=:==::= C::::::::CGCC:C::C:C:CACTCC::CTC: . . . : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : C A : : : : ~T6~AT~THC~ACAC6~:AG~T~CA~T~T~TA/~T~TfGAT~GG~TCT~GAT~TT~T~GAACA~CAAA~T~CAGGGGG~G~CAGTA~CTACT:6AGAA6~AG : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : ============================================================================================================= ============================================================================================================= TACC~T~A~C~CGT~GA~T~:C~CG~TCTGC~CCACAGTTCAGTC~TTCk~ACG~TGATGG~G~ACGTTTGGC~T~TAAAT~CAT~CA~TT~CA~TC~T~TTTAC~TCC : : : : : ~ : : : : : : : : ~ : : : : : : : : T : : A : ~ T : ~ : : : ~ : ~ : : ~ : : : : : T : : : C ~ : : : A : T G : : : : : . L L - J : ~ : ~ C A ~ : : ~ C A k : ~ : ~ T ~ 6 T C A : C C ~ :::AAECEATTTAEC::::::::AT::C::AATG:T:G:::AAGC:::::::GGA:AG:CT::::T:C:T: :::::6C6CTA:CAC~::::::::::T::A6AT~:T:A6~CA~::T::GCGG~::GC:G:A::T:T:TAC.`A~/~ATA:6T~:A:~C:A:CA::TT~TCAT:TT~:::~ :::A:~C~T~:CAC~::~::::::~:~:~AA7~:::G:::A~::T~:G:G~:AA:~:::::T:T~T~:..L~AA:~:TTT~:~:~:CA::TT~:~::]~f~.AT:-- AAACCECCCAACCACA:CATCAC::ACACACCTGTGCCGAATC~Q~-~A/~GT:T::TT:CAAATT(A)~(C)11 :GCATTATA .. . . ~ATk~CAATTGGCATG( "" I I . . . '.I~ATA~TATTTACC~(C)~ . . . .~TATTTCCT6T6Tb'TTTCAT(A)lq(C)17
Fig. 2. Comparison of cloned cDNA sequences coding for fl~ and y-crystallins. The sequences are aligned according to their corresponding amino-acid sequence. The stop codons for the longest open reading frame are underlined. Po|yadenylation signals
BOVINE ~;S CARP ES BOVINE V-ll BS fis "v-lI N-ARM S'~;TKTTF~DKN~Q~RHYDSDC DCADFtI~YLS GRI IFYEDKNFQGRRYECDS DCSDFHAFLrl GKITFYEDRGFQGHCYECSS DCPNtQPYFS 1 i0 20 30 YKLQIFEKGDFNGQMHETTE DCPSlMEQFHMR YKIQLYDKGDFTGQVYESTE DCPSVVDRFRTR FRMRIYERDDFRGQMSEITD DCPSLQDRFHLT 90 i00 ii0
RCN~IR VEG
[RCNSIR VES I MOTIF
1
RCNSIR VDS 'l EVHSCK VLE t I EVHSCK VLD I MOTIF 3 EVHSLN VLE ~ 120 91Bs GTWAVYERPNFAGYMYI LPRGEYPEYQH WMC, LNDRLSSCRAVH~'~'G~ ~ Bs GAWVIYERPNFMGYQYVLTRGEYPDYQR WMGLNDRLCSCKMI~VSGSE] i, MOTIF 2 "f- n GCWMLYERPNYQGHQYFLRRGDYPDYQQ WMGFNDSTRSCRLIPI QHTG1]
40 50 60 70 80
~s
GAWI FYELPNYRGRQYLLDKKEYRKPVD WGAASPAVQSFRRIVEBs GIWIFYEHPNYRGRQYLLEKGEYRKPVD WGAVCPTVQSFKRLME MOTIF 4 Y-If GSWVLYEMPSYRGRQYLLRPGEYRRYLD WGAMNAKVGSLRRVMDFY
130 140 150 160 170
Fig. 3. C o m p a r i s o n of the carp crystalhn sequence with that of bovine 7-II and fls crystallins. Protein sequences are s h o w n in the single-letter amino-acid code. The sequences are displayed by placing motif I on top of motif 3 and motif 2 on top of motif 4 so that topologically equivalent amino-acid residues can be easily compared. Solid circles indicate the conserved residues (see text).
Connector peptides are blocked.
sent at positions topologically equivalent to Tyr-6 and P h e - l l of 7-II crystallin. However, the carp addition as well as one h u m a n 7-crystallin [15] sequence breaks the rule of having a Glu at posi- tions topologically equivalent to Glu-7 of 7-II by substitution with an Asp at position 94 (Fig. 3). This substitution actually is a conservative one, since it will not change the charge of the protein. W h e n the connector peptide and the C-terminus are considered, the carp sequence again resembles m o r e closely the bovine fl~ than the V-II: the carp sequence and bovine fls b o t h have a hexapeptide connector in contrast to the pentapeptide in 7-11 and the fls and carp sequence lack the C-terminal tail (Phe-Tyr) of the y-II. Based on these ho- mology and structural comparisons it seems rea- sonable to classify this carp sequence as a fls-crys- tallin, although fls and 7-II are very homologous to each other and m a y have diverged from the same flV-superfamily [10]. It has to be pointed out that the carp sequence lacks the N-terminal a r m of four residues of the bovine fls and in this respect it is more like bovine 7-II.
The crystal structure of bovine 7-II crystallin has been determined with a resolution of 1.9 ,g, [16]. Recently, the tertiary structure of a bovine fl~ crystallin has also been modelled [10] b y interac- tive c o m p u t e r graphics on the coordinates of 3,-11
crystallin. All the structurally important residues in the bovine 7-II and fls-crystalllns are com- pletely conserved in the carp fls-crystalhn, such as Gly-13, -52, -100 and -141 (based on the number- ing of 7-II), Ser-34, -77, -123 and -166 and the Trp-42, -68, -131 and -157. Therefore, the carp fls m u s t assume the tertiary structure of the 3'-crystal- lins.
In conclusion, a crystallin sequence has been deduced f r o m a c D N A library of carp lens which belongs to the fls type on the basis of sequence h o m o l o g y and structural comparisons. The ex- istence of fls crystallin in fishes has been predicted f r o m the phylogenetic studies [10] and seems to be confirmed b y the present study.
R e f e r e n c e s
1 Piatigorsky, J. (1981) Differentiation 19, 134-153
2 De Jong, W.W. (1981) in Molecular and Cellular Biology of
the Eye Lens (Bloemendal, H., ed.), pp. 221-278, Wiley,
New York
3 Garber, A.T., Stirk, L. and Gold, R.J.M. (1982) Exp. Eye Res. 36, 165-169
4 Moormann, R.J.M., Den Dunnen, J.T., Bloemendal, H. and Schoenmakers, J.G.G. (1982) Proc. Natl. Acad. Sci. USA 79, 6876-6880
5 Den Durmen, J.T., Moormann, R.J.M., Lubsen, N.H. and Schoenmakers, J.G.G. (1986) J. Mol. Biol. 189, 37-46
92
6 Lok, S., Tsui, L-C., Shinohara, T., Piatigorsky, J., Gold, R. and Breitman, M. (1984) Nucleic Acids Res. 12, 4517-4529 7 Lok, S., Breitman, M.L., Chepelinsky, B., Piatigorsky, J., Gold, RJ.M. and Tsui, L-C. (1985) Mol. Cell. Biol. 5, 2221-2230
8 Tomarev, S.I., Zinovieva, R.D., Chalovka, P., Krayev, A.S., Skryabin, K.G. and Gause, G.G., Jr. (1984) Gene 27, 301-308
9 Meakin, S.O., Breitman, M.L. and Tsui, L-C. (1985) Mol. Cell. Biol. 5, 1408-1414
10 Quax-Jeuken, Y., Driessen, H., Leunissen, J., Quax, W., De Jong, W. and Bloemendal, H. (1985) EMBO J. 4, 2597-2602 11 Chiou, S-H., Chang, T., Chang, W.C., Kuo, J. and Lo, T.B.
(1986) Biochim. Biophys. Acta 871, 324-328
12 Gubler, U. and Hoffmann, B.J. (1983) Gene 25, 263-269 13 Paterson, B.M., Toverts, B.E. and Kuff, E.L. (1977) Proc.
Natl. Acad. Sci. USA 74, 4370-4374
14 Maxam, A.M. and Gilbert, W. (1977) Proc. Natl. Acad. Sci. USA 74, 560-564
15 Summers, L.J., Slingsby, C., Blundell, T.L., Den Dunnen, J.T., Moormarm, R.J.M. and Schoenmakers, J.G.G. (1986) Exp. Eye Res. 43, 77-92
16 Wistow, G., Turnell, B., Summers, L., Slingsby, C., Moss, D., Miller, F., Lindley, P. and Blundell, T. (1983) J. Mol. Biol. 170, 175-202