ewolucja jezyka genow, genetyka
[ Pobierz całość w formacie PDF ]
KODONY – trzyliterowe „wyrazy” DNA
i RNA – opisujà 20 aminokwasów,
z których powstajà tysiàce bia∏ek.
j´zyka genów
Nasz kod genetyczny
jest niezwykle
wyrafinowanym
systemem,
który chroni
˝ycie przed
katastrofalnymi
b∏´dami
i jednoczeÊnie
nap´dza proces
ewolucji.
Koniec prac nad sekwencjonowaniem
ludzkiego genomu – trzech miliardów par nukleotydów strzegàcych przepi-
su na istot´ ludzkà – naukowcy og∏osili Êwiatu 14 kwietnia 2003 roku.
Mimo to badacze nie potrafià jeszcze wy∏owiç spoÊród genowych „Êmie-
ci” wszystkich funkcjonalnych genów. Podobnie nadal wyzwaniem jest
dok∏adne zrozumienie zarówno regulacji aktywnoÊci genów, jak i wp∏y-
wu zawartej w nich informacji na kodowanie bia∏ek. Trudno wi´c dziwiç
si´ Francisowi S. Collinsowi, dyrektorowi Projektu Poznania Ludzkiego
Genomu, ˝e og∏aszajàc osiàgni´cia w∏asnej grupy, nazwa∏ je zaledwie
„koƒcem poczàtku”.
Collins nawiàza∏ te˝ wtedy do wydarzenia sprzed 50 lat, do „poczàt-
ku poczàtku”, kiedy James D. Watson i Francis H. Crick odkryli struk-
tur´ czàsteczki DNA. To by∏ niezwykle ekscytujàcy moment dla nauki, po-
niewa˝ badacze wiedzieli, ˝e czàsteczka ta zawiera tajemnic´ ˝ycia.
Dzi´ki niej organizmy przechowujà wzorzec wszystkich swoich cech,
który potem przetwarzajà w ˝ycie. Odgadywanie, jak ta przemiana si´
dokonuje, zaj´∏o naukowcom ca∏e lata. By∏o ju˝ wiadomo, ˝e alfabet
DNA sk∏ada si´ jedynie z czterech liter, a zatem informacja zakodowa-
na w podwójnej helisie musi zostaç tak˝e odczytana wed∏ug pewnych
regu∏. Dzisiaj rozumiemy, ˝e litery te mówià komórkom, które z 20
istniejàcych w przyrodzie aminokwasów po∏àczyç w ∏aƒcuch, tak by
powsta∏y tysiàce bia∏ek wyst´pujàcych w miliardach form ˝ycia. Ca∏y
o˝ywiony Êwiat nieustannie oddaje si´ szaleƒstwu odszyfrowywania
informacji – gdy sk∏adane sà jaja, kie∏kujà nasiona, rozrastajà si´ grzy-
by czy dzielà si´ bakterie.
Jednak w tamtych czasach niewiele wiadomo by∏o na temat komór-
kowych struktur i mechanizmów, które przek∏adajà j´zyk DNA na j´-
Stephen J. Freeland i Laurence D. Hurst
56
ÂWIAT NAUKI
MAJ 2004
Ewolucja
zyk bia∏ek. Dlatego kod genetyczny pró-
bowano z∏amaç za pomocà ró˝nych mo-
deli matematycznych. Chocia˝ na po-
czàtku wiele propozycji by∏o b∏´dnych
(niektóre z nich wyjàtkowo spektaku-
larnie), kreatywnoÊç ich twórców fascy-
nuje do dziÊ. Odszyfrowanie kodu pod
koniec lat szeÊçdziesiàtych niemal roz-
czarowa∏o naukowców. Wariant, któ-
rym pos∏u˝y∏a si´ przyroda, okaza∏ si´
znacznie mniej elegancki ni˝ niejedna
z hipotez.
Dopiero odkrycia ostatnich lat ujaw-
ni∏y, jak bardzo wyrafinowany jest kod
systemu symboli na zupe∏nie inny. Mo˝-
na to porównaç do przek∏adu z alfabe-
tu Morse’a na j´zyk polski.
W translacji uczestniczà tak˝e czàsteczki
transportujàcego RNA (tRNA) – komór-
kowi „kurierzy” – które dostarczajà po-
szczególne aminokwasy potrzebne do bu-
dowy ∏aƒcucha powstajàcego bia∏ka.
Na poczàtku lat pi´çdziesiàtych proces
ten by∏ wielkà niewiadomà, intrygujàcà
zagadkà matematycznà. Pierwszà pro-
pozycj´ jej rozwik∏ania przedstawi∏ nie
biolog, ale fizyk, George Gamow, bar-
dziej znany jako twórca teorii Wielkie-
go Wybuchu. Gamow, znajàc budow´
czàsteczki DNA, opublikowa∏ w 1954 ro-
ku niezwykle elegancki „kod karo”, któ-
Z∏amanie kodu
WATSON I CRICK
odkryli struktur´ DNA w
1953 roku. Ju˝ wtedy wiadomo by∏o, ˝e
geny zapisywane sà czteroliterowym al-
fabetem. Funkcj´ liter pe∏nià cztery typy
nukleotydów, które ró˝nià si´ od siebie
zasadami: adeninà, cytozynà, guaninà i
tyminà (odpowiednio A, C, G i T). Tworzà
one szczeble w dobrze dziÊ wszystkim
znanej skr´conej drabinie DNA. Alfabet
Cz´Êç kodonów okaza∏a si´ nadliczbowa, wielu badaczy uwa˝a∏o wi´c,
˝e
KOD
GENETYCZNY
JEST
DZIE¸EM
PRZYPADKU.
genetyczny. Nagle sta∏o si´ jasne, dla-
czego rzàdzà nim proste zasady, które
przetrwa∏y jakieÊ 3 mld lat doboru natu-
ralnego. DziÊ mo˝emy udowodniç, ˝e
regu∏y kodu nie sà sztywne i mogà przy-
Êpieszaç ewolucj´, równoczeÊnie chro-
niàc ˝ycie przed katastrofalnymi w skut-
kach b∏´dami w procesie syntezy bia∏ek.
Prace nad kodem genetycznym dostar-
czy∏y równie˝ pomys∏ów na rozwiàza-
nie niektórych problemów genomiki.
Gdy cofamy si´ do samego poczàtku, by
zrozumieç zasady rzàdzàce tym „kodem
˝ycia”, odkrywamy narz´dzia do dal-
szych badaƒ.
Kiedy mówimy „kod” i „odkodowa-
nie”, poj´cia te traktujemy ca∏kiem do-
s∏ownie. Instrukcje genetyczne zawar-
te sà w DNA i RNA, biochemicznych
czàsteczkach zwanych kwasami nukle-
inowymi. G∏ównym budulcem i budow-
niczym organizmów sà jednak zupe∏nie
inne czàsteczki – bia∏ka. Chocia˝ we-
d∏ug tradycyjnej definicji gen to sekwen-
cja nukleotydów, która opisuje budow´
pojedynczego bia∏ka, genetyczne „zda-
nie”, które ten opis zawiera, musi naj-
pierw zostaç przet∏umaczone z jednego
bia∏ek natomiast sk∏ada si´ z 20 ró˝nych
aminokwasów. Te genetyczne s∏owa mu-
szà zatem sk∏adaç si´ z kilku nukleoty-
dów, aby mo˝liwe by∏o ich precyzyjne
oznakowanie. Z czterech liter mo˝na
utworzyç tylko 16 dwuliterowych s∏ów
(czyli tzw. kodonów). JeÊli s∏owa sà trzy-
literowe, otrzymamy a˝ 64 kodony, czy-
li du˝o wi´cej, ni˝ mamy aminokwasów.
Naukowcy nie potrafili te˝ dok∏adnie
powiedzieç, jak informacja zapisana w
genach przek∏adana jest na bia∏ka. DziÊ
rozumiemy, ˝e na zapis genu sk∏adajà si´
trzyliterowe kodony, które okreÊlajà po-
szczególne aminokwasy. Aby uk∏ad tych
liter-zasad w genie przet∏umaczyç na ko-
lejnoÊç tworzàcych „∏aƒcuszek” amino-
kwasów, potrzeba kilku etapów. Na po-
czàtku gen zostaje skopiowany. Kopia
jednak nie jest identyczna – nowo po-
wsta∏y kwas to nie drugi DNA, ale RNA.
Ró˝nià si´ one od siebie jednà zasadà
– zamiast tyminy (T) w RNA wyst´puje
uracyl (U). W ten sposób powstaje tzw.
informacyjny RNA (mRNA). Nast´pnie
w procesie zwanym translacjà zapisany
w mRNA gen odczytywany jest przez ma-
szyneri´ komórkowà po trzy litery naraz.
ry mia∏ t∏umaczyç, jak z czteroliterowe-
go alfabetu powstaje 20 aminokwasów.
Wed∏ug wysnutej przez Gamowa teo-
rii w ka˝dym skr´cie podwójnej helisy
tworzy si´ przestrzeƒ w kszta∏cie rombu,
którego wierzcho∏ki wyznaczone sà
przez cztery nukleotydy. Przestrzenie te
mia∏yby tworzyç z DNA matryc´, wzd∏u˝
której aminokwasy uk∏ada∏yby si´ w
okreÊlonej, determinowanej przez nu-
kleotydy kolejnoÊci. W ka˝dym rombie
jeden z nukleotydów nie wnosi∏ ˝adnej
dodatkowej informacji, a pozosta∏e trój-
ki nukleotydów (taka trójka mo˝e po-
wstaç na 64 sposoby) tworzà grupy ko-
donów „znaczàcych”. Model zak∏ada∏
te˝, ˝e kodony te zachodzà na siebie –
ka˝dy nukleotyd, wyjàwszy te z pozycji
kraƒcowych, jednoczeÊnie mia∏ nale˝eç
do trzech innych kodonów. Wspó∏cze-
Êni Gamowowi teoretycy bardzo cenili
ide´ tak efektywnej kompresji danych.
Niestety, nied∏ugo póêniej odkryto ∏aƒ-
cuchy aminokwasów, które nie mog∏y
byç kodowane zgodnie z tà teorià.
W tym samym czasie wyniki doÊwiad-
czeƒ wskazywa∏y, ˝e DNA i aminokwa-
sy nie oddzia∏ujà ze sobà bezpoÊrednio.
Crick przedstawi∏ wi´c hipotez´ o po-
Êredniczàcych w tym procesie tzw.
czàsteczkach adaptorowych i w 1957 ro-
ku sformu∏owa∏ regu∏y ich dzia∏ania. W
uproszczeniu adaptory rozpoznawa∏y tyl-
ko te 20 z 64 kodonów, które okreÊla∏y
20 amionokwasów, pozosta∏e trójki zaÊ
by∏y kodonami „nonsensownymi”, bez
przypisanego znaczenia. W kodzie tym,
zamiast zachodzenia kodonów na siebie,
Crick zaproponowa∏ brak znaków prze-
stankowych. Puste kodony by∏y niewi-
Przeglàd /
Kod ˝ycia
n
Genetyczny przepis na produkcj´ bia∏ka okreÊlony jest trzyliterowymi „s∏owami”,
zwanymi kodonami. Ka˝dy z nich okreÊla jeden z 20 aminokwasów lub jeden
ze znaków okreÊlajàcych „zatrzymanie odczytu”. KiedyÊ uwa˝ano, ˝e uk∏ad kodonów
i ich znaczenie (czyli przypisanie okreÊlonego aminokwasu) jest losowy.
n
Niedawno okaza∏o si´ jednak, ˝e powstanie i utrwalenie tego systemu jest wynikiem
doboru naturalnego. Symulacje komputerowe wyjaÊniajà tego przyczyn´.
W porównaniu z alternatywnymi kodami hipotetycznymi naturalny kod nadzwyczaj
skutecznie zmniejsza szkody powodowane przez b∏´dy powsta∏e w genach
oraz podczas t∏umaczenia zapisu genetycznego na bia∏ka.
58
ÂWIAT NAUKI
MAJ 2004
PRZEPIS NA ˚YCIE
SEKWENCJ¢ GENU OPISUJÑCEGO BIA¸KO mo˝na porównaç do zdania zbudowanego z trzyliterowych s∏ów (kodonów tworzonych
przez trójki nukleotydów). Ka˝dy kodon symbolizuje jeden z 20 aminokwasów lub sygna∏ „stop” (zatrzymania odczytu). Maszyneria
komórkowa przek∏ada geny DNA na ich odpowiedniki w RNA. Trzynukleotydowe kodony RNA zapisuje si´ literami A, C, G i U. Geny
RNA, odczytywane kodon po kodonie, stanowià wzór, wed∏ug którego budowane sà ∏aƒcuchy aminokwasowe. Stosowane przez przy-
rod´ oznaczenia aminokwasów (
poni˝ej
) zosta∏y rozszyfrowane na poczàtku lat szeÊçdziesiàtych. Jednak prawdziwe znaczenie wzo-
ru, na którym opiera si´ kod, przez kilkadziesiàt lat by∏o niedoceniane.
IDENTYCZNY CZY PODOBNY?
Wiele z 64 istniejàcych kodonów oznacza
te same aminokwasy. Dzi´ki temu
wi´kszoÊç bia∏ek mo˝e byç zapisana
w genach na ró˝ne sposoby.
Synonimiczne kodony ró˝nià si´
od siebie jednà z trzech liter (zwykle
ostatnià), dzi´ki czemu mo˝na u∏o˝yç je
wed∏ug pewnego wzoru. Kodony
opisujàce aminokwasy, które
zachowujà si´ podobnie w Êrodowisku
wodnym, majà kodony ró˝niàce si´
od siebie ostatnià literà. Majàce
takà samà pierwszà liter´ najcz´Êciej
kodujà aminokwasy b´dàce swoimi
prekursorami lub produktami.
Jak si´ okaza∏o, w∏aÊnie te cechy
kodu majà fundamentalne znaczenie
dla przetrwania organizmów,
a dodatkowo mogà przyÊpieszaç
tempo ewolucji.
Drugi nukleotyd kodonu
U
C
A
G
U
UUU Fenyloalanina
UUC Fenyloalanina
UUA Leucyna
UUG Leucyna
CUU Leucyna
CUC Leucyna
CUA Leucyna
CUG Leucyna
AUU Izoleucyna
AUC Izoleucyna
AUA Izoleucyna
AUG Metionina
GUU Walina
GUC Walina
GUA Walina
GUG Walina
UCU Seryna
UCC Seryna
UCA Seryna
UCG Seryna
CCU Prolina
CCC Prolina
CCA Prolina
CCG Prolina
ACU Treonina
ACC Treonina
ACA Treonina
ACG Treonina
GCU Alanina
GCC Alanina
GCA Alanina
GCG Alanina
UAU Tyrozyna
UAC Tyrozyna
UAA STOP
UAG STOP
CAU Histydyna
CAC Histydyna
CAA Glutamina
CAG Glutamina
AAU Asparagina
AAC Asparagina
AAA Lizyna
AAG Lizyna
GAU Asparaginian
GAC Asparaginian
GAA Glutaminian
GAG Glutaminian
UGU Cysteina
UGC Cysteina
UGA STOP
UGG Tryptofan
CGU Arginina
CGC Arginina
CGA Arginina
CGG Arginina
AGU Seryna
AGC Seryna
AGA Arginina
AGG Arginina
GGU Glicyna
GGC Glicyna
GGA Glicyna
GGG Glicyna
C
A
G
doczne dla czàsteczek adaptorowych, tak
wi´c nie trzeba by∏o oznaczaç poczàtku
i koƒca odczytu genu. Pomys∏ by∏ tak pro-
sty, ˝e od razu zyska∏ aprobat´; oczywi-
Êcie do czasu, kiedy wyniki badaƒ wyka-
za∏y, ˝e ta pi´kna teoria jest b∏´dna.
lat, który up∏ynà∏ od momentu podzia∏u
Êwiata ˝ywego na trzy królestwa (obec-
nie wyró˝nia si´ najcz´Êciej pi´ç kró-
lestw – przyp. red.) nie powsta∏y ˝adne
warianty tego systemu. Dlatego w∏aÊ-
nie poj´cie „utrwalonego przypadku”,
tak proste i przekonujàce, a ukute przez
samego Cricka w 1968 roku, na d∏ugo
zdominowa∏o myÊlenie naukowców.
„Przypisanie kodonów do ich amino-
kwasów by∏o ca∏kowicie losowe” – na-
pisa∏. Lecz od momentu, gdy kod poja-
wi∏ si´ w formie, jakà znamy, sta∏ si´
fundamentem ˝ycia, i jakakolwiek dal-
sza zmiana by∏aby katastrofalna.
Dobór naturalny postulowany przez
Darwina opiera si´ na za∏o˝eniu, ˝e
ma∏a zmiana w pojedynczym genie mo-
˝e okazaç si´ cenna, jeÊli spowoduje, ˝e
organizm lepiej przystosuje si´ do Êro-
dowiska. Manipulacja w regu∏ach kodu
by∏aby jednak równoznaczna z wpro-
wadzeniem zmian w niezliczonych
miejscach materia∏u genetycznego, co
doprowadzi∏oby do ca∏kowitego spara-
li˝owania metabolizmu. To tak, jakby
porównaç efekt jednej literówki do
skutków zmiany uk∏adu klawiatury.
To atrakcyjne w swej prostocie rozu-
mowanie jest jednak zbyt uproszczo-
ne. Chocia˝ wi´kszoÊç organizmów ma
standardowy kod genetyczny, to wiemy
przynajmniej o 16 jego wariantach roz-
proszonych po ró˝nych ga∏´ziach ewo-
lucyjnego drzewa, kiedy okreÊlonym
kodonom przypisywane sà inne znacze-
nia. Podstawy kodu pozostajà zawsze
te same: trójki nukleotydów sà przek∏a-
dane na j´zyk aminokwasów. Ale pod-
czas gdy w wi´kszoÊci organizmów ko-
don CUG oznacza aminokwas zwany
leucynà, dla wielu gatunków grzybów
z rodzaju
Candida
oznacza on seryn´.
Obecne w wi´kszoÊci komórek mito-
chondria – maleƒkie generatory ener-
gii – majà w∏asny genom i u wielu z
nich tak˝e wytworzy∏y si´ znaczenia ko-
donów inne ni˝ standardowe. Na przy-
k∏ad w mitochondrialnym genomie
dro˝d˝y piekarnianych (
Saccharomyces
cerevisiae
) czterem z szeÊciu kodonów,
które normalnie kodujà leucyn´, przy-
pisana jest treonina.
W latach dziewi´çdziesiàtych, po ko-
lejnych odkryciach wariantów kodu ge-
netycznego, sta∏o si´ jasne, ˝e nie jest
Utrwalony przypadek?
BADANIA
z poczàtku lat szeÊçdziesiàtych
pokaza∏y, ˝e (przynajmniej w probów-
ce) synteza bia∏ek jest mo˝liwa tak˝e na
podstawie kodonów uznawanych za
nonsensowne. Do roku 1965 rozszyfro-
wano znaczenie wszystkich 64 mo˝li-
wych do utworzenia trójek nukleotydów.
Naukowcy nie dopatrzyli si´ w tym ja-
kiejÊ przejrzystej regu∏y matematycznej.
Niektóre kodony okaza∏y si´ nadliczbo-
we, cz´Êç aminokwasów zatem opisana
jest przez dwa, cztery, a nawet szeÊç ko-
donów. Po wszystkich pe∏nych entuzja-
zmu spekulacjach wielu badaczom
prawdziwy kod genetyczny wyda∏ si´ po
prostu dzie∏em przypadku.
Kiedy z∏amano kod, naukowcy odkry-
li, ˝e tym samym systemem pos∏ugujà
si´ tak ró˝ne organizmy, jak cz∏owiek i
bakteria. Wydawa∏o si´, ˝e przez miliard
MAJ 2004
ÂWIAT NAUKI
59
OCHRONA BIA¸EK
STWORZONY PRZEZ PRZYROD¢ KOD minimalizuje efekty b∏´dów genetycznych, zarówno wynikajàcych z mutacji w samych genach, jak
i tych, które powstajà podczas translacji (procesu przepisywania) genu na bia∏ko. Sekwencja genu jest t∏umaczona na kolejnoÊç odpowied-
nich aminokwasów okreÊlajàcych trójwymiarowà struktur´ bia∏ka (
1, 2
i
3
). Nawet gdy na skutek b∏´du wstawiony zostaje z∏y aminokwas,
jest on chemicznie tak podobny do w∏aÊciwego, ˝e powstajàce bia∏ko niewiele si´ zmienia. Rzadkim wyjàtkiem od tej regu∏y jest zmiana po-
wodujàca groênà chorob´ – niedokrwistoÊç sierpowatokrwinkowà.
Kodon
Jàdro
mRNA
DNA
mRNA
¸aƒcuch aminokwasów
Cytoplazma
z lewej
), najpierw jest kopiowany w RNA, którego alfabet sk∏ada si´
z czterech nukleotydów – adeniny, cytozyny, guaniny i uracylu.
Ten tzw. informacyjny RNA (mRNA) przenosi genetyczny przepis
na bia∏ko z jàdra komórkowego do cytoplazmy, gdzie zostaje odczytany.
Aminokwas
kodon po kodonie. W tym samym czasie inny typ RNA, transportujàcy
RNA (tRNA), chwyta wolne aminokwasy i przenosi je do rybosomu,
gdzie zostajà dodane do rosnàcego ∏aƒcucha bia∏kowego. Ka˝dy tRNA
na jednym koƒcu wià˝e si´ z trzynukleotydowym kodonem w mRNA,
a na drugim ma przyczepiony pojedynczy aminokwas.
tRNA
mRNA
¸aƒcuch
aminokwasów
zwija si´
w trójwymiarowe
bia∏ko
Rybosom
Glutaminian
przez powinowactwo aminokwasów do wody. Aminokwasy hydrofobowe
majà tendencj´ do chowania si´ we wn´trzu bia∏ka, pozostawiajàc cz´Êci
hydrofilowe (np. glutaminian) na zewnàtrz, wystawione na oddzia∏ywania
z wodà cytoplazmy komórkowej. Czàsteczka hemoglobiny (
z prawej
)
sk∏ada si´ z czterech ∏aƒcuchów aminokwasowych: dwóch ∏aƒcuchów
alfa (
niebieski
) i dwóch beta (
˝ó∏ty
).
NORMALNA
HEMOGLOBINA
Walina
B¸ÑD KRYTYCZNY. Hemoglobina jest bardzo dobrze zbadanà czàsteczkà. Naukowcy znajà kilka
mutacji w genie kodujàcym jej cz´Êç bia∏kowà, które pozostajà nieme (nie powodujà choroby).
Ale b∏àd, którego skutkiem jest zamiana aminokwasu hydrofilowego na hydrofobowy, mo˝e
zmieniç kszta∏t i funkcj´ powsta∏ego bia∏ka. W przypadku niedokrwistoÊci sierpowatokrwinkowej
mutacja polegajàca na zmianie pojedynczego nukleotydu w wyjÊciowym genie ∏aƒcucha
beta-hemoglobiny zmienia kodon GAG na GUG (
powy˝ej
). Powoduje to wymian´ „lubiàcego wod´”
glutaminianu na hydrofobowà walin´. Na powierzchni hemoglobiny powstajà wtedy „nielubiàce
wody” wysepki, które przyciàgajà si´ wzajemnie. Czàsteczki zmutowanej hemoglobiny sklejajà si´
ze sobà i tworzà sztywne w∏ókna nadajàce czerwonej krwince kszta∏t sierpa.
NIEPRAWID¸OWA
HEMOGLOBINA
1
KIEDY GEN ulega ekspresji, czyli zostaje aktywowany (
na górze
2
ORGANELLA KOMÓRKOWE, zwane rybosomami, odczytujà mRNA
3
POWSTAJÑCE BIA¸KO przybiera trójwymiarowy kszta∏t, okreÊlony
[ Pobierz całość w formacie PDF ]