Professional Documents
Culture Documents
1. Accesati site-ul NCBI si salvati secventele CDS (in format fasta: cu extensia .fas) ale
genelor pentru adenilat ciclaza, ale speciilor de bacterie: Bordetella pertussis (GI:
580667), B. parapertussis (GI: 7160623), B. bronhiseptica (GI: 11602642) si hemolizina
din Escherichia coli (GI: 157688243).
2. Porniti programul BioEdit si deschideti, pe rand, toate secventele salvate.
3. Incarcatile manual in acelasi document (de exemplu in documentul cu secventa din B.
pertussis, GI: 580667) astfel: selectati una din secvente (titlul ei), Edit/Copy Sequence(s),
activati fereastra documentului principal si apoi Edit/Paste Sequence(s). Procedati la fel
cu toate celelalte secvente.
4. Selectati secventele ADN din B. pertussis (GI: 580667) si B. parapertussis (GI: 7160623) si
aliniatile cu comanda Sequence/Pairwise alignment/Align two sequence (optimal
GLOBAL alignment).
Modulul de aliniere Align two sequence (optimal GLOBAL alignment) aliniaza perechile de
secvente pe toata lungimea lor. Modulul de aliniere Align two sequence (allow end to slide)
este un aliniament local si se foloseste pentru perechile de secvente mai putin asemanatoare
si/sau diferite ca dimensiune.
Rezultatul aliniamentului se regaseste in doua ferestre: una cu aliniamentul propriuzis si
cealalta cu sumarul in care sunt afisate titlurile secventelor, tipul de aliniament folosit (Optimal
GLOBAL alignment) sau Sequence ends allowed to slide over each other), scorul si gradul de
asemanare dintre secvente (Identity). Scorul depinde de fiecare secventa in parte. In cazul in
care cele doua secvente aliniate sunt identice, gradul de asemanare are valoarea 1 (100%).
Repetati aliniamentul si cu secventele de ADN din B. pertussis (GI: 580667) si B.
bronhiseptica (GI: 11602642).
5. Pentru a realiza un aliniament multiplu selectati toate secventele ADN si accesati
Accesori Application/ClustalW Multiple alignment. Asigurati-va ca in fereastra aparuta
sunt bifate casutele pentru Full multiple alignment(afisarea aliniamentului) si Output
Clustal format with Clustal consensus sequence generation (notarea nucleotidelor
conservate).
Functia Gap penalties poate fi folosita pentru restrictionarea introducerii si/sau
prelungirii unei intreruperi in cadrul secventelor.
Celelalte functii (Calculate NJ Tree, FAST algoritm for guide tree, Bootstrap for NJ
tree si Number of bootstraps) se folosesc pentru realizarea unor calcule preliminarii in
vederea formarii arborilor filogenetici. Crearea arborilor filogenetici se realizeaza cu ajutorul
aplicatiei TreeView care trebuie instalata (folosind fisierul executabil treev32.exe aflat sub
forma arhivata, in directorul BioEdit) si configurata in BioEdit. Aceasta aplicatie nu functioneaza
bine in sistemul de operare Windows 64bit.
Faceti click stanga pe butonul OK aflat in fereastra care se deschide pentru a anunta
fisierele temporale create in cursul alinierii.
Repetati aliniamentul si cu secventele de ADN din B. pertussis (GI: 580667), B. parapertussis
(GI: 7160623) si B. bronhiseptica (GI: 11602642).
6. Pentru printarea aliniamentelor se acceseaza File/Grafic View. In fereastra de editare
aparuta puteti modifica parametri de afisare a aliniamentului.
Fixati la 60 numarul de nucleotide per rand (Residues per row) si bifati casutele pentru:
afisarea titlurilor in stanga aliniamentului (Titles on left), ingrosate (Titles Bold), afisarea atat in
stanga (numbers left of seqs), cat si in dreapta aliniamentului (numbers right of seqs) a
numerotarii nucleotidelor, afisarea ingrosata (Sequence Bold) si eventual color (Sequence in
color) a secventelor si afisarea riglei (Show Ruler). Faceti click stanga pe butonul Redraw.
Printarea se realizeaza ca la majoritatea documentelor prin accesarea File/Print (sau
Ctrl+P), urmata de alegerea imprimantei sau a programului de creare a documentelor cu
extensia .pdf.
Bioinformatica asigura baza teoretica, dar si uneltele practice pentru explorarea proteinelor si ADNului. Ea consta dintr-o abordare computationala pentru gestionarea si analiza informatiilor biomedicale.
Este folosita tot mai mult in cercetare atat in cadru academic cat si industrial.
Obtinerea secventelor
1. Intrati pe pagina de web a NCBI (National Center for Biotechnology Information):
www.ncbi.nlm.nih.gov. NCBI este o retea exinsa de baze de date cu informatii genetice, medicale si
biochimice. Pentru informatii detaliate cu privire la acest site puteti accesa Manualul NCBI
(http://www.ncbi.nlm.nih.gov/books/NBK21101/).
2. Pentru a ajunge in portalul GQuery (http://www.ncbi.nlm.nih.gov/gquery/) selectati All
Databases din bara de navigatie din partea de sus a paginii, si dati click pe butonul Search.
Acesta ne asigura accesul la o mare varietate de informatii: de la literatura biomedicala (PubMed)
pana la baze de date ce cuprind secvente de nucleotide, secvente si structuri proteine etc.
3. Tastati in bara de cautare cuvintele cheie ale fragmentului de ADN cautat. In continuare vom lucra
cu adenilat ciclaza din Bordetella pertussis (cuvinte cheie: adenylate cyclase AND Bordetella
pertussis).
I1: Cate secvente nucleotidice s-au obtinut? Dar gene?
I2: Ce se obtine la folosirea cuvantului cheie: bacteria? De ce?
4. Accesati linkul Nucleotide: DNA and RNA sequences. In pagina afisata se poate gasi linkul adenilat
ciclazei din B. pertussis, urmat de cateva informatii legate de secventa respectiva: nr. de pb pe care
le contine (6441 pb), precum si Accession: A14850.1 si GI: 580667.
Accession cuprinde Accession number (nr de identificare unic atribuit fiecarei secvente
inregistrate, alcatuit dintr-o litera urmata de 5 cifre sau 2 litere urmate de 6 cifre), urmat de Version
number (indice al istoricului revizuirii care incepe cu 1 si creste cu fiecare revizuire a secventei).
GI (GenInfo Identifier) alcatuit dintr-o serie de cifre care sunt atribuite consecutiv pentru fiecare
secventa inregistrata si prelucrata de NCBI.
Cele doua sisteme functioneaza in paralel. Daca o secventa de ADN sau proteine sufera modificari de
orice natura, acesta va primi un nou numr de GI.
5. Accesati linkul adenilat ciclazei din B. pertussis pentru a acceseaza secventa in formatul GenBank.
Acesta cuprinde 3 parti: antet, caracteristici, si secventa in sine.
Prelucrarea secventelor
1. Deschideti programul de prelucrare a secventelor (ADN/proteine) BioEdit (kitul de instalare se
poate downloada de pe http://www.mbio.ncsu.edu/bioedit/bioedit.html).
2. Deschideti secventa de ADN (CDS-ul adenilat ciclazei din B. pertussis) salvata de pe NCBI (File/Open,
selectati All Files in dreptul Files of Types: si deschideti documentul cu extensia .txt).
3. Pentru a obtine harta de restrictie a secventei ADN, selectati secventa si accesati modulul de
restrictie pe urmatoarea cale: Sequence/Nucleic Acid/Restriction Map.
2
Setati conditiile de afisare a hartii de restrictie (Display), asa cum este prezentat in figura 2. Aici sunt
bifate casutele pentru afisarea hartii si a listelor enzimelor de restrictie aranjate dupa nume si pozitia in
cadrul secventei, lista enzimelor care au doar un singur situs de restrictie, a celor care au cel mult 5 situsuri
de restrictie, precum si a enzimelor care nu prezinta nici un situs de restrictie. Sunt luate in considerare
doar enzimele care recunosc situsuri de restrictie compuse din cel putin 6 nucleotide.
De asemenea cu ajutorul programului BioEdit se pot face diverse alte prelucrari de secvente (atat
ADN cat si proteine). O prelucrare ar fi traducerea secventelor ADN in proteine (Sequence/Nucleic
Acid/Translate). Se poate alege cadrul de citire (frame) care in cazul nostru este 1 deoarece codonul start
ATG incepe chiar din pozitia 1 a secventei nucleotidice. Se mai pot face aliniamente a doua secvente de
ADN sau poteine (Sequence/Pairwise Alignment/).
Electroforeza ADN
Introducere
Electroforeza in gel de agaroza este o metoda utilizata in
Electroforeza se realizeaza