DNA - Laboratory of Mouse Molecular Genetics
Transkript
Struktura myšího genomu odd. Myší molekulární genetiky, [email protected] http://www.img.cas.cz/mmg/ q Výhody experimentálního modelu myši domácí q DNA sekvenování - vývoj technologií – od malých k velkým genomům q Primární sekvence myšího genomu, chromozomy, organizace jádra q Klasifikace genomových oblastí a elementů: geny, centromery, telomery, repetitivní DNA, transposony q Databáze výsledků sekvenačních projektů – volný přístup Výhody experimentálního modelu myši domácí Životní cyklus : březost 20 dnů : 4-10 mláďat / vrh : 2-8 vrhů / samice : pohlavní dospělost v 7 týdnech Genom - osekvenován : 19 autozomů + XY : 2,7 x 109 pb / haploidní genom : 23 000 genů : 99% genů má lidského ortologa Kmeny Asistovaná reprodukce : Kryopreservace embryí a spermií : In vitro fertilizace : Inbrední - IB : Outbrední- OB : Rekombinantní inbrední - RI : Konsomické- CS Manipulace myšího genomu: Prostředky : Genomová DNA sekvence : Genomové knihovny v BAC : DNA mikročipy (expression arrays) : Embryonální kmenové buňky : „Gene-trap“-knihovny : MUGA (Mouse Universal Genotyping Arrays) : NGS – RNA-seq, ChIP-seq, Methylome-seq... : Transgeneze : Knocking-out : Knocking-down : Knocking-in : Podmíněná exprese : Inducibilní exprese : Retrovirové vektory : siRNA : editace genomu (ZnFN, TALEN, CRISPR) Metody pro určení sekvence DNA – Generace 1 (G1) Sanger sequencing /dideoxy or chain termination method/ Chain-termination method requires single-stranded DNA Template, DNA primer, DNA polymerase, radioactively labeled nucleotides, modified nucleosides (di-deoxynucleosidetriphosphates - ddNTPs) that terminate DNA strand elongation Principle: DNA-POLYMERASE CHAIN ELONGATION & SPECIFIC TERMINATION BY DIDEOXYNUCLEOSIDETRIPHOSPHATEs REFERENCE: Sanger F, Nicklen S, Coulson AR., DNA sequencing with chain-‐termina?ng inhibitors, Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-‐7 4 TubesReactions for 4 individual ddTTP Metody pro určení sekvence DNA – G1 4 tubes with reactions for 4individual ddTTP Sanger sequencing /dideoxy or chain termination method/ radioactive fragments terminated at 3’ ends specific sites of incorporated dideoxy nucleotides are resolved on denaturing polyacrylamide gel and exposed to autoradiograph films Electrophoresis on denaturing gel and autoradiography Frederick Sanger *13.8.1918 +19 .11.2013 http://en.wikipedia.org/wiki/Frederick_Sanger DNA sekvenování – Sangerova metoda – G1+ Sanger sequencing /dideoxy or chain termination method/- resolved by capilary electropheresis - DNA Polymerase elongated fragments terminated at 3’ end specific sites - by Dideoxy nucleotides labeled by base specific fluorescent dyes - Fragments are resolved by electrophoresis through a polymer in a capillary - Laser detector reads the sequence according to sequence of specific dye peaks ABI PRISM Model 3700 Automated Sequencer 96 capillaries. This vastly improved the process, but even so it could take over a year to read a DNA fragment one gigabase. The workhorse of the Human Genome Project was the capillary sequencer. This removed the need for radiation and pouring gels, automating the DNA-sequencing method invented by Fred Sanger in the 1970s. http://www.wellcome.ac.uk/Education-resources/Education-and-learning/Resources/Animation/WTDV026689.htm Současné metody sekvenace DNA – G2, G3 - High Throughput-Next Generation Sequencing v Next Generation Sequencing Instruments - Principles q 454/Roche Pyrosequencing q Illumina/ Solexa Reversible Terminator Nucleotides q Solid/Life Technologies Sequencing by Ligation q Ion Torrent/Life Technologies pH changes during DNA synthesis q Pacific Bioscinces Single DNA polymerase molecule “watched” in action q Oxford Nanopore Single DNA molecule sequenced at nanopore Sequencing instrument capacities since 2001 ER Mardis. Nature 470, 198-203 (2011) Kris Wetterstrand, M.S., National Human Genome Research Institute, E-mail: [email protected] 1 ExaByte = 1x1018 21 1 ZettaByte = 1x10 1http://schatzlab.cshl.edu/presentations/2014.03.24.Keystone%20BigData.pdf Použití HT-NGS technologií v HT - Next Generation Sequencing Applications - Projects q Genome Sequencing new genomes, genome resequencing q Transcriptome Sequencing sequencing – quantification of mRNA, smallRNA q Exome Sequencing sequencing of exome enriched libraries q Targeted Sequencing sequencing of targeted genome enriched regions q ChIP - Sequencing DNA – protein interactions q Genome – Wide Methylation genome-wide cytosine methylation q Multiplex Sequencing barecode specific simultaneous sequencing q Microbiome Sequencing enviromental, human, mouse microbiomes Sekvenování lidského genomu - IHGSC IHGSC - Hiearchical shotgun sequencing International Human Genome Sequencing Consortium (IHGSC) Sekvenování lidského genomu - CELERA Whole-genome shotgun sequencing Rychlá metoda celogenomového shotgun sekvenování: CELERA (an Applera Corporation Busisness, Craig Ventor) Overlapping shredded bactig fragments (red lines) and internally derived reads from five different individuals (black lines) are combined to produce a contig and a consensus sequence (green line). Contigs are connected into scaffolds (red) which are then mapped to the genome (gray line) with STS (blue star) physical map information DNA sekvence lidského genomu q „draft sequence genomu člověka publikována: 15.2.2001 q představuje 90% velikosti lidského genomu q 2.7Gb (2.7 x 109 bp) ü REFERENCE #1: International Human Genome Sequencing Consortium (2001). Initial sequencing and analysis of the human genome. Nature 409 (6822): 860–921. • Sekvenační postup: Hiearchical shotgun sequencing • Sekvence lidského genomu přístupná vědecké komunitě ve formě databáze DNA sekvencí ü REFERENCE #2 Venter, JC et al. (2001). The sequence of the human genome. Science 291 (5507): 1304–1351. • Sekvenační postup: Whole Genome Shotgun sequencing • Původně se CELERA snažila některé DNA sekvence patentovat, a tím vznikalo nebezpečí pouze komerčního přístupu k některým sekvencím lidského genomu q „final sequence oznámena: 25.4.2003 on UCSC genome browser appeared as assembly July 2003 (NCBI34/hg16) q představuje 99.3% velikosti lidského genomu q 3.1 Gb (3.1 x 109 bp) q současná „final sequence q 3.1 Gb (3.1 x 109 bp) Dec 2013 (GRCh38/hg38) DNA sekvence myšího genomu • Využití sekvenačních kapacit projektu lidský genom • +stará dobrá Sangerova sekvenační metoda, • +vylepšené programy na sestavení genomu (genome assembly) Sekvence genomu myši domácí (kmen C57Bl/6J ) byla publikována: 5.12.2002 „draft sequence“ t.j. 96% předpokládané velikosti myšího genomu – 2.5 Gb • Mouse Genome Sequencing Consortium (2002) : Initial sequencing and comparative analysis of the mouse genome, Nature, 420:520-562. „Draft sekvence genomu myši domácí Nature. 2002 Dec 5;420(6915): Kromě vlastní sekvence genomu myši (kmen C57Bl/6J ) zde byly publikovány další důležité články s detailní analýzou sekvence a porovnání genomu myši s lidským genomem publikovaným dříve Mouse Genome Sequencing Consortium (2002) : Initial sequencing and comparative analysis of the mouse genome, Nature, 420:520-562. Author List: Mouse Genome Sequencing Consortium, Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, An P, Antonarakis SE, Attwood J, Baertsch R, Bailey J, Barlow K, Beck S, Berry E, Birren B, Bloom T, Bork P, Botcherby M, Bray N, Brent MR, Brown DG, Brown SD, Bult C, Burton J, Butler J, Campbell RD, Carninci P, Cawley S, Chiaromonte F, Chinwalla AT, Church DM, Clamp M, Clee C, Collins FS, Cook LL, Copley RR, Coulson A, Couronne O, Cuff J, Curwen V, Cutts T, Daly M, David R, Davies J, Delehaunty KD, Deri J, Dermitzakis ET, Dewey C, Dickens NJ, Diekhans M, Dodge S, Dubchak I, Dunn DM, Eddy SR, Elnitski L, Emes RD, Eswara P, Eyras E, Felsenfeld A, Fewell GA, Flicek P, Foley K, Frankel WN, Fulton LA, Fulton RS, Furey TS, Gage D, Gibbs RA, Glusman G, Gnerre S, Goldman N, Goodstadt L, Grafham D, Graves TA, Green ED, Gregory S, Guigó R, Guyer M, Hardison RC, Haussler D, Hayashizaki Y, Hillier LW, Hinrichs A, Hlavina W, Holzer T, Hsu F, Hua A, Hubbard T, Hunt A, Jackson I, Jaffe DB, Johnson LS, Jones M, Jones TA, Joy A, Kamal M, Karlsson EK, Karolchik D, Kasprzyk A, Kawai J, Keibler E, Kells C, Kent WJ, Kirby A, Kolbe DL, Korf I, Kucherlapati RS, Kulbokas EJ, Kulp D, Landers T, Leger JP, Leonard S, Letunic I, Levine R, Li J, Li M, Lloyd C, Lucas S, Ma B, Maglott DR, Mardis ER, Matthews L, Mauceli E, Mayer JH, McCarthy M, McCombie WR, McLaren S, McLay K, McPherson JD, Meldrim J, Meredith B, Mesirov JP, Miller W, Miner TL, Mongin E, Montgomery KT, Morgan M, Mott R, Mullikin JC, Muzny DM, Nash WE, Nelson JO, Nhan MN, Nicol R, Ning Z, Nusbaum C, O'Connor MJ, Okazaki Y, Oliver K, Overton-Larty E, Pachter L, Parra G, Pepin KH, Peterson J, Pevzner P, Plumb R, Pohl CS, Poliakov A, Ponce TC, Ponting CP, Potter S, Quail M, Reymond A, Roe BA, Roskin KM, Rubin EM, Rust AG, Santos R, Sapojnikov V, Schultz B, Schultz J, Schwartz MS, Schwartz S, Scott C, Seaman S, Searle S, Sharpe T, Sheridan A, Shownkeen R, Sims S, Singer JB, Slater G, Smit A, Smith DR, Spencer B, Stabenau A, Stange-Thomann N, Sugnet C, Suyama M, Tesler G, Thompson J, Torrents D, Trevaskis E, Tromp J, Ucla C, Ureta-Vidal A, Vinson JP, Von Niederhausern AC, Wade CM, Wall M, Weber RJ, Weiss RB, Wendl MC, West AP, Wetterstrand K, Wheeler R, Whelan S, Wierzbowski J, Willey D, Williams S, Wilson RK, Winter E, Worley KC, Wyman D, Yang S, Yang SP, Zdobnov EM, Zody MC, Lander ES. Nature. 2002 Dec 5;420(6915): The house mouse, Mus musculus, has been inextricably linked with humans since the beginning of civilization — wherever farmed food was stored, mice would be found. Many of the advances in twentieth-century biology owe a huge debt to the mouse, which has become the favoured model animal in most spheres of research. With the completion of the draft sequence of its genome published in this issue, the mouse promises to continue to provide us with an essential resource for all aspects of biology. In this timeline, we chart the key events in the history of the mouse that led to this landmark achievement. commentaryMining the mouse genome p512 We have the draft sequence — but how do we unlock its secrets? Allan Bradley news and viewsComparative genomics: The mouse that roared p515 The laboratory mouse has become an indispensable tool for investigators in many areas of biomedical research. The availability of the full mouse genome sequence will immeasurably advance both the character and the pace of discovery. Mark S. Boguski Single nucleotide polymorphisms: Tackling complexity p517 Many traits, including susceptibilities to some diseases, are under complex genetic control. A new way of analysing the mouse genome will be a great help in understanding the interactions involved. Joseph H. Nadeau Functional genomics: A time and place for every gene p518 One benefit of studying mice is that most of their genes have counterparts in humans. Two groups have used this similarity to study when and where the genes found on human chromosome 21 are switched on. Roger H. Reeves articleInitial sequencing and comparative analysis of the mouse genome p520 and Mouse Genome Sequencing Consortium Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs p563 and The FANTOM Consortium and the RIKEN Genome Exploration Research Group Phase I & II Team* letters to natureThe mosaic structure of variation in the laboratory mouse genome p574 Claire M. Wade, Edward J. Kulbokas, III, Andrew W. Kirby, Michael C. Zody, James C. Mullikin, Eric S. Lander, Kerstin LindbladToh and Mark J. Daly doi:10.1038/nature01252 Numerous potentially functional but non-genic conserved sequences on human chromosome 21 p578 Emmanouil T. Dermitzakis, Alexandre Reymond, Robert Lyle, Nathalie Scamuffa, Catherine Ucla, Samuel Deutsch, Brian J. Stevenson, Volker Flegel, Philipp Bucher, C. Victor Jongeneel and Stylianos E. Antonarakis Human chromosome 21 gene expression atlas in the mouse p582 Alexandre Reymond, Valeria Marigo, Murat B. Yaylaoglu, Antonio Leoni, Catherine Ucla, Nathalie Scamuffa, Cristina Caccioppoli, Emmanouil T. Dermitzakis, Robert Lyle, Sandro Banfi, Gregor Eichele, Stylianos E. Antonarakis and Andrea Ballabio A gene expression map of human chromosome 21 orthologues in the mouse p586 and The HSA21 expression map initiative DNA sekvence myšího genomu - IV. 2014 / compared to 2008/ This latest major assembly, GRCm38, was released by the Genome Reference Consor;um in January 2012. It is based on Mus musculus strain C57BL/ 6J. The GRCm38 primary assembly comprises 21 chromosomes and 22 unplaced scaffolds. Similar to the human genome assembly, the Genome Reference Consor;um will be releasing addi;onal sequence for GRCm38 in the form of minor releases (patches). Assembly: GRCm38/mm10, Jan 2012 Genebuild: Ensembl, Jan 2011 Database version: 75.38 Coding genes: 23,148 Non-coding RNA genes: 9,934 Short non-coding genes: 5,860 Long non-coding genes: 4,074 Pseudogenes: 5,935 Gene transcripts: 94,647 Genscan gene predictions: 56,884 Short Variants: 75,968,355 /14,888,174/ Short Variants: 75,968,355 /14,888,174/ Base Pairs: 3,480,955,279 /3,420,842,930/ Golden Path Length: http://www.ensembl.org/Mus_musculus 2,730,871,774 /2,716,965,481/ /49.37b/ /22,010/ /3,014/ /1,190/ /40,466/ /72,043/ Myší genom – význam a struktura Genom – definice – je to veškerá genetická informace organismu. Tato genetická informace je zapsaná v lineární podobě ve formě DNA (u některých virů je to RNA). Obsahuje program s instrukcemi a zakódovanými prostředky pro život a reprodukci jedince. Dávka genomu je rozdílná v somatických a germinálních buňkách (např. diploidní a haploidní). Genom je fyzicky rozčleněn do chromozomů v buněčném jádře. Mitochondriální genom je nejaderný, jeho velikost je u myši 16 303 pb. Typické oblas. myšího chromozomu Myší karyotyp /soubor chromozomů v jádře buňky/ Myš domácí Mus musculus domesticus 20 párů chromozomů 19 párů autozomů + pohlavní chromozomy X a Y Anatomie myších a lidských metafazických chromozomů Metafazické chromozomy, ze sleziny samice, Bunker, M.C. 1965 Homo sapiens Mus mus. domesticus centromery sesterské chromatidy Jaderná DNA - chromozom 17, DNA a chromatin Jaderná DNA v metafázi Chr2 DNAChr8 v interfázi Cell Chr17 DNA HORMAD2 Nucleus http://en.wikipedia.org/wiki/File:Chromatin_Structures.png DNA Chromosome Chromosome Statistics Struktura a funkční oblasti myšího chromozomu 17 Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 http://www.ensembl.org/Mus_musculus/Location/Chromosome?r=17 Chromosome Statistics Struktura a funkční oblasti myšího chromozomu 17 Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 RefSeqGenes _ Complete Chr17 RefSeqGenes &Contigs_ Chr17:18,077,439-18,377,439 http://genome.ucsc.edu/cgi-bin/hgTracks?db=mm10&position=chr17 Chromosome Statistics Struktura a funkční oblasti myšího chromozomu 17 Length (bps) 94,987,271 Coding genes 1,092 (incl. 8 readthrough) Short non coding genes 186 Long non coding genes 157 (incl. 4 readthrough) Pseudogenes 230 Short Variants 2,820,108 http://www.ncbi.nlm.nih.gov/mapview/maps.cgi?taxid=10090&CHR=17 Genomy blízkých druhů jsou podobné, jejich chromozomální členění - karyotyp může být odlišný 2.73 Gb 2.51 Velikosti genomů v Gbp Gbp = 1 000 000 000 pb 3.10 Gb 3.11 3.35 3.10 Anomální karyotyp: strukturní aberace, numerické aberace, Balanced Genomic Translocations, Genome Dosage Imbalance q Aneuploidie - odlišný počet chromozomů oproti normálnímu karyotypu - monozomie, trizomie, tetrazomie, polyploidie (Genome Dosage Imbalance) q Nižší počet chromozomů, který vznikl spojením dvou chromozomů - fúzí jejich centromer - Robertsonovy translokace q Strukturní přestavby chromozomů - reciproké balancované translokace, nebalancované translokace Anomální karyotyp – příklady Normální meiotický crossing-over a segregace alel do gamet Chromozomální translokace Chromozomální translokace Chr16Chr17 „T43H A Anomální karyotypy způsobené translokací T43H ve spermatocytech heterozygotního samce B A. Subchromozomální TRISOMIE B. Reciproká balancovaná translokace proximální části chromozomu 17 s chromozomem 16 CEN& HORMAD2 & SYCP3 DAPI & HORMAD2 & Chr17 Vizualizace jaderné DNA, Chromozomu 17 a proteinu HORMAD2 v pachytenních spermatocytech trisomického samce Ts43H pomocí fluorescenční mikroskopie postupem FISH a imunobarvením Chromozomální translokace „T43H CEN& HORMAD2 & SYCP3 Vizualizace charakteristických proteinových markerů meitoické profáze v pachytenních spermatocytech imunobarvením pomocí fluorescenční mikroskopie ve vysokém rozlišení: Super-resolution image microscopy - Zeiss Axioimager Z.1 platform equipped with the Elyra PS.1 super-resolution system for SR SIM Trisomický samec Ts43H - část jádra pachytenního spermatocytu – synaptomenální komplex (SYCP3) - párování homologních chromosomů XY – pohlavní chromosomy , šipky označují nespárované oblasti autosomálních chromosomů - obsahující translokaci T43H Myší genom: od struktury k funkci Genom /definice/ představuje genetickou informaci organismu. Tato genetická informace je zapsaná v lineární podobě ve formě DNA (nebo RNA u některých virů). Obsahuje program s instrukcemi a zakódovanými prostředky pro život a reprodukci jedince. Dávka genomu je rozdílná v somatických a germinálních buňkách (např. diploidní v somatických buňkách a haploidní v gametách u myši). Genom je fyzicky rozčleněn do chromozomů v buněčném jádře. Typické oblas. myšího chromozomu Geny a jejich regulační segmenty GEN Ø obecná definice celé funkční jednotky, zahrnující kodující nebo „nekodující“ DNA, spolu s nekodujícími regulačními oblastmi, a nekodujícími introny) Ø genomová DNA, která koduje jednotlivý dědičný znak vyjádřený buď ve formě proteinu nebo RNA. Geny a jejich regulační segmenty Typický gen kodující protein v genomu obratlovců Centromery Jsou pro každý chromozom unikátním místem spojení sesterských chromatid Funkce - rozpoznání i oddělení chromatid pomocí kinetochorového proteinového komplexu při mitotickém a meiotickém buněčném dělení Guenatri-2004-JCB Centromery DNA sekvence centromer není mezidruhově konzervována Centromerické repetice u myši mají délku 234 a 120 bp - jde o AT bohatou DNA • majoritní satelitní - délka 234 bp - 70%AT, • 25 000kopií na chromozom, 700 000 kopií/ genom minoritní satelitní - délka 12O bp - 60%AT, 5 000 kopií/ genom, 100 000 kopií/ genom Avšak struktura chromatinu centromer je konzervována u eukaryot: • centrální kinetochorový CenH3 chromatin je z vnějších stran • obklopen repeticemi s asociovaným heterochromatinem tvořeným Swi6HP1 studie na myších buňkách odhalily odlišnou organizaci a odlišné asociované proteiny s minor a major satelitní DNA HP1 marks major satellite domains, whereas CENPs associate minor satellite domains Centromery Centromerická DNA myši se skládá z repetic 234 a 120 bp - jde o AT bohatou sekvenci Struktura centromery myšího akrocentrického chromozomu Red – Minor satelite Green– Major satelite Blue – DNA Metafazické chromozomy Interfazické chromozomy DNA-FISH vizualizece struktury centromer, Guenatri-2004-JCB Telomery q Struktura: telomery jsou tvořeny tandemovými repeticemi obsahující 3-4 guaniny (TTGGGG Tetrahymena TTAGGG myš, člověk) q Funkce: zajišťují chromozomům fyzikální stabilitu, chrání je před zkracováním při jejich replikaci během buněčných dělení q Délka telomer od 300 – 600 bp (kvasinka) 5 až 10 kb (myš, člověk). Telomery Konce chromozomů jsou chráněny komplexem proteinů. TRF1 a TRF2 reorganizují lineární konce chromozomů do smyčky, která konci chromozomu propůjčuje větší fyzikální stabilitu Repetitivní DNA • Transpozibilní DNA • DNA transpozony • RNA transpozony • Satelitní DNA – repetitivní DNA centromer • Mikrosatelitní DNA – rozptýlena v genomu • rDNA – kodující ribosomální RNA Repetitivní DNA-38% genomu myši /u člověka asi 46%/ Transpozony a repetitivní sekvence v myším genomu, lokalizace na chromozomu G-pruhování - barvení Giemsa+trypsin) Ø Ø Ø Ø Transposable elements (TEs) -"jumping genes" or transposons TE move (or jump) from one location in the genome to another Barbara McClintock maize geneticist discovered TEs in the 1940s for decadesTE DNA was called "junk" or „selfish DNA Retrotranspozony § Endogenní retrovirové elementy (LTR retrotranspozony), tvoří 3% genomu § jde o provirovou DNA integrovanou v genomu § za určitých okolností může být provirus aktivován § vyúsťující v transpozici elementu § jeden z genů je však mutován (např. env), proto se nevytvoří virová partikule Repetitivní elementy LINE v LINE-1 repetice (Long Interspersed Nuclear Element), - 500 000 kopií v myším genomu (20%), - velikost 0.5-5 kb - sobecká DNA kodující reverzní transkriptázu, - retrotranspozony schopné se šířit genomem pomocí svého RNA meziproduktu (výskyt v G pruzích = heterochromatin) L1-retrotranspoziční cyklus Repetitivní SINE „Alu elementy - Alu repetice (SINE B1) (Short Interspersed Nuclear Element) - asi 500 000 kopií B1 v genomu (3%) - velikost okolo 300 bp dimerická struktura, jejíž monomery si jsou podobné vznikly nezávisle ze 7SL RNA , (výskyt v R pruzích = euchromatin) - před 100 mil. let byly namnoženy u společného předka hlodavců a primátů Kategorie: AluS, AluJ, AluY mohou vyvolat: - rekombinaci genomové DNA - replikační skluz - CpG metylaci - alternativní splicing DNA transpozony q dlouhé asi 200bp (tvoří asi 1% myšího genomu) q obsahují gen pro transposazu, který je ohraničen z obou stran repetitivními sekvencemi (TIRs) q enzym transposaza detekuje TIRs a vyštěpí unitř integrovaný element (TE) a integruje ho na nové akceptorové místo, vzniklá díra na donorové pozici je pak buď opravena anebo vyplněna další kopií transpozonu Mikro- a mini- satelitní DNA Mikrosatelity – 1 až 6-nukleotidové repetice jsou zřejmě náhodně rozloženy po celém genomu, různé délky od tandemově opakované motivy např. CACACACACACACACA Minisatelity – 10 až 40-nukleotidové repetice a jejich délka se mění od stovek bp po několik kb Mikrosatelity, minisatelity = „koktající genom“ Jejich využití v genotypizaci jedinců: microsatelite markers, fingerprinting Genomika a její dcery Znalost primární DNA sekvence genomů – umožnila rozvoj dlaších oborů: Srovnávací genomika – mezidruhové či mezikmenové vztahy genomů (SNPs, konzervace, detekce ortologů, funkční anotace) Funkční genomika – studuje jak je daná primární DNA sekvence genomu buňkou (organismem) dynamicky interpretována z hlediska transkripce genů, translace a vzájemných interakcí Epigenomika -Epigenetika -zkoumá funkci genomu z hlediska epigenetických vlastností a změn, které jsou dědičné ale nejsou závislé jen na primární DNA sekvenci Systémová biologie – studuje komplexní interakce a integruje mnohostranné přístupy ke studiu určitého druhu (používá genomiku, proteomiku, transkriptomiku a další „-omics“) - je opakem redukcionistického přístupu (jeden gen, -protein, etc...) Doba genomická a post-genomická § - vývoj bioinformatických programů s hlediskem „ high-performance computing pro analýzu obrovských data setů vyprodukovaných novými technologiemi - DNA sekvenování – „příštích generací - HT-NGS - extrémně narůstají požadavky na kapacity pro zpracování a archivaci dat § - vyjímečná role myši jako experimentálního modelu se v blízké budoucnosti jistě potvrdí § - v současné době se díky nově vyvinutým technologiím pro modifikaci myšího genomu (ZnF nucleasy, TALEN, CRISPR) otevřely nové možnosti pro (např.): § ověření funkce genů cílenou mutagenezí § opravu genových mutací § radikální přestavbu genomové struktury § přípravu experimentálních modelů pro studium lidských genetických nemocí (more) Mouse Genomes Project/Sanger Institute 17 representative mouse strains: GOALs: o Complete sequence of multiple inbred strains o Bases for systems biology approach to phenotypic variation in the mouse PUBLICLY AVAILABLE data: § Raw sequence data – Read alignments § de Novo assemblies of genomes § SNPs – Single Nucleotide Polymorphism § Indels – short Insertions and deletions § SVs - Structural Variations § also RNASeq & ChIPSeq data of some tissues DATA Visualization on the Web site: § Query page to search for SNPs, Indels § Lookseq Visualizer to visualize read alignments § DAS Tracks – visualization at Esmble browser o 129P2/OlaHsd (ERP000034) o 129S1/SvImJ (ERP000035) o 129S5SvEvBrd (ERP000036) o A/J (ERP000038) o AKR/J (ERP000037) o BALB/cJ (ERP000039) o C3H/HeJ (ERP000040) o C57BL/6NJ (ERP000041) o CAST/EiJ (ERP000042) o CBA/J (ERP000043) o DBA/2J (ERP000044) o FVB/NJ (ERP000687) o LP/J (ERP000045) o NOD/ShiLtJ (ERP000046) o NZO/HlLtJ (ERP000047) o PWK/PhJ (ERP000048) o SPRET/EiJ (ERP000049) o WSB/EiJ (ERP000050) http://www.sanger.ac.uk/resources/mouse/genomes/ Bioinformatics and statistics EXAMPLE of SOLUTION: R is a freely available language and environment for statistical computing and graphics which provides a wide variety of statistical and graphical techniques: linear and nonlinear modelling, statistical tests, time series analysis, classification, clustering, etc. q POSSIBILITIES : o Quality control of sequencing reads o Data handling and visualization o Genomic mapping o Statistical concepts for data analysis o RNA-seq data analysis o ChIP-seq data analysis o Functional analyses REFERENCE • Myší Genom – struktura-funkce, analýza genomickýckých dat ü Jean-Louis Guenet (2005): The mouse genome, Genome Research, 15:1729-1740 ü Lee M. Silver (1994): Mouse Genetics, Oxford Univ. Press http://www.informatics.jax.org/silverbook ü M.Cline, J.Kent (2009): Understanding genome browsing, Nature biotechnology, 27:153-155. ü Eric S. Lander (2011): Initial impact of the sequencing of the human genome. Nature, 470: 187-197. Review. ü Next-generation sequencing of experimental mouse strains. Mammalian genome : official journal of the International Mammalian Genome Society 2012;23;910;490-8 WEB sites: Myší genom struktura - funkce a bioinformatika q q q q q q JAX Ensembl NCBI UCSC Sanger Inst. IMG-MMG http://jaxmice.jax.org/ http://www.ensembl.org/ http://www.ncbi.nlm.nih.gov/ http://genome.ucsc.edu/ http://www.sanger.ac.uk/resources/mouse/genom http://www.img.cas.cz/mmg/ Příklady bioinformatických úkolů a programů pro jejich řešení: http://www.broadinstitute.org/scientific-community/software?page=1 q Annotation - Ensembl, Artemis, Eponine, Argo, GeneCruiser q Alignment to genome – Bowtie, TopHat, BLAST, BLAT, Trinity q Whole-genome assembly - SSAHA, SMALT, Arachne, Allpaths, Vicuna q Gene expression - Gene Pattern q RNA-seq - Trinity, Inchworm q ChIP-seq - EdgeR=Bioconductor R-package q RNAi - GenE, GenePattern q Phylogenetic Analysis - Tree Chopper
Podobné dokumenty
M - Brumov
daly podnět na pracovníky Města BrumovBylnice k řešení nepovoleného úložiště stavebního odpadu v lokalitě Hliníky
v k.ú. Bylnice.
V této souvislosti upozorňujeme občany,
že bylo společně se zástupc...
Základy léka řské genetiky
tehdy, pokud jen jeden chromozom z páru nese
mutantní alelu, ačkoliv na druhém chromozomu je
alela normální); nebo recesivní (projeví se pouze
tehdy, když oba chromozomy z páru nesou mutantní
alelu).
Produkce modelů laboratorních zvířat společnosti HARLAN [PDF, 0
BALB/cOlaHsd
BiozziABH/RijHsd
C3H/HeNHsd
C57BL/6JOlaHsd
C57BL/6JRccHsd
C57BL/6NHsd
C57BL/10ScNHsd
C57BL/10ScSnOlaHsd
C57BL/KaLwRijHsd
CBA/CaOlaHsd
CBA/JCrHsd
DBA/1OlaHsd
DBA/2JRccHsd
DBA/2NHsd
DBA/...
Možnosti využití DNA čipů v molekulární diagnostice dědičných
vyústila ve vývoj DNA čipů – neboli microarrays. DNA
mikročipy mohou být efektivně využity pro detekci mutací a polymorfismů, sekvenační analýzy či studie genové exprese [1]. Široké uplatnění mohou...
Cytogenetika-09-Aberace
inhibuje reparaci DNA, což vede k další nestabilitě genomu. K léčbě se používají
inhibitory tyrosin kinázy.
Označení Ph chromosomu (t(9;22)(q34.1;q11.2) znamená translokace
podproužku 1 z proužku 4...
Produkce modelů laboratorních zvířat společnosti TACONIC [PDF, 0
CRE-Luc* GPCR Reporter Mouse, Line 11
CRE-Luc* GPCR Reporter Mouse, Line 64
CRE-Luc* GPCR Reporter Mouse, Line 187
Cyp1a1/1a2 Knockout Mouse
Cyp2c Knockout Mouse
Cyp2d Knockout Mouse
Cyp3a (7-gene)...
Výroční zpráva MBU_2015 - Mikrobiologický ústav AV ČR, vvi
k podávaným patentům a anotace projektů připravených k podání do veřejných
soutěží. Rada MBÚ schválila převedení finančních prostředků ve výši 1.337.958,Kč po zdanění, získané prodejem cyklotronu ...
Základy lékařské genetiky
4) Vybrat způsob, jakým se bude situace řešit,
s ohledem na to, aby jim nejvíce vyhovoval, z hlediska
rizik, cílů rodiny a jejích etických náboženských priorit;
Prednaska 1_2014 - Laboratory of Mouse Molecular Genetics
systém pro studium funkce savčích/lidských genů a
2009 - Fyziologický ústav AV ČR
rosiglitazonu a omezila riziko vzniku nežádoucích vedlejších účinků
terapie.
Kuda O, Jeleník T, Jílková Z, Flachs P, Rossmeisl M, Hensler M, Kazdová L,
Ogston N, Baranowski M, Gorski J, Janovská P,...