Chemoinformatická úloha 3
Transkript
Chemoinformatická úloha 3 - základní informace Predikce fyzikálních, chemických a biologických vlastností molekuly pomocí QSPR QSPR (Quantitative Strucutre-Property Relationship): Metoda, která modeluje (predikuje) fyzikální, chemické a biologické vlastnosti molekuly na základě struktury molekuly. Vstup: Strukturní deskriptory. Výstup: Fyzikální, chemické nebo biologické vlastnosti molekuly Obecný vztah pro QSPR modely: vlastnost = funkce (deskriptory) Příklad QSPR modelu: log (1/C) = k1.logP + k2.σ + k3 kde: C je koncentrace molekuly nutná k vyvolání základní reakční odezvy P je rozdělovací koeficient mezi vodou a 1-oktanolem (lze predikovat na základě struktury) σ je Hammetův substituční parametr k1, k2 a k3 jsou konstanty 2 Typy strukturních deskriptorů Typ deskriptoru 3 Informace, nutné Příklad struktury, nutné pro pro výpočet výpočet deskriptoru deskriptoru C7H5NO3S Příklad deskriptorů Počet atomů Molekulová hmotnost 1D Počet atomů a vazeb 2D Topologie molekuly (které atomy jsou vázány s kterými jakou vazbou) Počet cyklů Počet vazeb 2D fingerprinty Tanimotův koeficient 3D Geometrie molekuly (polohy atomů v prostoru) Povrch molekuly Vzdálenost mezi atomy Torzní úhly Závislost mezi deskriptorem a vlastností Příklady možných závislostí mezi deskriptorem a vlastností: Kvadratická závislost Deskriptor Nezávislé Vlastnost Vlastnost Vlastnost Lineární závislost Deskriptor Deskriptor Pro QSPR modely je nutno, aby závislost mezi deskriptorem a vlastností byla lineární Míra (kvalita) lineární závislosti The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again. Míra (kvalita) lineární závislosti je popsána Pearsonovým korelačním koeficientem R, tedy přesněji řečeno jeho druhou mocninou R2. R2 popisuje, jak se závislost mezi deskriptorem a veličinou blíží ideální lineární závislosti (= body ležící na přímce). Pearsonův koeficient vypočítáme dle vztahu: N R= ∑ (Vlastnost i =1 N ∑ (Vlastnost i − Vlastnost _ AVG )( . Deskriptori − Deskriptor _ AVG ) 2 i 2 − Vlastnost _ AVG ) .(Deskriptori − Deskriptor _ AVG ) i =1 Kde N je počet molekul, Vlastnost_AVG je průměrná hodnota vlastností všech molekul a Deskriptor_AVG je průměrná hodnota deskriptorů všech molekul. Pokud body leží na přímce, je R2 rovno 1. Čím více jsou body rozptýleny, tím více se hodnota R2 blíží 0. Ukázky R2 pro různé závislosti: Obecná rovnice pro QSPR model a parametrizace QSPR model je popsán rovnicí: vlastnost = parametr1 . deskriptor1 + parametr2 . deskriptor2 + ... + parametrn . deskriptorn + parametr Parametry jsou reálná čísla. Parametry určujeme na základě známých (nejčastěji experimentálně zjištěných) hodnot vlastností. Pro výpočet parametrů (neboli parametrizaci) používáme vícerozměrnou lineární regresi. Principem této metody je minimalizace odchylky vlastností vypočítaných pomocí QSPR modelu od známých hodnot vlastností.
Podobné dokumenty
ISDS_Instrukce pro vývojáře - SHA
autoritou GeoTrust, v jejichž podpisu je použita hashovací funkce SHA-1. Ve veřejném testovacím prostředí ISDS
(www.czebox.cz) je v tuto chvíli již nasazen nový certifikát založený na SHA-256.
Důle...
CSS reference
Syntaxe jednotlivých atributů v tomto dokumentu je zobrazena neproporcionálním písmem (Courier New). Klíčová slova, která je
potřeba zapsat tak jak jsou uvedena v tomto dokumentu jsou psána tučně, ...
Matematika 1 - wiki skripta fjfi
kde ak jsou komplexnı́ čı́sla pro všechny indexy k = 0, 1, . . . , n. Pokud an je nejvyššı́ nenulový
koeficient polynomu (tj. ak = 0 pro všechna k > n), řı́káme, že takový polynom má stu...
Zpracování řeči
interpretace P.
• Posluchač to zjistı́ a proto řeč interpretuje jako P.
Tj. k řešenı́ nejednoznačnosti pomůže model světa, řečnı́ka,
jazykový či akustický model.
Drug design - Racionální návrh léčiv - Biotrend
Oslu.
Léčiva jsou t íděna do skupin podle účinků na jednotlivé orgány a jejich soustavy,
farmakologického působení a chemické struktury. Na základě tohoto t ídění je jim p idělen
sedmimístný kód v ...
Nové poznatky v ekozemědělství
Nové poznatky v ekozemědělství
V polovině listopadu proběhla v Praze na půdě České zemědělské univerzity 3. mezinárodní vědecká konference ekologického zemědělství, kterou uspořádala
Česká technolo...
VOLÁNÍ 155 PŘI VZNIKU CMP: ŽÁDNÁ ZMĚNA CHOVÁNÍ JAKO
• V roce 2005 by respondenti volali 155 pro
27% příznaků CMP, což je přesně stejné
číslo jako v roce 2009 (p=0.76).
• Pouze 18% respondentů v roce 2005 by
volalo 155 pro >50% všech příznaků CMP
uve...