BI aplikace-výrobní linka IBM
Transkript
Výrobní linka IBM pro aplikace BI Výrobní linka IBM aplikací Business Intelligence Základní popis produktů a jejich využití 2010 MF Servis s.r.o. Hradec Králové duben 2010 Strana 1 Výrobní linka IBM pro aplikace BI Obsah : 1. CO JE BUSINESS INTELLIGENCE ? ................................... 4 1.1 ÚVOD .............................................................................................................................................. 4 ZÁKLADNÍ POJMY BI ........................................................................................................................ 5 1.2 1.2.1 Provozní data ............................................................................................................................... 5 1.2.2 OLTP ........................................................................................................................................... 5 1.2.3 Data Warehouse (DW - datový sklad)........................................................................................... 5 1.2.4 Data Mart (datové tržiště)............................................................................................................. 5 1.2.5 Externí zdroje dat ......................................................................................................................... 5 1.2.6 ETL (Extraction, Transformation, Loading).................................................................................. 5 1.2.7 OLAP ........................................................................................................................................... 5 1.2.8 Metadata ...................................................................................................................................... 6 1.2.9 Drill-down .................................................................................................................................... 6 1.2.10 Roll-up ....................................................................................................................................... 7 1.2.11 Slice & Dice ............................................................................................................................... 7 1.2.12 Data mining (dolování dat) ........................................................................................................ 7 2. VÝROBNÍ LINKA IBM PRO APLIKACE BI ......................... 8 2.1 2.2 2.3 2.4 2.5 IBM DB2 ......................................................................................................................................... 8 IBM INFOSPHERE WAREHOUSE (IW) ................................................................................................ 8 IBM INFOSPHERE BALANCED WAREHOUSE (IBW) ............................................................................ 9 IBM INFOSPHERE INFORMATION SERVER (IIS) ................................................................................. 9 IBM COGNOS BUSINESS INTELLIGENCE (CBI) .................................................................................. 9 3. IBM INFOSPHERE WAREHOUSE ....................................... 10 3.1 INFOSPHERE WAREHOUSE – PŘEHLED PRODUKTŮ .............................................................................10 3.1.1 InfoSphere Warehouse Starter Edition (IWSE) ............................................................................10 3.1.2 InfoSphere Warehouse Intermediate Edition (IWIE) ....................................................................10 3.1.3 InfoSphere Warehouse Advanced Edition (IWAE) .......................................................................10 3.1.4 InfoSphere Warehouse Base Edition (IWBE) ...............................................................................11 3.1.5 InfoSphere Warehouse Enterprise Edition (IWEE) ......................................................................11 3.1.6 InfoSphere Warehouse Developer Edition (IWDE) ......................................................................12 3.1.7 IBM Base Warehouse Feature for DB2 .......................................................................................12 3.1.8 IBM Enterprise Warehouse Feature for DB2...............................................................................12 INFOSPHERE WAREHOUSE - ARCHITEKTURA .....................................................................................12 3.2 INFOSPHERE WAREHOUSE - PLATFORMY .........................................................................................13 3.3 INFOSPHERE WAREHOUSE – TECHNOLOGICKÉ KOMPONENTY ............................................................14 3.4 3.4.1 DB2 Enterprise Server Edition (ESE)..........................................................................................14 3.4.2 Design Studio .............................................................................................................................14 3.4.3 SQL Warehousing Tool ...............................................................................................................14 3.4.4 Administration Console ..............................................................................................................15 3.4.5 Cubing Services ..........................................................................................................................15 3.4.6 Query Patroller (QP) ..................................................................................................................16 3.4.7 Performance Expert (PE)............................................................................................................17 3.4.8 DB2 Storage Optimization Feature .............................................................................................17 3.4.9 Alphablox (AB) ...........................................................................................................................17 Data mining a vizualizace ......................................................................................................17 3.4.10 Analýza nestrukturovaného textu.............................................................................................18 3.4.11 DB2 Workload Management ...................................................................................................18 3.4.12 WebSphere Application Server................................................................................................19 3.4.13 Cognos 8 BI Starter Edition ....................................................................................................19 3.4.14 Přehled komponent jednotlivých InfoSphere Warehouse Editions ............................................20 3.4.15 4. IBM INFOSPHERE BALANCED WAREHOUSE ............... 21 4.1 INFOSPHERE WAREHOUSE – TECHNOLOGICKÉ KOMPONENTY ............................................................21 Strana 2 Výrobní linka IBM pro aplikace BI 4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 InfoSphere Balanced Warehouse C1000......................................................................................21 InfoSphere Balanced Warehouse C3000......................................................................................21 InfoSphere Balanced Warehouse C4000......................................................................................22 InfoSphere Balanced Warehouse D5100 .....................................................................................22 InfoSphere Balanced Warehouse E7100 ......................................................................................23 5. IBM INFOSPHERE INFORMATION SERVER ................... 24 5.1 INFOSPHERE INFORMATION SERVER – INTEGRACE INFORMACÍ, DATOVÉ SKLADY ...............................24 5.1.1 InfoSphere Information Analyzer (IIA) ........................................................................................24 5.1.2 InfoSphere Business Glossary (IBG) ...........................................................................................25 5.1.3 InfoSphere QualityStage (IQS) ....................................................................................................25 5.1.4 InfoSphere DataStage (IDS).......................................................................................................25 5.1.5 InfoSphere Federation Server (WFS)..........................................................................................26 5.1.6 InfoSphere Replication Server (WRS) .........................................................................................26 5.1.7 Datové zdroje .............................................................................................................................27 5.1.8 Platformy ...................................................................................................................................27 RATIONAL DATA ARCHITECT (RDA) – DATOVÉ MODELOVÁNÍ .........................................................28 5.2 DALŠÍ INFORMACE ...........................................................................................................................28 5.3 6. IBM COGNOS BUSINESS INTELLIGENCE ...................... 29 6.1 6.2 6.3 6.4 6.5 COGNOS COGNOS COGNOS COGNOS COGNOS 8 REPORTING ....................................................................................................................29 8 ANALYSIS ......................................................................................................................30 8 SCORECARDING ..............................................................................................................31 8 DASHBOARDS.................................................................................................................31 8 DATOVÁ INTEGRACE PRO SAP R/3 ..................................................................................32 Strana 3 Výrobní linka IBM pro aplikace BI 1. CO JE BUSINESS INTELLIGENCE ? 1.1 Úvod Termín Business Intelligence (BI) nepopisuje pouze samotný proces obchodování, ale zabývá se způsoby jak zlepšit, usnadnit a zrychlit rozhodovací procesy. Ve vztazích lidí a firem v ekonomice, logistice, výrobě, obchodu a dalších aktivitách vznikají každý den enormní objemy informací: data o objednávkách, inventurách, účtování, platebních transakcích a samozřejmě o zákaznících. Mimo to jsou také shromažďována nestrukturovaná data jako například dokumenty a audiovizuální objekty a data z vnějších zdrojů. Bohužel však více jak 90% celkového objemu dat dnes není v automatizované podpoře procesu rozhodování použito. Metody konsolidace, organizace a analýzy dat pro dosažení vyšší kvality rozhodování mohou přinášet kompetitivní výhody a učí uživatele, jak tyto výhody odkrývat a využívat je. To je smysl aplikací BI. BI řešení IBM neznamená jen rozsáhlejší a lepší technologii – účelem je přinášet důmyslné informace a postupy koncovým uživatelům. BI transformuje informace do znalostí; aplikace BI dávají správné informace ve správný čas do rukou kompetentních uživatelů a podporují tak jejich rozhodování. Aplikace typu Business Intelligence jsou důležitým článkem IT infrastruktury organizace tím, že vytvářejí podmínky pro realizaci zpětných vazeb jejich procesů řízení. IT infrastruktura organizace Typickými BI aplikacemi jsou: • analýza obchodních aktivit a trhu • analýza profitability podnikání • analýza dodavatelsko-odběratelských vztahů Strana 4 Výrobní linka IBM pro aplikace BI • možnosti plánování a tvorby rozpočtů Oddělení využívající systém BI mezi prvními je marketing a obchod, kde BI systém může pomoci efektivně odpovídat podobné typy dotazů: • Kteří zákazníci přinášejí největší zisky a jak je možné prohloubit s nimi obchodní vztahy ? • Pro které produkty a služby lze rozšířit prodej stávajícím zákazníkům a kterým ? • • Které prodejní kanály jsou nejefektivnější a pro které produkty ? Která kampaň měla nejlepší finanční výsledek ? 1.2 Základní pojmy BI 1.2.1 Provozní data Provozní data jsou detailní data o ekonomických, logistických, výrobních nebo obchodních činnostech. Data vznikají převážně provozem podnikových informačních systémů typu OLTP (On-Line Transaction Processing). 1.2.2 OLTP OLTP je způsob zpracování dat uživatelem nebo počítačovým systémem. Zpracování je zaměřeno na opakovanou aktualizaci detailních dat s velkým objemem změn. 1.2.3 Data Warehouse (DW - datový sklad) Datový sklad je databáze, kde jsou shromažďována, organizována a vytvářena data pro účely analýzy. 1.2.4 Data Mart (datové tržiště) Datové tržiště obsahuje podmnožinu struktury a obsahu datového skladu organizace vyčleněnou podle konkrétního úseku, oddělení nebo skupiny uživatelů. 1.2.5 Externí zdroje dat Externí data jsou data mimo OLTP systémy potřebná pro tvorbu datového skladu. 1.2.6 ETL (Extraction, Transformation, Loading) ETL procesy jsou datové pumpy pro přenos zdrojových dat (provozních dat z OLTP systémů nebo z dat externích) do datového skladu. Datové pumpy provádějí načtení zdrojových dat, jejich transformaci a nahrání do databáze datového skladu. Výkon ETL nástrojů podstatně ovlivňuje výkon a tím užitnou hodnotu datového skladu. Plnění skladu probíhá dávkově. Data z provozních databází a jiných datových úložišť jsou načítána periodicky, např. každý den po pracovní době. Jejich načítání probíhá selektivně, dochází ke čtení pouze těch dat, která mají pro uložení v datovém skladu a následnou analýzu smysl. Získaná data se transformují do podoby, v jaké jsou následně uložena v datovém skladu. V průběhu transformace probíhá vyčištění dat od chybných, nekompletních, či irelevantních záznamů a hodnot. 1.2.7 OLAP On-Line Analytical Processing (OLAP) je SW technologie umožňující analytikům, manažerům i výkonným pracovníkům získat informace o datech rychle a interaktivně z různých pohledů. Tato data uložená v datovém skladu byla vytvořena transformací provozních dat. OLAP funkcionalita je charakterizována jako dynamická multidimenzionální (MD) analýza konsolidovaných dat. MD struktura je organizována tak, že každá datová položka typu „fakt“ Strana 5 Výrobní linka IBM pro aplikace BI (například množství nebo cena produktu) je lokalizována a zpřístupněna jako průnik položek typu „dimenze“ (například dimenze času, regionu, typu produktu). Nejčastější organizací je struktura hvězdy. OLAP server a struktury dat jsou optimalizovány pro rychlé vyhledávání „ad hoc“ informací i pro výpočty a transformace dat podle libovolné dimenze. OLAP server využívá data uložená v proprietární MD struktuře (MOLAP), v relační databázi (ROLAP) nebo s využitím kombinace obou způsobů (HOLAP). Struktura hvězdy 1.2.8 Metadata Metadata jsou druh informací, které popisují data uložená v databázi a obsahují tyto charakteristiky: • popis tabulek a polí v datovém skladu včetně datových typů a rozsahu přípustných hodnot • popis tabulek a polí ve zdrojových databázích s mapováním polí ze zdroje do datového skladu • popis způsobu transformace dat včetně formátování, konverze měny, struktury času apod. • jakékoli jiné informace potřebné pro podporu a provoz datového skladu 1.2.9 Drill-down Drill-down je schopnost postupovat do hloubky a detailu datové struktury podle popisu její hierarchie. Strana 6 Výrobní linka IBM pro aplikace BI 1.2.10 Roll-up Roll-up je schopnost postupovat do více agregované úrovně datové struktury podle popisu její hierarchie. Jdo o opačný postup než drill-down. 1.2.11 Slice & Dice Slice & Dice je schopnost otáčení datovou strukturou a volba zobrazovaného řezu napříč daty 1.2.12 Data mining (dolování dat) Dolování dat je proces výběru platných, využitelných, dříve neznámých a komplexních informací z datového skladu a jejich použití pro rozhodování. Tyto procesy kategorie „knowledge management“ pomáhají využívat informace skryté v datech, jejich nepředvídané souvislosti, vzory a trendy, které mohou vést ke konkurenčním výhodám uživatele. Strana 7 Výrobní linka IBM pro aplikace BI 2. VÝROBNÍ LINKA IBM PRO APLIKACE BI Technologie a produkty IBM pro tvorbu, provoz a údržbu aplikací Business Intelligence pokrývají všechny fáze životního cyklu těchto aplikací. Tento soubor produktů můžeme nazvat výrobní linkou pro aplikace BI. 2.1 IBM DB2 IBM DB2 je víceuživatelský databázový systém pro malé i rozsáhlé konfigurace od uniprocesorů k největším koncentracím SMP na platformách Windows, Linux, AIX, HP-UX a Solaris. DB2 je hybridní datový server pro zpracování relačních dat a dat ve formátu XML. DB2 je základním nástrojem DW, je nositelem obsahu a struktury datového skladu, zajišťuje optimalizaci jeho provozu v souvislosti s rostoucím objemem dat, náročností ad-hoc i předzpracovaných dotazů a rostoucím počtem současně přistupujících uživatelů. Pro velké datové sklady je určena technologie DB2 Database Partitioning Feature umožňující „SMP clustering“ a vytváření paralelních databázových architektur typu „shared-nothing“. DB2 je pro tvorbu a provoz BI aplikace vybavena důležitými vlastnostmi například: • operátory standardních příkazů SQL jako CUBE, ROLLUP, GROUPING SET • star-join algoritmus s dynamickými bitmapovými indexy • MultiDimenzionální Clustering (MDC) • Materialized Query Tables (MQT) Další informace : http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43 2.2 IBM InfoSphere Warehouse (IW) IBM InfoSphere Warehouse Edition (IW) je sada produktů a technologií, která je určena pro komplexní řešení tvorby, údržby a provozu datových skladů, podporu OLAP technologií a dolování dat nad databází DB2. Strana 8 Výrobní linka IBM pro aplikace BI 2.3 IBM InfoSphere Balanced Warehouse (IBW) IBM InfoSphere Balanced Warehouse (IBW) je kompletní řešení datových skladů obsahující o předem otestované, škálovatelné a plně integrované systémové komponenty software a hardware : InfoSphere Warehouse, IBM server, respektive IBM diskové pole 2.4 IBM InfoSphere Information Server (IIS) IBM InfoSphere Information Server (IIS) je základní platformou IBM pro integraci dat; jde o sadu produktů a technologií, která provádí analýzu, čištění a integraci informací z heterogenních zdrojů. IIS je robustní a škálovatelná technologie vhodná pro tvorbu a provoz rozsáhlých datových skladů. V kombinaci s IW poskytuje IIS produktivní a robustní prostředí pro tvorbu náročných aplikací typu Business Intelligence (BI), které podporují rozhodovací procesy v organizacích. 2.5 IBM Cognos Business Intelligence (CBI) Cognos Business Intelligence (CBI) je produkt patřící do kategorie BI, který obsahuje nástroje na zpracování různých typů analytických požadavků uživatelů: tvorbu reportů a analýz, výstupů typu scorecarding a dashboards. Cognos Business Intelligence je technologie využívající data datových skladů, která jsou zde připravena ve formě vhodné pro projektování analytických aplikací uživatelů. Propojení produktů IIS respektive IW pro tvorbu a provoz datových skladů s analytickými schopnostmi produktu CBI je ideální výrobní linkou společnosti IBM pro vývoj a provoz aplikací BI - aplikací pro podporu rozhodovacích činností organizací. Strana 9 Výrobní linka IBM pro aplikace BI 3. IBM INFOSPHERE WAREHOUSE 3.1 InfoSphere Warehouse – přehled produktů Produkt InfoSphere Warehouse (IW) je distribuován v těchto edicích: 3.1.1 InfoSphere Warehouse Starter Edition (IWSE) IWSE je technologie datového skladu určená pro malé a střední aplikace na Linuxu a Windows do 20 - 50 uživatelů na server v prostředí jednoho výpočetního nodu. IWSE obsahuje tyto komponenty: • DB2 Enterprise Server Edition (ESE) pro Linux a Windows • SQL Warehousing Tool • Administration Console • Design Studio • Cubing Services • DB2 Database Partitioning Feature (DPF) • WebSphere Application Server Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/starter.html 3.1.2 InfoSphere Warehouse Intermediate Edition (IWIE) IWIE je technologie určená pro větší a střední aplikace datového skladu (SMB) na Linuxu a Windows v rozsahu do 32 GB dat a výpočetním výkonu 400 Procesor Value Unit (PVU) v prostředí jednoho nebo více výpočetních nodů. IWIE obsahuje tyto komponenty: • DB2 Enterprise Server Edition (ESE) pro Linux a Windows • SQL Warehousing Tool • Administration Console • Design Studio • Cubing Services • DB2 Database Partitioning Feature (DPF) • WebSphere Application Server Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/intermediate.html 3.1.3 InfoSphere Warehouse Advanced Edition (IWAE) IWAE je technologie určená pro větší aplikace datového skladu (SMB) pro průmyslové a střediskové zákazníky na Linuxu v rozsahu do 2 TB dat a výpočetním výkonu 1000 PVU v prostředí jednoho nebo více výpočetních nodů. Pro zákazníky s velikostí datového skladu více než 2 TB je doporučen produkt InfoSphere Warehouse Enterprise Edition. IWAE obsahuje tyto komponenty: • DB2 Enterprise Server Edition (ESE) pro Linux • SQL Warehousing Tool • Administration Console • Design Studio • Cubing Services • DB2 Database Partitioning Feature (DPF) • DB2 Query Patroller • Workload Management Strana 10 Výrobní linka IBM pro aplikace BI • • • 3.1.4 Performance Expert DB2 Storage Optimization Feature WebSphere Application Server InfoSphere Warehouse Base Edition (IWBE) IWBE je určena pro organizace, které právě začínají vytvářet aplikace datových skladů. Poskytuje stejnou funkcionalitu jako produkt IWIE, ovšem bez jeho omezení. Obsahuje databázi DB2 a integrovanou schopnost tvorby a zpracování datových struktur OLAP. IWBE umožňuje optimalizaci výkonu OLAP aplikací partnerů IBM (Cognos. Business Objects, MicroStrategy,…). IWBE obsahuje tyto komponenty: • DB2 Enterprise Server Edition (ESE) pro Linux • SQL Warehousing Tool • Administration Console • Design Studio • Cubing Services • DB2 Database Partitioning Feature (DPF) • WebSphere Application Server • Cognos 8 BI Starter Edition Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/base.html 3.1.5 InfoSphere Warehouse Enterprise Edition (IWEE) IWEE poskytuje komplexní platformu pro aplikace BI zahrnující vše, co zákazníci potřebují k rozmístění a partneři k vybudování náročných řešení rozsáhlých datových skladů a tržišť. Tato výkonná platforma zahrnuje databázi DB2, technologii tvorby a údržby datového skladu, rozdělování dat (data partitioning), správu integrovaných metadat pro aplikace OLAP, špičkové dolování dat (data mining), nástroj pro tvorbu a provoz ETL procesů a správu pracovního zatížení. IWEE zajišťuje optimalizaci výkonu analytického produktu DB2 Alphablox a OLAP aplikací partnerů IBM (Cognos. Business Objects, MicroStrategy, …). IWEE obsahuje tyto komponenty: • • • • • • • • • • • • • • • • DB2 Enterprise Server Edition (ESE) pro Linux SQL Warehousing Tool Administration Console Design Studio Cubing Services DB2 Database Partitioning Feature (DPF) DB2 Query Patroller Workload Management Performance Expert DB2 Storage Optimization Feature DB2 Alphablox včetně Blox Builder Intelligent Miner, Modeling, Scoring a Miningblox Analýza nestrukturovaného textu WebSphere Application Server InfoSphere Federation Server Relational Wrappers Cognos 8 BI Starter Edition Strana 11 Výrobní linka IBM pro aplikace BI Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/enterprise.html 3.1.6 InfoSphere Warehouse Developer Edition (IWDE) IWDE má stejný obsah a funkčnost jako IWEE. Licencování produktu je vázáno pouze na vývoj, předvádění a testování aplikačních programů datových skladů. 3.1.7 IBM Base Warehouse Feature for DB2 Produkt je základní nabídkou technologie tvorby datových skladů v DB2. Obsahuje nástroje pro tvorbu robustních datových skladů od vývoje datového modelu k optimalizaci dat pro analýzy OLAP. Součástí jsou všechny komponenty, které obsahuje InfoSphere Warehouse Base Edition s výjimkou produktu DB2 Enterprise Server Edition : • SQL Warehousing Tool • Administration Console • Design Studio • Cubing Services • Range partitioning • Multidimensional clustering • DB2 Database Partitioning Feature (DPF) - DPF lze využít pro tvorbu a správu nesdílených datových oblastí (partitions) DB2, což poskytuje prakticky neomezenou škálovatelnost databázového serveru DB2. Další informace : http://www-01.ibm.com/common/ssi/cgibin/ssialias?infotype=AN&subtype=CA&htmlfid=897/ENUS207-297&appname=USN 3.1.8 IBM Enterprise Warehouse Feature for DB2 Produkt je řešením pro tvorbu a provoz průmyslových datových skladů, které vyžadují sofistikované nástroje. Obsahuje produkt IBM Base Warehouse Feature for DB2 a dále důležité nástroje pro optimalizaci, škálování výkonu datového skladu, analýzu nestrukturovaného textu a data mining. Tento produkt je tedy obsahově shodný s InfoSphere Warehouse Enterprise Edition s tím, že neobsahuje produkt DB2 Enterprise Server Edition. Mimo nástroje produktu IBM Base Warehouse Feature for DB2 navíc verze Enterprise obsahuje : • • • • • Storage Optimization Feature Performance Optimization Feature (POF). o Query patroller. o Workload management. o Performance expert. Alphablox. Analýza nestrukturovaného textu Intelligent Miner Další informace : http://www-01.ibm.com/common/ssi/cgibin/ssialias?infotype=AN&subtype=CA&htmlfid=897/ENUS207-297&appname=USN 3.2 InfoSphere Warehouse - architektura IWE má vícesložkovou architekturu, kde jednotlivé složky jsou rozděleny do tří logických skupin : • • Data Warehouse Server Application Server Strana 12 Výrobní linka IBM pro aplikace BI • Client Data warehouse server zahrnuje produkty DB2 Enterprise Server Edition, DB2 Query Patroller, Cubing Services a Data Mining (Intelligent Miner). Application server zahrnuje produkty WebSphere Application Server, InfoSphere Warehouse Administration Console, SQL Warehousing Tool, Alphablox a Miningblox. Administration Console vyžaduje buď DB2 server nebo klienta. Client zahrnuje produkty Design Studio, IBM Data Server Client, Query Patroller center, Intelligent Miner Visualization a Miningblox. Navíc je možno nainstalovat dokumentaci InfoSphere Warehouse včetně InfoSphere Warehouse Tutorial s jakoukoli z těchto skupin podle operačního systému. Složky IWE poskytují integrovanou platformu pro tvorbu a administraci datových skladů a pro vývoj navazujících analytických aplikací včetně webového rozhraní s vloženou funkcionalitou technologií OLAP a data mining. Struktura členění jednotlivých složek je zřejmá z následujícího obrázku. 3.3 InfoSphere Warehouse - platformy Linux • Red Hat Enterprise Linux (RHEL) v4, v5 - 64bit • SUSE Linux Enterprise Server (SLES) v9, v10 - 64bit Strana 13 Výrobní linka IBM pro aplikace BI Windows • Windows Server 2003, Standard Server, Enterprise Server a Datacenter Edition 32/64 bit AIX • AIX v5.3, v6.1 - 64bit Solaris • Solaris v9, v10 for UltraSPARC servery - 64bit Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/ 3.4 InfoSphere Warehouse – technologické komponenty 3.4.1 DB2 Enterprise Server Edition (ESE) DB2 Enterprise Server je škálovatelný, víceuživatelský, relační databázový systém, který může být využit k tvorbě a správě datových skladů, aplikací OLAP, aplikací transakčního zpracování (OLTP) a aplikací data mining. DB2 ESE mimo jiné zajišťuje následující funkce : • podpora pro lokální a vzdálené klienty DB2 • vzdálená administrace DB2 serverů • použitím DB2 Connect, samostatného produktu, lze zpřístupnit data uložená na DB2 pro iSeries, z/OS Další informace : http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43#db2ese 3.4.2 Design Studio Design Studio je prostředí pro tvorbu a údržbu datových modelů, kostek OLAP, modelů data mining, návrh a řízení ETL SQL procesů a analytických aplikací Blox Builder. Prostředí je založeno na vývojovém prostředí technologie Eclipse. Design Studio využívá tyto nástroje a vlastnosti : • • • • • • • Integrované datové modelování založené na produktech IBM Data Server Developer Workbench a Rational Data Architect (RDA) Návrh toku dat a řízení toku dat při plnění datového skladu založené na jazyku SQL Nástroje pro data mining, zkoumání a vizualizaci dat Nástroje pro návrh OLAP metadat, Materialized Query Tables (MQTs) a modelů kostek IBM Alphablox Blox Builder pro vývoj uživatelských analytických aplikací Nástroje pro definici, validaci a monitorování Workload Management Systému (WMS), který generuje objekty DB2 Workload Manageru z kódu SQL Možnost integrace s ETL systémem InfoSphere Data Stage V rámci Design Studia lze využít technologii produktu IBM Rational Data Architect k tvorbě, modifikování a generování DDL pro fyzické datové modely. Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/designstudio.html 3.4.3 SQL Warehousing Tool SQL Warehousing Tool (SQW) je grafický nástroj pro generování ETL skriptů SQL pro tvorbu, údržbu a administraci datového skladu, který nahrazuje manuální kódování SQL. SQW na základě v Design Studiu navrženého vizuálního toku dat generuje automaticky SQL. SQW rovněž spolupracuje s IBM produktem InfoSphere DataStage. Vývojáři datových skladů používají SQW v rámci Design Studia pro tvorbu : Strana 14 Výrobní linka IBM pro aplikace BI Fyzických datových modelů pro zdrojové a cílové databáze a staging tabulky Toků dat reprezentujících přesun dat z datových zdrojů prostřednictvím transformačních kroků do cílové databáze : o datové toky formované jazykem SQL pro tvorbu datových skladů o toky dolovaných dat integrující klíčová data z operací dolování do datového modelu založeného na SQL o datové toky formované jazykem SQL, které zahrnují jako podřízené operace joby DataStage ETL Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/sql.html • • 3.4.4 Administration Console Administration Console je webová WebSphere aplikace, která nabízí nástroj pro administraci BI aplikací, které jsou vytvořeny v Design Studiu. Pomocí Administration Console lze administrovat : • Obecné funkce tvorba a správa databází a systémových zdrojů, prohlížení logů, řízení chybových procesů SQW • SQL Warehousing rozmístění, provoz a monitorování aplikací DW vytvořených v Design Studiu • Cubing Services import, export, zkoumání modelů kostek, spouštění OLAP Metadata Optimization Advisoru • Mining view, export, update a delete modelů v mining databázi; load, import, export modelů data mining; grafické zobrazení výsledků mining modelů ve vizualizačním nástroji • Alphablox spouštění administrace Alphabloxu Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/administration.html 3.4.5 Cubing Services Cubing Services je využíván ke zrychlení dotazů do datového skladu z OLAP aplikací, jako např. Alphablox nebo technologie BI třetích stran. Cubing Services definuje a distribuuje OLAP metadata (kostky) - informace o struktuře dat v datovém skladu uložených v tabulkách faktů a o hierarchii všech dimenzí - a vkládá je do katalogu DB2. Metadata umožňují mapování multidimenzionálního modelu do relační struktury. Cubing Services na základě popisu metadat generuje skripty pro tvorbu DB2 objektů MQT (Materialized Query Tables). Agregace a součty v hierarchii dimenzí popsané v metadatech jsou v MQT předzpracovány. Optimalizátor DB2 je schopen přepsat komplexní analytický dotaz SQL tak, aby využíval MQT místo základních detailních tabulek. Příkladem může být dotaz na zjištění obratu obchodní firmy za první čtvrtletí běžného roku. Příkaz SQL, který načítá obrat po denních stavech, je optimalizátorem přepsán tak, že přímo zjistí stav obratu za 1.Q uložený v tabulce MQT, která byla vygenerována CV. Klientské nástroje BI připojené k relační struktuře přes Cubing Services jsou takto schopny využít podstatně větší rychlosti, jednoduchosti a škálovatelnosti přístupu k datům. Cube server, součást Cubing Services, zpracovává multidimenzionální (MD) dotazy ve formě dotazovacího jazyka MDX a produkuje MD výsledky. Cube server předkládá data z DB2 prostřednictvím dotazů SQL podle požadavků dotazů MDX. K technologiím Business Intelligence, které podporují Cubing Services patří : Ascential Software, Brio, Business Objects, Cognos, IBM OLAP Server, Kalido, Microstrategy a Rocket Software. IBM ve spolupráci s Meta Integration Technology, Inc. nabízí nový obousměrný most (bridge), který umožňuje integraci Cubing Services s více než 40 existujícími mosty metadat pro : Strana 15 Výrobní linka IBM pro aplikace BI • • • nástroje datového modelování, př. CA AllFusion ERwin Data Modeler nástroje objektového modelování, př. IBM Rational Rose nástroje ETL, př. Informatica PowerCenter • • nástroje BI, př. BusinessObjects a Cognos metadata repository a standardy, př. OMG CWM a UML XM DB2 je OLAP akcelerátor pro různé výrobce MD technologií Cubing Services je dodáván jako součást Infosphere Warehouse Editions Další informace : http://www-01.ibm.com/software/data/infosphere/warehouse/olap.html 3.4.6 Query Patroller (QP) QP využívá prognózy náročností dotazů vytvořené DB2 optimizerem ke správě zatížení datového skladu. QP je robustní nástroj, který dynamicky organizuje a řídí proud SQL dotazů proti databázi DB2. Je určen k optimalizaci provozu a zvýšení prostupnosti především datových skladů a rozsáhlých databází. QP provádí následující činnosti: • definuje oddělené skupiny dotazů rozdílných velikostí za účelem optimálního sdílení zdrojů • přiděluje priority dotazům různých uživatelů • monitoruje a pozastavuje náročné dotazy, které lze následně zrušit nebo naplánovat ke spuštění v čase nižšího zatížení zdrojů • sleduje a ruší nekoordinované dotazy QP umožňuje regulovat zatížení databáze tak, že malé SQL dotazy a dotazy s vysokou prioritou jsou vykonávány okamžitě současně s efektivním využíváním zdrojů systému. Informace o provedených dotazech mohou být shromažďovány a následně podrobeny analýze za účelem zjištění typů a četnosti dotazů, identifikace náročných uživatelů a často používaných tabulek a indexů. Strana 16 Výrobní linka IBM pro aplikace BI Další informace : http://www-01.ibm.com/software/data/db2/querypatroller/features.html 3.4.7 Performance Expert (PE) Nástroj pro analýzu a ladění výkonu v heterogenním prostředí datových serverů DB2 z jednoho místa. Další informace : http://www-01.ibm.com/software/data/db2imstools/db2tools/db2pe/db2pe-mp.html 3.4.8 DB2 Storage Optimization Feature Tento nástroj zahrnuje dva typy komprese, Data Row Compression a Backup Compression, které šetří místo na pamětových médiích. Další informace : http://www-306.ibm.com/software/data/db2/9/editions_features_storage.html 3.4.9 Alphablox (AB) Alphablox umožňuje rychlý vývoj a provoz webových analytických aplikací. Má otevřenou a rozšiřitelnou architekturu založenou na J2EE. Aplikace AB jsou provozovány ve standardním web browseru, takže lze provádět uživatelsky nastavitelné multidimenzionální aplikace v reálném čase. K základním funkcím patří možnosti interaktivní tvorby komplexních formátovaných webových reportů s možností drill-down, zpracování relačních i nerelačních dat s možností aktualizace zdrojových dat. AB je integrován s nástrojem Cubing Services, který umožňuje optimalizaci metadat a databáze pro multidimenzionální analýzy prováděné v AB. Typickými aplikacemi Alphabloxu jsou : • zpracování Key Performance Indicators (KPI) • aplikace typu scorecard • ekonomické prognózy Alphablox Bloxbuilder je integrován do Design Studia a poskytuje snadné rozhraní pro tvorbu analytických aplikací pro uživatele, kteří mají pouze zkušenosti s analytikou BI. Další informace : http://www-01.ibm.com/software/data/db2/alphablox/ 3.4.10 Data mining a vizualizace Infosphere Warehouse (IW) používá algoritmy data mining pro analýzu dat v datovém skladu a nabízí pohled do těchto dat. např.do chování zákazníků nebo vývoje obchodních parametrů. Příkladem může být zjištění, že více než 18% zákazníků, kteří nakupují tvrdé sýry současně nakupuje směs ořechů. Design Studio lze použít pro vizualizaci průběhu procesů data mining s využitím operátorů pro modeling, scoring a vizualizaci. Design Studio zobrazuje datové i textové toky operací data miningu a analýzy nestrukturovaného textu. Můžete rovněž generovat SQL a vkládat jej do analytického nástroje Alphablox. IW obsahuje tyto nástroje a funkce data mining: • • • • • • • funkce data mining v Design Studiu a Administration Consoli analýza nestrukturovaného textu v Design Studiu Intelligent Miner Easy Mining Intelligent Miner Modeling Intelligent Miner Scoring Intelligent Miner Vizualization Miningblox Strana 17 Výrobní linka IBM pro aplikace BI Intelligent Miner Modelling (IMM) IMM podporuje vývoj modelů dolování dat ve formátu tabulek relační databáze. Současně umožňuje export do formátu průmyslovému standardu pro analytické modely Predictive Model Markup Language (PMML) nebo do XML. IMM obsahuje databázové objekty UFT, UDF a DB2 extendry ve formě uložených procedur pro následující operace modelování: • • • Associations discovery příklady využití: výskyt produktu v analýzách trhu; kombinace finančních nabídek Demographic clustering příklady využití: segmenty trhu; návrh skladů; vzory nákupního chování Tree classification příklady využití: profilace zákazníků; pravděpodobnost ztrát v čase Intelligent Miner Scoring (IMS) Ověřené modely data mining mohou být aplikovány na data pro zjištění předvídatelných výsledků. Například při převzetí nové bankovní transakce do zpracování jsou na transakční data aplikována pravidla pro zjištění podvodu. Tato pravidla mají za úkol předpovědět pravděpodobnost, že datová věta je podvodná. Proces aplikující pravidla tohoto typu se nazývá Scoring. Aplikace Scoringu v reálném čase umožňuje zjistit podvodné souvislosti v datech rychleji, rozdělit nové zákazníky a nabídnout jím lepší a spolehlivější servis. IMS tedy zajišťuje provoz existujích modelů „data mining“ založených na historických datech nad aktuálními novými daty jak dávkově, tak i v reálném čase. Funkce „scoring“ jsou standardní rozšíření SQL a lze je proto použít nad DB2 i Oracle. Intelligent Miner Vizualization (IMV) IMV obsahuje javovské vizualizery pro zjišťování a grafickou prezentaci výsledků operací modelování: "associations", "demographic clustering" a "tree classification". Vstupem jsou modely odpovídající PMML v.2.0. Vizualizery mohou pracovat v transakčním režimu nebo jako applet ve web browseru. Další informace: http://www-01.ibm.com/software/data/infosphere/warehouse/mining.html 3.4.11 Analýza nestrukturovaného textu Nestrukturovaná data představují až 80% všech dat v organizaci. InfoSphere Warehouse lze použít pro extrahování strukturované informace z volně poskládaného textu. Přínos této technologie je značný – umožnění detekce podvodu, analýza chyb produktů, lepší profilace zákazníka a včasné upozornění na snižující se zájem zákazníka. Analýza nestrukturovaného textu je integrována do Design Studia a umožňuje drag and drop zpracování použitím dvou základních anotací – slovníku a na vzorech založených extraktorech. Další informace: http://www-01.ibm.com/software/data/infosphere/warehouse/unstructured-data-analysis.html 3.4.12 DB2 Workload Management DB2 Workload Management umožňuje řídit, zavádět a monitorovat worload při provozu datového skladu. DB2 WM poskytuje: • řízení workloadu DW podle uživatelských priorit Strana 18 Výrobní linka IBM pro aplikace BI • • • zabránění nekontrolovaného růstu DW zabránění zběhlých dotazů monitoring výkonu v reálném čase 3.4.13 WebSphere Application Server Další informace : http://www-01.ibm.com/software/webservers/appserv/was/ 3.4.14 Cognos 8 BI Starter Edition Cognos 8 BI Starter Edition poskytuje základnu pro tvorbu a provoz dotazů ad-hoc a reportů a obsahuje následující komponenty : • • • • komponenty platformy Cognos 8 BI : - Query Studio (ad-hoc dotazy) - Reporting Studio ( tvorba a doručování reportů a dashboardů) - Cognos Connection (navigace uživatelů) - Framework Manager (přístup k datům, modelování a publikování informací uživatelům) DB2 Express-C V9.5 (pro repozitory Cognosu) WebSphere Application Server Express Edition v.6.1.0.3 integrovaný instaler pro instalaci a konfiguraci komponent Použití Cognos 8 BI Starter Edition má tato omezení : • • • • max. 5 pojmenovaných uživatelů instalace na jednom serveru s max. 2 CPU pouze Windows platforma pouze datové zdroje DB2 Cognos 8 BI Starter Edition je součástí pouze těchto produktů : InfoSphere Warehouse Enterprise Edition InfoSphere Warehouse Base Edition InfoSphere Warehouse Base Edition with Optim Data Retention Edition IBM Base Warehouse Feature for DB2 IBM Enterprise Warehouse Feature for DB2 Další informace : http://www.cognos.com/solutions/data/ibm/starter_edition.html Strana 19 Výrobní linka IBM pro aplikace BI 3.4.15 Přehled komponent jednotlivých InfoSphere Warehouse Editions IWSE Starter IWIE Intermediate IWAE Advanced Operační systém Linux Windows Linux Windows Linux Limit 200 PVU 4GB mem 400 PVU 32GB mem 1000 PVU 2TB WH není není pouze vývoj DB2ESE + + + + + + SQL Warehousing Tool + + + + + + Admin. Console + + + + + + Design Studio + + + + + + Cubing Services + + + + + + DPF + + + + + + Query Patroller + volitelné + + Workload Management + volitelné + + Performance Expert + volitelné + + Storage Opt. Feature + volitelné + + Intelligent Miner + + Unstructured Text Analysis + + + + + + + + Produkt / komponenta Alphablox WAS IWBE Base + + InfoSphere Federation Server Relational Wrappers + Legenda : + komponenta v daném produktu existuje PVU Processor Value Unit Další informace : https://www112.ibm.com/software/howtobuy/passportadvantage/valueunitcalculator/vucalc.wss Strana 20 IWDE Developer Linux, Unix, Linux, Unix, Linux, Unix, Windows Windows Windows volitelné + IWEE Enterprise Výrobní linka IBM pro aplikace BI 4. IBM INFOSPHERE BALANCED WAREHOUSE Produkt InfoSphere Balanced Warehouse (IBW) je kompletní řešení datových skladů obsahující tyto předem otestované, škálovatelné a plně integrované systémové komponenty : • InfoSphere Warehouse • IBM server • IBM diskové pole 4.1 InfoSphere Warehouse – technologické komponenty IBW je strukturován do tří skupin : • InfoSphere Balanced Warehouse C-Class - umožňuje organizacím malé a střední velikosti jednoduché a kompletní řešení pro integraci a údržbu heterogenních datových zdrojů do škálovatelného datového skladu • InfoSphere Balanced Warehouse D-Class - nabízí podporu střediskových datových tržišť a menších datových skladů • InfoSphere Balanced Warehouse E-Class - umožňuje tvorbu robustních, široce škálovatelných datových skladů mimořádně vysokého výkonu IBW je produktově distribuován v těchto edicích : 4.1.1 InfoSphere Balanced Warehouse C1000 C1000 poskytuje jednoduché, ihned použitelné řešení tvorby, údržby a doručování dynamických reportů z datového skladu (do 350 GB uživatelských dat) vytvořeného z heterogenních datových zdrojů. Produkt podporuje flexibilní databázovou konektivitu a umožňuje vytvářet intuitivní formátované reporty. Tvorba reportů je urychlována pomocí wizardů a opakovaně použitelných vzorů. Řešení je integrováno a předem otestováno na IBM hardware. Podpora SW není součástí produktu. C1000 je dodáván ve dvou alternativních konfiguracích : Originální konfigurace : • InfoSphere Warehouse Starter Edition software • IBM Systém x 3500 BladeCenter Configuration : • InfoSphere Warehouse Starter Edition software • IBM BladeCenter S Chassis • IBM HS21 Blade Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c1000.html 4.1.2 InfoSphere Balanced Warehouse C3000 C3000 poskytuje jednoduché a kompletní řešení datových skladů pro tvorbu aplikací BI s objemem dat do 1,5 TB uživatelských dat. Produkt obsahuje pokročilé databázové vlastnosti – data partitioning a range partitioning umožňující produktivně zpracovávat rozsáhlejší datové sklady. Řešení je dodáváno na hardware IBM v integrované a předem testované konfiguraci, kterou je snadné nainstalovat a udržovat. Podpora SW není součástí produktu. C3000 je dodáván ve dvou alternativních konfiguracích : Strana 21 Výrobní linka IBM pro aplikace BI Originální konfigurace : • InfoSphere Warehouse Intermediate Edition software • IBM Systém x 3650 • IBM Systém Storage DS3200 BladeCenter Configuration : • InfoSphere Warehouse Intermediate Edition software • IBM BladeCenter S Chassis • IBM HS21 Blade • optional IBM System Storage DS3200 Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c3000.html 4.1.3 InfoSphere Balanced Warehouse C4000 C4000 poskytuje jednoduše navrhovatelné a spravovatelné řešení datových skladů pro tvorbu aplikací BI s objemem dat do 5 TB uživatelských dat. Řešení nabízí prostor pro škálovatelný růst a vývoj aplikací vyžadujících plnou funkčnost IBM Warehouse Base software a rozsáhlou infrastrukturu pro provoz kritických aplikací typu Business Intelligence. Podpora SW není součástí produktu. C4000 obsahuje : • InfoSphere Warehouse Base nebo Enterprise Edition software • IBM Systém x 3950 • IBM Systém Storage DS3200 • optional EXP3000 - rozšiřující expanzní jednotku diskového pole Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/c4000.html 4.1.4 InfoSphere Balanced Warehouse D5100 D5100 je k dispozici pro středně velké a velké organizace spravující data od kapacity 1 TB výše. Produkt nabízí škálovatelnost výkonu datových skladů v souladu s růstem organizace včetně volitelného zajištění vysoké dostupnosti a je nákladově efektivní. Podpora SW je součástí produktu. D5100 obsahuje : • InfoSphere Warehouse Base nebo Enterprise Edition software • IBM Systém x 3655 • IBM Systém Storage DS3400 K významným výhodám D5100 patří : • automatický failover poskytující potřebnou dostupnost systému • inteligentní funkce “call home” umožňující proaktivní automatickou údržbu systému • průmyslové nástroje a funkce hardware typu “midrange” Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/d5100.html Strana 22 Výrobní linka IBM pro aplikace BI 4.1.5 InfoSphere Balanced Warehouse E7100 E7100 je produkt nabízející plné využití nové technologie IBM POWER6 při vývoji, implementaci a provozu rozsáhlých datových skladů a analytických aplikací s požadavkem na maximální škálovatelnost výkonu. Podpora SW je součástí produktu. E7100 obsahuje : • InfoSphere Warehouse Enterprise Edition software • IBM Systém p570 (POWER6) • IBM Systém Storage DS4800 K významným výhodám E7100 patří : • technologie POWER6 zajišťující vysokou rychlost přístupu k informacím typu OLAP a Data Mining s maximální úrovní podpory tisíců konkurentních uživatelů zpracovávajících komplexní i ad-hoc dotazy • vlastnosti RAS (Reliability, Availability, and Serviceability) převzaté z technologií IBM mainframe umožňující téměř kontinuální operace datových skladů • autonomní bezpečnostní funkce operačního systému AIX jsou povýšeny nativním systémem bezpečnosti • škálovatelnost, která zajišťuje produktivní zpracování uživatelských požadavků Další informace : http://www-01.ibm.com/software/data/infosphere/balanced-warehouse/e7100.html Strana 23 Výrobní linka IBM pro aplikace BI 5. IBM INFOSPHERE INFORMATION SERVER 5.1 InfoSphere Information Server – integrace informací, datové sklady IBM InfoSphere Information Server (IIS) je skupina produktů integrace dat, která organizacím umožňuje získávat informace s přidanou hodnotou z heterogenních datových struktur napříč informačními systémy. V této kapitole jsou popsány základní produkty, které umožňují integraci dat a tvorbu datových skladů a splňují maximální požadavky na komplexnost a kvalitu vstupních dat a škálovatelnost výkonu. Další informace: http://www-01.ibm.com/software/data/integration/info_server/ 5.1.1 InfoSphere Information Analyzer (IIA) IIA automatizuje proces profilace a analýzy hodnot, kvality a struktur datových zdrojů. IIA poskytuje tyto vlastnosti : Profilace a analýza zdrojových dat - umožňuje snadné pochopení dat, nalezení jejich anomálií, validace datových hodnot, validace vztahů sloupce/tabulka, mapování vztahů zdrojová/cílová data a drill-down na úroveň řádků. Funkce profilace dat zahrnuje sloupce, primární a cizí klíče, relační vztahy a základní analýzy. Komplexní reporty - vizuální a nastavitelné reprezentace analýz/trendů/metrik včetně poznámek uživatelů Uživatelské anotace- vkládání popisných informací, které umožňují uživatelům přizpůsobit výstupy svým pojmům, termínům a atributům tabulek a sloupců Společná metadata - sdílení metadat ve všech modulech IBM InfoSphere Information Serveru; například InfoSphere DataStage designer je schopen ihned vidět, které sloupce byly profilovány i navazující informace, př., že sloupec „Adresa“ musí být vyčištěn před aplikací procesu ETL. Security Framework - zajišťuje řízený a omezený přístup k citlivým analytickým informacím na úrovni projektu, role a uživatele Strana 24 Výrobní linka IBM pro aplikace BI Škálovatelnost - vysoce výkonný paralelní provoz IIA proti velkým objemům dat snižující čas až o 70% Další informace: http://www-01.ibm.com/software/data/infosphere/information-analyzer/ 5.1.2 InfoSphere Business Glossary (IBG) IBG umožňuje uživatelům správu vlastnictví informací o informacích (metadat) prostřednictvím importu názvů datových prvků z externích zdrojů, jejich autorizaci a editování ve webovém rozhraní, klasifikaci těchto názvů do kategorií a propojení názvů s dalšími technickými pojmy spravovanými ve InfoSphere Metadata Serveru, který reprezentuje unifikovanou vrstvu metadat v IBM InfoSphere Information Serveru Další informace: http://www-01.ibm.com/software/data/infosphere/business-glossary/ 5.1.3 InfoSphere QualityStage (IQS) IQS automatizuje proces zkoumání, porovnávání, čištění a standardizování dat. Tyto automatizované činnosti snižují čas a náklady na kontrolu a úpravu dat a současně zvyšují jejich spolehlivost a důvěryhodnost. Produkt nabízí aplikaci pravidel pro standardizaci, čištění, porovnávání, která mohou být provozována v reálném čase, dávkově nebo jako webové služby. IQS pracuje ve výkonném paralelním režimu. Další informace: http://www-01.ibm.com/software/data/infosphere/qualitystage/ 5.1.4 InfoSphere DataStage (IDS) InfoSphere DataStage zajišťuje rychlou integraci průmyslových informací z mnoha různorodých datových struktur. Produkt podporuje kompaktní přístup také k aplikačním systémům CRM (Customer Relationship Management), SCM (Supply Chain Management), a ERP (Enterprise Resource Planning. IBM InfoSphere DataStage poskytuje následující funkce a vlastnosti: • • • • ETL (Extract, Transform, Load) - robustní technologie umožňující sběr, integraci a transformaci velkých objemů dat s jednoduchou i vysoce komplexní strukturou. InfoSphere DataStage řídí tok dat v reálném čase i dat zpracovávaných v periodickém nebo plánovaném intervalu. Škálovatelnost InfoSphere DataStage využitím paralelních schopností multiprocesorových platforem zajišťuje škálovatelnost požadavků na zpracování neustále rostoucích objemů dat současně se stále se zmenšujícími časovými intervaly, které jsou k dispozici pro dávkové zpracování. Podpora velkého množství zdrojových a cílových datových struktur Podporovány jsou heterogenní zdrojová a cílová data včetně textových souborů, komplexní struktury v XML, ERP systémy jako SAP a PeopleSoft, téměř všechny databáze (včetně partitioningu), webové služby a nástroje BI jako je SAS Konektivita mezi libovolnými datovými zdroji a aplikacemi Nabídka komplexní konektivity zajišťuje integraci většiny relevantních, úplných a přesných dat. Konektivita může být použita i spolu se známými průmyslovými aplikacemi včetně SAP, Siebel, Oracle a PeopleSoft Následující produkty umožňuji konektivitu WDS k průmyslovým aplikacím : • • • • • • InfoSphere DataStage Pack for SAP BW InfoSphere DataStage Pack for SAP R/3 InfoSphere DataStage Pack for Siebel InfoSphere DataStage Pack for PeopleSoft Enterprise InfoSphere DataStage Pack for Oracle Applications InfoSphere DataStage Pack for JD Edwards Enterprise One Strana 25 Výrobní linka IBM pro aplikace BI • InfoSphere DataStage Pack for SAS Další informace: http://www-01.ibm.com/software/data/infosphere/datastage/ 5.1.5 InfoSphere Federation Server (WFS) InfoSphere Federation Server umožňuje virtuální přístup k datovým zdrojům v reálném čase, jako by se jednalo o jednu databázi bez ohledu na její umístění. Principiálně jde o spuštění jediného příkazu SQL nad heterogenními datovými zdroji. Federovaný server umožňuje : • tvorbu relačního pohledu napříč různými datovými organizacemi • využití existujících nástrojů pro tvorbu reportů a vývoj aplikací • využití optimalizátoru DB2 • podpora XML • jednodušší pohledy na data • federovaný dvoufázový commit, umožňující aktualizaci více různých datových zdrojů současně (DB2, MS SQL Server, Informix, Oracle a Sybase CTLIB) • federované uložené procedury SP dovolující použití remote SP ve federovaném dotazu • error-tolerant vnořené tabulkové výrazy; programátor má možnost specifikovat určité chybové kódy SQL, které budou tolerovány; když se v příkazu SQL vyskytne tato chyba, není příkaz ukončen a chyba je tolerována • GUI (Eclipse-based) pro návrh, generování a uvedení do provozu federovaných databází; k dispozici jsou dvě licence IBM Rational Data Architect, nástroje pro návrh a tvorbu datových modelů Další informace : http://www-01.ibm.com/software/data/infosphere/federation-server/ 5.1.6 InfoSphere Replication Server (WRS) InfoSphere Replication Server distribuuje, konsoliduje a synchronizuje data za účelem vysoké dostupnosti a výkonu. WRS umožňuje : • řízení strategie přesunu dat mezi různými zdroji • monitorování procesu synchronizace replikací. V rámci tohoto produktu mohou být použity dva přístupy pro asynchronní datovou replikaci : • SQL replikace • Q replikace (Queue-based) Oba přístupy mohou být použity nezávisle nebo je lze kombinovat. SQL replikace - základní vlastnosti : Transformaci dat lze provádět během přenosu dat standardními příkazy SQL nebo pomocí uložených procedur. Přenos dat je spouštěn automatickým plánovačem na základě navrženého intervalu, nepřetržitě nebo na základě události. Přenos dat, která jsou vždy online, je řízen v čase v příhodném časovém okně nebo v souvislosti s prováděnými transakcemi. DB2, Informix Dynamic Server, Microsoft SQL Server, Oracle a Sybase Adaptive Server Enterprises mohou být jak zdroji, tak i cíli replikace; Informix Extended Parallel Server a Teradata pouze replikačními cíli. Strana 26 Výrobní linka IBM pro aplikace BI Q replikace - základní vlastnosti : Tento typ replikace poskytuje vysokou rychlost, nízké zpoždění a příznivé rozdělení zátěže (workload). Prováděné změny jsou publikovány do fronty zpráv WebSphere MQ, důmyslný mechanismus APPLY je prováděn v souladu s probíhajícími uživatelskými transakcemi a aplikuje replikované transakce na cílový systém s minimálním zpožděním a využitím paralelismu K dispozici je sada algoritmů pro detekci a řešení konfliktů, které umožňují produktivní práci backup systémům tak, že workload aplikace může být distribuován podél více serverů Data mohou být filtrována, přenášena jsou pak pouze potřebná data Mechanismus APPLY může vyvolat SP, které provádějí transformace dat Integrované možnosti automatických funkcí a vysokého výkonu; zpracování je prováděno paralelně, proto cílová dat mohou být zapisována současně s tím, jak jsou změnová data replikována Data mohou být replikována do/z databází DB2 a z databází DB2 do Informix, Oracle, MS SQL Server, a Sybase Další informace : http://www-01.ibm.com/software/data/infosphere/replication-server/ 5.1.7 • • • • • • • Datové zdroje Textové soubory XML datové struktury Oracle, DB2 (včetně Data Partitioning Feature), Informix, Sybase, Teradata a MS SQL Server Web Services SAP, Siebel,Oracle a PeopleSoft SAS WebSphere MQ Další informace : http://www-01.ibm.com/support/docview.wss?uid=swg27011206&rs=3171 5.1.8 Platformy Linux • Red Hat Linux Advanced Server 4.0, 32/64 bit Windows • klient - 32-bit Windows XP, Service Pack 2, nebo Windows Vista • server - 32-bit Windows Server 2003, Service Pack 1 nebo 2 AIX • AIX 5.2, 5.3, 32 bit režim Solaris • Solaris 9,10 pro UltraSPARC , 32 bit režim HP • • HP-UX 11i v2 pro PA-RISC, 32/64 bit režim HP-UX 11i v2 pro Itanium, 64 bit režim Další informace: http://www-01.ibm.com/support/docview.wss?uid=swg27009462&rs=14 Strana 27 Výrobní linka IBM pro aplikace BI 5.2 Rational Data Architect (RDA) – datové modelování RDA je průmyslová technologie datového modelování a navrhování relačních vztahů. Lze jej využít k tvorbě, modifikování a generování DDL pro fyzické datové modely. Fyzický datový model popisuje relační datové objekty (např. tabulky, sloupce, primární klíče a cizí klíče) a jejich vzájemné relace. Fyzický datový model vytváříme pro zdrojové a cílové databáze a staging tabulky pro aplikace datových skladů.. Generování příkazů DDL lze směrovat přímo do databázového serveru prostřednictvím nástroje Database Explorer. Technologie RDA lze využít i k porovnávání datových objektů nebo analýze dopadů změn a jejich souvislostí. Můžeme zjišťovat rozdíly mezi porovnávanými objekty nebo modely a změny mezi nimi kopírovat. RDA umožňuje : • Vytvářet logické a fyzické datové modely relačních nebo federovaných databází • • • • Zjišťovat, analyzovat a vizualizovat strukturu datových zdrojů a modelů vzhledem k průmyslovým standardům Identifikovat relační vztahy mezi různými datovými zdroji (impakt analýza) Porovnávat a synchronizovat strukturu dvou datových zdrojů/cílů Podporuje DB2 v9 včetně podpory XML Další informace: http://www-01.ibm.com/software/data/integration/rda/ 5.3 Další informace Další informace o uvedených produktech naleznete na adrese : http://www.mfservis.cz/index.php?sid=&kat=2&pol=pr_ibm&p1=4&p2=43 Strana 28 Výrobní linka IBM pro aplikace BI 6. IBM COGNOS BUSINESS INTELLIGENCE Cognos Business Intelligence (CBI) je BI produkt, který poskytuje nástroje na pokrytí všech požadavků na aplikace BI: tvorba reportů, analýz, scorecarding, dashboards. CBI poskytuje uživatelské rozhraní umožňující uživatelům snadné ovládání a podporuje podnikové procesy rozhodování. CBI je ve verzi 8 distribuován ve formě následujících produktů : 6.1 Cognos 8 Reporting Cognos Reporting poskytuje odpovědi na interaktivní dotazy a umožňuje vytvářet potřebné výkazy a přehledy. Dává uživateli volnost k rychlému a snadnému zhotovení libovolného standardního nebo ad-hoc výkazu, avšak současně umožní administrátorům IS kontrolovat a udržovat konzistenci všech uživatelů a reportů. Cognos Reporting je významný nástroj v rámci CBI, který poskytuje přístup ke všem typům reportů, umožnuje připojit jakýkoliv datový zdroj a pracuje s jednou metadatovou vrstvou, která umožňuje různé výhody jako například poskytování reportů ve vícejazycích. Katalog Cognos Reportingu izoluje uživatele od složitostí databáze jako jsou syntaxe příkazů SQL, spojení tabulek a symbolická jména polí tím, že organizuje data za použití odborné uživatelské terminologie. Výsledkem je, že informace jsou předkládany manažerům tak, jak chápou své podnikání, nikoli tak, jak jsou uloženy v databázi. Charakteristiky reportů : • • • • • Jedno prostředí pro vytváření všech typů reportu včetně dashoardů Uživatelský interface pro více jak 10 jazyků, reporty ve více jak v 25 jazycích; uživatelský interface lze měnit do podoby definované implementátorem řešení Různé exportovací formáty reportu (Excel, PDF, XML, HTML a CSV) Flexibilní distribuční metody: centalizovaný přístup, email, aplikační integrace, MS Office Jednotná architektura pro prohlížení, dotazování, analyzování a pro týmové vytváření jakéhokoliv typu reportu včetně dashoardů Rozšířené možnosti vytváření reportů : • • • • • • • • Intuitivní vytváření reportu bez nutnosti jakéhokoliv programování Federalizované dotazy - pouze jeden dotaz na více heterogenních datových zdrojů Konzistentní vzhled, který se přizpůsobuje v případě přidání, změně nebo odebrání objektu Možnost vložit do reportu aplikace, odkazy a jakýkoliv jiný obsah Drag and Drop funkce umožnující přidat data, texty, grafy, grafiku a obrázky Editování reportu pomocí příkazového řádku i pomocí objektových nástrojů Interaktivní vizualizace reportů pomocí velkého množství grafů (crosstabs, bar/3D bar, pie/donut, line, gauge, funnel, scatter, dot density, waterfall, a dalších) Vytvářet komplexní, vícestránkové návrhy reportů s použitím různých datových zdrojů, bez programování podmíněného formátování a automatické kalkulace Datové zdroje : • • • • • • Relační datové zdroje zahrnující DB2, Oracle, SQL, Informix, Teradata, Sybase a ODBC Multi Dimenzionální zdroje jako IBM Cubing Services, Cognos OLAP, SAP BW, Microsoft, SAS, EssBase, Oracle 10g ERP systémy jako SAP, PeopleSoft a Siebel Moderní datové zdroje zahrnující XML, Java Beans, JDBC, LDAP, WSDL Ostatní zdroje např. soubory Excelu, Accessu a flat soubory Legacy a mainframe systémy VSAM, IMS, IDMS a Cobol Copybooks Strana 29 Výrobní linka IBM pro aplikace BI • • • ECM systémy zahrnující FileNet, Documentum a OpenSoft Podpora operačních systémů Windows, UNIX, Linux SAP-certified BAPI a iViews. Webové rozhraní : • • • Integrace s technologií WebSphere Plně publikované webové rozhraní SDK Jednotná metadatová vrstva pro všechny typy reportů Další informace: http://www.cognos.com/products/cognos8businessintelligence/reporting.html 6.2 Cognos 8 Analysis Cognos Analysis umožňuje jednoduše zkoumat a analyzovat informace, které náleží do všech oblastí lidských činností bez ohledu na to, kde jsou data uložena. Analýza a reporting jsou zpracovány za použití On-Line Analytického zpracování (OLAP) a dimenzionálně orientovaných datových zdrojů. Robustní analytické nástroje : • • • • Provádějí komplexní analýzy rychle a jednoduše, odpovídají na otázku "PROČ" Analyzují klíčové faktory výkonnosti podnikání s daty orientovanými v logických kategoriích (dimenzích) jako finanční rok, oblasti prodeje, produkty, a další Jednoduše přecházejí z agregované úrovně k detailu a poskytují požadované informace Sofistikované časové analýzy trendů umožní zjistit, co se změnilo během posledního roku, měsíce, dekády, týdne popřípadě zjistit, jak se změnily jiné kritické ukazatele během tohoto časového období Jednoduchost a snadné používání : • • • • • • • • • Zkoumání komplexní datové struktury s použitím drag and drop funkcionality. Drill down do úrovní s větším detailem a prohlížení dat přes různé dimenze, jako je např. prodej přes oblasti prodeje nebo prodej přes jednotlivé produkty Prohlížení a analyzování graficky znázorněných datových závislostí s možností přepínání různých pohledů Jednoduché používání operací: drill down, slice & dice, roll-up, rank, sort, forecast. Obecný XML formát reportu umožňuje umístit report do libovolného uživatelského nástroje dle potřeb uživatele Uživatelsky přívětivé rozhraní umožňuje provádět multidimenzionální analýzy jednoduše bez ohledu na úroveň znalostí IT Import a manipulace s daty v MS Office Podpora relačních databází i zdrojů dat typu OLAP Integrace se stávajícími kostkami a OLAP servery třetích stran Analýza zpracovává a sumarizuje data na aplikační úrovni a vrací pouze sumarizované výsledky; výsledkem je úspora objemu přenášených dat a zvýšení propustnoti sítě Další informace: http://www.cognos.com/products/cognos8businessintelligence/analysis.html Strana 30 Výrobní linka IBM pro aplikace BI 6.3 Cognos 8 Scorecarding Scorecarding je ověřená metoda na sledování, měření a řízení sledování a měření výkonnosti na úrovni strategické i taktické pro firmy, týmy nebo jednotlivé zaměstnance. Na taktické úrovni se scorecardy používají na sledování jednotlivých projektů a porovnávají se s cílovými hodnotami. Na strategické úrovni mohou být scorecardy součástí rozsáhlého systému na sledování výkonnosti. Cognos Scorecarding je reprezentován seznamem klíčových ukazatelů nebo metrik, jejichž prostřednictvím se prezentuje výkonnost organizace v porovnání s cílovými hodnotami. Scorecardy ve své většině nabízejí kombinace finančních a nefinančních informací, provozních a výsledkových ukazatelů a odpovídajících strategických map. K hledání odpovědi na otázku PROČ může být s výhodou využita funkcionalita definice závislosti mezi jednotlivymi metrikami. Jednotlive metriky ovlivňují metriky jiné a proto může být často skutečnou příčinou špatné hodnoty nějaké metriky metrika jiná, jenž je s ní v úzkém závislostním vztahu. Další informace: http://www.cognos.com/products/cognos8businessintelligence/scorecarding.html 6.4 Cognos 8 Dashboards Dashboardy jsou systémy, které umožňují zobrazení kritických informací na jedné obrazovce, a jsou proto velmi vhodné pro manažery. V prostředí produktů Cognos BI je možné vytvářet všechny typy dashboardů (jak provozní, tak taktické a strategické). Dashboardy dávají manažerům možnost vidět klíčové ukazatele prezentované přehlednou formou na jednom místě. Dashboardy mají rovinu aplikační, rovinu vrstev a typů. Aplikační rovinu lze rozčlenit na: • • • monitoring analýzy reporting Rovinu vrstev lze rozčlenit na: • • • grafickou sumární dimenzní data detailní provozní data Z pohledu typů rozeznáváme následující typy dashboardů: • • • provozní strategické taktické Strana 31 Výrobní linka IBM pro aplikace BI V prostředí produktů Cognos BI je možné vytvářet všechny typy dashboardů (jak provozní, tak taktické a strategické). Další informace: http://www.cognos.com/products/cognos8businessintelligence/dashboards.html 6.5 Cognos 8 datová integrace pro SAP R/3 Cognos 8 datová integrace pro SAP R/3 rozšiřuje schopnosti SAPu. Nástroj je postaven jako webová služba se SOA architekturou a je certifikován SAP NetWeaverem. Cognos 8 datová integrace pro SAP R/3 kombinuje data ze SAPu a data mimo SAP, využívá výhody SAP NetWeaveru a infrastruktury mimo SAP. Cognos 8 datová integrace pro SAP R/3 umožňuje použití starých nebo nových verzí SAPu a násobných SAPovských instancí. Řešení je nezávislé na SAPovské infrastruktuře - zvyšuje flexibilitu a snižuje riziko. Další informace:http://www.cognos.com/solutions/data/sap/index.html Strana 32
Podobné dokumenty
IBM WebSphere
Relační databáze (db) – obsahuje tabulky a vazby mezi tabulkami. Používá jazyk SQL.
OLTP (On-Line Transactional Processing) – technologie zpracování dat, typická pro ERP.
Multidimenzionální db (mdb...
celý časopis
Pokud jste podlehli Windows 7 natolik, že je
používáte jako primární desktop a potřebovali
byste, aby z něho bylo možné spravovat servery
na síti přímo prostřednictvím nástrojů a ne jen
připojením ...
SOUBOR Č. 1 INSTRUCTION MANUAL © 1992
šířku textu (ja nastavena "natvrdo" na 48® bodů, což není cifra jan tak vycucaná z prstu,
ala standard, který dokáže vytisknout vitiina tiskáren).
Najeden uživatel vlak uposlechl rad uveřejnlných v...
Ceník Express modlů IBM System x
x3200
x3200M2 E4600 2.40GHz 2MB L2, 2x 512MB, O/B H/S SAS/SATA, multiburner
x3200M2 Xeon 3320 2.50GHz 6MB L2, 2x 512MB, 2x 250GB SS SATA, multiburner
x3200M2 Xeon 3320 2.50GHz 6MB L2, 2x512MB, O/B ...
Databázové servery pro nejvy‰‰í nároky a pro zpracování jak
a pfiedvídání v˘voje trhu
• získávání klíãov˘ch obchodních
poznatkÛ
PDF / 4,8 MB - Duha - Moravská zemská knihovna v Brně
programů knihoven. Jedná se o Strategii celoživotního učení ČR (2007) a návrh Strategie rozvoje vzdělávání do roku 2020 (http://www.vzdelavani2020.cz).
V těchto materiálech jsou knihovny, jako význ...