Konference Moderní databáze

Řešení a služby
Reference

Moderní databáze 1999

Ve dnech 15. - 16.6.1999 proběhl v Berouně seminář Moderní databáze. Přinesl řadu zajímavých informací z oblasti vývoje a budování informačních systémů, které ocení zejména všichni ti, kteří rozhodují a zodovídají za nákup databázových systémů a vývojových nástrojů. Na našem webu si můžete stáhnout kompletní přednášky jednotlivých účastníků.

Anotace příspěvků

Přednášky jsou k dispozici v sekci "ke stažení".

Automatizované získávání znalostí z dat (Úloha DM v procesu KDD)

Jan Krejčí, Petr Stupka - KOMIX

Definice základních principů umělé inteligence a jejich aplikace v oblasti strojového učení(ML), popis procesu KDD (Knowledge Discovery from Databases) se zvláštním zřetelem k úloze, kterou v něm zaujímá data mining (DM). Metody a algoritmy DM. Nejčastější problémy při aplikaci, omezení jednotlivých metod. Použití nástroje Intelligent Miner for Data firmy IBM.

Zabezpečení dat v databázích kryptováním

Petr Kučera, Radim Šilhánek, Jana Michalcová - KOMIX

V současné době se klade stále větší důraz na zabezpečení dat v informačních systémech. Informace se stávají hlavní konkurenční výhodou a firmy i stát začínají stále více dbát na jejich ochranu. Tento článek popisuje metodu selektivního šifrování dat uložených v databázích, která umožňuje řídit přístup k jednotlivým datovým položkám. Data uložená v databázi je možno statisticky zpracovávat běžnými komerčními programy, aniž by se jejich uživatel dostal k citlivým individuálním údajům.

Informix – datové sklady a datové tržnice

Pavel Procházka - Informix

Informix nabízí jako jediná firma kompletní řešení datových skladů a datových tržnic. Sada komponent pro datové sklady a tržnice Decision Frontier Solution Suite byla nedávno, po akvizici firmy Red Brick, doplněna o špičkové produkty této firmy. V příspěvku je popisováno otevřené řešení společnosti Informix, které je založeno na databázových strojích IDS/AD a IDS/AD/XP pro velmi rozsáhlé databáze a Red Brick Warehouse pro výkonné analytické datové tržnice. Tyto produkty jsou doplněny o sadu klientských komponent MetaCube ROLAP Option pro analytické aplikace, InfoMover pro naplnění datových skladů a tržnic a reportovacím nástrojem Seagate Crystal Info. Řešení pokrývá kompletně celou oblast datových skladů a analytických aplikací: datové tržnice, podnikové datové sklady, velmi rozsáhlé sklady (>1TB), přizpůsobitelný OLAP, ETL (datové pumpy), Data Mining a správu agregátů.

Business Inteligence od IBM

Dalimil Bartoň, Miroslav Kučera - IBM

Nástroje pro budování infrastruktury datového skladu musí podporovat zvolenou metodologii. Na jedné straně by měly umožnit rychlé nasazení pilotního projektu, na druhé straně by však měly zohledňovat dlouhodobé záměry podniku v budování celopodnikových informačních aplikací. Neméně důležitou oblastí je integrace metadat od úrovně zdrojových dat až po analytické nástroje koncových uživatelů. V tomto příspěvku představíme nástroje a technologie, které pro budování kompletního systému Business Intelligence používá IBM. Budeme se věnovat nástroji pro tvorbu a správu datových skladů a trhů Visual Warehouse, jeho propojení se serverem DB2OLAP. Na závěr se zmíníme o tom, jak spolu souvisí Business Intelligence a e-business.

Quasi-nezávislé provozní databáze a dvouvrstvý datový sklad

Petr Vršek - SOFTMODEL

Architektura dvouvrstvého datového skladu (dynamický datový sklad = DDW + vločkový datový sklad = SFDW), popisovaná v mém loňském příspěvku, předpokládala, že provozní (OLTP) aplikace jsou vytvořeny přímo nad DDW.
Zde se navrhuje taková architektura, kdy provozní aplikace operují nad nezávislými provozními databázemi, ale přitom je stále dodržována konzistence údajů mezi těmito databázemi a dvouvrstvým datovým skladem. Tato nezávislost musí mít samozřejmě určitá omezení, abychom této konzistence dosáhli. Předkládaný článek tato omezení stanoví, odůvodňuje existenci takto vzniklé třívrstvé databázové architektury a diskutuje její vlastnosti.

OLAM = skladování dat + OLAP + dolování dat

Jaroslav Pokorný - Matematicko-fyzikální fakulta UK

Analýza a řízení trhu, podnikové analýzy, risk management a odhalování podvodů, to jsou příklady sfér řídících činností vyžadujících dokonalé znalosti osob, které tyto činnosti provádějí. Získávání znalostí z dat v databázích, tradičně nazývané dolování dat, představuje první krok v technologii řízení znalostí. Vhodným zdrojem pro dolování dat může být dnes tolik populární datový sklad. Další technologie, OLAP, se týká provádění analýz nad multidimenzionální databází vybudovanou jako logická či fyzická vrstva nad datovým skladem. Použití dolování dat nad multidimenzionální databází (OLAM – OnLine Analytical Mining) představuje další směr vývoje, který umožní kvalitativně nový přístup k získávání znalostí a jejich použití při rozhodování.

Postrelační databáze

Simona Papenbrock, Michal Tomek - InterSystems

Pokrok v technice se uskutečňuje podle stejných evolučních zákonů, jaké určují i přírodu. S tím velkým rozdílem, že technologický rozvoj probíhá tempem, které bere dech, a my jako pozorovatelé můžeme často pozorovat několik vývojových skoků v průběhu několika málo dekád. Obzvláště to platí pro vývoj výpočetní technologie a tím také pro vývoj databází. V 70. letech s jejich na technologii orientovaným zpracováním dat ještě na uložení a následné nalezení malého množství příslušných dat - většinou za účelem tisku sestav - stačily hierarchické databanky. Když se v počítačové technice 80. let potom objevilo myšlení orientované na uživatele, byl zapotřebí logický datový model, který byl nezávislý na fyzickém ukládání dat, aby uživateli poskytl jednoduchý přístup k jeho datům. Nastal velký čas relačních databází, i když mohly posloužit pouze jednoduchým matematickým datovým modelem a přístupovým jazykem SQL.

Použití VisiBrokeru a C++ Builder Enterprise při realizaci datových skladů.

Jan Karpíšek - INPRISE Praha

Účastníky semináře Moderní databáze bych rád seznámil s konkrétní implementací nových databázových technologií firmou Inprise. Spektrum produktů pokrývá téměř celou šíři běžně používaných databázových technologií začínaje výkonným a snadno udržovatelným SQL serverem InterBase, přes Decision Support komponenty až po implementaci standardu CORBA pro rozsáhlé distribuované aplikace. Tyto výše popsané technologie jsou dostupné v balení produktů pro vývoj aplikací třídy Client/Server a Enterprise. Konkrétně se jedná o verze Delphi 4 Client/Server a C++Builder 4 Enterprise.

Data mining a jeho použití v komerční praxi

Michal Dovrtěl, Petr Jebavý - Silicon Graphics

Smyslem data miningu je objevit v datech informace použitelné pro pochopení jejich významu a následné řešení problému. Při běžných databázových dotazech nebo při použití OLAP (on-line analytic processing) nástrojů je nutné předem znát vztahy mezi proměnnými, které chceme sledovat. Metody data miningu umožňují nalézt v datech vztahy dosud neznámé.
Příspěvek se zabývá integrací analytických a vizualizačních nástrojů v produktu MineSet. Kromě popisu vlastních metod se zaměřuje zejména na způsob jejich začlenění do uživatelských aplikací a v širším kontextu do analytického procesu.

Řešení Datového skladu na Oracle 8i

Radovan Čechvala, Jiří Hanák - Oracle Czech

V úvodu budeme diskutovat motivace a přínosy datových skladů pro podniky, dále nastíníme architekturu řešení datového skladu a předpoklady nezbytné pro vybudování a provoz datového skladu a budeme informovat o integrovaných řešeních datových skladů Oracle.
Nové verze databázového serveru Oracle 8 byly rozšířeny především o vlastnosti potřebné pro provoz datových skladů, proto jádrem příspěvku bude diskuze a použití těchto vlastností pro datové sklady. Ve druhé části příspěvku se budeme zabývat analýzou a reportováním dat za použití Web browseru.

Sybase Warehouse Studio (včetně níže uvedeného příspěvku téhož autora)

Vladimír Kyjonka - Sybase ČR

V tradičním pojetí bývá datový sklad chápán často pouze jako nástroj umožňující jeho uživatelům souhrný analytický pohled na data vyprodukovaná jejich informačními systémy. Ve skutečnosti však jde o komplexní proces, v jehož průběhu je třeba příslušná data transformovat z operativnách zdrojů, očistit, uložit do odpovídajících struktur a zajistit jejich doručení uživatelům ve struktuře, formě a čase, jenž je pro ně užitečný. Vzhledem k proměnlivosti uživatelských požadavků na jedné straně a omezených možnostech zmapovat konečnou podobu informačního terénu datového skladu v prvních etapách jeho návrhu, je jedním z rozhodujících faktorů schopnost zvolených nástrojů dynamicky a flexibilně tyto skutečnosti zvládat.
Sybase Warehouse Studio je integrovanou sadou produktů, jež pokrývá všechny etapy a komponenty vývoje a provozu datových skladů a data martů s důrazem na flexibilitu, otevřenost a vysoký výkon. Jeho jednotlivé komponenty i řešení jako celek jsou navrženy pro maximální efekt s ohledem zejména na minimalizaci rizik při rychlé implementaci a krátké návratnosti vložených investic.

Dynamický datový sklad

Vladimír Kyjonka - Sybase ČR

Pro současné projekty IT jsou mj. charakteristické dvě skutečnosti, působící ve svém důsledku proti sobě:
Vzhledem k tomu, že projekty IT zasahují stále výraznějším způsobem do života organizací, nabývají rizika spojená s jejich nesprávnou funkcí podstatně výraznějšího charakteru pro život podniku. Proto jsou zcela na místě zvýšené nároky na důkladnou a přesnou analýzu požadavků, architektury i samotný návrh systému.
Na druhé straně se výrazně zkrátila doba aktuálnosti a životnosti všech typů informací; zejména v oblasti IT se může rychlost a včasnost realizace systému stát rozhodujícím faktorem úspěchu. „Klasický“ přístup vytváření projektů s mnohaletým horizontem realizace je v tomto směru elementem, zvyšujícím riziko. Požadavek na maximální zkrácení projekčního cyklu je tedy zcela legitimní. Pro datové sklady je tento aspekt zvýrazněn převráceným charakterem životního cyklu projektu; pravděpodobnost „minutí cíle“ při nesprávném nasměrování je zde výrazně vyšší.
Čelit tomuto nebezpečí je možno pouze dostatečně flexibilním přístupem, jenž při důkladné analýze umožní zapojit korektivní mechanismy a využít již v jednotlivých etapách výstavby datawarehousu procesu učení, jenž se uplatňuje při využívání (t.j. fakticky při provozování) sytému.