Klasifikácia databázy: varianty, dátové modely a hlavné charakteristiky

Databáza je súbor údajov, ktoré je potrebné objednať, a za ich správu je zodpovedný systém správy databáz (DBMS), ktorý určuje štruktúru, poradie, prístupové práva a závislosti. Na tento účel používame vlastný kompilátor a vhodný model, ktorý definuje architektúru databázového systému. Klasifikácia DB sa vykonáva na základe architektúry.

História stvorenia

Databázy (DB) sú logicky štruktúrované systémy pre elektronickú správu, ktorá sa vykonáva pomocou systému správy databáz (DBMS) a pridáva sa do úložiska. Väčšinu databáz je možné otvárať, upravovať a konzultovať iba pomocou konkrétnych aplikácií. Podľa týchto princípov sa vykonáva klasifikácia DB. V roku 1960 sa koncept elektronickej informačnej základne začal rozvíjať ako samostatná softvérová vrstva medzi OS a aplikačným programom.

Myšlienka elektronického databázového systému sa stala jednou z najdôležitejších inovácií vo vývoji počítačov. Prvými modelmi, ktoré boli vyvinuté, boli hierarchické a sieťové databázy. Spoločnosť IBM spôsobila revolúciu v tomto sektore v sedemdesiatych rokoch vývojom modelu relačnej databázy. Najúspešnejšími produktmi v tom čase boli Oracle SQL database query language a nástupcovia IBM, SQL / DS a DB2.

Koncepcia DB a klasifikácia DB

Dnes sú databázové systémy dôležité v mnohých oblastiach vedy, techniky a používateľských aplikácií. Akýkoľvek typ softvér, vyvinutý pre spoločnosti je založený na spoľahlivých databázach s veľkým počtom možností a nástrojov pre správca. Bezpečnosť údajov je tiež čoraz dôležitejšia, heslá, osobné údaje a dokonca aj elektronické meny sú uložené a šifrované v elektronických databázach.

Moderný finančný systém nie je nič iné ako sieť databáz, v ktorej väčšina peňažných súm existuje iba vo forme elektronických informačných jednotiek, ktorých ochrana pomocou bezpečných databáz je jednou z hlavných úloh finančných inštitúcií.

Koncepcia DB a klasifikácia DB

V závislosti od variability databázy sa jej typ klasifikuje podľa klasifikácie databázy ako statický alebo dynamický.

Funkcie statických databáz:

  1. Povoliť iba čítanie údajov, s výnimkou úprav.
  2. Používajú sa na biografie a historické fakty alebo scenáre, ku ktorým je možné získať prístup pre výskum bez potreby zmeny obsahu.
  3. Sú bezpečné a ľahko použiteľné pri pripojení k sieti.

Funkcie dynamickej databázy:

  1. Majú koncepciu samosprávy.
  2. Možnosť pripojenia k dynamickým sieťam.
  3. Toto štrukturálne Priradenie vám umožňuje ukladať a aktualizovať informácie o databáze.
  4. Používa HTML ako komunikačný jazyk medzi sieťou a dynamickou databázou.
  5. Najčítanejšie články jazyky pre vytváranie dynamických sietí súvisiacich s BBDD sú: Perl, CGI, PHP, JSP a ASP.

Hlavné DBMS, ktoré pracujú s dynamickými webovými stránkami, sú PostgreSQL, MySQL, Oracle a Microsoft SQL.

Aby sme pochopili, aké možnosti existujú na klasifikáciu databáz používaných vo vedeckom a vzdelávacom prostredí, zvážte:

  • bibliografický;
  • dokumentárny;
  • špecializovaný;
  • odkaz.

Funkčnosť bibliografických databáz:

  1. Spojené so starými záznamami, ktoré obsahujú informácie o umiestnení knihy alebo dokumentu.
  2. Neobsahuje celý text, iba odkaz.
  3. Vďaka formátom, ako je PDF, vám umožňuje prístup k originálnym článkom, ktoré majú odkazy.
  4. S rozvojom technológie sú zahrnuté odkazy z iných médií.

Vlastnosti špecializovaných databáz:

  1. Obsahujú presné informácie a sú zamerané na konkrétnu tému.
  2. Používajú sa v akademickom a vedeckom prostredí.
  3. V niektorých prípadoch sa neberú do úvahy ako správne BBDD: napríklad telefónny zoznam, zoznam kontaktov spoločnosti alebo medzinárodnej spoločnosti.

Modely elektronického spracovania

Aby bolo možné podrobne študovať otázku, aké možnosti klasifikácie DB existujú, nie je možné obísť tému modelov. Hierarchické databázy boli prvé vyvinuté v 60. rokoch v hollerithových spisoch, záviseli od typu ukladania informácií 1N / NN vo forme obráteného stromu.

Vzťahy sú typu 1N, keď nadradený uzol môže mať viac podradených podradených uzlov, ale podradený uzol nemôže patriť k viacerým nadradeným uzlom. Ich nevýhodou je, že redundancia údajov nie je veľmi dobre zastúpená.

Model sieťovej databázy navrhnutý spoločnosťou CODASYL je jej prvým systémom riadenia (IMS), ktorý sa objavil v roku 1968 pre program NASA "Apollonian". Vyriešil niektoré problémy predchádzajúceho hierarchického modelu, ktoré sa v modernom it procese prakticky nepoužívajú.

Aby sme pochopili moderný model, je potrebné zvážiť, aké vzťahy existujú medzi rodičovskými a podriadenými uzlami v klasifikácii databázy. Dnes sa vzťahy typu NN používajú, keď je podriadenému poduzlu povolené patriť do viacerých nadradených uzlov. Spolu s hierarchickým modelom tvorí prvú generáciu databázy.

Výhody modelu: ponúkajú vynikajúcu stabilitu, dobrý výkon a lepšiu redundanciu spracovania. Nevýhodou modelu je zložitosť systému, ktorá si vyžaduje znalosti v oblasti programovania.

Vlastnosti transakčných databáz:

  1. Jediným účelom je odosielať a prijímať údaje vysokou rýchlosťou.
  2. Sú zamerané na kvalitatívnu analýzu a výrobné údaje.
  3. Jedinečným účelom je zhromažďovať a obnovovať údaje čo najrýchlejšie, takže redundancia a duplikácia informácií nie je problémom, ako v prípade iných databáz.
  4. Povoliť pripojenie k relačným databázam.
  5. Operácie sú atómové, pri tomto type je možné iba to, že sa vykonávajú úplne (integrita) alebo sa nevykonávajú vôbec.

Hlavné rozdiely v databázach

Dokumentárne filmy-návratový obsah, práca s kognitívnymi a koncepčnými dokumentmi, patria do intelektuálneho a akademického prostredia. Majú správcov dokumentov a obsahu, ako sú CDS / ISIS, Filemaker, Knosys alebo Imagic Text na kontrolu terminológie. Sú ľahko dostupné pri použití štandardizovaných dotazovacích jazykov a majú klasifikáciu databázy podľa typu dátového modelu.

Relačný je založený na vytváraní vzťahov medzi súbormi údajov, usporiadaných vo forme tabuliek, ktoré spĺňajú niektoré základné požiadavky. Majú pevný počet polí. Každý atribút má názov a mnoho možných hodnôt. Každý záznam je jedinečný a identifikovaný pomocou kľúča. Implementujú dotazovací jazyk SQL a sú založené na modeli vyvinutom Edgarom Coddom v 70. rokoch.

Zlaté Pravidlo

Objektovo orientované databázy vracajú fyzické súbory alebo programový kód, objavili sa na konci dvadsiateho storočia. Používa sa v priemyselnej výrobe a dizajne. Práca s objektovo orientovaným jazykom, ako je C++ alebo Python. Pozorovať "zlaté pravidlo": perzistencia, sekundárny správca úložiska, súbežnosť, obnova a objekt dotazu.

Systémy riadenia DBMS

Systémy riadenia DBMS

Systém správy databáz (DBMS) je termín na opis funkcií a požiadaviek transakcií v systéme správy databáz, skrátene ako kyselina (kyselina) z atomicity, konzistencie, izolácie a trvanlivosti. Tieto štyri parametre pokrývajú najdôležitejšie požiadavky DBMS vyhovujúce kyselinám:

  1. Atomicita (atomicita) označuje nehnuteľnosť "Všetko Alebo Nič" z manažérov DB, aby bola žiadosť platná, bola transakcia vykonaná správne a implementovaná so správnym poradím postupov.
  2. Konzistentnosť alebo súdržnosť, keď transakcia DB zostáva stabilná, čo si vyžaduje neustále sledovanie všetkých operácií.
  3. Izolácia je podmienkou a zárukou, že transakcie navzájom nezasahujú, čo sa zvyčajne dosahuje blokovaním určitých funkcií, ktoré izolujú údaje zapojené do transakcie.
  4. Trvanlivosť znamená, že všetky údaje sú uložené v DBMS z dlhodobého hľadiska, a to aj po uzavretí transakcie, ako aj v prípade zlyhania systému, ak dôjde k zlyhaniu DBMS. Pre táto podmienka , vyžadujú sa záznamy transakcií, ktoré zaznamenávajú všetky procesy, ktoré sa vyskytujú.

Klasifikácia funkcií a požiadaviek

Databáza ukladá informácie a viaže ich do logickej jednotky spolu s metadátami, potrebné pre spracovanie. Toto je veľmi užitočný nástroj na správu veľkých súborov pomocou jednoduchého dotazu, ktorý má systém povolení, ktorý určuje, ktorí používatelia alebo programy majú prístupové práva.

Klasifikácia funkcií a požiadaviek

Klasifikácia databázy:

Funkcia

Stretnutie

Ochrana osobných údajov

Databáza ukladá texty, dokumenty, heslá. V elektronickom formáte je možné získať prístup k údajom prostredníctvom konzultácií.

Zmena Osobných Údajov

V závislosti od dostupných povolení vám väčšina databáz umožňuje upravovať filtre ochrany údajov.

Vymazať údaje

Záznamy vo väčšine variantov klasifikácie DB je možné úplne vymazať bez zanechania medzier. V niektorých prípadoch je možné odstránené údaje obnoviť, v iných sa však natrvalo odstránia.

Správa Metadát

Informácie sa zvyčajne ukladajú s metadátami alebo metaznačkami, ktoré udržiavajú poradie v databáze a umožňujú funkciu vyhľadávania. Metadáta sa tiež často používajú na reguláciu povolení.

Ochrana osobných údajov

Databázy musia byť chránené, aby sa zabránilo neoprávneným osobám v prístupe k informáciám, ktoré uchovávajú.

Údaje

integrita dát integrita znamená, že musia byť v súlade s určitými pravidlá pre zabezpečiť ich správnosť a určiť obchodnú logiku databanky.

Funkcia pre viacerých používateľov

Aplikácie DB poskytujú prístup z rôznych zariadení. Prideľovanie povolení a bezpečnosť údajov sú pri používaní pre viacerých používateľov základné.

Optimalizácia dopytov

Technicky by databáza mala byť schopná spracovať dotazy najlepším možným spôsobom, aby bola zaručená dobrá výkon.

Spúšťače a uložené procedúry

Tieto dva postupy sú mini-aplikácie uložené v DBMS. Spúšťače a uložené procedúry sú typické procesy relačnej databázy.

Transparentnosť systému

Transparentnosť systému je dôležitá, najmä v modeloch klasifikácie distribuovaných databáz.

Hierarchický model

Hierarchický model

Rozdiely medzi najčastejšie otázky databázové modely sú výsledkom technického vývoja elektronického prenosu údajov, ktorý nielen sledoval ciele efektívnosti a spravovateľnosti, ale rozšíril aj možnosti najslávnejších výrobcov. Toto je najstarší model, ktorý je dnes výrazne lepší ako relačný, hoci v poslednej dobe došlo k nárastu jeho popularity.

XML používa tento systém ukladať informácia. Niektoré poisťovňa a banky sa obracajú na hierarchické databázy v najstarších aplikáciách. Najznámejšia je databáza IBM IMS / DB.

V hierarchickom modeli klasifikácie údajov databázy existujú prísne a jednoznačné závislosti. Každý záznam má iba jeden precedens (vzťahy rodič-dieťa, PCR), s výnimkou koreňa, ktorý tvorí stromovú schému. Aj keď každý podradený uzol môže mať iba jedného rodiča, "rodičia" môžu mať toľko podradených uzlov, koľko chcú.

Vzhľadom na prísne hierarchické usporiadanie úrovne, ktoré nemajú priame spojenie, navzájom neinteragujú, takže nie je ľahké spojiť dva rôzne stromy. Hierarchické databázové štruktúry sú zároveň mimoriadne flexibilné a zrozumiteľné. Záznamy s "dieťa" sa nazývajú záznamy a tie bez nich sa nazývajú listy a zvyčajne ide o dokumenty v zázname pre listy v klasifikácii databázy. Dotazy do hierarchickej databázy sa dostanú k listom, začínajúc od koreňa a prechádzajú rôznymi záznamami.

Graficky orientované DMS

Sieťový model sa vyvíjal takmer súčasne s relačným modelom, aj keď ho časom konkurenti porazili. Na rozdiel od hierarchického modelu tu záznamy nezverejňujú prísne "vzťahy rodič-dieťa", , ale každý môže mať niekoľko precedensov, čo mu dáva sieťovú štruktúru jeho názvu. K dispozícii je tiež jedinečná a nemenná cesta na prístup k záznamu.

V modeli sieťovej databázy nie je žiadna pevná hierarchia, a preto existuje viac ciest vedúcich k rovnakému cieľu. K záznamu umiestnenému v strede obrázka je teoreticky možné pristupovať z piatich ďalších a prístupom k nemu získate prístup k piatim ďalším záznamom.

V sieťovom modeli je možné definovať aj závislosti-register umiestnený vyššie. Nie je priamo spojený s registrom v polohe úplne vpravo, takže na jeho dosiahnutie musí prejsť registrom v strede, ktorý môže prijať alebo odmietnuť. Môžete kontaktovať ten, ktorý sa nachádza vľavo hore. V sieťovom modeli sa záznamy pridávajú alebo odstraňujú bez ovplyvnenia globálnej štruktúry.

Dnes sa tento model používa na veľkých počítačoch. V iných oblastiach sa stále spoliehajú na hierarchický model alebo sa obracajú na relačný model, ktorý je oveľa flexibilnejší a ľahko použiteľný. Niektoré známe modely sieťových databáz sú Siemens UDS a Sperry Univac DMS. Postupom času obaja výrobcovia tiež vyvinuli zaujímavé zmiešané formy medzi sieťovým modelom a relačnými. Graficky orientovaná databáza sa vďaka svojej retikulárnej štruktúre považuje za moderný vývoj sieťového modelu.

Graficky orientovaný DMS Sperry Univac

Škálovateľnosť úložiska

V dokumentovo orientovanom databázovom modeli sú dokumenty hlavnou jednotkou ukladania informácií. Tieto jednotky sú tie, ktoré štruktúrujú údaje, a nemali by sa zamieňať s dokumentmi programov na spracovanie textu. Tu sú údaje uložené v tzv "páry kľúč-hodnota".

Pretože nie je definovaná ani štruktúra, ani počet párov, dokumenty, ktoré tvoria dokumentovo orientovanú databázu, sa môžu navzájom veľmi líšiť. Každý dokument sám o sebe je uzavretou jednotkou a nie je ľahké nadviazať vzťahy medzi dokumentmi.

V posledných rokoch zaznamenali dokumentárne databázy vďaka úspechu NoSQL veľký rozmach, najmä vďaka dobrej škálovateľnosti. Príklad databázového systému tohto typu je MongoDB. V dokumentovo orientovanom databázovom modeli sú údaje uložené v samostatných dokumentoch, nie v tabuľkách, ako v relačnom modeli.

Tieto systémy sú obzvlášť zaujímavé pre webové aplikácie, pretože vám umožňujú ukladať kompletné formuláre HTML. Je potrebné zdôrazniť, že medzi rôznymi dokumentovými systémami existujú značné rozdiely, od syntaxe po vnútornú štruktúru, takže nie všetky dokumentovo orientované databázy sú pre tento scenár vhodné. Práve kvôli týmto rozdielom existuje niekoľko databázových systémov zameraných na reputačné dokumenty Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB a OrientDB.

Výhody a nevýhody

Výhody a nevýhody

Správne systémy správy databáz pomáhajú získať lepší prístup k údajom a optimalizovať ich správu. Bodový prístup zase pomáha koncovým používateľom rýchlo a efektívne vymieňať údaje v rámci úloh organizácie.

Databázový model

Rok vzniku

Výhod

Nevýhoda

Hierarchický

jedentisandninestredšesťdesiat

Veľmi rýchly prístup na čítanie, prehľadná štruktúra, technicky jednoduchá.

Opravená štruktúra v strome, ktorá neumožňuje spojenie medzi stromami.

Sieť

Začiatku 1970

Podporuje viac spôsobov prístup k záznamom bez prísnej hierarchie.

Zlý prehľad s veľkými databázami.

Relačné

jeden tisícdeväťstovky sedemdesiat

Jednoduché, flexibilné vytváranie a úpravy, ľahko rozšíriteľné, rýchle uvedenie do prevádzky, ľahké rozšírenie, rýchle spustenie, veľmi dynamický kontext.

Nespravované s veľkým množstvom údajov, zlá segmentácia, atribúty umelých kľúčov, externé programovacie rozhranie, zle odráža vlastnosti a správanie objektov.

Objektovo orientovaný

Neskoré 1980

Lepšia podpora objektovo orientovaných programovacích jazykov, ukladanie multimediálneho obsahu. Podporuje objektovo orientované programovacie jazyky, umožňuje ukladať multimediálny obsah.

Nižší výkon s veľkým množstvom dát, málo kompatibilných rozhraní.

Zamerané na dokumenty

z roku 1980

Príslušné údaje sú centrálne uložené v nezávislých dokumentoch, voľná štruktúra, multimediálny koncept, odkazuje na klasifikáciu dB entít.

Organizačná práca je pomerne vysoká, často vyžaduje programovacie zručnosti.

Oblasti použitia

Oblasti použitia

Človek si to nemusí uvedomiť, ale databázy sú všade. Bez ohľadu na to, či o nich niečo vie alebo nie, ich vplyv na každodenný život je veľmi veľký. Od meteorologických aplikácií až po online filmy sú databázy zodpovedné za mnoho služieb, ktoré ľudia denne využívajú, a aby sa nenechali zmiasť zvýšeným množstvom informácií, používajú klasifikáciu údajov v databáze.

Oblasti použitia DBMS:

  1. Bankovníctvo - informácie o zákazníkoch, účtoch a pôžičkách, ako aj bankové operácie.
  2. Letecké spoločnosti - informácie o rezervácii a harmonograme. Letecké spoločnosti boli medzi prvými, ktoré používali databázy geograficky distribuovaným spôsobom: terminály umiestnené po celom svete pristupovali k centrálnemu databázovému systému prostredníctvom telefónnych liniek a iných sietí na prenos údajov.
  3. Vysoké školy-informácie o študentoch, evidencia kurzov a ročníkov.
  4. Transakcie kreditnou kartou - pre nákupy kreditnou kartou a tvorbu mesačných výpisov.
  5. Telekomunikácie-na vedenie evidencie uskutočnených hovorov, zostavovanie mesačných účtov, udržiavanie zostatku na predplatených telefónnych kartách a ukladanie informácií o komunikačných sieťach.
  6. Financie-na ukladanie informácií o akciách, predajoch a nákupoch finančných nástrojov, ako sú akcie a dlhopisy.
  7. Predaj-informácie o zákazníkovi, produkte a nákupe.
  8. Výroba - pre riadenie dodávateľského reťazca a pre sledovanie výroby tovaru v továrňach, zásoby tovaru v skladoch, v obchodoch a objednávky tovaru.
  9. Ľudské zdroje-získavať informácie o zamestnancoch, mzdách, daniach zo mzdy a výhodách, ako aj dostávať platy.

Budúce trendy

Budúce trendy

V budúcom svetonázore databáz bude World Wide Web (WWW alebo v skrátenej podobe web) naďalej dôležitým aspektom ako prostriedok na publikovanie dokumentov a ako prostriedok na výmenu informácií. WWW poskytuje jeden z najrozmanitejšie a komplexné prostredie v oblasti interakcie.

Nedávno sa objavili technológie a štandardy zamerané na to, aby sa sieť stala škálovateľnou a zvládnuteľnou infraštruktúrou. Jednou z týchto technológií je XML, ktorý sa transformuje na Internet, na databázový systém v štýle tradičných obslužných programov databáz, čo poskytuje oveľa lepšie výsledky ako vyhľadávače. Výzvou je integrovať túto funkciu do XML a čo najlepšie využiť strategické informácie, ktoré môže používateľ nájsť na internete.

Novými trendmi sú proaktívna a prediktívna analýza výkonu, testovanie zaťaženia databázy, použitie NOSQL-mongodb a cassandra a BigData (Hadoop) v podnikových a cloudových prostrediach.

Články na tému