Databáze 6

45. hodina DVOP WBB


Matěj Cajthaml — SSPŠ

©

Opakování

K čemu v MongoDB slouží distinct?
Jak vypadá volání příkazů na MongoDB databázi?
Jaké znáte kardinality?
Co je to sharding a replikace?
Je Atlas jediný způsob, jak hostovat MongoDB databázi?

Agregace

Agregace

  • rozděleno do stages
  • každý stage zpracuje vstup a vytvoří výstup
  • výstup se použije jako vstup pro další stage
  • výstup posledního stage je výsledek agregace

Typy agregací

  • match — filtrování
  • group — seskupení
  • sort — řazení

Group stage

  • seskupuje dokumenty podle zadaných kritérií
  • výsledkem je pole objektů
  • každý objekt obsahuje hodnoty agregovaných polí:
    • _id — hodnota agregovaného pole
    • count — počet dokumentů
    • sum — součet hodnot
    • avg — průměr hodnot
    • min — nejmenší hodnota
    • ...

Ukázka

Mohou se jednotlivé stage opakovat? Kolik stage může v jedné agregaci být?

Map-Reduce

Práce

Zjistěte, co je to Map-Reduce a jak se používá.

Další

  • lookup
  • merge

Sledování

Sledování

  • umožňuje sledovat změny v kolekci
  • zpracovává změny v reálném čase

Ukázka

K čemu se hodí sledování?

Propojení dokumentů

Jak uvnitř MongoDB můžeme vytvořit relaci? A co propojení?

Propojení dokumentů

  • vlastnosti dokumentu mohou obsahovat ObjectId jiného dokumentu
  • každý dokument v MongoDB má vlastnost _id datového typu ObjectId
  • co když se jiný dokument, na který je vázán, smaže?

BigData

BigData

  • označení pro velké množství dat
  • buzz word
  • v podstatě každé odvětví, které pracuje s daty:
    • zdravotnictví
    • bankovnictví
    • výroba
    • ...

Kde se berou data?

V jakém formátu data mohou být?

Jak velké množství dat ukládat?

Co je to vertikální a horizontální škálování?

Patří sharding a replikace do bigdata?

Používané technologie

  • Hadoop
  • Spark
  • ElasticSearch
  • ...

Děkuji za pozornost!

  • matej.cajthaml@ssps.cz
  • https://ssps.cajthaml.eu/