32. hodina MVOP WBF
Matěj Cajthaml — SSPŠ
©
| Stránka 1 | Stránka 2 | Stránka 3 | Stránka 4 | |
|---|---|---|---|---|
| text | 1 | 1 | 1 | 1 |
| je | 1 | 1 | 1 | 0 |
| krásný | 1 | 0 | 0 | 0 |
| nejkrásnější | 0 | 1 | 0 | 0 |
| stránka | 0 | 0 | 1 | 1 |
nejkrásnější
| Stránka 1 | Stránka 2 | Stránka 3 | Stránka 4 | |
|---|---|---|---|---|
| text | 1 | 1 | 1 | 1 |
| je | 1 | 1 | 1 | 0 |
| krásný | 1 | 0 | 0 | 0 |
| nejkrásnější | 0 | 1 | 0 | 0 |
| stránka | 0 | 0 | 1 | 1 |
Co budeme dělat, když chceme ale najít nejkrásnější stránku
?
nejkrásnější AND stránka
nejkrásnější OR stránka
| Stránka 1 | Stránka 2 | Stránka 3 | Stránka 4 | |
|---|---|---|---|---|
| text | 1 | 1 | 1 | 1 |
| je | 1 | 1 | 1 | 0 |
| krásný | 1 | 0 | 0 | 0 |
| nejkrásnější | 0 | 1 | 0 | 0 |
| stránka | 0 | 0 | 1 | 1 |
| VÝSLEDEK | 0 | 1 | 1 | 1 |
Jak vypadají výsledky dotazu?
krásnýa
krásnějšíse spojí do jednoho slova
Jak tato tabulka — index, bude velký? Kolik bude mít řádků a sloupců?
| mám | 1 | 3 | |||
|---|---|---|---|---|---|
| rád | 1 | 2 | |||
| mvop | 1 | 2 | 3 | 4 | |
| je | 1 | 2 | 3 | 4 | |
| krásný | 3 | 4 | 12 | 15 | 203 |
Může nastat, že dotaz (mvop AND krásný) AND rád
bude rychlejší než mvop AND (krásný AND rád)
?
Je to, že stránka obsahuje nějaké slovo, dostatečným ukazatelem, že je stránka dotazu relevatní?
Takto ale asi na Googlu nehledáte, ne?
Toto vyhledávání se hodí právě tehdy, když víte co hledáte. Což skoro nikdy nevíte.
| Stránka 1 | Stránka 2 | Stránka 3 | Stránka 4 | |
| mám | 0.43 | 0.00 | 0.45 | 0.0 |
|---|---|---|---|---|
| rád | 0.43 | 0.11 | 0.00 | 0.03 |
| mvop | 0.43 | 0.43 | 0.43 | 0.43 |
| je | 0.95 | 1.00 | 0.23 | 0.47 |
| krásný | 0.00 | 0.00 | 0.00 | 0.01 |
Jak počítáme hodnocení celého dotazu vůči jedné stránce?