filtr_rozsireny_jedinecne_01_nahled

Rozšířený filtr – získání duplicitních, unikátních a jedinečných záznamů

Identifikace hodnot, které se vyskytují v oblasti dat vícekrát (duplicity) nebo naopak hodnot, které jsou zastoupeny pouze jednou (unikátní hodnoty), patří mezi základní požadavky při zpracování dat.

***Zkušební soubor ke stažení exceltutor_filtr_rozsireny_jedinecne_hodnoty.xlsx***

V literatuře věnované Excelu (a v textech nápovědy a dialogových oken) je často pojem unikátní hodnoty používán ve dvojím, zcela odlišném smyslu – jednak pro označení hodnot, které jsou v datové sadě obsaženy pouze jednou (například rodné číslo) a jednak ve smyslu jedinečného zástupce několika stejných (duplicitních) hodnot. Z hlediska dalšího výkladu budeme pro zástupce několika stejných hodnot používat termín jedinečná hodnota.

Data - vzorek

Data – vzorek

V tomto seznamu je obsaženo:

  • 10 hodnot
  • 4 duplicitní hodnoty (A+, A-,B+,AB+) – hodnoty, které se vyskytují vícekrát
  • 1 unikátní hodnota (AB-) – hodnota. Která se vyskytuje pouze jednou
  • 6 jedinečných hodnot (A+,A-,B+,AB+,AB-) – zástupci všech různých hodnot v seznamu

Často potřebujeme pro další zpracování vyfiltrovat záznamy, které vytvářejí jednu z výše definovaných skupin:

  • Duplicitní hodnoty: zajímá nás, zda vůbec duplicity v poli hodnot existují, jaké hodnoty jsou zastoupeny vícekrát, případně kolik duplicitních hodnot a v jaké frekvenci pole obsahuje. Ubezpečení, že duplicitní hodnoty nejsou v daném poli zastoupeny, je nezbytně důležité zejména v případě pole, které používáme pro spojení s jinými tabulkami hodnot (klíč). Jedná se zejména o pole obsahující identifikátory, rodná čísla, čísla účtů, alfanumerické ekvivalenty čárových kódů, čísla smluv, jednací čísla spisů, čísla pojistných událostí.
  • Unikátní hodnoty: v případě, že pole může obsahovat více stejných hodnot, představují hodnoty, které se vyskytují pouze jednou, obvykle význam výjimek nebo extrémů – například v poli hodnot, které představují naměřené teplotní údaje za rozsáhlé časové období, bude představovat unikátní hodnota mimořádnou událost.
  • Jedinečné hodnoty: seznam jedinečných hodnot nám poskytuje přehled všech dostupných hodnot v daném poli. Pokud máme například oblast dat představující přehled vyplacených provizí prodejcům, bude nás jistě zajímat, kteří prodejci provizi obdrželi, bez ohledu na počet výplat – vytvoříme z pole identifikátorů (například interních čísel prodejců nebo ve zjednodušeném případě jmen a příjmení) seznam jedinečných hodnot. Obdobně nás může zajímat seznam jedinečných čísel účtů pro zjištění, na kterých účtech došlo k nějaké finanční operaci.

Specifickou úlohou může být vytvoření seznamu chybějících hodnot – například jmen prodejců, kteří žádnou provizi neobdrželi, „spících“ účtů – tedy účtů, na kterých k žádné operaci v minulosti nedošlo, pojistných smluv, ke kterým nebyla nahlášena žádná pojistná událost nebo seznam kalendářních dat pro dny, kdy nebyla hlášena žádná závada. V další části kapitoly si ukážeme postup, který paradoxně umožnuje vyfiltrovat neexistující záznamy.

Použití rozšířeného filtru pro získání jedinečných hodnot

Stačí v nastavení rozšířeného filtru aktivovat volbu Bez duplicitních záznamů:

filtr_rozsireny_jedinecne_01

Použití rozšířeného filtru pro získání unikátních hodnot

Musíme použít výpočtové kritérium založené na funkci COUNTIF, která prohledá oblast buněk zadanou v 1. argumentu funkce a vrací počet výskytů hodnoty zadané ve 2. argumentu.

Unikátní hodnoty jsou ty, které se vyskytují pouze jednou a funkce COUNTIF tedy vrací hodnotu 1:

Unikátní hodnoty - rozšířený filtr v Excelu

Unikátní hodnoty – rozšířený filtr v Excelu

Použití rozšířeného filtru pro získání duplicitních hodnot

Musíme použít výpočtové kritérium založené na funkci COUNTIF, která prohledá oblast buněk zadanou v 1. argumentu funkce a vrací počet výskytů hodnoty zadané ve 2. argumentu.

Duplicitní hodnoty jsou ty, které se vyskytují více než jednou a funkce COUNTIF tedy vrací hodnotu větší než 1:

filtr_rozsireny_duplicity_03

 

***Zkušební soubor ke stažení exceltutor_filtr_rozsireny_jedinecne_hodnoty.xlsx***

 

 

Vložit komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *