Delta-NEM

Statistika

Položka analýzy „Statistika“ umožňuje vytvářet statistické přehledy („reporty“) o trhu nemovitostí na míru podle potřeb uživatele. Příklady různých statistik včetně zadání lze nalézt na našem použít webu.

Při vytváření statistického souhrnu lze určit tyto náležitosti:

•
Filtr dat – určuje, které nemovitostí se mají do statistika zahrnou (např. podle typu nemovitosti, data prodeje, umístění nemovitosti, dispozice bytu atd.)
•
Členění dat – vybraná data lze rozčlenit podle nějakého klíče. Tak lze porovnat vlastnosti různých nemovitostí (např. členění podle data prodeje pro zobrazení časový vývoje cen, členění podle obcí pro srovnání místních odlišností, členění podle plochy bytu umožňuje posoudit závislost ceny na velikosti atd.)
•
Výsledné hodnoty – pro nemovitosti, která odpovídají filtru a členění lze určit, jaké hodnoty budou vypočteny (např. průměrná nabídková cena, medián prodejní ceny, průměrná plocha ad.)
•
Uspořádání do tabulky – lze určit, které hodnoty budou zobrazeny v řádcích tabulky, které ve sloupcích a které volně za sebou.

Filtr a členění

Filtr a členění dat spolu úzce souvisí, proto se zadávají společně.

Po vybrání položky analýzy „Statistika“ se zobrazí výchozí položky filtru/členění podle typu nemovitosti, data a umístění nemovitosti. Viz obrázek:

Do těchto položek je třeba doplnit konkrétní hodnoty. Pokud se pro typ nemovitosti označí více hodnot, bude výsledkem zvlášť statistický souhrn pro každý vybraný typ.

Je případně možné tyto výchozí položky smazat a přidat jiné. Pro vložení, přesunutí a smazání položky filtru/členění slouží nabídka vpravo u každé položky (malé tlačítko s šipkou dolů). Novou položku nakonec lze přidat tlačítkem „+ přidat členění/filtr“. Tlačítko zobrazuje seznam vlastností nemovitosti, podle nichž lze data členit a filtrovat.

Položky filtru/členění se svým obsahem liší podle příslušného typu dat. Jednotlivé případy jsou popsány dále.

Filtr a členění – datum

Pomocí zaškrtávacího políčka „pouze filtrovat určené období“ lze určit, jestli bude zadán pouze časový interval, kterým se data odfiltrují, nebo zda se data mají podle času rozčlenit. V obou případech se zvolí časová jednotka (rok, pololetí, čtvrtletí, měsíc, týden, nebo den) a začátek a konec časového intervalu. Pokud se má podle času členit, bude členění provedeno podle zvolené jednotky.

Data se počítají včetně okrajových údajů. Zadáme-li tedy jednotku „rok“ a hodnotu „2019“ jako první i poslední rok, budou odfiltrována pouze data z tohoto roku.

Filtr a členění – umístění nemovitosti

Podle umístění lze zároveň filtrovat i členit. Pro obojí je zobrazeno výběrové políčko (viz obrázek výše). Pro filtrování lze vybrat kraje, okresy, nebo obce. Dále program zobrazí editor seznamu, kam lze zadat požadované kraje, okresy či obce.

Členit lze podle krajů, okresů, obcí, částí obcí a katastrálních území. Členit na katastry a části obcí je možné pouze, když se filtruje podle obcí (jinak by bylo členěných případů příliš mnoho.) Členění na „části obce“ je smysluplné jen u větších měst, které jsou rozděleny na městské části či obvody (MOMČ), tj. Brno, Liberec, Opava, Ostrava, Pardubice, Plzeň, Praha a Ústí nad Labem.

Pokud se filtruje podle vyšších území než podle kterých se člení (např. filtr na Jihočeský kraj, členění na okresy), data se prostě odfiltrují podle vyššího území a ve výsledku bude zahrnut jen seznam příslušných nižších území. (Tedy v uvedeném příkladě budou zahrnuty jen údaje pro jihočeské okresy).

Lze též naopak filtrovat podle nižších území a členit podle vyšších. V tom případě bude výsledek rozčleněn podle požadovaných vyšších území, zahrnuty budou však jen údaje z vybraných nižších území. (Např. je zadán seznam obcí ve filtru a členění na kraje. Ve výsledku budou údaje vypsány po krajích, zahrnuta budou však jen data z vybraných obcí.)

Filtr a členění – číselné údaje

Pro číselné údaje (výměra, počet obyvatel apod.) se ve výchozím stavu zobrazí dvě políčka, kam lze zadat hodnoty od – do, podle kterých se data odfiltrují. Pokud se mají data rozčlenit na více intervalů, lze k tomu použít tlačítko „+ přidat skupinu“, které vloží další políčko mezi základní interval od – do. Jeho opakovaným stisknutím lze vložit požadovaný počet kroků členění. Pokud tedy například pro výměru vložíme dva mezilehlé kroky a doplníme hodnoty 0, 40, 60 a 100, budou data rozčleněna na tři intervaly podle výměr: [0 – 39], [40 – 59] a [60 – 100]. Výměry vyšší než 100 m² budou ze statistiky vyloučeny.

První a poslední hodnotu lze ponechat nezadanou, v tom případě se vezme minimální, resp. maximální hodnota (tj. data nebudou zdola, resp. shora omezena).

Zaškrtnutím políčka „pojmenovat skupiny“ program umožní zadat popisky jednotlivých intervalů členění. Pokud popisky nejsou zadány, budou ve výstupu vypsány číselná rozmezí intervalů. Konkrétně ve shora uvedeném případě bude členění nadepsáno „0 – 39“, „40 – 59“ a „60 – 100“. Pomocí pojmenování skupin lze místo toho zadat jiné popisky, např. „malé byty“, „střední byty“ a „velké byty

Filtr a členění – výčtové údaje

Pro údaje, které představují jednu možnost z předem daného výčtu (např. stav objektu, dispozice místností apod.), se zobrazí zaškrtávací políčka – jedno pro každou možnost.

Potom je několik možností, jak data filtrovat/členit:

a) označit jednu možnost – data se potom odfiltrují pouze na případy odpovídající označené možnosti.

b) označit víc možností a zvolit „filtrovat vybrané případy – odfiltrují se všechny zvolené případy a statistika se počítá ze všech dohromady. (Např. označíme stav „výborný“ a „velmi dobrý“ a necháme vypočítat průměrnou cenu – výsledkem bude průměrná cena objektů ve výborném a velmi dobrém stavu)

c) označit více možností a zvolit „rozčlenit na vybrané případy – data se rozčlení na skupiny pro každý případ jedna a statistiky se počítají zvlášť pro každou skupinu. (Např. označíme stav „výborný“ a „dobrý“ a necháme vypočítat průměrnou cenu – výsledkem bude zvlášť průměrná cena objektů ve výborném stavu a zvlášť průměrná cena objektů v dobrém stavu)

d) vytvořit více skupin tlačítkem „+ přidat skupinu – lze vytvořit více skupin, kde každá sestává z několika základních možností. Pro každou se určí název a vyberou možnosti, které se mají zahrnout. (Např. pro stav objektu lze tak vytvořit tři skupiny: „Nadprůměrné– zahrnuje stav „výborný“ a „velmi dobrý“, „Průměrné“ – zahrnuje stav „dobrý“ a „Podprůměrné“ – zahrnuje stav „před rekonstrukcí“ a „špatný“)

Poznámka ke údaji „stav objektu“: kategorie „výborný“ zahrnuje i novostavby – statisticky se nedá prokázat rozdíl cen mezi objekty se stavem označenými jako „výborný“ a „novostavba“ či „projekt“.

Filtr a členění – hodnoty ano/ne

Údaj „vlastnosti nemovitosti“ sestává z výčtu vlastností, kde každá může být buď přítomna, nebo chybět (např. napojení na vodovod, elektrická přípojka atd.). Položka filtru/členění zde obsahuje výčet vlastností, kde pro každou lze vybrat jednu z následujících možností:

•
Filtrovat hodnotu ANO – do statistiky budou zahrnuty pouze objekty, které mají příslušnou vlastnost.
•
Filtrovat hodnotu NE – do statistiky budou zahrnuty pouze objekty, kterým příslušná vlastnost chybí.
•
Rozčlenit – data budou rozčleněna na dva soubory – objekty, které danou vlastnost mají, a ty, které nikoli. Statistika bude vypočte pro oba soubory zvlášť.
•
Nezohledňovat (výchozí nastavení) – daná vlastnost objektů se nebere v úvahu.

Poznámka k filtrům a členění: ne všechny kombinace vlastností dávají smysl. Některým kombinacím přirozeně neodpovídají žádné objekty (např. družstevní vlastnictví je smysluplné pouze pro byty, napojení na sítě pouze pro pozemky apod.). Je na uživateli, aby zvážil, které kombinace jsou smysluplné. Pokud zvolené kombinaci filtrů neodpovídá žádný objekt, výsledná statistika bude prázdná. Totéž platí, pokud se vybere příliš úzké prostorové a časové omezení. V malých katastrech nemusí být evidovaná žádná prodávaná nemovitost. Pokud se tedy např. rozčlení na katastry celý okres, většina políček výsledné tabulky pak bude prázdná.

Výsledné hodnoty

Výsledkem členění a filtrování dat je určitý omezený soubor objektů. Dále je třeba určit, které statistické vlastnosti daného souboru nemovitostí nás zajímají. Požadované výsledné hodnoty lze určit pod nadpisem „Výstup“, který je umístěn pod seznamem filtrů a členění:

Nejprve je třeba zvolit hodnotu, ze které se statistika bude počítat. Kromě nabídkové a prodejní ceny lze vybrat některou z typů ploch nemovitostí nebo dalších charakteristik.

Prodejní ceny vycházejí ze srovnání nabídkových objektů s ekvivalentními objekty z dat skutečně realizovaných prodejů evidovaných ČÚZK.

Dále je třeba určit, jaká statistická operace se nad zvolenými hodnotami má provést. Možnosti jsou tyto:

•
průměr – ze souboru hodnot se vypočte běžný aritmetický průměr.
•
medián – ze souboru hodnot se vypočte medián. Mediánem se rozumí hodnota, pro kterou platí, že právě polovina hodnot souboru je menší a polovina je větší (tj. kdyby se hodnoty upořádaly podle velikosti, medián by byl hodnota uprostřed). Medián může být vhodnější charakteristika souboru cen než průměr. A to ze dvou důvodů: (1) Vzhledem k tomu, že distribuce cen je typicky asymetrická s delším horním koncem, medián se více blíží nejčastější hodnotě; aritmetický průměr dává převážně vyšší hodnotu. Tento jev je obecně známý u mezd – medián mezd se více blíží „běžné mzdě“. (2) Medián je méně citlivý na odlehlé hodnoty. Pokud se v souboru vyskytne např. jeden objekt s abnormálně vysokou cenou, tato cena může průměr podstatně vychýlit. Vzhledem k tomu, že medián je definován pomocí počtu objektů nad a pod jeho hodnotou, jeden abnormální objekt nemůže jeho hodnotu výrazně neovlivní.
•
cena dle modelu – pro objekty daného souboru se vypočte cena podle modelu MoniT (nabídková nebo prodejní, podle výběru uživatele). Výsledkem je potom statisticky nejpravděpodobnější cena vybraného typu nemovitostí. Cena dle modelu může představovat přesnější charakteristiku, než průměr či medián z hrubých dat, protože cenový model efektivně oddělí podstatnou informaci (trend) od nahodilého šumu. To může být zvlášť významné, pokud jde o malé soubory nemovitostí (např. nemovitosti v jednom katastru za kvartál – takových nemovitostí bude jen pár desítek a jejich průměrná cena tedy bude výrazně náhodně kolísat. Cena podle modelu toto kolísání odstraní, takže lze statisticky mnohem věrohodněji posoudit např. trend růstu v čase nebo rozdíl ceny mezi různými lokalitami/typy nemovitostí). Další podrobnost k této problematice lze nalézt na našem webu v článku Na matematice záleží.
Poznámka: Ceny podle modelu se blíží mnohem spíše mediánu než průměru cen. U cen je obecně medián lepší charakteristika než průměr.

Pokud je pro výstup zvoleno více hodnot, je třeba pro každou zadat titulek, kterým bude hodnota nadepsána, aby se ve výstupu rozlišily.

Uspořádání do tabulky

Pro každé členění dat a také pro výsledné hodnoty (pokud je jich více) lze zvolit, jak mají být dané hodnoty ve výstupu uspořádány. Možnosti jsou tyto:

•
Text pod sebou
•
Řádky tabulky
•
Sloupce tabulky

Tak lze snadno určit strukturu výsledného textu. Náhled výsledného textu je zobrazen pod zadáním statistiky, takže ho lze před vlastním výpočtem průběžně kontrolovat.

Možnost „Text pod sebou“ pro koncové hodnoty znamená, že jednotlivé hodnoty budou na samostatných řádcích s vlastním popiskem. Pokud je tato možnost naopak použita na nejvyšší úrovni členění, za níž případně následuje definice tabulky, bude výsledkem několik nezávislých tabulek umístěných za sebou v textu, každá nadepsaná příslušným popiskem členění.

Cena

Výpočet statistického přehledu je zpoplatněn 2 kredity za každých 10 údajů. Počet údajů se zaokrouhluje na desítky nahoru. Jedním údajem se rozumí jedna číselná hodnota (jedno políčko tabulky) ve výsledném textu.

Během zadávání struktury statistického přehledu se zobrazuje náhled výstupu, kde jsou konkrétní hodnoty nahrazeny otazníky. Zpoplatněn je až konečný výpočet.

Vypočtené hodnoty jsou uloženy v počítač uživatele, takže pokud byl výpočet dané hodnoty jednou zpoplatněn, její opakované použití je již zdarma. Pokud tedy chce uživatel pouze změnit vzhled již vypočteného přehledu, není mu nic účtováno. Podobně, pokud např. chce pouze přidat sloupec do existující tabulky v přehledu, bude mu účtován pouze výpočet nového sloupce a nikoli celé tabulky.

Vypočtené hodnoty jsou v počítači uloženy po dobu, než je vydána aktualizace dat. Data jsou aktualizována zhruba jednou měsíčně. Výpočty statistik nad aktualizovanými daty jsou zpoplatněny znovu.