Cena bytu

Odhad ceny nemovitosti

Predikce nabídkové ceny na základě vlastností bytu a lokalit

O projektu

Odhad a analýza cen nemovitostí

Proč tento projekt vznikl?

Dostupnost bydlení je v posledních letech stále palčivějším tématem. Ceny nemovitostí setrvale rostou a pro běžného člověka je dnes velmi obtížné poznat, zda je požadovaná cena za dům či byt skutečně adekvátní.

Běžné realitní portály sice nabízejí základní filtry nebo ukazují průměrné ceny za metr čtvereční, tyto agregované statistiky ale pro hlubší pochopení nestačí. Cílem tohoto projektu je přinést do cenotvorby nemovitostí větší transparentnost a pomoci lidem se rozhodovat.

Projekt vznikl jako bakalářská práce na Fakultě informačních technologií ČVUT ve spolupráci s laboratoří OpenDataLab.

Hlavní cíl

Aplikace analyzuje vztah mezi nabízenou cenou a vlastnostmi nemovitosti pomocí datové analytiky a modelů strojového učení. Výsledkem je nástroj, který predikuje nabídkovou cenu a vysvětluje vliv jednotlivých parametrů.

Jak projekt funguje?

Komu aplikace pomůže?

Jak se počítá „Vliv faktorů na cenu“?

Když aplikace zobrazí odhad ceny, ukáže také graf „Vliv faktorů na cenu“. Ten nevznikl pouhým seřazením parametrů podle důležitosti – každý modrý a červený pruh vychází z matematicky přesného rozdělení zásluh mezi všechny vstupní údaje, které do modelu vložíte.

Proč to nestačí: průměry klamou

Běžné realitní portály často ukazují jen průměrnou cenu za m² v dané lokalitě. Ta ale neřekne, o kolik levnější je byt v panelovém domě oproti cihlovému, nebo jak moc cenu ovlivní energetický štítek. Tyto vlivy se navíc navzájem ovlivňují – například výtah zvedne cenu jinak v Praze než na venkově. Jednoduché průměrování tyto souvislosti nedokáže zachytit.

Jak to řeší SHAP: Spravedlivé rozdělení

Používáme metodu SHAP (SHapley Additive exPlanations), která je převzata z teorie her. Představte si, že každý parametr (rozloha, lokalita, stav, …) je „hráč“ a výsledná cena je jejich společná „výhra“. SHAP spravedlivě spočítá, kolik každý hráč k výhře přispěl – a to tak, že bere v úvahu všechny možné kombinace parametrů. Díky tomu víte nejen že model cenu odhadl, ale také proč je výsledek právě takový.

Co graf znamená v praxi

Jak model vznikl

Model je natrénován na ~11 000 reálných nabídkách nemovitostí. Používáme algoritmus XGBoost (gradient boosted trees), který je považován za jeden z nejlepších pro práci s tabulkovými daty. Pro dosažení co nejvyšší přesnosti prošel model rozsáhlým laděním hyperparametrů a byl porovnán s několika alternativními přístupy (lineární regrese, rozhodovací stromy, hierarchické mediány). Pro zajištění spolehlivosti jsou výsledky vyhodnocovány na datech, která model při trénování neviděl.

← Zpět na odhad