Bytero Engine™
Náš Machine Learning XGBoost algoritmus založený na 185 atributech nemovitosti s visual recognition AI.
Bytero Engine určuje tržní cenu pro celý trh s nemovitostmi. XGBoost model nad 185 atributy s visual recognition AI nad fotografiemi, kalibrovaný per region a segment, holdout-validovaný a kontinuálně přetrénovaný. Deal screening, due diligence a portfolio monitoring pro fondy, asset manažery a oceňovací týmy.
Architektura a tréninkový proces
Celý trh
Bytero Engine zpracovává celý trh v reálném čase - více než 360 000 inzerátů v rámci EU. Každý inzerát je kontinuálně sledován: atributy, fotografie, pohyby ceny i historie proměn. Tato data tvoří základ pro trénink i kalibraci modelu - bez nich by žádná predikce neodrážela skutečnou dynamiku trhu. Bytero je datová vrstva trhu, nikoli jednorázový snapshot.
Čištění, deduplikace a filtrování outlierů
Surová data procházejí vícestupňovou pipelineou. Perceptual-hash shoda obrázků kombinovaná s prostorovými a geometrickými kontrolami sloučí tentýž byt napříč celým trhem. Kanonicky normalizujeme dispozici, stav, typ konstrukce i energetický rating a sjednotíme menu. Pro trénink model váhuje inzeráty proti dominanci větších segmentů a iterativně odfiltruje extrémní odchylky cen - tak se Bytero Engine učí typické chování trhu, ne agentské anomálie ani datasetové outliery.
Feature engineering a vizuální analýza
Z každého inzerátu generujeme desítky příznaků v pěti kategoriích: lokalita (vzdálenosti k centru města, dopravním uzlům, školám, supermarketům), geometrie (plocha, věk budovy, podlaží), vybavení (výtah, parking, balkon, garáž), geografické enkódování regionů a okresů a vizuálně-finanční skóre interiéru. Vizuální skóre pochází z multi-modálního computer-vision modelu, který hodnotí byt podle fotografií. Pro predikci je každý příznak rovnocenný vstup.
Dva nezávislé XGBoost modely - prodej a pronájem
Trénujeme dva nezávislé XGBoost regresory - jeden pro prodejní cenu, druhý pro měsíční nájemné. Každý je interní ensemble více variant optimalizovaných pro různá měřítka a robustnost vůči asymetrické distribuci cen. XGBoost (gradient-boosted trees) patří k nejpřesnějším algoritmům pro tabular data a Bytero Engine jej kalibruje pro realitní kontext s vlastní regularizací, validací a strategií proti přetrénování. Výstupem je jedna tržní cena, nikoli kompromis mezi modely.
Kalibrace prodejní ceny a regionů
Listing ceny jsou asking ceny - prodávající listují optimisticky a rozdíl závisí na segmentu. Po tréninku Bytero Engine měří mediánové reziduum mezi modelem a pozorovaným trhem na holdout datech po segmentech a aplikuje kalibrační posun na každou predikci. Tentýž mechanismus zachycuje regionální specificitu - Bratislava, vysokotatranské resortové okresy a venkovské kraje fungují podle odlišných pravidel a dostávají vlastní offsety. Resortové ceny tak nejsou sloučeny do dynamiky hlavního města.
Holdout validace a kontinuální retraining
Každý nový kandidát na model projde validací na holdout datech, která nikdy neviděl - měříme R², MAE, MAPE, MedAPE, podíl predikcí v přesných pásmech a per-segment scoreboard. Naživo jde jen model, který překoná aktuálního šampiona na všech klíčových metrikách. Po každém obnovovacím cyklu trhu Bytero Engine doplní ceny pro nové inzeráty a v pravidelných intervalech přetrénuje na nejaktuálnějších datech. Žádné zastaralé modely - vždy aktuální kalibrace.
Tržní cena
Pro každou nemovitost Bytero Engine stanoví čtyři ceny: inzerovanou cenu (cenová úroveň podobných nabídek na trhu) a prodejní cenu (úroveň, na které se transakce reálně uzavírají) na prodejní straně, plus brutto a netto měsíční nájemné na nájemní straně. Z nich odvodí výnosové procento i odchylku listované ceny od tržní. Prodejní cena vychází z inzerované přes kalibrační vrstvu zohledňující kraj, aktuální sazby hypoték (ECB MIR), čas inzerátu na trhu a odchylku konkrétního inzerátu od srovnatelných nabídek. Výstup je strukturovaný, datovaný a verzovaný: připravený na decision-grade použití v deal screeningu, portfolio monitoringu i oceňovacích reportech. Bytero Engine určuje cenu, která odpovídá reálnému trhu - bez ručního porovnávání a bez kompromisů mezi modely.
Vizuální analýza interiéru
Computer-vision model zpracuje fotografie z inzerátu a kvantifikuje atributy, které by jinak hodnotil makléř při fyzické obhlídce.
Multi-modální LLM
Bytero Engine používá multi-modální computer-vision model, který zpracuje všechny fotografie inzerátu najednou a vrátí strukturované hodnocení. Přidává rozměr, který čistá tabulková data nedokážou zachytit: jak nemovitost reálně vypadá. Tentýž byt s identickou plochou a lokalitou může být připraven k nastěhování nebo vyžadovat kompletní rekonstrukci - a model vidí rozdíl.
Devět hodnocených atributů
Na škále 0-10 hodnotíme devět atributů: celkový stav, kuchyň, koupelnu, nábytek, podlahu, okna, přirozené světlo, kvalitu fotografií a potřebu rekonstrukce. Distribuce skóre je kalibrována tak, aby horní extrém zabíral jen malou část portfolia - model rozlišuje, nesbíhá se do průměru. Každý atribut je samostatný vstup do predikční pipeline.
Vliv na predikci
Dva byty s identickou plochou, lokalitou a dispozicí mohou mít tržní hodnotu odlišnou o desítky tisíc eur - podle stavu interiéru. Vizuální skóre vstupuje do predikce jako plnohodnotný příznak a vysvětluje rozptyl, který čistě numerický model nezachytí. Bez tohoto vstupu by Bytero Engine při stejné dispozici sloučil byt po rekonstrukci s původním stavem.
Verzionované hodnocení
U každého inzerátu vidíte agregované vizuální skóre spolu s verzí hodnotícího rámce. Při každém upgrade modelu umíme zpětně porovnat, která verze přinesla jaká zlepšení, a aplikovat novou revizi retroaktivně. Žádný black-box - každé skóre má auditovatelný původ, datum vyhodnocení i kontrolovatelná metadata.