Stavim, stavis, stavime - aneb budovy a adresni body z CUZK

20 zpráv
Zpět na přehled

Stavim, stavis, stavime - aneb budovy a adresni body z CUZK

20 zpráv LSRJPOPM 11 účastníků 13 min čtení
  1. Lukas Kabrt lukas na kabrt.cz #m046693
    Zdravim, behem poslednich par dnu jsem si trochu hral s automatickym/poloautomatckym importem informaci z katastralni mapy. Co se mi podarilo: -------------------------- Stazeni dlazdic Nalezeni definicnich bodu budov (v mape oznaceny cervenou teckou a popisem - c.p., c.e, bez c.p./c.e.) Automaticke rozpoznani c.p./c.e Prozatimni export do OSM (pouze node v miste definichiho bodu a tag 'note' s rozpoznanym textem - hlavne pro kontrolu) Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji tak temer stoprocentni. Program je mozne stahnou a vyzkouset z adresy http://lkabrt.aspone.cz/osm/cuzk-import.zip Program pro svuj beh potrebuje .NET 3.5, pro rozpoznavani textu je pouzita knihovna tesseract. Je to testovaci verze, zdrojaky vypadaji hrozne a rychlost je pro seriozni praci nepouzitelna, tak me prosim nekamenujte :-) Ve slusnem stadiu rozpracovani mam rozpoznani obrysu budov. Co je potraba dodelat: -------------------------------- Zvysit rychlost - na tom se pracuje Aby bylo mozne nejak automaticky/poloautomaticky importovat adresni body tak je jim potreba priradit mesto/obec/mestskou cast ve ktere se nachazi a podle toho priradit nazev ulice a dalsi informace napr. UIR-ADR. Pokud jsem spravne pochopil situaci z prispevku v talk-cz, tak tohle je trochu problem. Z prehledove mapy CUZK se daji zjistit nazvy katastralnich uzemi, ale nevim jestli jejich hranice koresponduji s hranicemi obci. Hanoj tady nedavno psal, ze vektorizoval prehledove mapy z CUZK, ale bez nazvu katastralnich uzemi. Pokud by hranice katastralnich uzemi korespondovali s hranicemi obci/mestskych casti, ve kterych jsou c.p. jedinecna, tak by to slo vyuzit, i kdyby se nazvy katastralnich uzemi meli zadavat rucne - stejne nepredpokladam, ze by se importovala traba cela republika. Pro jednotlve adresni body jsem schopny rozpoznat i obrys budovy, ale to musim jeste doladit. Mam mnozinu definicnich bodu budov a mapu vektorizovanou na mnozinu vektoru (vektory na sebe navazuji) Pro kazdy z bodu se snazim najit polygon jehoz hranice jsou tvoreny temito vektory. Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej pokracuju dal a snazim se uzavrit cyklus, heuristika je takova, ze vzdy kdyz se da pokracovat vice smery, tak vybiram uzel, ktery je blize def, body budovy. Kdyz uzavru polygon, tak zkontroluju jestli je def. bod budovy opravdu uvnitr, jinak hledam dal / z jineho bodu) Jde o to, zda budovy do mapy pridavat, pripadne jak detailne - aby se velikost mapy nekolikanaspobne nezvysila. Na jednom miste jsem budovy kreslil rucne, docela podrobne a mapa hned vypada o tridu lip (http://www.openstreetmap.org/?lat=50.49736&lon=16.10043&zoom=16&layers=B000FTF).Koukal jsem, ze treba v Praze jsou budovy take kresleny docela podrobne, takze ja bych byl pro. Rad si prectu vsechny napady, rady a pripominky.
  2. Petr Schönmann pschonmann na gmail.com #m3c4cba
    Rad si prectu vsechny napady, rady a pripominky.
    Jak se to ovládá ? Kde je dokumentace ?
  3. Lukas Kabrt lukas na kabrt.cz #m3cf308
    Jak se to ovládá ? Kde je dokumentace ?
    Je to jenom testovaci verze, takze dokumentace neni. Stazeni mapy z WMS CUZK: tile-downloader.exe [north] [west] [south] [east] [path] north, west, south, east definuje hranice oblasti, ktera se ma stahnout, path cesta kam se maji dlazdoce ulozit. Ukazka pouziti je v souboru "downloader-sample.bat" Pozor - nezadavat prilis velkou oblast, velikost jedne dlazdice je 0.005° a jeji rozliseni 4000x4000px. Pro kazdou dlazdici vyvvori 3 soubory - mapa s definicnimi body budov, katastralni mapa a soubor info. Rozpoznani definicnich bodu budov: tile-processor.exe [tile-path] tile-path cesta a nazev dlazdice mapy (pokud ma dlazdice nazev 'test' - soubory test-kn.png, test-budovy.png a test.info a je ulozena v adresari data, tak se zada 'data/test'). Priklad je v souboru processor-sample.bat Vystupem programu je soubor address.osm, ktery lze otevrit v JOSM. Ulozeny tam jsou pouze definicni body budov, ne jejich obrysy jejich rozpoznani je jeste pomalejsi, tak jsem to tam zatim nedaval.
  4. jzvc jzvc na tpfree.fdns.net #m37a0f7
    Zdravim, potiz adresnich bodu muze byt ta, ze adresni bod je mimo budovu (jelikoz obkresluju ruco, tak sem takovych uz videl desitky) a pak automat nakresli jako budovu napr zahradu. Dal muze byt budova poskladana z vice polygonu (nebo je to vice budov tesne u sebe), ale adresni bod je jen v jednom. => videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim schvalenim, ale na fullauto import asi ne.
  5. Stanislav Brabec utx na penguin.cz #m77cdc1
    Lukas Kabrt píše v Ne 28. 06. 2009 v 20:56 +0200:
    Zdravim, behem poslednich par dnu jsem si trochu hral s automatickym/poloautomatckym importem informaci z katastralni mapy.
    Když jsem včera obkresloval domy a viděl jsem ty digitálně generované tečky, myslel jsem na to, že by něco podobného šlo udělat.
    Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji tak temer stoprocentni.
    Pokud se překrývají, stačí vyžádat detailnější mapu.
    Pro jednotlve adresni body jsem schopny rozpoznat i obrys budovy,
    To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je označena zastavěná plocha, která nemá přiřazen adresní bod.
    ale to musim jeste doladit. Mam mnozinu definicnich bodu budov a mapu vektorizovanou na mnozinu vektoru (vektory na sebe navazuji) Pro kazdy z bodu se snazim najit polygon jehoz hranice jsou tvoreny temito vektory. Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej pokracuju dal a snazim se uzavrit cyklus,
    Na to lze snadno nalézt protipříklad: dlouhá budova, před ní dvě malé boudy. Ale pokud provede kontrola a bude se hledat dál, nemusí to vadit. Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze vytrasovat přiléhající čáru. Stanislav Brabec, ICQ 116020046, xmpp:utx na jabber.cz
  6. Ondrej Novy onovy na nomi.cz #m0fead5
    Ahoj,
    Zdravim, behem poslednich par dnu jsem si trochu hral s automatickym/poloautomatckym importem informaci z katastralni mapy.
    rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni katastralni mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
  7. Petr Dlouhý petr.dlouhy na email.cz #mf29b7a
    1) Jen v některých místech, což se dá snadno odhalit pomocí ortofoto (nebo se to pozná podle vzhledu té katastrální mapy). 2) Samozřejmě to není tak, že by budova byla místo 10m široká 60m. Prostě bude spíš jen šouplá, což jde jednoduše opravit (nebo to ani tak moc nevadí, pokud je šouplé všechno. Tím chci říct, že to většinou není velký problém.
  8. Martin Kokeš shr3k na typo3-hosting.com #mb1a958
    rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni katastralni mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
    To máš ale na mysli digitalizované kreslené (analogové) mapy, nikoliv digitální katastr ne? :-) Viz. http://www.vugtk.cz/gis/info/digitalizace.html http://www.cuzk.cz/Dokument.aspx?PRARESKOD=998&MENUID=0&AKCE=DOC:10-DIGITALIZACE_KATASTRMAP MK
  9. jzvc jzvc na tpfree.fdns.net #m69a07f
    I v tom digitalnim katastru jsou pekne kravoviny, napr cesty ktere vedou desitky let jinudy, budovy, ktere uz nestoji ...
  10. Jan Dudík jan.dudik na gmail.com #m574f82
    Jenže v katastru jsou zaneseny pozemky + dělení podle majitele. To, že cesta vede jinudy není chyba katastrálky, ale spíš že to zatím nikomu nevadilo. J&D Dne Mon, 29 Jun 2009 01:50:46 +0200 jzvc <jzvc na tpfree.fdns.net> napsal/-a:
  11. Lukas Kabrt lukas na kabrt.cz #m6f523b
    Stanislav Brabec:
    To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je označena zastavěná plocha, která nemá přiřazen adresní bod.
    Existuje mnoho budov, ktere nemaji prirazen adresni bod ale na katastralni mape je zobrazen definicni bod budovy a u nej uvedeno "bez c.p./c.e.". Velka vyhoda rozpoznavani pouze def. bodu budov je v tom, ze jdou stahnout z WMS jako samostatna vrstva. Asi by slo hledat i budovy podle te tecky primo v katastralni mape, ale netroufnu si odhadnout, jaka bude uspesnost. Pokud budu mit cas tak vyzkousim.
    Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze vytrasovat přiléhající čáru.
    To je zajimavy napad. Diky, taky vyzkousim. jzvc:
    videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim schvalenim, ale na fullauto import asi ne.
    nejakou miru rucni kontroly predpokladam uz jenom proto, ze OCR neni uplne stoprocentni. S automatickym importem obrysu budov bych byl opatrny, pokud ale jde o adresni body, tak tam by to treba slo i automaticky. V oblastech kde na mape zadne nejsou, je IMHO lepsi je mit je o kousek blbe, nez vubec. Jesli provadet import pouze oblasti, ktere jsou v digitalnim katastru, nebo i oblasti, pro ktere jsou k dispozici jenom skenovane katastralni mapy, je otazkou.
  12. Radomir Cernoch radomir.cernoch na gmail.com #m031fa0
    Ahoj, Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
    Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze vytrasovat přiléhající čáru.
    To je zajimavy napad. Diky, taky vyzkousim.
    na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí. Radek
  13. Radomir Cernoch radomir.cernoch na gmail.com #m9cf1f9
    Dobrý den, Lukas Kabrt píše v Ne 28. 06. 2009 v 20:56 +0200:
    Zdravim, behem poslednich par dnu jsem si trochu hral s automatickym/poloautomatckym importem informaci z katastralni mapy.
    skvěle!
    Prozatimni export do OSM (pouze node v miste definichiho bodu a tag 'note' s rozpoznanym textem - hlavne pro kontrolu) Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji tak temer stoprocentni.
    Automatického importu bych se bál. Vím o budovách, které v KM mají popisek "bez označení", ale ve skutečnosti na nich visí tabule s číslem popisným. V tomto případě vím určitě, že KM obsahuje chybu. Dále je nemalé množství budov, u kterých číslo popisné v mapě neodpovídá číslu popisnému v databázi MVČR. Zatím nevím, zda je chyba v mapě či databázi. Zkouším však srovnat databázi MVČR s informacemi z České pošty a dám vědět hned jak se dozvím výsledek. Co tedy importovat tak, že data z OCR přilepíme k databázi adres MVČR a import budeme dělat postupně za pomocí CzechAddress? Je to způsob, jak využít OCR, zajistit ruční kontrolu dat a tuto kontrolu navíc distribuovat mezi více lidí. Pomohlo by to řešit i ten problém, že pozice adresního bodu v KM není vždy u vchodu do budovy... S pozdravem, Radek Černoch
  14. Radomir Cernoch radomir.cernoch na gmail.com #m7027e1
    jzvc píše v Ne 28. 06. 2009 v 21:40 +0200:
    Zdravim, potiz adresnich bodu muze byt ta, ze adresni bod je mimo budovu (jelikoz obkresluju ruco, tak sem takovych uz videl desitky) a pak automat nakresli jako budovu napr zahradu. Dal muze byt budova poskladana z vice polygonu (nebo je to vice budov tesne u sebe), ale adresni bod je jen v jednom. => videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim schvalenim, ale na fullauto import asi ne.
    Úplně souhlasím. Dokáži si představit takovou funkci, kdy po kliknutí na uzavřenou oblast v katastrální mapě se automaticky vytvoří obrys budovy. Fungovalo by to podobně rychle jako se dnes vytváří adresní body v CzechAddress. Nemám teď příliš času; pokud by to však bylo aktuální, s vytvořením nějakého takového pluginu rád pomůžu.
    Zdravim, ... Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej pokracuju dal a snazim se uzavrit cyklus, heuristika je takova, ze vzdy kdyz se da pokracovat vice smery, tak vybiram uzel, ktery je blize def, body budovy. Kdyz uzavru polygon, tak zkontroluju jestli je def. bod budovy opravdu uvnitr, jinak hledam dal / z jineho bodu)
    S pozdravem, Radek Černoch
  15. Stanislav Brabec utx na penguin.cz #m9852f6
    Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
    Stanislav Brabec:
    To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je označena zastavěná plocha, která nemá přiřazen adresní bod.
    Existuje mnoho budov, ktere nemaji prirazen adresni bod ale na katastralni mape je zobrazen definicni bod budovy a u nej uvedeno "bez c.p./c.e.". Velka vyhoda rozpoznavani pouze def. bodu budov je v tom, ze jdou stahnout z WMS jako samostatna vrstva. Asi by slo hledat i budovy podle te tecky primo v katastralni mape, ale netroufnu si odhadnout, jaka bude uspesnost. Pokud budu mit cas tak vyzkousim.
    Měl jsem na mysli polygony, které nemají ani tento definiční bod. Jde o místa, kde se jedno č. p. skládá v KN mapě z více přiléhajících polygonů, nebo když se jedno č. p. skládá ze dvou oddělených budov. Aby bylo jasné, které polygony znamenají zastavěnou plochu, bývá uprostřed polygonu namalovaná tečka. Je mi jasné, že rozpoznávání tečky v kreslené mapě bude problematičtější, ale bez ní bude v mnoha místech zakreslena jen část budov. I kdyby to nefungovalo úplně dokonale, bylo by to užitečné. Ostatně ani sama mapa v KN občas neodpovídá skutečnosti. Stanislav Brabec http://www.penguin.cz/~utx
  16. Stanislav Brabec utx na penguin.cz #m74a0b0
    Radomir Cernoch píše v Po 29. 06. 2009 v 10:50 +0200:
    Ahoj, Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
    Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze vytrasovat přiléhající čáru.
    To je zajimavy napad. Diky, taky vyzkousim.
    na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí.
    On třeba existuje potrace[1] nebo autotrace[2]. potrace je stále vyvíjen, dává slušné výsledky a autor je komunikativní. Myslím, že by byl ochoten poradit s případnou úpravou algoritmu pro tento účel. [1] http://potrace.sourceforge.net/[2] http://autotrace.sourceforge.net/ Stanislav Brabec http://www.penguin.cz/~utx
  17. Lukas Kabrt lukas na kabrt.cz #m9d8a2a
    na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí.
    Podobny algoritmus pouzivam pro vektorizaci a myslim ze funguje vcelku uspokojive. Vysldny vektor se vetsinou vejde do puvodni cary, ktera je tlusta nekolik px.
    On třeba existuje potrace[1] nebo autotrace[2]. potrace je stále vyvíjen, dává slušné výsledky a autor je komunikativní. Myslím, že by byl ochoten poradit s případnou úpravou algoritmu pro tento účel.
    Z potrace by se mozna dalo pouzit nektere algoritmy, ale vystup samotneho potrace mi prilis pouzitelny neprijde.
  18. Tomas Kolda kolda na web2net.cz #mb2611e
    Potrace byl pouzit na vektorizaci UHUL lesu... Pouziva se velmi hezky a celou CR (100 000 * 70 000 pixelu nebo tak nejak) vypocital za par minut. Pouzival jsem ho jako knihovnu. T
  19. Lukas Kabrt lukas na kabrt.cz #m063ac5
    2009/6/29 Tomas Kolda <kolda na web2net.cz>:
    Potrace byl pouzit na vektorizaci UHUL lesu... Pouziva se velmi hezky a celou CR (100 000 * 70 000 pixelu nebo tak nejak) vypocital za par minut. Pouzival jsem ho jako knihovnu.
    Aha, tak to vypada, ze bych si mel rozsirit obzory a dat mu jeste sanci :-)
  20. Pavel Machek pavel na ucw.cz #m016f03
    Ahoj!
    Prozatimni export do OSM (pouze node v miste definichiho bodu a tag 'note' s rozpoznanym textem - hlavne pro kontrolu) Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji tak temer stoprocentni.
    Automatick??ho importu bych se b??l. V??m o budov??ch, kter?? v KM maj?? popisek "bez ozna??en??", ale ve skute??nosti na nich vis?? tabule s ????slem popisn??m. V tomto p????pad?? v??m ur??it??, ??e KM obsahuje chybu.
    Coz myslim neni duvod se automatickeho importu bat... ...lidi to stejne delaj podle KM; kdyz bude v KM chyba, tak ji stejne zkopirujou, jen jim to da vic prace.
Napsat odpověď e-mailem… Odpovědět

Otevře váš e-mailový klient. Odpovědi pak sledujte zde na webu.