Adresy a is_in, RUIAN

11 zpráv
Zpět na přehled

Adresy a is_in, RUIAN

11 zpráv PDPVH 5 účastníků 12 min čtení
  1. Petr Vejsada osm na propsychology.cz #m3ae692
    Ještě jednou zdravím, chci se optat - poskytnout námět ohledně sjednocení adres. Docela mi vadí, že Nominatim neumí použít tag is_in, který se v databázi vyskytuje dosti často. Pak se nedá nalézt konkrétní dům, obzvláště v menších sídlech bez ulic. Ve větších sídlech si najdu ulici a tam se už podle orientačního čísla dá konkrétní dům nalézt, i když také ne vždy snadno. Třeba tehdy, když je k dispozici jen číslo popisné. V těch menších sídlech vůbec nemám tušení, kde bych měl dům hledat. Napadlo mě, zda se neuvažovalo o kompletním importu z RUIAN s následným (nebo současným) automatickým smazáním stávajících adresních bodů. To by asi šlo algoritmizovat podle vzdálenosti, něco jako: - vezmu nový adresní bod z RUIAN - podívám se kolem do vzdálenosti třeba 20 metrů, zda tam už adresní bod příslušného místa není. Pokud je, smazat a nahradit novým. Pokud není, jen přidat nový. Mohou nastat situace, kdy se stávající adresní bod nepodaří identifikovat. Chtělo by to zkusit. Snažil jsem se naimportovat RUIAN do postgisu, ale je asi zase nějaký nový formát a nezdařila se mi konverze z GML. Pokud by chodil import do postgisu, asi bych se v případě volného času pustil do pokusů.?
  2. Dalibor Jelínek dalibor na dalibor.cz #m1159f4
    Ahoj, Nominatim umi najit dum v mensich sidlech bez ulic, pokud je a adrese addr:place. Osobne se to snazim to vsech adres, tam kde mapuju, doplnovat. Zdravi, Dalibor
  3. Petr Vejsada osm na propsychology.cz #mb6e1ab
    Ahoj, díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se, že automaticky.. Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z nich má tag is_in a tedy 2.425 adresních míst tento tag nemá. Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852), cestách (4.375) i relacích (2). Mapnik vykresluje adresy jen u bodů. Podle pravidel na http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku. Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první), které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a rozhodnout, co s tím. Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000 adres dohledatelnými by nebylo špatné.
  4. "Petr Morávek [Xificurk]" petr na pada.cz #mb39093
    Ahoj, díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se, že automaticky.. Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z nich má tag is_in a tedy 2.425 adresních míst tento tag nemá. Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852), cestách (4.375) i relacích (2). Mapnik vykresluje adresy jen u bodů. Podle pravidel na http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku. Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první), které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a rozhodnout, co s tím. Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000 adres dohledatelnými by nebylo špatné.
    Ahoj, (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z této databáze. Zdraví, Petr Morávek aka Xificurk
  5. Petr Vejsada osm na propsychology.cz #mfefaa3
    Ahoj, díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech být cokoli. Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních místech: count | k | v --------+-----------------+------------------------------ 1 | source | http://www.autolibra.cz/1 | source | http://www.pension-libra.cz/1 | source | ruian 1 | source:addr | mvcr:adresa;ruian 1 | source:name | wikipedia 2 | source | local knowledge 3 | source:position | cuzk:km 45 | source | cuzk:kn 46 | source | cuzk:km 309 | source | mvcr:adresa 684 | source:loc | cuzk:km 1091 | source:addr | mvcr:adresa 202194 | source:addr | ruian S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a napsat do is_in nějaký nesmysl. Kolik jich bude? Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place? (víceméně řečnické otázky). To vyvolává další otázky, jako třeba: Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude? číslo popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v katastrálním území i bez znalosti ulice. To dnes v Nominatimu nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou. V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o zavedení městských částí? (Praha 1, Praha 2 atd.) Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce: Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry contains non-closed rings Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position 3490 within geometry a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také přidal projekci 5514, takže nevím. Jdu spát _)
  6. "Petr Morávek [Xificurk]" petr na pada.cz #me788f8
    Ahoj, díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech být cokoli. Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních místech: count | k | v --------+-----------------+------------------------------ 1 | source | http://www.autolibra.cz/1 | source | http://www.pension-libra.cz/1 | source | ruian 1 | source:addr | mvcr:adresa;ruian 1 | source:name | wikipedia 2 | source | local knowledge 3 | source:position | cuzk:km 45 | source | cuzk:kn 46 | source | cuzk:km 309 | source | mvcr:adresa 684 | source:loc | cuzk:km 1091 | source:addr | mvcr:adresa 202194 | source:addr | ruian S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a napsat do is_in nějaký nesmysl. Kolik jich bude?
    Nemám tušení... ona to totiž není jen otázka toho, jestli to někdo od "importu" zeditoval nebo ne. Já totiž vůbec nemám přehled, co, kdo, při jakém importu do tohodle tagu házel, ty ano, je to někde rozumně zdokumentováno? Myslím si, že pokud se něco opravuje, tak by se to mělo opravit pořádně.
    Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place? (víceméně řečnické otázky).
    To je dobrá otázka, před nedávnem jsme se o tom v jednom vlákně bavili...
    To vyvolává další otázky, jako třeba: Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude?
    Taky už jsem psal ve vedlejším vlákně (včetně odůvodnění) - já jsem pro to "všude" a obsahem by měl být název části obce.
    číslo popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v katastrálním území i bez znalosti ulice.
    Tady se pleteš, č.p. není jedinečné v katastrálním území, ale v "části obce".
    To dnes v Nominatimu nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou. V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o zavedení městských částí? (Praha 1, Praha 2 atd.)
    Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1, 2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích.
    Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce: Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry contains non-closed rings Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position 3490 within geometry
    Co přesně pouštíš za příkaz? Já jsem RUIAN importoval před pár dny bez problémů.
    a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také přidal projekci 5514, takže nevím. Jdu spát _)
    Zdraví, Petr Morávek aka Xificurk
  7. Václav Řehák rehakv01 na gmail.com #m6d013d
    To dnes v Nominatimu nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která se mi honí
    hlavou.
    V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se
    uvažovat o
    zavedení městských částí? (Praha 1, Praha 2 atd.)
    Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1, 2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích. Ona ta problematika je dost složitá, v Praze existuje mnoho různých
    dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy V centru je to ještě celkem přehledné, ale takové Satalice jsou buď samostatná MČ, nebo součást Prahy 19, ale na adresu se píše Praha 9. Osobně bych se do toho nepouštěl, pro neznalé územního členění Prahy to může přinést víc škody než užitku. Viz třeba Google, který renderuje názvy městkých částí, takže na mapě je Praha-Čakovice, Praha-Satalice, ale také Praha 19 (místo Kbely - což považuju za dost matoucí, byť úředně správné). V.
  8. Dalibor Jelínek dalibor na dalibor.cz #m967c47
    Ahoj, ja si myslim, ze je to celkem dobry napad. Jen by melo byt splneno nekolik podminek. Jen n a vysvetlenou. addr:place se nepouzival, pac nic rozumneho nedelal. Az od kvetna 2013 podle toho umi Nominatim vyhledavat Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak trochu svaty gral, protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat. Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu. Takze bych byl docela pro to, aby se do addr:place dala ta prvni cast is_in. Ano, sice hrozi, ze nekde se tam dostane nesmysl, ale porad mi prijde lepsi, ze ve vetsine pripadu pujde diky tomu adresa vyhledat. Davam k uvahu zvazit, zda tu zmenu neprovadet ze zacatku treba podle uzivatele, ktery adresu vytvoril. Myslim si, ze vetsina z nich je bud delana nejakym sikovnym importem, nebo pomoci pluginu Czech Address. V kazdem pripade vetsina adres, kde jsem editoval, byla delana jen par uzivateli (minimalis,... ) a ti meli tag is_in spravne. Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym vyhrazenym uctem (s inteligentnim nazvem). Co se tyce pridavani mestksych casti do addr:place, tam kde jsou ulice, tak tam si myslim, ze je to celkem jasne. Proste se do addr:place dava vzdy cast obce. Takze v Praze by to byla Liben, Kobylisy, Vysocany, tedy tak jak je to v KN a RUIAN. Jen nevim, jestli je tahle infromace v is_in tagu a mam pocit, ze vetsinou ne, takze stejne nebudes v prvni fazi mit, kde brat. Ale podle RUIANu by to jiste slo. Mit v adrese i Praha 9 by bylo sice fain, ale kde tu infomaci vezmes? Podle PSC urcite ne. Je to v RUIANu? Zdravi, Dalibor
  9. Petr Vejsada osm na propsychology.cz #ma6e2e3
    Ona ta problematika je dost složitá, v Praze existuje mnoho různých
    dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
    díky za info, autor článku má můj obdiv. Tak do toho nejdu.
  10. Petr Vejsada osm na propsychology.cz #m5ad9ce
    Ahoj, mojí prvotní motivací bylo a stále je mít možnost najít dům na malém sídle. Udělat to z is_in by tomuto cíli IMO významně přispělo s rizikem, že se v jistém množství případů dostanou do addr:place nepsrávné údaje, a to jen z toho důvodu, že už nesprávné v OSM teď jsou, jen na jiném místě. Varianta přes RUIAN vnáší riziko, že se stávající adresní místa chybně propojí s RUIAN a dostanou se tam nesmysly. Další chyby se mohou převzít z RUIAN. Také je třeba nalézt nějakou rovnováhu mezi mírou dokonalosti na jedné straně a množstvím času a energie do toho vložené na druhé straně.
    Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak trochu svaty gral, protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat. Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu.
    Pokud je RUIAN opravdu svatý, tak by se mohly všechny stávající adresní body smazat a nahrát je znovu kompletně z RUIAN. Následně pak dělat třeba jednou za rok aktualizaci.? Co třeba s tímto - http://mapapi.poloha.net/#map=20/50.22517/14.42172 - jsou tam adresy jednak jako adresní body a zároveň jsou na budovách. V okolí Odolené Vody je toho takto povícero. To smazání a komplet nový import by to vyřešil, jen jak je to s tou svatostí ;). Momentálně díky Xficurkově radě importuji RUIAN do db, pak to budu studovat a učit se s tím zacházet, takže uvidíme. jak to energeticky-časově odhadnu.
    Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym vyhrazenym uctem (s inteligentnim nazvem).
    Rozumím tomu tak, že pedro'_import není inteligentní název ;-)))
  11. hanoj ehanoj na gmail.com #me750c9
    Ona ta problematika je dost složitá, v Praze existuje mnoho různých
    dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
    díky za info, autor článku má můj obdiv. Tak do toho nejdu.
Napsat odpověď e-mailem… Odpovědět

Otevře váš e-mailový klient. Odpovědi pak sledujte zde na webu.