Aktualizace již importovaných adres

7 zpráv
Zpět na přehled

Aktualizace již importovaných adres

7 zpráv PHDJLM 6 účastníků 4 min čtení
  1. Petr Vejsada osm na propsychology.cz #m3937d9
    Ahoj, s potěšením dávám na vědomí, že začala (polo)automatická aktualizace již importovaných adres. Začal jsem minisetem Praha-Prosek, dále celou Prahu a teď se počítá celá republika. Aktualizace se dělá jen na již importovaných územích (t.j. v těch částech obce, kde je naimportováno více než 85% adres). Algoritmus je podobný jako při prvotním importu. Je přísnější, vyžaduje lepší shodu, protože se dá předpokládat, že naimportované adresy budou relativně dobré. Už taky maže. Maže se jen to, co je v RUIAN smazané a přitom se dělá další kontrola tak, že se spočítá počet adresních bodů v okolí s příslušným číslem popisným či evidenčním, a to jak v RUIAN, tak i v OSM. Pokud po smazání zbude v OSM odpovídající počet adresních entit daného čísla, tak se maže, jinak ne. Myslím, že tímto postupem by snad nemělo docházet k neoprávněnému mazání. Mazání je když: - bod obsahuje jen adresní tagy a není součástí cesty či relace, tak se opravdu smaže. - v ostatních případech se jen odstraní adresní tagy. Pokud někdo máte chuť, zkoukněte changesety na http://www.openstreetmap.org/user/CzechAddress/history , jestli tam přeci jen není nějaká blbost. Import se nám stále zpomaluje, kontributoři ubývají a i ti pilní jsou unavení. Území, která zbývají, jsou mnohdy opravdové "lahůdky". Pořád přemýšlím nad variantou zpracovat taková území, jako je Zlín tak, že by se všechny adresy smazaly a nahrály kompletně znovu. Například Brno-Chrlice - tam Tomáš pracoval prý asi 8 hodin a já to ještě doopravoval další více než 2 hodiny. A to šlo o cca 900 adres!!! Byly tam posuny klidně o 2 domy, body umístěné úplně nesmyslně, ale zase ne tak daleko, aby na to bot přišel. Co rada starších ;-) na variantu smazat/nahrát?
  2. hanoj ehanoj na gmail.com #m78f51c
    Co rada starších ;-) na variantu smazat/nahrát?
    *** já jsem pro, minimálně u importů hanoj
  3. Dalibor Jelínek dalibor na dalibor.cz #md0a82c
    Ja bych se smazani adres a jejich cisteho nahrani take nebal. Dalibor
  4. Jakub Sykora kubajz na kbx.cz #mdae915
    smazat a nahrát - souhlas. V případě nějakých výrazných problémů je vždy možné se podívat do historie a případně některá data revertnout - to v případě, že by se ukázalo, že importovaná data jsou opravdu velmi velmi nekvalitní nebo nekompletní. Nicméně do budoucna by i díky práci OSM mohl být RUIAN docela kvalitním zdrojem. Díky za investovaný čas - fascinující! K
  5. Libor Pechacek lpechacek na gmx.com #m085e16
    Co rada starších ;-) na variantu smazat/nahrát?
    Pro adresní body, které jsem nahrál já, dávám souhlas. V oblastech, kde znovu dělám RÚIAN import vidím, že opravy jsou v podstatě jen "za dobu od poslední editace bylo AM změněno, smazáno nebo byla upřesněna jeho poloha", "je chyba v RÚIAN", či "falešný poplach". Ruční revize podle mě nepřidává velkou hodnotu. Pro ostatní AM hlasuji pro smazat/nahrát, Libor
  6. Marián Kyral mkyral na email.cz #m4e63fc
    smazat a nahrát - souhlas. V případě nějakých výrazných problémů je vždy možné se podívat do historie a případně některá data revertnout - to v případě, že by se ukázalo, že importovaná data jsou opravdu velmi velmi nekvalitní nebo nekompletní. Nicméně do budoucna by i díky práci OSM mohl být RUIAN docela kvalitním zdrojem. Díky za investovaný čas - fascinující! K
    Taky jsem pro smazání a opětovné nahrání. Když je to teď tak špatné, tak po importu dat z RUIANu to určitě nebude horší :-D Marián
  7. Petr Vejsada osm na propsychology.cz #m24617c
    Ahoj, díky všem za schválení :). Zatím jsem se do toho nepustil. Myslel jsem, že to použiji na Zlín, ale tam, zdá se, jsem objevil podstatu toho šíleného množství varování. Ve Zlíně je cca 2000 dvojdomků. Každý dvojdomek má v realitě 2 adresy. I v OSM má 2 adresy, jenže tak, že je tam vlastně vždy jen jedna a ta druhá tam není, respektive je zduplikovaná ta první. Příklad: V realitě je dvojdomek s čísly 350 a 400. V OSM je s čísly 350 a 350. Bot tedy spáruje 350 z RUIAN s 350 v OSM, 400 nikde nevidí a tak ho nově vytvoří. Výsledek je, že dvojdomek má adresy 350, 350 a 400 plus výhrůžný řádek v data.csv. Zkouším Zlín udělat na 2 kola. V prvním kole jsem jen promazal těch 2000 duplicit, lehce zkoukl a nahrál do OSM. Až to budu mít zpátky v DB, tak toho bota na to poštvu ještě jednou, jakoby to ještě nebylo zpracované, a doufám, že už toho nebude k opravování takové kvantum. U metody smazání/znovunahrání jsem narazil na problém, že neumím poznat, co mám vlastně v OSM smazat. Asi to půjde vybírat jen podle polygonu, jenže jakého? Části obcí polygony nemají, tak jedině katastrální území Nu, budu řešit až pokud na to dojde.
Napsat odpověď e-mailem… Odpovědět

Otevře váš e-mailový klient. Odpovědi pak sledujte zde na webu.