Cestina bez diakritiky

12 zpráv
Zpět na přehled

Cestina bez diakritiky

12 zpráv PBJMP 5 účastníků 6 min čtení
  1. Martin Vidner martin.osm na vidner.net #m86077b
    Hola, jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. Připadá mi škoda tam takhle zadávat neúplné údaje. Problém 1: Potlatch na Linuxu komolí český vstup. Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes schránku. Pokud máte jiné problémy, podělte se a třeba najdem řešení. Martin
  2. Pavel Machek pavel na ucw.cz #me7f5ab
    Ahoj!
    jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. Připadá mi škoda tam takhle zadávat neúplné údaje.
    Myslim ze je to z lehce historickych dob a muzu za to ja.
    Problém 1: Potlatch na Linuxu komolí český vstup. Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes schránku.
    Problem 2: Chybi ceska "ucw" klavesnice pro Xa ;-). Pavel
  3. BH singularita na gmail.com #m491e3f
    jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. Připadá mi škoda tam takhle zadávat neúplné údaje.
    Myslim ze je to z lehce historickych dob a muzu za to ja.
    Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to jednoznacne by se dala diakritika automaticky doplnit ... MP
  4. Jakub Sýkora kubajz na kbx.cz #ma237e0
    Mnohdy ani jako clovek netusim, jak ma jmeno vypadat, takze automatiku bych zavrhl :)
  5. Pavel Machek pavel na ucw.cz #m9eccb0
    jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. Připadá mi škoda tam takhle zadávat neúplné údaje.
    Myslim ze je to z lehce historickych dob a muzu za to ja.
    Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to jednoznacne by se dala diakritika automaticky doplnit ...
    Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym rozumnym formatu? Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni body v josm, bylo by doplnovani jmen ulic hned veselejsi... Pavel
  6. Kubajz kubajz na kbx.cz #m1450c7
    Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke... K
  7. Pavel Machek pavel na ucw.cz #m23e767
    Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke...
    Ono by stacilo to pridat jako vrstvu do josm, ale problem by mohl byt z tim vytahovanim databaze.. Pavel
  8. BH singularita na gmail.com #m18c026
    Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym rozumnym formatu? Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni body v josm, bylo by doplnovani jmen ulic hned veselejsi... Pavel
    http://www.mvcr.cz/adresa/xml.html Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici cisla popisna Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi ona :) MP
  9. Pavel Machek pavel na ucw.cz #md5e5df
    Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym rozumnym formatu? Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni body v josm, bylo by doplnovani jmen ulic hned veselejsi...
    http://www.mvcr.cz/adresa/xml.html Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici cisla popisna
    No, kompletni databazi snad rozdavaj na CDckach...
    Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi ona :)
    No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho dostanu zpet na server? Jinak jsem si trosku hral: Adresy mvcr obsahuji 25858 adresy.ofic unikatnich jmen ulic. Data v osm obsahuji 2518 adresy.osm unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr -- tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc). Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze jeste mame co delat. Pavel
  10. Pavel Machek pavel na ucw.cz #m3205b3
    Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym rozumnym formatu? Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni body v josm, bylo by doplnovani jmen ulic hned veselejsi...
    http://www.mvcr.cz/adresa/xml.html Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici cisla popisna
    No, kompletni databazi snad rozdavaj na CDckach...
    Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi ona :)
    No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho dostanu zpet na server? Jinak jsem si trosku hral: Adresy mvcr obsahuji 25858 adresy.ofic unikatnich jmen ulic. Data v osm obsahuji 2518 adresy.osm unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr -- tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc). Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze jeste mame co delat.
    (aha, tak tohle bylo na lehce starejch datech, ale ted to neni o moc lepsi. Nemecky ulice zmizely, zrejme diky presnejsimu czechia.osm).
  11. Petr Nejedly Petr.Nejedly na Sun.COM #m0775cb
    No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho dostanu zpet na server?
    No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten pred kazdym uploadem provede download daneho elementu a porovna to na konflikt. Pokud konflikt bude, oznaci, zbytek proste uploadne. Tim se dostavas na race window radove sekundy, skutecne transakce nejsou, ale stale by slo (s rizikem dalsi race) udelat download, upload, download history, pri detekci vlozene zmeny rollback. Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul hodiny....
  12. Pavel Machek pavel na ucw.cz #m368c9d
    Ahoj!
    No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho dostanu zpet na server?
    No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten pred kazdym uploadem provede download daneho elementu a porovna to na konflikt. Pokud konflikt bude, oznaci, zbytek proste uploadne.
    :-). Me neslo ani tak o detekci kolizi, jako o to jak to nahrat zpet... predpokladam ze bych mohl v .osm souboru opravit jmena a pak tam nastavit nejaky ten attribut "changed" aby to JOSM byl ochoten uploadovat.. ale to uz se bude v sedu delat tezko. (Ona to kazdopadne nebude moc legrace; data v seznamu adres jsou vsechna velkymi pismeny, a "zkombinuj velikost pismen z osm a diakritiku ze seznamu adres" neni neco co bych touzil psat v shellu...)
    Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul hodiny....
    Ted to jede docela rozume... Pavel
Napsat odpověď e-mailem… Odpovědět

Otevře váš e-mailový klient. Odpovědi pak sledujte zde na webu.