Import/Synchronizace dat z All The Places

11 zpráv
Zpět na přehled

Import/Synchronizace dat z All The Places

11 zpráv VJMDTP 6 účastníků 7 min čtení
  1. Vojtěch Fošnár me na vfosnar.cz #mdb1de1
    Ahoj, Začal jsem pracovat na programu, co automaticky synchronizuje data z https://www.alltheplaces.xyz/ do OSM. Pokud má někdo zájem vypomoct, ocenil bych hlavně pomoc s kontrolou kvality, návrhy na další zdroje dat, popř. přispívat kód přímo do upstreamu All The Places. Kód bota jako takového mám v plánu dost měnit, takže tam spíš nic nepřidávat. Až dostanu dost feedbacku, chci spustit import přímo do OSM a exportovat pravidelně CSV s custom questama do SCEE (a možná https://github.com/Helium314/SCEE/issues/522). Přehled: https://atpsync.vfosnar.cz/ SCEE custom quest CSV preview: https://atpsync.vfosnar.cz/scee.csv (Nastavení -> Data management -> Load custom quest file -> Provide) Zdroj bota: https://gitlab.com/vfosnar/atpsync Momentálně umí stahovat včetně otevírací doby: - Billa - Burger King - dm - KFC - Lidl - Mc Donald's - Teta A bez otevírací doby COOP. Nápady do budoucna: - Foodora - existence a otevírací doba všech podniků, ve kterých operuje? - Zásilkovna - to samé jako u Foodory
  2. Jan Martinec jan na martinec.name #m7b34e5
    Ahoj, nepotěším tě, mám ZÁSADNÍ problém s licencí těch dat. ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část, co k ní máme práva, mrk mrk": https://github.com/alltheplaces/alltheplaces/issues/5133 Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu. "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá. (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je nějaká proprietární databáze, která rozhodně svobodná data neposkytuje) Zdar, Honza Piškvor Martinec
  3. Vojtěch Fošnár me na vfosnar.cz #m44c960
    Nad licencí jsem dumal a už se to probíralo i na Matrix chatu.
    ATP.xyz sice ta data poskytuje jakoby CC-0 (na hlavní stránce), ale staví se k tomu mimořádně alibisticky "se mrkněte, jestli ten konkrétní zdroj fakt je ok, my to jen někde sehnali, cc0 je ta část, co k ní máme práva, mrk mrk": https://github.com/alltheplaces/alltheplaces/issues/5133 Nezdá se mi, že takhle to funguje. Do OSM bych to rozhodně neimportoval - o nic víc, než jakýkoliv jiný data nascrapovaný z webu. "Nascrapoval to někdo jinej, já se tam radši nekoukal" z toho CC0 neudělá.
    Toho jsem si vědom, ATP scrapery jsem ale všechny ručně procházel, ve většině případů i poupravoval. Momentální scrapery používají veřejně dostupné informace z webu a jejich dostupnost na mapách je v zájmu daných společností. Něco jiného by bylo, kdyby se jednolo třeba o scrapování firmy.cz.
    (Namátkou jsem se proklikal ke zdroji Decathlonu, a zrovna to je nějaká proprietární databáze, která rozhodně svobodná data neposkytuje)
    Scraperu Decathlonu bych se např. vyhnul, protože má hardcoded API klíč. Pokud ten API klíč ale posílá stránka a scraper ho extrahuje za běhu, nevidím v tom problém.
  4. Daniel Kašík kasik.daniel na email.cz #m12d34e
  5. Jan Martinec jan na martinec.name #mea80ce
    "pokud by se na základě ATP vytvořily úkoly v SCEE" Skoro bych řekl, že pokud někdo vidí na webu nějaký tvrzení (třeba na tý mapě bodů), a do OSM přidá, co zjistí v terénu, tak to je úplně v klidu. Jak je to má SCEE s licencema, to vůbec netuším. Zdar, HPM pá 15. 3. 2024 v 12:58 odesílatel Daniel Kašík <kasik.daniel na email.cz>
  6. Vojtěch Fošnár me na vfosnar.cz #mf8bc87
    Předmět ochrany 1. Podle této směrnice jsou databáze, které způsobem výběru nebo uspořádáním obsahu představují vlastní duševní výtvor autora, chráněny jako takové podle autorského práva. Pro určení, zda podléhají této ochraně, se neuplatní žádná další kritéria. 2. Autorskoprávní ochrana databází podle této směrnice se nevztahuje na jejich obsah a není na újmu práv k tomuto obsahu.
    A to podle mě celkem shrnuje tahle zpráva z Matrix chatu
    *amunak* (telegram) ? Tak ty firmy davaji ty udaje na svoje weby proto, ze chteji byt nalezeny, a na verejne zname udaje se copyright neaplikuje (ani explicitni, ani implicitni), pokud nekdo nekopiruje formu, jakou to napsali, coz tohle nedela.
    Nebo mi ještě něco uniká?
  7. Tomas Kasparek tomas.kasparek na gmail.com #m5624c5
    Ahoj, ano. Pro doplneni dat do OSM jsou tyhle moznosti: - nekdo s uctem v OSM jehoz aktivaci souhlasil s podminkami to na miste overi a prida - externi zdroj s prokazatelne kompatibilni licenci s ODbL. - explicitni souhlas vlastnika dat To ze je to v necim zajmu nestaci. tom.k
  8. Vojtěch Fošnár me na vfosnar.cz #me6df29
    Ahoj, jsem si vědom toho, že mít to v zájmu nelegalizuje akci. Jen to říká, že si nebudou stěžovat :) Proto příklad s firmy.cz Navíc při pátrání jsem ještě narazil na oficiální vyjádření OSMF k importu ATP dat. viz https://osmfoundation.org/wiki/Licensing_Working_Group/Minutes/2023-08-14#Ticket#2023081110000064_%E2%80%94_First_party_websites_as_sources
    From a legal risk perspective, we do not consider accepting this information to be a legal risk to OSMF
    Takže v tom jak je bot momentálně nastavenej nevidím problém.
  9. Miroslav Suchý mirek na rodina-sucha.cz #m7b730f
    Ahoj, sice se v tom importu neangažuji, ale mám dotaz k licenci: pokud by se na základě ATP vytvořily úkoly v SCEE a přidaly se jen pokud někdo ověří v terénu údaje, bylo by to taky porušení?
    Databáze může vzniknout i novým uspořádáním jiné databáze vytvořené jiným subjektem (§ 2 odst. 4 autorského zákona). Nicméně toto uspořádání a vklad ?nového tvůrce? musí být podstatné.
    Tedy pouhé scrapovaní a automatizovaný přepis není "podstatné" - je triviální. Vytvoření úkolů, jejich ověření v terénů je "podstatné" přetvoření. Nutno podotknout, že "podstatné" není AZ definováno a je ponecháno na výkladu soudu. Takže tento výklad se opírá o existující judikáty a zaběhnutou praxi. Mirek
  10. Miroslav Suchý mirek na rodina-sucha.cz #m2b157b
    Momentální scrapery používají veřejně dostupné informace z webu
    To, že je něco veřejně dostupné ještě neznamená, že je možné to dále šířit. https://www.zakonyprolidi.cz/cs/2006-398#p44
    a jejich dostupnost na mapách je v zájmu daných společností.
    Něco takového AZ nezná. Pokud je v zájmu firem danou databázi šířit, tak mají udělit souhlas k šíření. Tj. v praxi zveřejnit to pod svobodnou licencí. Nejde ani spoléhat na to, že daná firma nebude někho žalovat, protože porušení AZ je trestný čin. A trestný čin může oznámit kdokoliv. A policie a prokuratura se takovým oznámením musí zabývat.
    Něco jiného by bylo, kdyby se jednolo třeba o scrapování firmy.cz.
    Ne. Jedná se o uplně stejný případ. V tom horším výkladu jaké jsou důsledky. Mirek
  11. petr.kadlec na gmail.com petr.kadlec na gmail.com #m3d7255
    Ahoj, On Tue, Mar 19, 2024 at 10:54?AM Miroslav Suchý <mirek na rodina-sucha.cz>
    Momentální scrapery používají veřejně dostupné informace z webu
    To, že je něco veřejně dostupné ještě neznamená, že je možné to dále šířit. https://www.zakonyprolidi.cz/cs/2006-398#p44
    Jistěže. Ale také to, že to něco, co je veřejně dostupné, je _něco_, automaticky neznamená, že je to chráněno právem autorským či právy souvisejícími. :-)
    Pokud je v zájmu firem danou databázi šířit, tak mají udělit souhlas k šíření. Tj. v praxi zveřejnit to pod svobodnou licencí.
    Může být. Ale to bychom nejprve museli zjistit, že se v daném konkrétním případě vůbec jedná o databázi, ke které náleží zvláštní práva pořizovatele. (Ke kterým někdo má a může udělovat nějaké licence.) A jak se vysvětluje v té výše odkazované odpovědi od Licensing WG, v případě, že tou databází je seznam obchodů nějaké konkrétní firmy na jejím vlastním webu, nebude se zpravidla jednat o takto chráněnou databázi, protože sui generis právem jsou chráněny v zásadě jen databáze tvořené třetími osobami, protože podmínkou ochrany je onen ?kvalitativně nebo kvantitativně podstatný vklad? do pořízení _té databáze_ (nikoli jejího _obsahu_). Tzn. ta firma tu databázi vyrábí normálně v rámci své vlastní činnosti, není to tak, že by vedle toho, že prodává rohlíky, taky investovala nějaké peníze, aby se podařilo sestavit databázi jejích prodejen (a tu poté vystavila na internetu).
    Něco jiného by bylo, kdyby se jednolo třeba o scrapování firmy.cz.
    Ne. Jedná se o uplně stejný případ. V tom horším výkladu jaké jsou důsledky.
    To právě nejedná, tam jde o to, že Seznam.cz v případě firmy.cz investuje do sestavení té databáze a to sui generis právo chrání _právě_ takovéhle pořizovatele databází. Oproti tomu v případě nějaké té Billy ta databáze vznikla takříkajíc ?sama od sebe?, v rámci běžné činnosti té firmy, nezakládá tedy zvláštní práva pořizovatele. -- Petr Kadlec / Mormegil
Napsat odpověď e-mailem… Odpovědět

Otevře váš e-mailový klient. Odpovědi pak sledujte zde na webu.