Geoinformace v prostředí sociálních sítí
Transkript
GEOINFORMACE V PROSTŘEDÍ SOCIÁLNÍCH SÍTÍ Dana FUSKOVÁ Vedoucí práce: Mgr. Lukáš MAREK www.geoinformatics.upol.cz SOCIÁLNÍ SÍTĚ • Primárně geosociální sítě – geolokační sítě – – – – Foursquare Couchsurfing Google places I just made love • Sociální sítě s prostorovou složkou, nebo geolokací – Facebook, Twitter, Google+ – Instagram, Flickr, Panorama • Sociální sítě s prostorovým atributem – – – – LinkedIn ČSFD / IMDb Youtube, MySpace Spolužáci www.geoinformatics.upol.cz SOCIÁLNÍ SÍTĚ Země 1. místo 2. místo 3. místo 4. místo 5. místo ČR Facebook YouTube LinkedIn Lidé Twitter Slovensko Facebook YouTube LinkedIn Tumblr Twitter Austrálie Facebook YouTube LinkedIn Twitter Pinterest Brazílie Facebook YouTube LinkedIn Twitter Instagram Čína Qzone Sina Weibo Renren Douban PengYou Egypt Facebook YouTube Twitter Vube.com Ask.fm Indie Facebook YouTube LinkedIn Twitter Pinterest Japonsko YouTube Facebook Twitter Mixi Ameba Jižní Afrika Facebook YouTube LinkedIn Twitter Pinterest Německo Facebook YouTube Xing LinkedIn Tumblr Nizozemsko Facebook YouTube LinkedIn Twitter Tumblr Polsko Facebook YouTube LinkedIn Tumblr Vube.com Rusko Vkontakte Odnoklassniki Facebook LiveInternet LiveJournal Španělsko Facebook YouTube Twitter LinkedIn Tumblr USA Facebook YouTube LinkedIn Twitter Pinterest Velká Británie Facebook YouTube LinkedIn Twitter Tumblr www.geoinformatics.upol.cz DATA MINING Proces vyšší úrovně získávání informací prostřednictvím dolování dat a to společně s přípravou před dobýváním znalostí až po následnou prezentaci. www.geoinformatics.upol.cz DOLOVACÍ PROSTŘEDKY • API – Twitter (dev.twitter.com) – Facebook (developers.facebook.com) – LinkedIn (developer.linkedin.com) • Web scraping – Mozenda – Web-Harvest • Komerční / Open source nástroje – – – – WEKA Pajek Rapid Miner R – knihovny – rFacebook, TwitteR, rGoogleVis, igraph… www.geoinformatics.upol.cz VIZUALIZACE DAT ZE SOC. SÍTÍ • ArcGIS – Social Media – Chrome-Twitter • R • Placebook • GeoSocialAggregator • A jiné www.geoinformatics.upol.cz TWITTER • Proces autorizace – consumer Key, consumer secret • Prostředí a jazyk R – Knihovny: OAuth, twitteR, streamR, • API – 3 části (Search API, Streamin API, REST API) – Search API • twitteR – searchTwitter uk100<-searchTwitter('#sochi', geocode='30.52,50.46,100km', cainfo="cacert.pem") www.geoinformatics.upol.cz TWITTER Streaming API • streamR – filterStream filterStream(file.name="ukraine1603.json", track=c("#crimea", "#ukraine"), timeout=3600, oauth=twitCred) • „lat“, „lon“ • „location“ – geokódování www.geoinformatics.upol.cz TWITTER Datum Počet Počet sběru získaných tweetů s tweetů tweetů geolokací 16.3.2014 17.3.2014 18.3.2014 19.3.2014 20.3.2014 21.3.2014 22.3.2014 23.3.2014 24.3.2014 25.3.2014 26.3.2014 27.3.2014 28.3.2014 29.3.2014 30.3.2014 25 822 9 376 17 868 13 705 41 241 12 546 15 847 11 074 19 297 25 444 15 230 17 107 7 666 12 869 17 401 www.geoinformatics.upol.cz 269 94 150 85 313 114 125 136 238 132 125 136 59 83 103 Velikost Velikost Počet geokódovaných tweetů JSON před geokódováním [kb] GeoJSON po geokódování [kB] 13 660 4 690 7 642 6 230 13 449 5 581 6 971 5 331 8 535 9 253 7 446 7 554 3 159 5 533 7 151 115 291 94 817 78 182 59 298 192 346 54 861 73 119 49 643 80 658 115 939 66 946 97 135 34 745 64 163 78 380 12 302 4 199 6 944 5 704 12 168 5 115 6 255 4 832 7 770 8 228 6 844 6 912 2 906 4 965 6 567 www.geoinformatics.upol.cz www.geoinformatics.upol.cz FACEBOOK • Autorizace – User Acess Token , App Acess Token, Page Acess Token, Klient Token • Prostředí R – rFacebook, Oauth • Přátelé – GEOLOKACE - hometown , location pratele <- getFriends(token, simplify = TRUE) pratele_info <- getUsers(pratele$id, token, private_info = TRUE) • Veřejné příspěvky – locale www.geoinformatics.upol.cz FACEBOOK www.geoinformatics.upol.cz FACEBOOK www.geoinformatics.upol.cz LinkedIn • JavaScript API • REST API – IPython • Pouze textový prostorový prvek • Mladé API • Informace vztažené pouze ke konkrétnímu uživateli www.geoinformatics.upol.cz DATA a jejich problémy • Twitter – – – – 42 proměnných Pouze 1% geolokovaných Parametr: Location Různé znaky netextového charakteru • Facebook – Pouze 1-3% geolokovaných – Není atribut pro samostatnou geolokaci • LinkedIn – Mladé API – Geoinformace pouze ve formě textu www.geoinformatics.upol.cz VÝSLEDKY • Postupy a metody pro zisk dat ze sociálních sítí • Popisy tří vybraných sociálních sítí a jejich API • Případové studie – Krize na Ukrajině a Twitter (262 493 tweetů) – Facebook – přátelé a veřejné příspěvky • Skripty v R a programový kód Python www.geoinformatics.upol.cz Děkuji za pozornost www.geoinformatics.upol.cz
Podobné dokumenty
Live Maps (Bing Maps)
Bing Maps developer account s pomocí Windows Live
ID
Vygenerovat Bing Maps key, tedy klíč, nutný k práci s
naší webovou aplikací
Silverlight
Bing maps platformy:
Silverlight Map Control I...
PDF verze - Hroch - VOŠ a SPŠE Olomouc
Procesy
Proces (program)
Proces (anglicky process) je v informatice název pro spuštěný
počítačový program. Proces je umístěn v operační paměti počítače v
podobě sledu strojových instrukcí vykonávan...
zadání tutoriálu
V minulém dı́le tutoriálu jsme se seznámili se základnı́mi pravidly syntaxe a programovanı́ v jazyce
Python. Popularita tohoto jazyka však nepramenı́ pouze z velmi pohodlné syntaxe, ale také...
7 divů světa metodika
Anotace: Prezentace a pracovní listy jsou určeny k prohloubení a upevnění
znalostí o antické kultuře, konkrétně divech světa.
Druh učebního materiálu: Výuková prezentace a pracovní list
Očekávaný v...
kapitoly z kvalitativního výzkumu
Jde o specifický přístup k vytváření a analýze kulturních dat v rámci kognitivní
antropologie, s jehož názvem se studenti často setkávají, ale pro mnohé z nich
zůstává zahalen rouškou tajemství. Sm...