Charles Explorer logo
🇨🇿

Digitální žurnalistika a datová analýza

Předmět na Fakulta sociálních věd |
JJM300

Sylabus

Uvedení do problematiky semináře (první třetina semestru)

Přístup k datům

Způsoby stahování

Veřejně dostupná data v českém prostředí - příklady

Zpracovávání dat, dostupné nástroje a interpretace

Nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií  

Praktický workshop na příkladu datových zdrojů Socialbakers* (dvě třetiny semestru)

Jak visualizovat data (a jak ne).

Co můžeme říct o lidech, kteří sledují (mentionují) profil na Twitteru? Příklad na politice a médiích.

Identifikace klíčových lidí v síti.  

* Datové zdroje se sestávají z veřejně měřitelného obsahu sociálních sítí prostřednictvím developerského rozhraní (APIs). Primárně se v datech určených pro mediální komunikaci společnost Socialbakers zaměřuje na následující platformy: Facebook, Twitter, Instagram, Youtube. Veřejně měřitelný obsah může být například velikost fanouškovské základy, aktivita stránek a angažovanost jejich publika.  

Datové zdroje ke zpracování do médií

Poskytnutí několika datových zdrojů k aktuálnímu tématu nebo využití veřejně dostupných datových zdrojů, konzultace výsledků (především statistického zpracování datové analýzy a interpretací výsledků).

Presence of Czech media (newspaper, online news) on Facebook and/or Twitter

Focus:keyword analysis, affinities of followers, overall activity (shareability, sentiment, most shared articles via social), differences between platforms (Twitter tends to use specific group of users in CZ)Platforms:Facebook and Twitter

Datasets: 1) Facebook posts a)  Fields: created time, message, total interactions, attachment, external link, post link, reactions, sentiment, post type b)  Time range: 2019 c)  Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky, aktualne) d)  Security: public data from SBKS database posts 2)  Twitter a)  Fields: created time, message, total interactions, mentions, hashtags, attachment, external link, tweet link, sentiment, post type b)  Time range: 2019 c)  Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky, aktualne) d)  Security: public data from SBKS database 3)  Media followers a)  Fields: follower id, following ids, following names, following handles, following sbks tags b)  Scope: List of following for random Czech 1000 followers of max 8 media c)  Security: public data from Twitter proxy, tags from SBKS database

US Election/Politics

Focus: analysis of potential presidential candidates, affinities of followers, followers overlap, mentions in media... with the goal to select the most probable opponent to Donald Trump in 2020 election.Platforms: Twitter

Datasets: 1) Followers of selected candidates (max 20) a)  Fields: profile id, followers ids b)  Scope: List of followers (ids) for selected profiles c)  Security: public data from Twitter proxy 2)  Twitter posts by selected US media that include mentions (or name) of selected candidates (max 20) a)  Fields: created time, message, mentions, hashtags, sentiment b)  Time range: 2019 c)  Security: public data from SBKS database 3)  Political affinities a)  Fields: follower id, following ids, following names, following handles, following sbks tags b)  Scope: List of following for random US 5000 followers of max 8 selected politicians/parties c)  Security: public data from Twitter proxy, tags from SBKS database 4)  Replies to tweets and mentions of selected democr. party candidates by other candidates (max 10) a)  Time range: 2019 b)  Scope: posts of max 10 selected politicians c)  Fields: mentions, message, sentiment, name d)  Security: public data from SBKS database

Czech Politics

Focus:keywords analysis, affinities, followers overlap, overall activity (shareability, sentiment), connectivity across parties (politicians from the same party)Platforms:Facebook and TwitterDatasets: 1)  Followers of selected Politicians / Parties (max 20) a)  Fields: profile id, followers ids b)  Scope: List of followers (ids) for selected profiles c)  Security: public data from Twitter proxy 2)  Facebook posts a)  Fields: created time, message, total interactions, attachment, external link, post link, reactions, sentiment, post type b)  Time range: 2019 c)  Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,

Piráti, Andrej Babiš, SPD) d)  Security: public data from SBKS database 3) Twitter a)  Fields: created time, message, total interactions, mentions, hashtags, attachment, external link, tweet link, sentiment, post type b)  Time range: 2019 c)  Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,

Piráti, Andrej Babiš, SPD) posts d) Security: public data from SBKS database 4)  Twitter a)  Fields: created time, message, mentions, hashtags, sentiment b)  Time range: 2018-2019 c)  Scope: mentions of max 8 selected politicians/parties (example: Dominik Feri,

ČSSD, Piráti, Andrej Babiš, SPD) d)  Security: public data from SBKS database 5)  Political affinities a)  Fields: follower id, following ids, following names, following handles, following sbks tags b)  Scope: List of following for random Czech 1000 followers of max 8 selected politicians/parties c)  Security: public data from Twitter proxy, tags from SBKS database

Other Topics

If anything in

Anotace

► Stručná charakteristika předmětu:

Cílem volitelného semináře, jehož odborným garantem je Středisko žurnalistiky umělé inteligence při IKSŽ FSV UK, je seznámit studentky a studenty s problematikou datové analýzy, včetně jejího následného zpracování do žurnalistických obsahů. Seminář se skrze případové studie zaměřuje na problematiku přístupu k datům (tzn. způsoby stahování, příklady veřejně dostupných dat v českém prostředí apod.), dále na zpracovávání dat, dostupné nástroje a interpretaci (tzn. nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií). Závěrečnou částí semináře je praktický workshop na příkladu datových zdrojů z Národního katalogu otevřených zdrojů. Účastníci semináře budou rozděleni do redakčních týmů, v nichž se naučí identifikovat klíčová témata a osobnosti sociálních sítí, datovou analýzu, správnou vizualizaci dat, včetně možných úskalí. Výstupy workshopu budou publikovány na webových stránkách Střediska žurnalistiky umělé inteligence.

► Jména vyučujících: Václav Moravec, Veronika Halámková

► Rozsah výuky: 0/2 ZS

► Podmínky zapsání předmětu: přijetí do magisterského studia

► Podmínky pro úspěšné zakončení semináře: 1) aktivní účast v semináři doplněná studiem povinné i doporučené literatury, ověřováno průběžně (40% z celkového hodnocení), 2) zpracování předmětné datové analýzy do publikovatelného textu na webových stránkách Střediska žurnalistiky umělé inteligence (60% z celkového hodnocení). Nesplnění jedné ze dvou výše uvedených podmínek znamená neúspěšné ukončení předmětu.

► Počet kreditů: 4