What gramma8cal morphemes tell us about
Transkript
What gramma8cal morphemes tell us about
What gramma)cal morphemes tell us about discourse: A key“morph” analysis of Czech presiden)al speeches Masako U. Fidler (Brown University, USA) in Prague, Czech Republic) Václav Cvrček (Charles University upon Tyne, UK ICLC-‐13, Newcastle July 21, 2015 Overview Ini)al hypothesis: gramma)cal morphemes inform us about discourse style. Method: a corpus-‐driven key“morph” analysis of Czech presiden)al speeches (1975-‐present) Exposure to language and what it does… • Frequent exposure to linguis)c forms ! entrenchment (Usage-‐based grammar) (Bybee 1985: 117). • “Mental Corpus” (Taylor 2014) – A possible view that a speaker implicitly knows the rela)ve frequencies of linguis)c units. • “No)cing hypothesis” (Schmidt 1990, 2010) – Benefits of speaker's explicitly contras)ng his/her familiar linguis)c paferns and the new language input ! befer language learning ! Interac)on between what the speaker knows about language and the new input -‐-‐ how does this help us capture individual discourse style? Approach and method • A corpus linguis)c method of TgC keyword analysis with Difference Index (DIN) (Cvrček and Fidler 2013) • Number of words (measuring the surprisal degrees of – Husák, Gustáv 27 374 the addressee) – Havel, Václav 47 853 • Corpora – Klaus, Václav 26 650 – Reference Corpus (RefC): SYN2010 – Zeman, Miloš 5 086 A balanced corpus of 100 million from wrifen language primarily from 2005-‐2010. A model (idealized) na)ve speaker of the 21st century. 2005–2010 . – Target Corpora (TgC) from corpus Speeches Includes the Presiden)al speeches by four Czechoslovak/Czech presidents (Husák, Havel, Klaus, and Zeman), tagged, lemma)zed, 248,839 posi)ons Number of speeches – Husák, Gustáv – Havel, Václav – Klaus, Václav – Zeman, Miloš 17 25 21 4 Havel zastupitelských odpovědně vstupujeme mírového jistot vykonali rozkvět mírových demokratických solidaritu soužití národy zájmům sborů národů hospodářského společenství úspěchů přátelé československa společenského spravedlivé hospodářství prospěchu příznivé společenských společenský nadcházející zárukou rozvíjet politika ekonomiku politického hospodářský republika občany odpovědnosti milióny čelitvůle smyslem politiku politická lidstvo politice mír národních hospodářské stručně úspěšně ovzduší politickou zájmů společné úsilí dobré společný svobodu zájmu rostoucí cílů svobody rozvoj státy budoucnosti přesvědčen zájmy řešitvíme životě cíle života ekonomické společnosti chceme nového význam žít mnoho světě státní především nové znovu lidí Husak • Can be informa)ve w.r.t. 0 přičiňme soudružky pětiletky osvobozenecký zamýšlíme bratrskými pětiletce energičtěji pokrokovým pozdravuji bratrských střízlivým kvalitněji socialistickými imperialistické bratrský upevňování mírový socialistických imperialismu přikládáme opíráme oceňujeme uplynulým pokročili posíláme xv poctivou pokrokových kapitalistických odzbrojení opravňují rozvíjelo progresivních prohlubování upevnili pracujícího udělejme vzestupný pozdravy upevňovat optimismem sovětským pracujících socialistickým svazem kapitalistického nastávajícím vykonanou připomeneme podporujeme prohlubovat pracujícím usilujeme všestranný vyspělou zabezpečování zbrojení rovnoprávnosti upevnění kolektivy osvobozeneckého nejspolehlivější soudružské bratrskému drazí horečného fronty vyspělost tužby sjezdem rozkvétala svědomitou přispěli vědeckotechnické vědeckotechnického všestranná zdravíme dařila obětavé uplynulý xvii spolehlivou uplynulém socialistického rozdílným činorodé uvědomujeme náročně mírovému vzkvétala urychlení tvořivou překonávání obětavou rolníkům socialistické soudruzi spojenectví příslušníkům obětavá tvořivá pokroku odvrácení nestraníků lidu domovům všestranného poctivé pracovištích ústředního uskutečňování přejeme mírovou socialistická výborů zasedáních opravňuje osvobozování kolektivů dělníkům zmařit překonávat sjezd vykořisťování zřízením sjezdu uvolňování národností uspokojování všestranné generacím národně angažovanost vlasti odhodláni tvořivé pozvednout přestavbě přestavby klademe uplynulého mírové úsecích xiv bratrské uskutečňovat důvěrou rozvoji úkoly vážíme hodnotíme zabezpečit plodem ksss upřímné rozvíjela vážené nadcházejícím komunistické dosažené efektivněji jednoty spokojenosti zlepšovat výhodnou zdokonalovat varšavské pozitivních xvi konstruktivní ústavech prohloubení spokojenost novoroční obětavě odhodláním srdečně hrdostí československo sovětskou realisticky dějinné hrozby pohodu školských historickými zlepšování vlast rozvoje připomněli rolníků rozkvětu zdravím důsledné slováků revolučních sovětského maloobchodních efektivnosti socialismu kontinentě překonání továrnách inteligenci československá zeměmi krizových úkolů mládeži socialistickou socialistický soudruha mírová podnětem československý kázně prožili považujeme lid nedostatků přispívat československého náročných efektivnost výboru dělnické stavbách kriticky vlastenectví hospodařit úspěchy společenským jistoty splnění přesvědčeni společným armádou vyvrcholení šťastného zřízení styků respektování silám dynamiku dosáhli hmotné hrdosti nemálo složitost pracující širokých odvětvích překážek stranických důsledně uspokojením osobním ksč ozbrojených těžkosti výsledcích úseků záměry československé hranicemi výsledkům perspektivy nedostatky odstraňovat uplynulých aktivně potvrdily uvítali přáním politickém iniciativy přátelům pramení vědeckých pevným samozřejmé vyžadovat usilovat důvěry splnili příznivý složitých základnou plnění míru vyjádřili jednota spojenci odkazu nezávislosti upřímně konfrontace věříme společenském rodinném svazu přátelství výročí sovětských dopravě reakční hrdí potřebám jménem závěrů díváme pracovišti pokrok vzpomínat úspěšného materiální životních přátele vůlí vrstev styky vašim jaderných stupních vítěznou mezinárodních odhodlání spolupráce úrovně podíleli mechanismu zasedání inteligence prostá naléhavé sovětský závěry rozloučili složitou rozvojem důstojně prosazování výstavbě společenské blaho národní dělníků revoluční budování udrželi dialogu zhodnotil významných reálné zásobování osvobození podmínkách tvůrčí stavebnictví zvyšování sovětském náročnost nejvyšších měny socialismus hovoříme povstání předpoklady orgánů náročné výsledků potřeb trvalý trvalého spojeno výsledky katastrofy úsilím mezinárodním vývojem složitá vztazích zlepšení válečného ústřední spotřeby plní surovin lidstva silami vyžadují organizací potvrzují právem sociálně bezpečnosti vědě nezbytná zásluhou zajistili prošli počest šesté úspěšný důvěra zemědělství slovenského výbor podílí návrhy rovnosti tendence výstavby spokojený zkušenostmi členských jaderné základnu delegace komunistů existující pevnou jednotlivců sil správě mezinárodní vstupu zdůraznit prahu zdravotnických obav zásad etapy států ekonomice úroveň dobrých letošním příslušníků naléhavě zvyšovat důraz společná zajištění otevřeně dnešním bojují vítězstvím jdeme prací úseky významné stranické úlohy zničení desetiletí připomínat přínos aktivita zahraničního vědy minulém službách složek kupředu válečné slabá vzájemně pohodě ženám současných zdrojem ekonomických kultuře šťastný strany plně mezinárodního životní oblastech minulého napětí osmé dalšímu sociálních uplatnění zápasu vysoce tříd plnou československu vývoj vývoje cen realizovat čechů plánu dalšího obyvatelstva síly revoluce zachování páté průmyslu podporuje vnitřních státních vývoji nadále závodů příštích říci zásady správnou růstu spolupráci vzájemné podrobně výroby otázek národního ukazují školství přáteli dalšími základy překonat účasti práci nároky loňském lidové realizaci zápase postupu zabezpečení odstranění povinnosti vztahů bezpečnost základem rychleji orgány podporu mládeže boje pracovat konat zdravotnictví užívání kulturních zbraní události práce celkově dále nových důsledky vztahy sociálního zvýšení pracovní stupňů zápas lépe podmínky závisí věnovat celém podstatně můžeme opatření vytvoření pozitivní postavení celého dosáhnout generace dobrou kulturní rozhodující potřebné široké cestou kvalitu novém dalším sociální zemích dalších udržet pokračovat zkušenosti všude program procesu miliónů přání potřeby vlády správné postup roce růst vysokou krok evropě zvláště obchodu možností cesta cestu ostatních pozornost chci řešení hlavním smlouvy velkou poděkovatpokračoval cílem současně vítězství srdce člověka rovněž celé lepší období řízení splnit další PC2 – Discourse agendas – Topics −50 • Disadvantage roku štěstízejména zemí problémy pevné radost krize problémů ekonomického zdraví pozdravil přispět spolutvoří přerozdělovacích dřímaly spoluodpovědnos nedobrých mocnějších provázeny raduji standardnost turbulencemi zapomínali proměňující desítiletích přelomový parlamenty soudobý provázena svobodám sebelepší spoluobčanům hlásíme desítiletí vyzývám rozmáhá občanech tvořivě sdružování státnosti obstáli sjednocování staneme iniciativní vzkvétá kriminalitě lide obracím nepoměrně severoatlantické kultivovat civilizačních mravního prohloubit občanskou demokratickým solidarity právům snášeli probouzet občanovi nalézat zmíním cílech nabyté demokratický národům mravním identitě zdědili projevům nervozity ocitáme demokratického bližním zklamáni pokora zvolíme věznicích onak veskrze pociťují federaci všestranně vskutku pečují bezpočet hospodářským úcta uzavřeme rozmanitých obecným liberalizace vpravdě nadcházejících slušnosti žádám staletích transformaci posilovat ztraceno bližní bytostně obklopuje pravidlům nadhled poměrech zdůrazňovat tvořivosti nedůvěry slováky svobodného aliance spravedlivě dovolíte mravní systematicky privatizace poměrů občanském mocných samých trvalým šťasten chápali radostné nevyhnutelné vzájemného idea lokálních veřejném solidarita urychleně nadhledem zjišťujeme vyvodit hledáme demokratické ústava obecných svobodně založenou politikům parlament občanské účastnit výzvou chybné východiskem umíme demokracií občanská rasismu totalitní tržní natrvalo ideu vlastníky respektu neobejde slováci právního lidským jevit republikou brzké každodenním zajisté srdcí transformace nenávistí úctu důležitých historicky trpělivosti úkor systémové záruky obecné rozděluje konfliktů opřít klima trvale úcty důvěře zvykli mluvím státem politický zlem dařit obecného cítíme evropskými uvědomují budovat sousedy respekt ekologicky kriminality samu lidském ohromnou občanský federální povodně souvislostí hodnot považuji masaryk komenského vizi přátelské statisíce dobrému příslušnosti občana naději vzájemných samostatná justice naslouchat hloubku pomáhali společném reformě zdí reforma obecnou standardní zhroutil rukách lidského lidskou potenciál komunismu institucí rozdělení budoucího pocitu nekončí odpovědnost politiků obyvateli začneme tvorby ba naděje politicky lepšího navázat poměry vůli občanských ústavního integrace lepšímu evropa tvorba rozhodovat tisíciletí úkolem dějinách vytvářet skutečného přijmout neméně občanského žádoucí evropu principu připravovat dobrého plnit sebevědomí nemáme pořádek kéž civilizace nenápadně ústavní dobrém ústavy právním zákonů jevy senát chápat podniků nejrůznějších výzvu dědictví vracet konkrétních druhých trápí podílet politici vize rodí tvorbě kulturu bytí skutečné mnozí novému touhy navzájem pomáhají sektoru klimatu atmosféře jedince lidský volbách prospěch státě hezký důležitou uznání obzvlášť míře příčiny celek myslet posléze podnikání bytosti evropy úkol hluboce prezidentem zákony veřejného definitivně důležitější řádu vlivu dnešního neznamená oběti mínění řád svoboda budoucí nejlépe životem nejsme shromáždění celku odvahu charakteru instituce sloužit věcí směr evropských smyslu automaticky osudu životu jiným ducha kdykoli záleží podaří jinými tradice historie násilí osud pevně denně špatné obecně závěr existence různé ostatně zahraniční pochopitelně společnost systém mnoha zároveň naopak různých světa hodnoty důležité česká zdá znamená víc nový systému myslím dělat lidem prostě svět měly nelze opět dosud daleko jiného stále samozřejmě méně prostředí nejen velké měli sice být dokonce tedy totiž není jen Zeman by politiky politické přeji spoluobčané životstátu občané bych budeme demokracie dobrým země politických rokem máme musíme jsme občanů vážení občanům jsem jsou dovolte rokprezidentské vím chtěl činnosti ministr prezident vystoupení zákon negativní dej nebudu členové hodnotu účty nemohu parlamentní popřát osobnosti slib vědom rozuměl deviace nabízím dnes smysl bychom věci stát bude lidské věřím reformy změny pokusme nemůžeme milí porozumění nemůže ekonomiky svobodných nikoli žijeme zkusme zemi svobodné schopni sféře nepřímo budoucnost důvěru ekonomika dnešní volit veřejné voleb členství voliči jedině věcech nesmí evropské vláda republiky právě více nebude české dětí vědět nejvíce příležitost vzniku nebudou týká neměli říkám sněmovny přicházejí jistou dnem unie uspořádání přál ukončení nebudeme žili vpřed volby evropského pokles občan vedly parlamentu ovlivnit potřebujeme loňský životy stabilní vlastními Klaus ciziny poslanecké unii vládu dluh ukázaly rozhodnou vědomím životů nesmíme volbám úspěšným svobodnou nezapomínejme buďme přejme dělejme zadlužování hlasům nenechme važme −100 – Cannot be held constant across speakers (right: Cvrček and Fidler 2014) 0.5 −100 −50 0 PC1 50 0.5 0.0 0.0 −0.5 −0.5 50 What about lexical content? Gramma)cal features 1. Parts of speech Nouns-‐Adjec)ves vs. Verbs-‐Adverbs (cf. nominaliza)on in Fairclough 2003: 143-‐44) 2. Inflec)onal morphemes Case , Person, Number 3. Aspect-‐Mood 40.000 1. Parts of speech (in Difference Index (DIN)) 30.000 20.000 Nouns 10.000 Adjec)ves Verbs 0.000 Husák Havel Klaus Zeman Adverbs -‐10.000 -‐20.000 -‐30.000 Noun-‐heavy (adjec)ves as modifier, predicate nominals) Husák vs. the other three presidents 2. Verbal aspect Imperfec)ve ≈ [PROCESS], perfec)ve ≈ [THING] 10.000 5.000 0.000 -‐5.000 Husák Havel Klaus -‐10.000 -‐15.000 -‐20.000 -‐25.000 -‐30.000 Imperfec)ve Perfec)ve Zeman 3. Gramma)cal case (Agency: N>I>G>D>A>>L) 40.000 30.000 20.000 Nomina)ve 10.000 Instrumental Geni)ve 0.000 Husák -‐10.000 Havel Klaus Zeman Da)ve Accusa)ve Loca)ve -‐20.000 -‐30.000 -‐40.000 80.000 4. Gramma)cal person (verb forms) S1 “I” : P1 “we” : P2“you (pl)” 60.000 40.000 20.000 0.000 -‐20.000 Husák Havel Klaus Zeman -‐40.000 -‐60.000 -‐80.000 -‐100.000 S1 P1 P2 Prominence of P1 expected for the genre: S1 is less expected 5. Mood 60.000 40.000 20.000 Condi)onal 0.000 Husák -‐20.000 Havel Klaus Zeman Infini)ve Impera)ve Indica)ve -‐40.000 -‐60.000 -‐80.000 6. Passive Par)ciples 18.000 16.000 14.000 12.000 10.000 passive par)ciple 8.000 6.000 4.000 2.000 0.000 Husák Havel Klaus Zeman Gramma)cal features suggest… Husák • Last socialist president, boring, loyal to the USSR • flat, ritualis)c, sta)c texts Havel • first President awer 1989, intellectual, dissident, • Inten)onally a “non-‐professional”/”dissident” poli)cian (dis)nct from the previous regime), instructs indirectly, sophis)cated intellectual prose (contrast between hypothe)cal and current worlds, modal expressions in passive construc)ons) Klaus • macro-‐economist, Euro-‐skep)c, an)-‐ecology, strongly opinionated, arrogant • top-‐down leader, telling the audience what to do, professional poli)cian, conflates what he thinks and what the audience should think Zeman • social-‐democrat, “one of us”, having a big ego, “father-‐like”; cri)cized as a “yokel”* • populist, professional poli)cian, contact with the audience, use of a limited set of politeness expressions to assert his own self. What this all might mean to cogni)ve linguis)cs • Morphemes are not empty: a crystalized conceptualiza)on of human cogni)on, sequen)al and summary scanning (Langacker 1987) • Prominence levels of gramma)cal morphemes informs us of discourse style ! serve as KEYs to discourse style • A combina4on of keymorphs informs discourse style Offshoots of this study • Keyword analysis, which has been looking mostly at lexicon to analyze discourse, can benefit from probing into gramma)cal informa)on (thus keymorph analysis) • Advantages of keymorph analysis based on inflected languages: gramma)cal case, person, mood, aspect, par)cipial forms References Biber, D. 1993. Using Register-‐Diversified Corpora for General Language Studies. Computa)onal Linguis)cs. 19(2): 291-‐241. Brown, P. and S. C. Levinson. 1987. Politeness: Some universals in language usage. Bybee, J. 1985, Morphology: A study of the rela)onbetween meaning and form. Cvrček, V. and M. Fidler 2013. Not all keywords are made equal: How can we measure keyness: Corpus Linguis)cs Conference. Lancaster UK. Cvrček, V. and M. Fidler 2014. Prezidentské projevy: Analýza téma)cké výstavy a řečových strategií pomocí Kwords [Czech presiden)al speeches: Analysis of their thema)c structures and speech strategies using Kwords]. Knference korpusové lingvis)ky. Prague, Czech Republic. Cvrček, V., P. Truneček, P. , and V. Horký. 2015. SPEECHES: korpus prezidentských projevů. Ins)tute of Czech Na)onal Corpus, Charles U. in Prague. . At hfp://www.korpus.cz Fidler, M. 2002. Rela)onal features in poli)cal language: A comparison of speeches by Havel, Clinton and Mori. Where one’s tongue rules well: Festschriw for Charles E. Townsend, ed. by L. A. Janda and S. Franks, 213-‐28. Indiana: Slavica. Fidler, M. and V. Cvrček. forthcoming. Corpus-‐assisted analysis of reader viewpoints: Reconstruc)ng the historical reader using keyword analysis. Journal of Slavic Linguis)cs 23 (2). Hart, Ch. 2014. 15. Discourse. E. Dabrowska and D. Divjak (eds.), Handbook of Cogni)ve Linguis)cs. 322-‐346. Hopper P. and S. Thompson. 1980. Transi)vity in grammar and discourse. Language56(2): 251-‐299. Janda, L. A. 2004. A metaphor in search of a source domain: the categories of Slavic aspect. Cogni)ve Linguis)cs 15(4), 471-‐527. Langacker, R. 1987. Founda)ons of cogni)ve grammar, vol. 1: Theore)cal prerequisites. Schmidt, R. 1990. The role of consciousness I second language learning. Applied Linguis)cs, 129-‐158. Schmidt, R. 2010. Afen)on, awareness, and individual differences in language learning. In W. M. Chan, et al. Taylor, J. 2014. The mental corpus: How language is represented in the mind. Acknowledgments • Brown University Humani)es Research Fund • Programme for the Development of Fields of Study at Charles University, No. P11 Czech na)onal corpus. THANK YOU!
Podobné dokumenty
Prezidentské projevy: Analýza tématické výstavby a řečových
Pokus o charakteristiku jednotlivých řečnických strategií
od cuni.cz - Český národní korpus
use a combination of statistical tests and ways of presenting data that enable
salient patterns of language to be identified. Partington et al (2013: 11) argue
that corpus approaches can thus help ...