Portal Novosti često je na meti pojedinih novinara. Primjer je nedavni tekst Nine Raspudića u kojem se autor kritički osvrće na ovaj portal. Navodim neke citate iz teksta:
Nominalno i proračunski tjednik srpske manjine, a koji je postao udomilište za Feralovu siročad, gdje su de facto ti etnički Hrvati zauzeli glasilo srpske manjine, suzili ga na ekstremno-lijevo poziciju i vezali uz partikularne političke opcije pa srpsku manjinu, u čije ime tobože govore i kojoj namijenjena sredstva sisaju, perfidno konfrontiraju s hrvatskom većinom. … Mi moramo plaćati njih da nas podsjećaju i nabijaju nam na nos sve kolektivne krivnje, od kojih sebe, naravno, izuzimaju. Svaki tekst im već gotovo četvrt stoljeća leži na istim ključnim riječima: fašizam (frekvencija korištenja približava se onoj sastavnog veznika), ustaše, Aleksandra Zec, Ahmići, Stari most, privatizacija.
Jedna od ključnih kritika autora odnosi se na sadržaj tekstova u novostima. fokus je na ustašama, fašistima, obitelji Zec, Ahmićima i drugim hrvatskim mrljama iz prošlosti, a premalo o posebnostima, specifičnostima i problemima srpske manjine. Raspudić tako ističe da se pojam fašizam koristi češće od veznika. Jasno je da je ova primjedba ironija, ali komentar o učestalosti pojave riječi me odmah asocirala na analizu teksta koju sam nedavno proveo i prikazao na ovom blogu. Koliko često se spomenuti termini zaista pojavljuju u Novostima? Je li frekvencija veća u odnosu na druge portale? Koji autor najviše upotrebljavaju predmetne pojmove? Na ova pitanja možemo odgovoriti pomoću jednostavne analize teksta.
Za potrebe ove analize preuzeo sam tekstove dostupne na web stranicama portala “Novosti”. Podaci se sastoje od 4 varijable: autor, datum, naslov i tekst. Baza ima ukupno 10944 tekstova u razdoblju od 6.9.2009 do 12.5.2019. Broj autora je teško utvrditi jer je nekada korišteno cijelo ime i prezime autora, a nekada samo inicijali. Ako se zanemari ovo ograničenje, top 3 autora po broju članaka u Novostima su Nenad Jovanović, Novosti i Bojan Munjin. Top listu 20 autora po broju članaka možete pogledati u tablici 1. Ovih 20 autora je napisalo 52% svih članaka u Novostima (možda i više, ako su u potpisima tekstova koristili inicijale).
| autor | n |
|---|---|
| Nenad Jovanović | 546 |
| Novosti | 454 |
| Bojan Munjin | 434 |
| Srećko Pulig | 389 |
| Viktor Ivančić | 322 |
| Marinko Čulić | 293 |
| Igor Lasić | 289 |
| Boris Rašeta | 286 |
| Tena Erceg | 273 |
| Dragan Grozdanić | 256 |
| Mirna Jasić | 253 |
| Eldin Hadžović | 248 |
| Damir Radić | 244 |
| Ivica Đikić | 241 |
| Boris Postnikov | 225 |
| Nikola Bajto | 202 |
| Tatjana Tagirov | 197 |
| Dejan Kožul | 188 |
| Davor Konjikušić | 172 |
| Rade Dragojević | 167 |
Pojedini tekstovi u Novostima su pisani na ćirilici. Ovi tekstovi su izostavljeni u daljnjoj analizi. Nakon prilagodbe podataka, možemo pogledati nekoliko zanimljivih stvari. Za početak je korisno pogledati najkorištenije riječi u svim tekstovima. Nakon tokenizacije teksta, tokeni su poredani po učestalosti pojavljivanja te je filtrirano 100 najkorištenijih riječi. Najkorištenije riječi su prikazane u tablici 2. Na žalost nije provedena lematizacija teksta, pa se pojavljuje više riječi sa istim korijenom (npr. “godine” i “godina”).
| rijec | broj |
|---|---|
| godine | 6688 |
| više | 6273 |
| zbog | 4926 |
| godina | 4908 |
| prema | 4404 |
| može | 4212 |
| kad | 4182 |
| ljudi | 3979 |
| hrvatskoj | 3911 |
| danas | 3881 |
| bez | 3831 |
| hrvatske | 3792 |
| ima | 3660 |
| dok | 3535 |
| dana | 3474 |
| toga | 3383 |
| jedan | 3357 |
| sada | 3269 |
| kaže | 2885 |
| protiv | 2882 |
| vrijeme | 2672 |
| onda | 2669 |
| oko | 2665 |
| rekao | 2661 |
| hdz | 2614 |
| treba | 2576 |
| gdje | 2529 |
| im | 2524 |
| kojoj | 2425 |
| zato | 2375 |
| nekoliko | 2365 |
| prava | 2309 |
| mogu | 2301 |
| kojem | 2300 |
| ove | 2193 |
| tom | 2159 |
| čak | 2147 |
| između | 2146 |
| dva | 2109 |
| hrvatska | 2094 |
| posto | 2083 |
| među | 2078 |
| tek | 2025 |
| način | 2013 |
| pitanje | 1968 |
| radi | 1950 |
| koliko | 1947 |
| ipak | 1939 |
| vlasti | 1886 |
| tri | 1884 |
| druge | 1867 |
| države | 1862 |
| rata | 1858 |
| dio | 1839 |
| upravo | 1812 |
| riječ | 1803 |
| ništa | 1795 |
| uvijek | 1765 |
| prvi | 1762 |
| strane | 1761 |
| predsjednik | 1758 |
| tko | 1750 |
| kod | 1746 |
| odnosno | 1746 |
| drugi | 1735 |
| one | 1708 |
| poput | 1708 |
| dobro | 1707 |
| kuna | 1705 |
| baš | 1677 |
| dalje | 1664 |
| ovaj | 1639 |
| svojim | 1622 |
| dakle | 1615 |
| možda | 1610 |
| osim | 1602 |
| preko | 1598 |
| jednom | 1596 |
| srbije | 1588 |
| ovo | 1547 |
| svoju | 1547 |
| svih | 1543 |
| dvije | 1541 |
| put | 1535 |
| država | 1528 |
| srpske | 1526 |
| zašto | 1523 |
| pred | 1504 |
| malo | 1483 |
| tim | 1471 |
| vlade | 1433 |
| govori | 1422 |
| politike | 1415 |
| zagrebu | 1404 |
| kulture | 1401 |
| ovdje | 1399 |
| političke | 1399 |
| gotovo | 1397 |
| postoji | 1389 |
| sad | 1388 |
Zanimljivo je da su prve tri riječi iste kao i najfrekventnije riječi na portalu vecernji.hr (za analizu večernjeg pogledati ovdje). Vrlo često se koristi korijen riječi Hrvatska (hrvatskoj, hrvatske). Čini se mnogo češće nego korijeni riječi Srbija. Vrlo često korištena riječ je i “hdz”, koja se čak češće koristila od uobičajenih riječi poput “gdje” i “treba”.
Nakon prikaza najfrekventnijih riječi, vraćam se na pojmove koje je spominjao Nino Raspudić u svojoj kolumni. U tablicama od 3 do 5 pokazujem frekventnost sljedećih riječi: “faši”, “ustaš”, “zec”, “ahmić” i “privatiz”.
| rijec | broj |
|---|---|
| fašizma | 306 |
| antifašista | 264 |
| antifašističkih | 173 |
| antifašizam | 163 |
| fašizam | 156 |
| antifašističke | 154 |
| antifašizma | 138 |
| antifašisti | 82 |
| fašizmom | 69 |
| antifašistički | 68 |
| fašističke | 65 |
| fašizmu | 65 |
| fašističkog | 59 |
| antifašistička | 56 |
| fašistički | 52 |
| antifašističkog | 50 |
| antifašizmu | 50 |
| antifašist | 39 |
| fašističkih | 36 |
| fašizacije | 34 |
| fašisti | 31 |
| fašista | 30 |
| antifašističkim | 28 |
| antifašističkoj | 28 |
| antifašističku | 26 |
| fašistima | 26 |
| antifašistkinja | 24 |
| fašističkim | 22 |
| fašističkom | 19 |
| antifašistima | 18 |
| neofašizma | 18 |
| fašističku | 17 |
| nacifašizma | 17 |
| antifašističkom | 15 |
| antifašiste | 14 |
| fašiste | 13 |
| fašističkoj | 13 |
| antifašizmom | 12 |
| fašistička | 12 |
| nacifašizam | 11 |
| fašist | 10 |
| fašizacija | 9 |
| profašistički | 9 |
| profašističkog | 9 |
| fašistoidne | 8 |
| profašističke | 8 |
| antifašističko | 7 |
| antifašistom | 6 |
| antifašistu | 6 |
| fašistoidnih | 6 |
| fašistoidnosti | 6 |
| nacifašizmom | 6 |
| neofašista | 6 |
| neofašističkog | 6 |
| profašističkim | 6 |
| fašizaciji | 5 |
| nacifašističke | 5 |
| nacifašističkih | 5 |
| neofašistički | 5 |
| profašistička | 5 |
| profašističkih | 5 |
| klerofašističkih | 4 |
| nacifašizmu | 4 |
| neofašističke | 4 |
| neofašističkih | 4 |
| neofašizam | 4 |
| postfašizam | 4 |
| postfašizmu | 4 |
| fašističko | 3 |
| fašističkoga | 3 |
| fašistoidni | 3 |
| fašistoidnu | 3 |
| fašizaciju | 3 |
| fašizmima | 3 |
| klerofašizma | 3 |
| klerofašizmom | 3 |
| neofašiste | 3 |
| neofašisti | 3 |
| neofašističkim | 3 |
| neofašističkom | 3 |
| neofašistima | 3 |
| profašističkom | 3 |
| refašizaciji | 3 |
| antifašistkinje | 2 |
| antifašizirat | 2 |
| fašistoidnim | 2 |
| fašistoidno | 2 |
| fašizacijom | 2 |
| fašizme | 2 |
| filofašistima | 2 |
| klerofašista | 2 |
| klerofašisti | 2 |
| klerofašističke | 2 |
| klerofašističkim | 2 |
| klerofašističko | 2 |
| klerofašističkoj | 2 |
| nacifašista | 2 |
| nacifašističkim | 2 |
| neofašističkome | 2 |
| neofašizmu | 2 |
| profašističko | 2 |
| profašističku | 2 |
| anitifašističke | 1 |
| antifašističkoga | 1 |
| antifašističnega | 1 |
| antifašizama | 1 |
| antifašizmima | 1 |
| defašizacije | 1 |
| fašističkima | 1 |
| fašističkome | 1 |
| fašistkinjom | 1 |
| fašistogenih | 1 |
| fašistoida | 1 |
| fašistoidnog | 1 |
| fašistoidnoj | 1 |
| fašistoidnom | 1 |
| fašistoidnost | 1 |
| fašistoidnošću | 1 |
| fašistom | 1 |
| fašistovizije | 1 |
| fašistovu | 1 |
| fašistu | 1 |
| fašizmi | 1 |
| filofašista | 1 |
| filofašistička | 1 |
| filofašističke | 1 |
| filofašističkog | 1 |
| jugofašista | 1 |
| jugofašisti | 1 |
| klerofašistička | 1 |
| klerofašističkog | 1 |
| klerofašistom | 1 |
| klerofašizacije | 1 |
| klerofašizam | 1 |
| klerofašizmu | 1 |
| kriptofašista | 1 |
| kriptofašizmom | 1 |
| kriptofašizmu | 1 |
| mikrofašizacije | 1 |
| monarhofašizma | 1 |
| nacifašističko | 1 |
| nacifašističkog | 1 |
| nacifašističkom | 1 |
| neofašistička | 1 |
| neofašističko | 1 |
| neofašističkoj | 1 |
| neofašistu | 1 |
| neofašizama | 1 |
| novofašizmima | 1 |
| parafašističkih | 1 |
| polufašističku | 1 |
| postfašiste | 1 |
| postfašističke | 1 |
| postfašističkih | 1 |
| postfašističkim | 1 |
| postfašizma | 1 |
| postfašizmima | 1 |
| profašiste | 1 |
| profašističkoga | 1 |
| profašističkoj | 1 |
| protofašista | 1 |
| protofašističkih | 1 |
| protofašističkoj | 1 |
| refašizacije | 1 |
| refašizaciju | 1 |
| starofašizmima | 1 |
| rijec | broj |
|---|---|
| ustaškog | 327 |
| ustaše | 305 |
| ustaški | 257 |
| ustaške | 242 |
| ustaša | 181 |
| ustaškim | 149 |
| ustaških | 140 |
| ustaškom | 123 |
| ustašama | 94 |
| ustaška | 76 |
| ustaštva | 74 |
| ustaško | 47 |
| ustaškoj | 36 |
| ustaštvo | 36 |
| ustašku | 35 |
| proustaške | 22 |
| proustaškog | 15 |
| proustaška | 14 |
| proustaški | 14 |
| proustaškim | 13 |
| ustaštvom | 11 |
| ustašu | 11 |
| filoustaške | 9 |
| proustaških | 9 |
| ustaškoga | 9 |
| proustaškom | 8 |
| ustašoida | 7 |
| ustaškome | 6 |
| ustašovanja | 6 |
| filoustaških | 5 |
| proustaško | 5 |
| ustaši | 5 |
| ustašoidne | 5 |
| ustaštvu | 5 |
| filoustaša | 4 |
| neoustaštva | 4 |
| proustaškoj | 4 |
| proustašku | 4 |
| ustašizacije | 4 |
| ustašluka | 4 |
| ustašofila | 4 |
| ustašom | 4 |
| filoustaškog | 3 |
| filoustašku | 3 |
| reustašizacije | 3 |
| ustašluk | 3 |
| ustašluku | 3 |
| ustašo | 3 |
| ustašoidi | 3 |
| ustašonostalgičara | 3 |
| filoustaška | 2 |
| filoustaškoj | 2 |
| filoustaštva | 2 |
| filoustaštvo | 2 |
| neoustašama | 2 |
| neoustaške | 2 |
| neoustaškog | 2 |
| neoustaštvo | 2 |
| reustašizacija | 2 |
| ustašizaciji | 2 |
| ustaškima | 2 |
| ustaškinje | 2 |
| ustašoid | 2 |
| ustašoidnu | 2 |
| ustašonostalgičare | 2 |
| ustašonostalgije | 2 |
| filoustaše | 1 |
| filoustaški | 1 |
| filoustaškim | 1 |
| filoustaško | 1 |
| filoustaštvu | 1 |
| kriptoustaštva | 1 |
| neoustaša | 1 |
| neoustaška | 1 |
| neoustaški | 1 |
| neoustaških | 1 |
| neoustaškom | 1 |
| novoustaša | 1 |
| novoustašama | 1 |
| novoustaše | 1 |
| novoustaške | 1 |
| poustašeni | 1 |
| proustašenog | 1 |
| proustaštvo | 1 |
| srednjoustaška | 1 |
| ustašev | 1 |
| ustašije | 1 |
| ustašizane | 1 |
| ustašizani | 1 |
| ustašizanski | 1 |
| ustašiziranja | 1 |
| ustaškin | 1 |
| ustašluke | 1 |
| ustašofil | 1 |
| ustašofili | 1 |
| ustašofilije | 1 |
| ustašofiliju | 1 |
| ustašofilima | 1 |
| ustašoidni | 1 |
| ustašoidnih | 1 |
| ustašoidnim | 1 |
| ustašoidno | 1 |
| ustašoidu | 1 |
| ustašonostalgičarima | 1 |
| ustašonostalgičarskim | 1 |
| ustašonostalgičarstvom | 1 |
| ustašonostalgičnih | 1 |
| ustašonostalgično | 1 |
| ustašonostalgija | 1 |
| ustašonostalgiju | 1 |
| ustašovanje | 1 |
| ustašovanju | 1 |
| ustašovati | 1 |
| ustašuje | 1 |
| rijec | broj |
|---|---|
| zec | 59 |
| zeca | 15 |
| zecovima | 2 |
| zecovi | 1 |
| zecu | 1 |
| rijec | broj |
|---|---|
| ahmićima | 13 |
| ahmići | 3 |
| ahmića | 1 |
| ahmiće | 1 |
| ahmićke | 1 |
| ahmićkih | 1 |
| rijec | broj |
|---|---|
| privatizacije | 162 |
| privatizaciju | 91 |
| privatizacija | 85 |
| privatizaciji | 40 |
| privatizacijom | 17 |
| privatizirati | 14 |
| privatizacijama | 10 |
| privatizacijskog | 10 |
| privatizira | 10 |
| privatizacijskih | 9 |
| privatizirana | 9 |
| privatizacijska | 6 |
| privatizacijske | 6 |
| privatizacijskom | 6 |
| privatizacijsku | 6 |
| privatiziran | 5 |
| privatizirane | 5 |
| privatizirano | 5 |
| privatizacijski | 4 |
| privatiziraju | 4 |
| privatiziranih | 4 |
| privatizirale | 3 |
| privatiziranog | 3 |
| privatizacijskim | 2 |
| privatizacijsko | 2 |
| privatizirala | 2 |
| privatiziranja | 2 |
| privatizirao | 2 |
| privatizovane | 2 |
| privatizuje | 2 |
| deprivatizacije | 1 |
| neprivatiziran | 1 |
| neprivatizirani | 1 |
| neprivatiziranih | 1 |
| paraprivatizacije | 1 |
| privatizacijskoj | 1 |
| privatizacione | 1 |
| privatizacionog | 1 |
| privatizacionom | 1 |
| privatizirali | 1 |
| privatiziralo | 1 |
| privatiziramo | 1 |
| privatizirani | 1 |
| privatiziranim | 1 |
| privatiziranu | 1 |
| privatizirat | 1 |
| privatizovani | 1 |
| privatizovanih | 1 |
| privatizovanim | 1 |
| reprivatizacija | 1 |
Tablice pokazuju sve izvedenice spomenutih riječi. Postoji mnogo riječi koje se pojavljuju samo jednom u tekstovima novosti. Primjerice riječi “fašizmi”, “fašistu”, “faštisovizije” ili “ustašje”, “ustašovati”, “ustašovanju”. Može se primijetiti i rijetko korištenje pojmova “ahmić” i “zec” (koji dodatno može poprimit značenje životinje umjesto obitelji Zec), što opovrgava tvrdnju da se pojmovi Zec i Ahmići često pojavljuju u tekstovima novina Novosti, barem na temelju ove jednostavne analize. Međutim izvedenice pojmova “faši” i “ustaš” se pojavljuju relativno često. Kako bi dobili bolji dojam učestalosti ovih pojmova, usporedio sam učestalost pojmova sa učestalosti istih pojmova na večernjem.hr. Za obje tiskovine (web stranice) ću usporediti učestalost pojmova u odnosu na (1) ukupan broj tokena i (2) broj članaka u kojima se pojavljuju.
Krenimo s posljednjim pristupom. Prvo sam izračunao da se pojam “ustaš” pojavljuje u 7.48% svih napisanih članaka u Novostima. U Večernjem se pojam “ustaš” pojavljuje u 1.3% svih tekstova. Dakle, pojam “ustaš” se 5.7 puta češće pojalvjuje u Novostima nego u večernjem.hr. Isti postupak sam ponovio za sljedeće pojmove: “^faši”, “^ahmić”, “^privatiz” i “srb|srps” (posljednji pojam podrazumijeva da tekst može sadržavati “srb” ili “srps”). Rezultati se mogu vidjeti na slici 1. Nakon toga sam izračunao učestalost istih riječi u ukupnom broju riječi, na način da sam ukupan broj riječi podijelio sa brojem tokena (umjesto sa brojem članaka). Rezultati su prikazani na slici 2.


Za kraj, radi zabave, možemo usporediti iste pojmove samo za autore Ninu Raspudića i Viktora Ivančića. Koristimo 76 tekstova Raspudića i 273 tekstova Ivančića:

Iz svega se može zaključiti da Novosti znatno češće pišu o fašizmu, ustašama i privatizaciji od portala večernji.hr. Nijedan portal ne piše često o obitelji Zec. Ovo je daleko od potpune analize teksta ovih dviju novina, ali omogućava određene uvide o sadržaju koji se u njima pojavljuje. Detaljnija analiza bi trebala uključivati spomenutu lematizaciju i analizu sentimenta. Primjerice, poželjno bi bilo analizirati kakav je sentiment članaka koji koriste određene pojmove. To ostavljamo a neke od budućih postova.
Preplatite se
Preplatite se putem newslettera ili RSS feeda