Svakodnevno smo suočeni sa eksponencijalnim porastom proizvodnje informacija i podataka. Sa sveprisutnim online aktivnostima, društvenim mrežama, e-trgovinom i ostalim digitalnim platformama, generiraju se velike količine podataka. Ako uzmemo u obzir sve podatke koji su trenutno dostupni globalno, oko 70% ih stvaraju prosječni korisnici interneta. Korisnički generirani sadržaj obuhvaća sve objave na internetu ili društvenim mrežama, uključujući blogove, forume, web stranice i online recenzije. Zamislite, ako biste htjeli preuzeti sve podatke s interneta za to bi vam trebalo otprilike 181 milijun godina[1].
Ovi podaci često su nestrukturirani što znači da dolaze u različitim formatima i oblicima, uključujući tekst, fotografije, videozapise i ostale nejednolike formate što čini njihovu analizu izazovnom. Data science tehnike poput obrade prirodnog jezika (NLP) i strojnog učenja postaju neophodne za ekstrakciju vrijednih uvida iz ovog obilja informacija.
Što je analiza sentimenata?
Analiza sentimenata (engl. Sentiment analysis) predstavlja granu NLP-a koja se bavi identifikacijom i analizom sentimenta, emocija i stavova iz stavova iz teksta[2]. Cilj sentiment analize je utvrditi da li je stav izražen u određenom tekstu pozitivan, negativan ili neutralan. Kroz analizu teksta iz različitih izvora poput društvenih medija, recenzija proizvoda ili komentara na internetskim stranicama, mogu se dobiti uvidi u korisnička iskustava.
Analiza sentimenata je snažan alat koji se sve više koristi u raznim područjima kako bi se bolje razumjela percepcija i stavovi korisnika prema određenim proizvodima, uslugama ili društvenim događanjima. Može se koristiti za praćenje komentara i mišljenja na društvenim medijima što pomaže u brzom prepoznavanju pozitivnih ili negativnih reakcija na proizvode ili marketinške kampanje. Web stranice s recenzijama proizvoda često koriste analizu sentimenata kako bi automatski ocijenile i kategorizirale recenzije prema tonu. Ovo pomaže potrošačima da brže dobiju uvid u iskustva drugih kupaca. Tvrtke mogu pratiti online reputaciju brenda analizirajući komentare, recenzije i članke na internetu čime se omogućuje brzo reagiranje na negativne situacije i poboljšanje pozitivnog dojma. Analiza sentimenata može otkriti ključne elemente koji utječu na zadovoljstvo korisnika. Tvrtke ih mogu koristiti za prilagodbu proizvoda ili usluga kako bi bolje odgovarale potrebama svojih korisnika. U političkim ili društvenim analizama može pomoći u praćenju mišljenja javnosti o političkim pitanjima ili događanjima. Analiza sentimenata pomaže marketinškim stručnjacima u razumijevanju kako se njihove kampanje percipiraju među potrošačima što omogućuje prilagodbu strategija za maksimiziranje pozitivnih reakcija.
Kako koristiti analizu sentimenata?
Za primjer kako se analiza sentimenata može koristiti odabrane su recenzije restorana Pod Zidom koji se nalazi u Zagrebu. Ovaj restoran, smješten u pitoresknoj Tkalčićevoj ulici, nije samo oaza dobre hrane, već i inspiracija za istraživanje stvarnog pulsiranja javnog mnijenja kroz recenzije objavljene na TripAdvisor platformi[3]. TripAdvisor, svjetski poznata platforma za ocjenjivanje i recenziranje ugostiteljskih objekata, postao je go-to izvor informacija za putnike i lokalce širom svijeta. Korisnici ostavljaju svoje iskrene dojmove o restoranima, hotelima i atrakcijama, stvarajući mozaik stvarnih iskustava. Kroz analizu sentimenata TripAdvisor recenzija, istražit će se stvarna iskustva posjetitelja. Analizirat će se ključni izrazi, emocije i stavove iz recenzija kako bi se stvorio dublji uvid u ono što čini Pod Zidom posebnim.
1. Prikupljanje podataka i njihova priprema
Prvi korak je prikupljanje podataka koji se žele analizirati. To mogu biti recenzije, komentari, članci ili bilo koji drugi tekstualni sadržaj. Tekstualni podaci često sadrže specijalne znakove, emotikone, stop riječi i slično. U ovom koraku tekst je potrebno očistiti kako bi bio pripremljen za analizu. Pomoću alata Octoparse[4] prikupljene su recenzije restorana Pod Zidom s popularne platforme TripAdvisor. Kroz pažljivo planiranje i implementaciju web skrapiranja, uspješno je prikupljeno 467 recenzija u vremenskom periodu od lipnja 2016. do 31. prosinca 2023. Korištenje Octoparse-ove mogućnosti automatskog ekstrahiranja podataka omogućuje precizno prikupljanje informacija. Međutim, uvijek je važno poštovati etičke smjernice i uvjete korištenja platforme s koje prikupljate podatke.
Prije provođenja dubinske analize sentimenata nad recenzijama, tekstualni podaci se podvrgavaju predobradi koja uključuje tokenizaciju (razdvajanja teksta ili sekvence teksta na manje jedinice, nazvane tokeni), uklanjanje nepotrebnih riječi (stop-riječi), lematizaciju (normalizacije teksta u kojem se riječi sličnog značenja reduciraju na njihov korijen ili lemu) i druge korake. Nakon što su podaci pripremljeni, potrebno je analizirati neke opisne karakteristike recenzija kako bi se stekao uvid u njihovu raspodjelu i trendove kroz godine.
Slika 1. Trendovi recenzija
Analiza pokazuje da je najveći broj recenzija zabilježen tijekom ljeta 2015. i 2016. godine što ukazuje na sezonsku varijaciju u aktivnosti recenziranja (Slika 1). Nakon toga, primjećuje se postupan pad broja recenzija sve do 2019. godine. Međutim, od 2019. godine bilježi se nagli porast aktivnosti recenziranja, što može biti rezultat različitih faktora poput promjena u popularnosti proizvoda ili usluge, marketinških kampanja ili promjena u korisničkim navikama. Nakon 2019. godine, dolazi do iznenadnog pada broja recenzija koji traje sve do kraja 2021. godine kada se primjećuje lagani rast aktivnosti recenziranja koji se i dalje nastavlja.
Ove informacije o trendovima u broju recenzija pružaju korisne uvide u dinamiku korisničkog angažmana i mogu poslužiti kao osnova za daljnju analizu sentimenta, omogućujući bolje razumijevanje stavova i mišljenja korisnika prema proizvodu ili usluzi.
2. Najučestalije riječi i izrazi u recenzijama
Riječi ili unigrami predstavljaju najosnovniju jedinicu teksta. U kontekstu analize teksta, svaka riječ se smatra zasebnom jedinicom. Analizom unigrama mogu se identificirati riječi koje se najčešće pojavljuju u recenzijama pružajući uvid u ključne teme, karakteristike ili aspekte proizvoda ili usluge o kojima korisnici najčešće pišu. Bigrami su parovi uzastopnih riječi u tekstu. Analizom bigrama mogu se identificirati kombinacije riječi koje se često pojavljuju zajedno u recenzijama. Ova analiza može otkriti specifične fraze ili koncepte koji su značajni za korisnike. Na primjer, “izvanredna usluga” ili “visoka kvaliteta” mogu biti česti bigrami u pozitivnim recenzijama. Analizom ovih lingvističkih struktura mogu se dobiti dublji uvid u načine na koje korisnici opisuju proizvode ili usluge, otkriti njihove preferencije te identificirati ključne elemente koji utječu na njihovo zadovoljstvo ili nezadovoljstvo. Ova analiza može poslužiti kao koristan alat za razumijevanje sentimenta i percepcije korisnika te za donošenje informiranih odluka o poboljšanjima proizvoda ili usluga.
Slika 2. Najučestalije riječi i izrazi u recenzijama
Analizom recenzija identificirane su najčešće pojave riječi i fraza pružajući uvid u ključne aspekte koji su istaknuti u korisničkim iskustvima. “Food”, “wine”, “service”, “nice” i “restaurant” su najčešće pojave riječi u recenzijama (Slika 2). Ovo ukazuje na važnost hrane, vina, usluge, općeg dojma i same lokacije restorana u iskustvima korisnika. Česte upotrebe ovih riječi sugeriraju da su ovi aspekti ključni za korisničko zadovoljstvo i da su vjerojatno bili važni u njihovim iskustvima. Najčešći bigrami koji se pojavljuju u korisničkim iskustvima su “Pod Zidom”, “wine list”, “live music”, “delicious food” i “wine bar” (Slika 2). Restoran je poznat i prepoznatljiv po svom nazivu te ga korisnici često spominju dok opisuju svoja iskustva. Korisnici često spominju “wine list” u recenzijama kako bi istaknuli kvalitetu i raznolikost vina koje restoran ima u ponudi. Ovaj bigram može biti važan indikator za ljubitelje vina i one koji cijene dobru vinsku ponudu. Kada se koristi u recenzijama, “live music” može biti ključan aspekt koji privlači goste i pridonosi atmosferi restorana. “Delicious food” može biti ključni faktor u pozitivnom iskustvu gostiju i može biti važan pokazatelj kvalitete restorana. “Wine bar” može biti atraktivna opcija za ljubitelje vina koji žele uživati u širokom izboru vina i posebnom iskustvu degustacije. Analiza ovih bigrama pomaže u boljem razumjevanju što korisnici cijene i ističu kao važno u svojim iskustvima te omogućuje da oblikujemo jasniju sliku o tome što restoran nudi i kako se percipira u očima gostiju.
3. Trendovi najučestalijih riječ u recenzijama
Analizom trendova najčešćih riječi u recenzijama primijećeni su zanimljivi obrasci koji pružaju uvid u evoluciju korisničkih iskustava tijekom vremena (Slika 3). Primjećujemo kontinuirani porast u učestalosti spominjanja riječi “food” tijekom analiziranog razdoblja. Ovaj rast ukazuje na zadržanu ili čak poboljšanu percepciju kvalitete hrane u restoranu. Korisnici često spominju hranu kao ključni aspekt njihovog iskustva, a kontinuirani porast u spominjanju riječi “food” sugerira da restoran uspijeva održavati visoke standarde kvalitete hrane ili čak unaprjeđivati svoju ponudu kako bi zadovoljio promjenjive ukuse i potrebe gostiju. U 2022. godini bilježi se nagli pad u učestalosti spominjanja riječi “service” u recenzijama. Ovaj pad može ukazivati na razdoblje kada je kvaliteta usluge bila manje zadovoljavajuća ili kada su korisnici bili manje impresionirani pruženim uslugama. Međutim, nakon toga, riječ “service” bilježi porast što sugerira poboljšanje ili povratak na zadovoljavajuću razinu usluge. Za razliku od usluge, riječi “wine” i “nice” bilježe pad u učestalosti spominjanja tijekom analiziranog razdoblja. Ovaj pad može biti povezan s promjenama u preferencijama korisnika ili promjenama u ponudi proizvoda ili usluga. Smanjenje spominjanja riječi “wine” možda ukazuje na manje naglašen fokus na vinski aspekt u restoranu ili na manji interes korisnika za vinskim izborom. S druge strane, smanjenje učestalosti riječi “nice” može sugerirati da su korisnici manje impresionirani općim dojmom restorana ili kvalitetom usluge koja se pruža
Slika 3. Trendovi najučestalijih riječi u recenzijama
Ovi trendovi pružaju vrijedne uvide u promjene u korisničkim preferencijama i percepciji kroz vrijeme. Nagli pad učestalosti spominjanja riječi “service” u 2022. godini, a zatim njezin porast, sugerira dinamičnost u kvaliteti usluge koja može biti od ključne važnosti za zadovoljstvo korisnika. S druge strane, pad učestalosti spominjanja riječi “wine” i “nice” ukazuje na potrebu za promjenama ili prilagodbama kako bi se zadovoljile promjenjive potrebe i očekivanja korisnika. Ovi trendovi mogu poslužiti kao osnova za daljnje analize i strategije poboljšanja kako bi se osiguralo kontinuirano zadovoljstvo korisnika i uspješno poslovanje.
4. Što je Word cloud?
Word cloud je vizualna reprezentacija teksta u kojoj se riječi prikazuju različitim veličinama, pri čemu je veličina svake riječi proporcionalna njezinoj frekvenciji u tekstu. Što je veća frekvencija riječi, to će ona biti prikazana većom veličinom. Word cloud se često koristi za brzo vizualno prepoznavanje najčešćih riječi u tekstu te za dobivanje općeg dojma o temama i sadržaju.
Slika 4. Word cloud
U središtu word cloud-a nalazi se riječ “food” što ukazuje na to da je hrana bila centralni fokus analiziranih recenzija. Oko riječi “food” grupiraju se druge ključne riječi poput “wine”, “service”, “restaurant”, “excellente” i “atmosphere”. Ova grupacija sugerira da su teme poput vinske ponude, kvalitete usluge, općenite atmosfere u restoranu i općeg dojma o restoranu bile važne za korisnička iskustva.
Riječ “wine” ukazuje na važnost vinske ponude u recenzijama, dok riječ “service” naglašava značaj kvalitete pružene usluge. “Restaurant” sugerira općenitu temu restoranskog iskustva, dok riječ “excellente” implicira pozitivne ocjene i dojmove korisnika. Riječ “atmosphere” ističe važnost općeg ambijenta ili atmosfere restorana.
Ova vizualna reprezentacija pruža brz i sintetički pregled ključnih tema i termina koji su se često pojavljivali u recenzijama. Osim što omogućuje prepoznavanje dominantnih tema, word cloud također može poslužiti kao polazna točka za daljnju analizu i istraživanje detalja vezanih uz te ključne teme.
5. Emocije u recenzijama
NRC Word-Emotion Association Lexicon[5] je referentni resurs koji sadrži popis engleskih riječi i njihove povezanosti sa osam osnovnih emocija (ljutnja, strah, anticipacija, povjerenje, iznenađenje, tuga, radost i odvratnost) te s dvije sentimentne kategorije (negativno i pozitivno).
Ovaj leksikon razvijen je kao alat za analizu sentimenta u tekstualnim korpusima, pružajući informacije o tome koje emocije ili sentimenti su povezani s određenim riječima. Svaka riječ u leksikonu označena je s određenim emocionalnim ili sentimentnim kategorijama na temelju njezine uobičajene uporabe i konotacija u engleskom jeziku.
Primjerice, riječi poput “sreća” ili “radost” bit će označene kao povezane s emocijom “radost” ili sentimentom “pozitivno”, dok riječi poput “mržnja” ili “bol” bit će označene kao povezane s emocijom “tuga” ili sentimentom “negativno”.
Leksikon se koristi u analizi sentimenta tekstova kako bi se automatski identificirale emocionalne i sentimentne nijanse. Koristeći ove informacije moguće je kvantificirati emocionalni ton ili sentimentnost teksta te bolje razumjeti kako se emocije izražavaju u određenim kontekstima.
Top tri sentimenta koji se često pojavljuju u recenzijama su radost (joy), povjerenje (trust) i anticipacija (anticipation) (Slika 5). Sentiment radosti obično se izražava kroz pozitivne komentare i osjećaje zadovoljstva korisnika. Kada korisnici izražavaju radost u svojim recenzijama to može značiti da su bili iznimno zadovoljni hranom, uslugom ili atmosferom u restoranu. Povjerenje u kontekstu recenzija restorana može se odnositi na osjećaj pouzdanosti i vjere korisnika u kvalitetu hrane, usluge i cjelokupnog iskustva u restoranu. Kada korisnici izražavaju sentiment povjerenja to može značiti da su imali pozitivno iskustvo i da vjeruju u kvalitetu i reputaciju restorana. Anticipacija u recenzijama može se odnositi na uzbuđenje ili nestrpljenje korisnika zbog planiranog posjeta ili isprobavanja hrane u restoranu. Kada korisnici izražavaju sentiment anticipacije to može značiti da su s nestrpljenjem očekivali svoje iskustvo u restoranu i da su imali visoka očekivanja.
Slika 5. Sentimenti u recenzijama
Ovi sentimenti ključni su pokazatelji korisničkog iskustva te pružaju dublje razumijevanje stavova, preferencija i reakcija posjetitelja. Analiza ovih sentimenta omogućuje menadžmentu restorana učinkovitije upravljanje i prilagodbu usluga kako bi se zadovoljile potrebe i očekivanja gostiju.
Kada govorimo o prikazu pozitivnih i negativnih sentimenata u kontekstu analize recenzija fokusiramo se na identifikaciju i vizualizaciju osjećaja zadovoljstva ili nezadovoljstva izraženih u korisničkim komentarima (Slika 6).
Slika 6. Odnos pozititvnih i negativnih sentimenata u recenzijama
Kada pozitivne ocjene znatno nadmaše negativne, kao i ovdje, to može ukazivati na visoku razinu zadovoljstva korisnika s uslugom, jelovnikom, ambijentom ili drugim aspektima restorana. Takvo pozitivno iskustvo potiče lojalnost gostiju, pozitivne preporuke i povratne posjete što može doprinijeti dugoročnom uspjehu restorana.
Osim toga, visoki omjer pozitivnih ocjena može stvoriti snažnu reputaciju restorana u zajednici i na online platformama za recenzije. Pozitivne recenzije privlače nove goste i povećavaju vidljivost restorana, te rezultiraju povećanim prometom i rastom poslovanja.
6. Trendovi pozitivnih i negativnih recenzija
Unatoč prevladavanju pozitivnih ocjena, važno je i dalje pažljivo pratiti negativne ocjene i riješiti eventualne probleme ili nedostatke koji se pojavljuju. Održavanje visoke kvalitete usluge i kontinuirano poboljšanje korisničkog iskustva ključni su za očuvanje konkurentnosti i dugoročni uspjeh poslovanja.
Analiza pokazuje značajne promjene u trendovima pozitivnih i negativnih recenzija tijekom vremena (Slika 7). Pozitivne recenzije postupno su se smanjivale, s naglim porastom 2021. godine, nakon čega se opet nalaze u opadanju. S druge strane, negativne recenzije, nakon naglog pada u istoj godini, nastavile su rasti. Trendovi pozitivnih i negativnih recenzija pružaju važan uvid u percepciju i iskustvo korisnika restorana. Razumijevanje ovih promjena omogućuje menadžmentu restorana da identificira probleme ili nedostatke, te poduzme potrebne korake kako bi poboljšao kvalitetu usluge i održao visoku razinu zadovoljstva gostiju.
Slika 7. Trendovi pozitivnih i negativnih recenzija
Prednosti i nedostaci analize sentimenata
Korištenjem različitih metode analize, uključujući unigrame, bigrame, word cloud, emocije u recenzijama te analizu pozitivnih i negativnih sentimenta dobiven je dublji uvid u stavove i mišljenja korisnika, omogućujući bolje razumijevanje njihovih potreba i preferencija.
Prednosti analize sentimenata su mnogobrojne. Ona omogućuje bolje razumijevanje kako korisnici doživljavaju proizvod ili uslugu. Otkrivanjem najčešćih tema i osjećaja u recenzijama mogu se identificirati ključni problemi ili nedostaci s kojima se korisnici susreću. Na temelju rezultata analize sentimenta mogu se donositi informirane poslovne odluke koje mogu poboljšati korisničko iskustvo i povećati zadovoljstvo korisnika.
Međutim, analiza sentimenta može propustiti suptilnosti i kontekst u jeziku te dovesti do netočnih ili nepotpunih rezultata. Analiza sentimenta može biti osjetljiva na različite stilove pisanja i lingvističke varijacije te otežati precizno tumačenje rezultata.
Kako bi se poboljšala analiza sentimenta i maksimizirala njezina korisnost potrebna je integracija s drugim metodama istraživanja, poput anketiranja ili fokusnih grupa čime se osigurava cjelovitija slika korisničkog iskustva. Zatim, upotreba naprednih tehnika obrade prirodnog jezika i strojnog učenja kako bi se bolje razumjeli kontekst i nijanse u jeziku. Kombinacija ovih pristupa može pomoći u maksimiziranju koristi od analize sentimenta i doprinijeti poboljšanju korisničkog iskustva i poslovne uspješnosti.
Kroz ove načine, analiza sentimenata može pomoći poduzećima da bolje razumiju svoje tržište, poboljšaju svoje proizvode i usluge te izgrade jači odnos s korisnicima, stvarajući dodatnu vrijednost za poslovanje.
Literatura
[2] https://www.cambridge.org/core/books/abs/sentiment-analysis/introduction/563742A639EEE9F5AB3F29CB2387E41C
Kommentare