La Sentiment Analysis ha ormai incuriosito studiosi ed organizzazioni diverse. Le nostre convinzioni, i nostri comportamenti e le scelte che facciamo sono prevalentemente condizionati da chi ci sta attorno e mai come in rete possiamo farci influenzare dalla moltitudine di opinioni. Quando prendiamo una decisione, specialmente di carattere economico, spesso chiediamo consiglio ad altri. È evidente che le opinioni sono fondamentali nella vita dell’essere umano e sono spesso i principali driver delle nostre decisioni e dei nostri comportamenti. Ciò vale non solo per le persone, ma anche per le organizzazioni; non serve scomodare Kotler per capire quanto l’opinione dei clienti sia determinante nelle decisioni di una impresa riguardo ad un determinato prodotto. L’esperienza della SI-IES in tale ambito è soddisfacente. La rete ha creato una lunga fila di opinioni e suggerimenti, in buona parte creata da commenti scritti da “persone” che rispetto a un determinato argomento si stanno esprimendo e che si basano solamente sulla propria esperienza o su quello che realmente pensano. I consumatori, o meglio gli utenti all’interno del web, possono esercitare un enorme pressione nell’influenzare le opinioni di altri users e quindi indirizzare gli stessi brand nelle decisioni di acquisto. In questo ambito anche servendosi di algoritmi molto complessi, degni del machine learning si sono fatti studi e ricerche ed investimenti riguardo l’analisi del “sentiment” mediante software, da cui nasce, appunto, la sentiment analysis. Molti interessi per questo settore arrivano da parte di politici, sociologi, enti di ricerca, e tanti altri che hanno compreso l’importanza di un approccio alla sentiment analysis ed i relativi benefici. Opinion: il termine indica un concetto ampio che racchiude: sentiment, valutazioni, attitudini ed anche tutte le informazioni connesse ad essa; parole chiave: opinion target, opinion holder, time of the opinion, sentiment. Il sentiment caratterizza la polarità di un opinione che si può dividere in positiva, negativa e neutrale. La sentiment analysis è quel campo di indagine che analizza le opinioni, i sentiment, gli apprezzamenti, le emozioni delle persone in merito ad un prodotto, servizio, organizzazioni, politici, personaggi, problemi, eventi, argomenti e loro annessi. La procedure è quella di estrarre una polarità da un opinion, con un procedimento che si articola nelle seguenti fasi: raccolta dati; revisione dei testi, individuazione del sentiment, classificazione del sentiment, presentazione dei risultati.
Nella raccolta dati si inizia nella processazione tramite software di tutte le opinioni che sono in qualche modo coerenti con il nostro “oggetto” di ricerca nei social media, vedi forum, blog, recensioni e social network; poi si passa alla revisione del testo che consiste in una pulizia dei testi e delle opinion, eliminando per prima cosa tutti i nomi e le eventuali generalità degli opinion holder e tutte le informazioni non necessarie ed i contenuti non verbali. Poi vi è l’individuazione del sentiment: l’obiettivo è di comprendere la polarità delle varie opinion per poterle poi classificare. L’individuazione del sentiment può venire riferito ai più livelli: 1) livelli del documento: lo scopo è unicamente capire se l’opinion è negativa, positiva o neutra. 2)livelli della frase: viene analizzato il sentiment di ogni frase del documento; 3) livello della caratteristica, qui ci si sofferma negli aspetti definitivi dell’opinione stessa. L’analisi è complessa ed anche lunga, profonda ma efficace dato il sentiment di un livello desiderato:
Il sentiment può essere individuato tramite software in diversi modi tutti accumunati da un procedimento iniziale che ha, tra l’altro, lo scopo di rendere il testo “digeribile” ad un algoritmo. Questo procedimento è chiamato “stemming”. Si può ridurre il testo ad un insieme ridotto di termini detti stilemi (stem). Per stilema si intende una singola parola-unigram. Gli stilemi non devono necessariamente essere parole intere, ma si preferisce invece ridurre il termine alla sua radice fondamentale. Dopo lo “stemming” si deve scegliere un metodo software di analisi delle opinioni, sono complessi, ingegneristici, un esempio il “machine learning approach”, tratta il processo come classificazione del testo ed utilizza diversi algoritmi come il Support Vector Machine o SVM. Nei metodi di Machine Learning si parte da documenti annotati ed è in questo caso che ciascun documento è considerato una raccolta di parole (bag-of-words). Questo è il metodo utilizzato da Bo Pang, Lillian Lee, Shivakumar Vaithyanathan. Un successivo approccio è quello che utilizza la ricerca di pattern di parole per determinare il sentiment, oppure altro approccio ancora, il Dictionary based. Fatto questo vi è la classificazione dei sentiment rappresentati con la propria polarità: positivo, negativo, buono, cattivo, like, dislike, ecc. Infine la presentazione dei risultati dell’analisi che può essere usata per lo scopo preposto in modalità diverse in base alle esigenze.