好,那我們就以下面這張圖來很快地講解這個情感分析的流程。
好,那所以我們給定了一批所謂的產品線上評論 或其他的社區媒體的資料。
好,那左手邊的這一條 路徑詞就是文件層級的情感分析,所以它就透過
文字的處理,然後試圖去 判定我們剛剛提到的,文件整體的情感態度為正向、
負向或者是中立。
好,那至於所謂的概念層級它就需要多一個步驟,所以它要是一樣透過文件
文字處理的技術或自然語言處理的技術,去萃取在這個文件裡頭所談論的
概念或產品特征,那一旦我們能夠認定出來概念或產品特征
在句子中,那我們就從它的前後文或這一句裡頭的 使用的動詞、
形容詞等等,來決定這個概念,作者對於這個概念它的情感 態度,一樣是正面、 負面或者中立。
不管是左邊是文件層級,或者是右邊是概念層級的情感分析 那最終呢,我們就可以了解使用者或消費者
在網絡上談論到某個產品或某一個服務的時候 那它的正向態度、
負向態度,那經過匯整之後 我們就可以進行後續的輿情分析或者是社群聆聽。
好,那我以底下這個例子來跟大家解釋。
那這個是在一個網絡上,我們拿到的一個針對 EVA Air 長榮航空的一個顧客評論。
那在這個 顧客評論裡頭,它首先標題就寫成很棒的飛機,飛機的經驗。
然後嘞,它裡頭大家可以看到,就是說他提到了他從台北
飛到曼谷,他覺得位置,經濟艙位置的大小很好。
他覺得機上娛樂的選擇 很棒,然後他覺得食物也很好,工作人員的服務態度很好等等 等等。
所以整體來講,我們基本上從這個文件裡頭你可以感受到
寫評論的這個消費者,其實他的整體的情感態度對於
長榮航空的這個例子,他的態度是正面的。
好,那這個就是一個所謂的文件層級的情感分析的 技術。
那剛剛提到了,就是說如果我們把這些文件分成正面、 負面這個
中立的態度,匯整了很多的這個產品評論或顧客
意見之後,那我們就可以做後面的口碑分析或者是輿前分析。
好,左邊這張圖是我從網絡上,有一家企業叫 Openview 的工具所提供出來的。
所以他們針對國產車的 各式的款項,他們的情感的態度的比較,OK。
所以你可以看到 那某些,某些的汽車它的被討論的
量非常地大,然後它的正評、 負評的比例實際上是非常地 平衡的。
那至於有一些的車款,它可能正評的比較少,負評的比較多。
所以,有了這一張的匯整的這個所謂的輿情分析或口碑分析的圖,那我們就可以
去分析你和你的競爭對手在顧客的 態度中或觀感中,那到底是 正面居多還是負面居多。
那右邊是另外一個範例。
好,那也是我從網絡上,大家可以找到的。
它是針對 IPHONE7 HTC 10、 Samsung 的手機。
那你就可以看到,一樣它分成正面態度、 負面態度跟中立態度。
你就可以透過這張圖就去比較,到底哪一款手機在顧客的心目中
那可能正面的評價高過負面的評價。
那你跟其他的手機,競爭對手的手機來比
那你的優劣到底又在哪裡?好,那所以這個是所謂的文件層級的情感分析的一個例子。
好,那至於這個所謂的概念層級的情感分析,
那我們剛剛已經提到了,它必須要從文件中先去
尋找跟發現,顧客到底在 評論裡頭談及到哪些產品的特征。
那我們還是用剛剛的這個 EVA Air
的評論為例,那在這個評論裡頭 其實這個顧客有談到了經濟艙的位置
還有談到的娛樂的選擇 還有提到了機上的食物,然後還有工作人員
的面向,好,那所以這一部分經過了所謂的產品特征
萃取的步驟,我們基本上就要認定出來,在這裡頭所談論到的產品特征。
好,那有了產品特征之後,那我們就要進行所謂的情感態度的辨識。
好,那所以根據剛剛的,比如說經濟座位的位置
大小,然後你會尋找附近的形容詞,它談到了是很好。
OK,所以這是一個正面的態度;那至於娛樂 選項呢?它在附近的形容詞的描述也是用很好。
所以它也是一個正面,好。
那所以依序我們分析完之後,你就可以看到
這一個顧客在這個產品評論裡頭,提到的四個產品特征,分別對於這四個產品特征的態度、
情感態度都是正面的,好。
那所以這個層級的分析,就又比剛剛的文件層級分析 來得更細膩,因為它不單純只在告訴你
整體態度,它還告訴你針對哪些面向 然後他的態度是什麼?那或者是說我們也可以
從這個評論裡頭了解,這個顧客在乎的是哪些層面的面向。
好,所以以這個例子來講,他在乎的是位置、 它在乎的是食物 工作人員的態度等等。
顯然他可能比較不在乎價格; 他可能不在乎是不是延遲或者是準時這件事情。