欧美国产日韩精品-欧美国产日韩久久久-欧美国产日韩一区二区三区-欧美国产日韩在线-台湾毛片-台湾美女古装一级毛片

基于微博文本的用戶人格分析模型研究

來源:期刊VIP網(wǎng)所屬分類:綜合論文時間:瀏覽:

  摘 要:傳統(tǒng)的微博用戶人格分析將人格分為五類,但未考慮人格類別之間潛在的關(guān)聯(lián)性。為此基于多標簽集成分類方法(RAkEL)進行改進,構(gòu)建RAkEL-PA模型。RAkEL-PA模型使用標簽集合中不同的隨機子集訓練相應的Label Powerset(LP)分類器,然后集成所有分類結(jié)果作為最終分類結(jié)果。在微博用戶文本消息數(shù)據(jù)上進行實驗,結(jié)果表明,RAkEL-PA模型的兩個不同策略對用戶人格分類準確率較高。RAkEL-PA模型充分考慮多個人格之間的相關(guān)性,以提高用戶人格分類魯棒性。

  關(guān)鍵詞:大五人格;人格分析;多標簽學習;RAkEL-PA;微博文本

社交論文發(fā)表

  0 引言

  心理學把個體人格研究與社交網(wǎng)絡(luò)結(jié)合,用社交網(wǎng)絡(luò)中用戶行為數(shù)據(jù)對用戶人格進行分析與預測[1],如工作績效預測[2]、青少年網(wǎng)絡(luò)成癮誘因分析[3]、抑郁癥預測[4]、人格與情緒表達關(guān)系[5]等,價值巨大。

  文獻[6]統(tǒng)計地理位置、發(fā)布頻率等移動互聯(lián)網(wǎng)用戶特征,將人格分類看作三分類和五分類問題實驗;文獻[6,7,8]分別采用新浪微博、Facebook、Twitter和YouTube數(shù)據(jù)集進行人格識別;文獻[9,10]采用二進制粒子群算法和半監(jiān)督算法建立社交網(wǎng)絡(luò)用戶人格分析模型;文獻[11]將人格分類問題轉(zhuǎn)化為二分類問題;Rosen等[12]針對用戶個體網(wǎng)站內(nèi)容分析用戶人格;Ross等 [13]通過研究用戶數(shù)據(jù)得出外向型與組成成員個數(shù)關(guān)系密切。

  以上方法都是將五維人格看作不相干任務(wù)執(zhí)行,而事實上五個維度之間有一定關(guān)聯(lián)[1,6-8,11,14]。本文通過對多標簽集成方法—隨機k標簽集(Random k-LabELsets,RAkEL)[10]進行改進,構(gòu)建基于微博文本的RAkEL-PA(RAkEL-Personality Analysis)模型,綜合考慮五維人格相關(guān)性,彌補前人工作的空白。

  1 研究流程

  人格模型泛指大五人格模型(Big-Five Model),包括外向性(Extraversion,E)、神經(jīng)質(zhì)(Neuroticism,N)、宜人性(Agreeableness,A)、責任型(Conscientiousness,C)和開放性(Openness,O)五個維度[1]。

  本文研究流程:①獲取數(shù)據(jù):在微博上發(fā)放大五人格量表問卷,志愿者填寫問卷以及微博userID,采用userID通過爬蟲獲取志愿者微博文本數(shù)據(jù);②特征提取:從微博文本中提取與人格相關(guān)度高的特征,創(chuàng)建人格分析模型的特征屬性;③建立模型:構(gòu)建RAkEL-PA模型;④評估模型:采用分類準確率Accuracy和損失函數(shù)Hammingloss兩個指標進行評估。

  2 RAkEL-PA模型構(gòu)建

  2.1 數(shù)據(jù)獲取

  2.1.1 獲取用戶五維人格得分

  在問卷星網(wǎng)站上制作大五人格量表[1]作為調(diào)查問卷。制作5個分量表,每個分量表包括5個選項(非常不符合、不太符合、不確定、比較符合、非常符合)12個題目,分別記2、4、6、8和10分,其中有題目反向計分,滿分為100分。將問卷發(fā)放到微博,志愿者填寫問卷,根據(jù)得分標注用戶五維人格標簽。

  2.1.2 微博用戶數(shù)據(jù)獲取及數(shù)據(jù)預處理

  利用userID使用Python語言編寫微博爬蟲程序,爬取用戶3個月微博文本數(shù)據(jù)。刪除僅含圖片、表情等無用數(shù)據(jù)。

  2.2 特征提取

  本文使用CCPL開發(fā)的中文心理分析系統(tǒng)TextMind[14],產(chǎn)生已驗證的76個微博文本特征[14],如表1所示。另外,表情符號更能反應用戶情緒,所以本文統(tǒng)計微博消息中含有的表情符號,并統(tǒng)計每條消息的影響力,如表2所示。

  由于特征量化為數(shù)值后差異巨大,必須對其先歸一化[11]。將每個特征進行[0,1]區(qū)間歸一化,如公式(1)所示。

  其中,[f]和[f*]分別為文本特征的原始值和歸一化值,[fmin]和[fmax]分別為所有用戶相應特征的最小值和最大值。

  2.3 RAkEL-PA模型構(gòu)建

  2.3.1 多標簽分類方法

  多標簽學習方法主要有算法自適應和問題轉(zhuǎn)換方法兩種[15]。前者主要包括支持向量機[7]和多標簽[k]近鄰算法(ML-kNN)[16];后者主要有Binary Relevance(BR)[5]和Label Powerset(LP)。

  2.3.2 基于微博文本的RAkEL-PA模型構(gòu)建

  LP方法優(yōu)點是考慮標簽相關(guān)性,但也存在不足[17],因此將大量標簽的集合隨機分成很多小的標簽集,采用LP為每個小標簽集訓練多標簽分類器,將所有LP分類器決策集成得到RAkEL的最后結(jié)果。本文基于微博文本的用戶人格分析模型,構(gòu)建基于人格分析的不相交子集策略RAkELd-PA和基于人格分析的重疊子集策略RAkELo-PA。

  確定RAkELd-PA標簽集[k]的大小,將標簽集合[L]隨機分成[m=Mk]個不相交的[k]標簽集[Rj],[j=1,2…m]。用LP學習[m]個多標簽分類器[hj],[j=1,2…m]。每個分類器[hj]學習一個單標簽分類任務(wù),包含訓練集中所有[Rj]的子集類值。該策略中不同標簽集中的標簽不相交,所以標簽數(shù)越多性能越好[18]。

  RAkELd-PA模型訓練過程和分類過程分別如圖1和圖2所示。

  RAkELo-PA中[Lk]表示[L]中所有不同[k]標簽集的集合。[Lk]大小由二項式系數(shù)[Lk=Mk]決定。與RAkELd-PA不同的是,已知標簽集[k]的大小以及期望的分類器數(shù)量[m≤Lk],RAkELo-PA通過從[Lk]隨機采樣選擇[m]個[k]標簽集[Ri],[i=1,2…m]。當[mk>M]時標簽集會重疊。

  在RAkELo-PA模型上訓練過程和分類過程分別如圖3和圖4所示。

  3 實驗

  3.1 實驗數(shù)據(jù)集和特征提取

  本文共收到258份問卷,經(jīng)過篩選(如:每個問題答案相同)得到有效問卷169份。使用爬蟲得到用戶在微博上的文本消息。利用文心軟件提取文本特征,如表1和表2所示,并進行歸一化處理。標簽數(shù)[M]為人格的五個維度。因此標簽集界限是[25]=32,而實際標簽集數(shù)量范圍為此邊界的5%~44%[17]。本文標注的標簽集中有8種標簽集出現(xiàn)次數(shù)最多,將集中60%的數(shù)據(jù)作為訓練集,其余作為測試集。

  3.2 模型評價指標

  本文使用分類準確度Accuracy(A)和Hammingloss(H)評估多標簽分類效果。

  用[D]表示一個多標簽數(shù)據(jù)集,[D]表示樣本個數(shù),[xi]表示第[i]個樣本,[yi?L]表示[xi]的標簽集,[i=1,2…D]。本文通過學習一個多標簽分類器[h]預測實例[xi]的標簽集[zi],即[zi=h(xi)]。

  分類準確度(A)[18]定義如下:

  3.3 實驗結(jié)果與分析

  3.3.1 RAkELd-PA模型實驗結(jié)果分析

  在RAkELd-PA實驗中,標簽集[k]取2、3和4。[k]值不同模型數(shù)[m]也不同。

  如圖5所示:k=2時,模型的A值最高;k=3和k=4時,A值略低于k=2時,而LP的A值保持不變。原因是同時具有兩種人格特質(zhì)的人較多。隨著[k]值增大,[m]變小,參與訓練的分類器個數(shù)變少,導致RAkELd-PA性能變差。

  如圖6所示:k=2時,模型H值最小;k=3和k=4時,H值略高,可見隨著[k]值增大,H值也在變大,而LP的H值不變。該模型的H最大值和LP的H值接近,說明隨著[k]值接近M,模型性能與LP性能相當。

  3.3.2 RAkELo-PA模型實驗結(jié)果分析

  RAkELo-PA模型使用[k](2~4)的所有有意義值進行實驗。在k=2和k=3時,[m]范圍為1~10,k=4時,[m]范圍為1~5。RAkELo-PA模型的分類決策計算方式采用多數(shù)投票規(guī)則。

  如圖7所示:①k=2(同時具有兩種人格特質(zhì))時,A值在m=8時最高,與文獻[9]得出的結(jié)論一致,即A和C、C和E、C和O、O和E分別具有很強的相關(guān)性;②k=3時,A值在m=8時最高,文獻[11]也表明,C、A、E,E、C、O,O、A、C分別有強相關(guān)性;③k=4時,A值在m=4時最高,與k=2和k=3相比,同時具有4種人格特質(zhì)的人相對較少,所以A值略低于k=2和k=3時的A值,而LP的A值不隨[m]和[k]的改變而改變。

  如圖8所示:隨著[m]值增大,模型的H值在減小。k=2,m=7、8、9時,H值最小;k=3,m=8時,H值最小;k=4,m=3時,H值最小。LP分類器的H值不隨[m]和[k]的改變而改變。可以看出,模型的H值均比LP小,說明該模型性能比LP好。

  4 結(jié)語

  針對傳統(tǒng)人格分析方法未考慮五個人格維度之間的潛在相關(guān)性導致個體人格分類準確率較低問題,提出RAkEL的改進模型RAkEL-PA實現(xiàn)個體人格分類。實驗結(jié)果表明,具有雙重人格特質(zhì)和三重人格特質(zhì)的人較多,說明五維人格之間存在依賴性。該模型考慮了五維人格之間的相關(guān)性,提高了微博用戶人格分類的準確率,從而驗證了RAkEL-PA模型對人格分類的有效性。后續(xù)考慮獲取更多微博用戶數(shù)據(jù),在更大數(shù)據(jù)集上進行實驗,以進一步驗證該模型的有效性。

  參考文獻:

  [1] 張磊,陳貞翔,楊波. 社交網(wǎng)絡(luò)用戶的人格分析與預測[J]. 計算機學報,2014,37(8):1877-1894.

  [2] JUDGE T A, ZAPATA C P. The person–situation debate revisited: effect of situation strength and trait activation on the validity of the big five personality traits in predicting job performance[J]. Academy of Management Journal, 2015, 58(4): 1149-1179.

  [3] ZHOU Y, LI D, LI X, et al. Big five personality and adolescent internet addiction: the mediating role of coping style[J]. Addictive behaviors, 2017, 64(8): 42-48.

  [4] ALLEN T A, CAREY B E, MCBRIDE C, et al. Big five aspects of personality interact to predict depression[J]. Journal of personality, 2018, 86(4): 714-725.

  [5] 劉真亦. 不同人格傾向微博用戶的情緒表達分析[D]. 杭州:浙江大學,2019.

  [6] 孫啟翔. 基于移動互聯(lián)網(wǎng)社交行為的用戶性格分析和預測[D]. 北京:北京理工大學,2016.

  [7] FARNADI G,SITARAMAN G,SUSHMITA S,et al. Computational personality recognition in social media[J]. User Modeling and User-Adapted Interaction, 2016, 26(2-3): 109-142.

  [8] 楊潔. 基于用戶情感和網(wǎng)絡(luò)關(guān)系分析的人格預測模型[D]. 上海:東華大學,2016.

  [9] 毛雨. 基于社交網(wǎng)絡(luò)的用戶人格分析研究與實現(xiàn)[D]. 北京:北京郵電大學,2019.

  [10] 鄭赫慈. 網(wǎng)絡(luò)空間中人格分析的研究與實現(xiàn)[D]. 北京:北京郵電大學,2019.

  [11] XUE D, HONG Z, GUO S, et al. Personality recognition on social media with label distribution learning[J]. IEEE Access, 2017, 5(142): 13478-13488.

  作者:舒曉敏

  推薦閱讀:全球社交網(wǎng)絡(luò)的新聞生態(tài)與國際輿論引導

精品视频在线看| 国产精品12| 日韩在线观看免费完整版视频| 国产麻豆精品免费视频| 台湾美女古装一级毛片| 亚洲精品中文字幕久久久久久| 日本特黄特黄aaaaa大片| 九九精品久久| 人人干人人草| 台湾毛片| 日本特黄特黄aaaaa大片| 午夜欧美成人香蕉剧场| 国产伦久视频免费观看视频| 欧美a免费| 天天做人人爱夜夜爽2020毛片| 欧美日本免费| 尤物视频网站在线| 日本特黄特色aa大片免费| 国产一区二区精品| 国产亚洲精品成人a在线| 亚欧视频在线| 黄视频网站在线看| 日日夜夜婷婷| 九九精品久久久久久久久| 四虎影视久久久免费| 亚洲第一页乱| 韩国三级香港三级日本三级la| 久久久久久久男人的天堂| 亚洲 国产精品 日韩| 亚洲www美色| 国产不卡高清在线观看视频| 亚洲天堂一区二区三区四区| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美另类videosbestsex高清| 成人在免费观看视频国产| 国产精品免费久久| 日韩男人天堂| 国产国语对白一级毛片| 人人干人人插| 日韩一级精品视频在线观看| 精品久久久久久中文| 台湾美女古装一级毛片| 日韩专区第一页| 美国一区二区三区| 久久久久久久免费视频| 一级片免费在线观看视频| 精品国产三级a| 国产极品白嫩美女在线观看看 | 国产高清在线精品一区a| 亚洲精品久久久中文字| 国产美女在线观看| 韩国三级香港三级日本三级| 一本伊大人香蕉高清在线观看| 日本在线不卡免费视频一区| 欧美激情一区二区三区在线| 亚飞与亚基在线观看| 日本在线不卡视频| 国产精品自拍亚洲| 黄视频网站在线免费观看| 日日日夜夜操| 精品视频免费在线| 成人免费观看视频| 青青久久精品| 日韩一级黄色大片| 九九九网站| 日本特黄特色aaa大片免费| 成人在免费观看视频国产| 麻豆午夜视频| 日韩中文字幕在线播放| 国产不卡在线播放| 日韩在线观看免费完整版视频| 亚洲精品久久久中文字| 日本特黄特色aa大片免费| 国产麻豆精品免费密入口| 国产亚洲精品aaa大片| 香蕉视频久久| 欧美激情一区二区三区视频 | 99久久精品国产高清一区二区 | 99热精品在线| 天天做日日干| 亚飞与亚基在线观看| 亚洲www美色| 国产一区免费观看| 欧美另类videosbestsex| 国产成人啪精品| 黄色免费网站在线| 天天色成人| 美国一区二区三区| 91麻豆精品国产自产在线观看一区 | 日韩av东京社区男人的天堂| 精品久久久久久影院免费| 久久99中文字幕久久| 日本免费乱人伦在线观看 | 午夜家庭影院| 免费国产在线观看| 欧美一级视频免费| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美日本免费| 九九九在线视频| 一本高清在线| 国产一区二区精品在线观看| 黄视频网站在线看| 香蕉视频三级| 日韩中文字幕一区| 成人免费观看的视频黄页| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 一级毛片视频播放| 99久久精品国产国产毛片 | 国产网站麻豆精品视频| 国产成人精品在线| 亚洲第一色在线| 九九国产| 九九九在线视频| 黄视频网站在线免费观看| 日韩av东京社区男人的天堂| 在线观看导航| 欧美电影免费看大全| 韩国三级香港三级日本三级| 色综合久久天天综线观看| 九九国产| 国产a视频| 国产一区二区精品在线观看| 九九热精品免费观看| 香蕉视频亚洲一级| 91麻豆精品国产自产在线 | 韩国三级视频在线观看| 青青久热| 欧美a免费| 亚洲精品永久一区| 欧美另类videosbestsex久久| 国产高清在线精品一区二区 | 国产精品自拍一区| 成人高清视频在线观看| 日韩在线观看网站| 沈樵在线观看福利| 国产伦久视频免费观看视频| 日韩avdvd| 999精品在线| 亚洲天堂在线播放| 国产原创视频在线| 91麻豆精品国产高清在线| 国产极品精频在线观看| 999精品在线| 亚洲精品中文字幕久久久久久| 午夜在线观看视频免费 成人| 久久精品免视看国产成人2021| 深夜做爰性大片中文| 成人免费网站久久久| 久久久久久久久综合影视网| 沈樵在线观看福利| 国产视频在线免费观看| 免费一级片在线| 欧美一区二区三区性| 国产不卡精品一区二区三区| 亚洲精品久久玖玖玖玖| 美女免费精品视频在线观看| 欧美激情一区二区三区视频高清| 999久久狠狠免费精品| 91麻豆tv| 一级毛片视频播放| 天天做日日爱夜夜爽| 免费国产一级特黄aa大片在线| 亚洲www美色| 999精品在线| 欧美日本国产| 国产91精品系列在线观看| 欧美1区| 日韩在线观看免费| 色综合久久久久综合体桃花网| 青青久热| 中文字幕一区二区三区精彩视频| 日韩中文字幕在线播放| 99久久精品费精品国产一区二区| 国产成人欧美一区二区三区的| 四虎影视库国产精品一区| 91麻豆精品国产自产在线 | 久久精品大片| 国产a免费观看| 一级毛片视频播放| 国产视频一区二区在线观看| 久久国产精品自由自在| 一本高清在线| 日日夜夜婷婷| 国产成人精品在线| 日本伦理网站| 日本免费乱人伦在线观看 | 日本特黄特色aaa大片免费| 二级特黄绝大片免费视频大片| 欧美一区二区三区在线观看| 成人免费观看网欧美片| 九九热国产视频| 日韩中文字幕在线亚洲一区| 香蕉视频亚洲一级| 日本免费区| 午夜久久网| 亚久久伊人精品青青草原2020| 日韩欧美一及在线播放| 精品在线视频播放| 欧美一级视| 九九九国产|