期刊VIP學術指導 符合學術規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:新聞傳播時間:瀏覽:次
摘要:為了實現(xiàn)全媒體內(nèi)容庫中資源有效利用及用戶服務的提升,本文首先對其內(nèi)容服務的需求進行分析,著重介紹了相關內(nèi)容挖掘及可視化技術,并對全媒體內(nèi)容庫核心模塊的功能設置進行介紹,希望對全媒體數(shù)據(jù)庫建設發(fā)展有借鑒作用。
關鍵詞:全媒體內(nèi)容;智能化;內(nèi)容挖掘;可視化
《中國多媒體與網(wǎng)絡教學學報(電子版)》(月刊),創(chuàng)刊于2002年,是經(jīng)國家新聞出版總署批準的中央級電子期刊,是國內(nèi)很久以前以多媒體形式發(fā)表中小學信息化教學改革前沿成果的學術期刊群,是教育部重點成果的發(fā)表平臺之一,由教育部主管、清華大學主辦、清華同方光盤電子出版社出版。
一、全媒體內(nèi)容服務需求分析
如今,媒體融合已成為趨勢,媒體融合平臺的搭建為媒體內(nèi)容管理和服務提供了新的渠道和思路,而全媒體內(nèi)容庫是其關鍵部分,有利于全媒體資源的統(tǒng)籌管理。全媒體內(nèi)容庫的作用主要體現(xiàn)在全媒體信息的共享、檢索和調(diào)用方面,使平臺所有媒體資源獲得更深層次的開發(fā)利用,還能對全媒體運營、策劃以及生產(chǎn)等起到有力支撐作用。如今,各類新媒體發(fā)展迅速,網(wǎng)絡環(huán)境更加復雜,如何幫助用戶獲取有價值的媒體內(nèi)容,優(yōu)化媒體內(nèi)容服務流程,搭建行業(yè)可視化模型庫成為需要解決的問題。
面對龐大的全媒體內(nèi)容,用戶僅依靠傳統(tǒng)分類、搜索等功能很難得到有用信息,需要借助更加智能化的工具提高檢索效率,挖掘價值內(nèi)容。要依據(jù)用戶需求,提供精準服務,在確定用戶目標的情況下應借助搜索工具幫助其快速、準確的得到目標內(nèi)容,若用戶對自身需求也不確定時,應體現(xiàn)全媒體內(nèi)容智能服務特點,主動智能分析客戶需求,幫助客戶逐步明確并得到所需內(nèi)容。全媒體內(nèi)容庫的開發(fā)利用要兼具數(shù)據(jù)分析和可視化功能,特別是諸多可視化分析工具的應用,實現(xiàn)了更加便利、直觀、高效的內(nèi)容庫分析功能,優(yōu)化了用戶體驗。
二、內(nèi)容挖掘及可視化技術
(一)全媒體內(nèi)容的特征提取
從多媒體類型上劃分全媒體內(nèi)容有視頻、音頻、圖像以及文本等形式,對于不同的內(nèi)容對象其特征往往需要從多個角度分析,如何準確的提取出內(nèi)容特征是了解和利用全媒體內(nèi)容的關鍵。
1.文本特征提取
對于多媒體中的文本信息來說,其特征主要為詞性、詞義、關鍵詞以及包含的情感等,為了更準確、快速的提取文本特征,這里需要用到自然語言處理技術。
2.圖像特征提取
對于圖像來說,既包含圖片中文本信息的提取,又包含圖像特有的背景、人物、物體等信息的特征描述,將人工智能應用于內(nèi)容庫中圖像特征分析,可對圖像特征以文字的形式予以描述。為了挖掘圖像的更深層的特征,更好理解圖像表達的內(nèi)容,應從不同維度生成圖像相關的不同特征向量,并通過特征向量的對比、分析以及計算,可準確把握圖像內(nèi)容。
3.音頻特征提取
在全媒體內(nèi)容庫中,音頻媒體的分析處理也需要借助人工智能技術,為了獲取音頻特征,可有兩條途徑:一是進行音頻語音的智能識別,并將其轉(zhuǎn)化為文本形式,然后再利用文本特征提取方法挖掘音頻內(nèi)容,該方法局限于人類語言內(nèi)容的音頻;二是從聲樂特征的角度進行分析,提取音頻中所包含的聲紋特征、音調(diào)、音色等。音頻特征提取之后的分析計算有助于音頻媒體中內(nèi)容的把握。
4.視頻特征提取
對視頻來說,可以概括為以上三類媒體類別的綜合體,需借助智能處理技術意義分析,所包含內(nèi)容層次更多如場景、人物、聲音以及文字等。為獲取視頻特征,需要對視頻中出現(xiàn)的所有信息進行分類識別,可采用分幀處理或者單獨提取音頻和文本的方式處理,視頻特征的分析計算也是必須的。
(二)基于標簽的內(nèi)容分析
由于全媒體內(nèi)容特征數(shù)量龐大,若對特征信息準確分類和快速提取,需要利用好“標簽”的概念,對于多媒體內(nèi)容的特征以標簽的形式進行描述,可描述的內(nèi)容不固定可以是選題、報道等。標簽與分類不屬同一概念,以某個全媒體內(nèi)容來說,所屬分類的維度有限,通常只能簡單分為幾類,相對來說比較固定,而對于標簽來說,則不存在數(shù)量限制,可從各個維度進行表述并自由添加。鑒于標簽的特征,面對日益龐大的全媒體內(nèi)容,可將標簽用于內(nèi)容管理中去,通過多維度管理更能提高多媒體數(shù)據(jù)利用效率。要針對多媒體內(nèi)容進行特征分析,選取有代表性的、明顯的內(nèi)容特點并將其設定為標簽,多重維度的標簽有助于媒體內(nèi)容的準確定義以及海量內(nèi)容的有效挖掘。內(nèi)容標簽的設置大大提高了目標內(nèi)容的快速提取,對全媒體內(nèi)容挖掘帶來極大便利,而且標簽的作用還體現(xiàn)在多媒體內(nèi)容的管理方面,可以更加高效的進行組織和整理。面對未知的全媒體內(nèi)容,若要發(fā)掘其中有價值的內(nèi)容,在人工智能技術支持下,標簽為客戶提供了探索發(fā)現(xiàn)的鑰匙。借助于內(nèi)容標簽,全媒體內(nèi)容特征更直觀的展現(xiàn)在用戶面前,更易發(fā)現(xiàn)用戶所需求的內(nèi)容,這體現(xiàn)了標簽的使用價值。
(三)多種媒體的可視化技術
為了將全媒體內(nèi)容庫中的不同媒體形式的內(nèi)容進行可視化展示,常用方法有:2D/3D圖表、數(shù)據(jù)列表、地圖分布、數(shù)據(jù)模型等,當采用多維數(shù)據(jù)分析時,若要達到可視化效果則要求掌握信息不同維度數(shù)據(jù)間的內(nèi)在聯(lián)系,并對其分布情況以曲線圖、柱狀圖或者雷達圖等形式表達出來。這里著重對標簽云技術進行分析,其主要用于文本媒體內(nèi)容的可視化應用。其整體形式就是預先對某文本信息所包含的關鍵詞進行提取,然后將其以特定順序進行排列,最終呈現(xiàn)在我們面前。還要對這些關鍵詞予以區(qū)別,區(qū)分標準主要是出現(xiàn)頻次和重要程度,并對關鍵詞的字體大小、顏色進行調(diào)整,給予高頻次和高重要性的標簽更加醒目的標記。
(四)可視化內(nèi)容的探索工具
探索工具的應用對于發(fā)掘全媒體中有價值內(nèi)容有很好的輔助效果,而且工具的應用降低了內(nèi)容挖掘的難度,只需掌握簡單的操作方法,就能更直接的發(fā)掘全媒體內(nèi)容潛在的關聯(lián),發(fā)現(xiàn)更多內(nèi)容價值。下面對各類探索分析工具進行介紹:
1.內(nèi)容分布分析工具,能夠利用全媒體內(nèi)容的標簽和屬性等信息自動完成相關內(nèi)容的分布分析工作,并具有可視化功能設計,方便使用者對內(nèi)容分布有更清晰的認識;
2.熱點內(nèi)容挖掘工具,對于各類社會熱點問題,工具可在熱點的基礎上深入發(fā)掘其他相關信息,并且還具有領域分類功能,可依據(jù)客戶對時政、體育、娛樂等不同喜好有選擇性的挖掘熱點信息;
3.內(nèi)容關聯(lián)性挖掘工具,能夠在大量媒體信息中心發(fā)現(xiàn)其潛在的關聯(lián)并以不同專題的形式將其融合成,如人物專題。利用可視化功能對內(nèi)容關聯(lián)性挖掘結(jié)果進行直觀展示,有利于提高選題、決策等有效性;
4.詞云分析工具,主要用于標簽數(shù)據(jù)的可視化展示,幫助使用者更好掌握各關鍵詞間的聯(lián)系,提高標簽數(shù)據(jù)的利用價值;
5.情感分析工具,主要針對的是網(wǎng)絡推文的評論信息及其他輿情相關信息,在智能識別技術支持下可更精確的發(fā)掘媒體內(nèi)容中所表達的情感信息,并進行智能判斷,實現(xiàn)更高價值的應用;
6.數(shù)據(jù)分析與仿真工具,通過對多維數(shù)據(jù)交互關聯(lián)分析,利用統(tǒng)一的關系/空間/時間/統(tǒng)計等數(shù)據(jù)分析模式,同時嵌入各種自定義業(yè)務仿真計算模型,支持對閾值模型/評估模型/預測模型等,再利用大量分析算法,還可擴充開發(fā)新的分析模型,適應行業(yè)業(yè)務需求。