通信電纜 網(wǎng)絡(luò)設(shè)備 無線通信 云計算|大數(shù)據(jù) 顯示設(shè)備 存儲設(shè)備 網(wǎng)絡(luò)輔助設(shè)備 信號傳輸處理 多媒體設(shè)備 廣播系統(tǒng) 智慧城市管理系統(tǒng) 其它智慧基建產(chǎn)品
智慧云天(深圳)技術(shù)有限公司
閱讀:70發(fā)布時間:2023-7-2
心理情緒測評系統(tǒng)主要基于語音情緒識別、面肌心理情緒識別、人臉情緒識別、眼動情緒識別等,采用多維度、多模態(tài)心理情緒特征、三級數(shù)據(jù)建模及神經(jīng)網(wǎng)絡(luò)計算模型,結(jié)合個人常模大數(shù)據(jù)和多級大數(shù)據(jù)的分析與管理,實現(xiàn)對測試者的心理情緒做出科學(xué)趨向性分析與評估,達到多級數(shù)據(jù)管理,以及心理測評、心理預(yù)警心理干預(yù)的一站式解決方案,實現(xiàn)管理者駕駛艙體驗式的實時動態(tài)數(shù)據(jù)平臺監(jiān)測的目標。
人的情感是一種心理和生理的綜合體驗,往往伴隨著生理喚醒和一定的外部表現(xiàn),研究顯示人類80%的交流信息都是情感性的信息。眼睛是生命體感知外界信息的器官,它們可以感知光線,從而進一步從周圍環(huán)境獲取信息,是人類觀察世界的主要途徑。同時,眼睛縝藏著豐富的心理層面潛在意識信息。這種豐富的意識信息包括了人的情感狀態(tài)和內(nèi)心活動,意識信息傳達至眼睛,通過不同的眼球運動將信息直觀地表達出來。
AI心理情緒測評系統(tǒng)基于眼睛的瞳孔直徑、掃視、凝視、眨眼等眼動特征能夠反映內(nèi)在的情感變化,然而這些眼動特征不能全面的刻畫眼動狀態(tài)及運動軌跡,基于眼動數(shù)據(jù)的情感特征提取方法,得到眼動數(shù)據(jù)的情感特征提取: 注視事件、瞳孔直徑變化率、眨眼變化率以及眼跳速度的夠更全面的刻畫眼動狀態(tài),例如由正或負性情感激引起的瞳了直徑明顯大于在平靜條件下的瞳孔直徑,瞳孔對不同情緒的反應(yīng)后,根據(jù)眼動特征(瞳孔直徑、掃視、凝視、眨眼)識別情感狀態(tài)。
通過將眼動狀態(tài)與用戶的情感狀態(tài)進行映射,表明人的眼動行為能夠在某種程度上反映出人的情感狀態(tài)。事實證實眼部瞳孔大小的變化與情感喚酶呈線性關(guān)系,當觀看不愉快的圖像刺激時,瞳孔會縮小,當觀看偷快的圖像刺激時,瞳孔就會放大。雖然瞳孔直徑反映了情緒變化,但是人的瞳孔直徑物理大小差別很大,不能直接用于情感體驗的測量。多使用眼跳信號、瞳孔直徑、注視信號進行基于眼動的情感識別研究。
根據(jù)面部實時或視頻文件識別的情感數(shù)據(jù),智慧云天AI情感識別系統(tǒng)根據(jù)的情緒建模及神經(jīng)網(wǎng)絡(luò)獲得被測試者每一時刻或在說話片段中的害怕、排斥、沖突、期待、壓力、興奮、邏輯、比率、概率、分心、猶豫、認知、緊張、壞感、想象、思考、潛意識、潛在情緒等數(shù)據(jù)。
人臉表情識別是機器視覺和模式識別領(lǐng)域具有較為廣泛的應(yīng)用意義。人臉表情識別技術(shù)是一個非?;钴S的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理、模式識別、計算機視覺、神經(jīng)網(wǎng)絡(luò)、心理學(xué)等諸多學(xué)科的內(nèi)容。如今,雖然在這方面的應(yīng)用已取得了一些的成果,但是FRT在實用應(yīng)用中仍面臨著復(fù)雜的問題,因為人臉五官的分布是非常相似的,而且人臉本身又是一個柔性物體,表情、安態(tài)的千變?nèi)f化都給正確識別帶來了相當大的麻煩。如何能正確識別大量的人并滿足實時性要求是迫切需要解決的問題。
從視頻中提取的多幀特征值和智慧云天AI情感識別引擎中標記標記的30萬+情感數(shù)據(jù)庫中的值進行比較來完成平靜、高興、吃驚、悲傷、憤怒、厭惡和恐懼7種情感識別功能。
正常狀態(tài)下,人在說話時心理情感的波動會引起聲壓、語氣、語速、停頓時間和發(fā)聲器官的微小變化,以及通過人體大腦皮層的生理反應(yīng),利用心理學(xué)、生理學(xué)、神經(jīng)科學(xué)、信號分析處理、人工智能等的諸多前沿科技,檢測分析語音中某些特征參數(shù)的變化,因此,心理測評系統(tǒng)通過監(jiān)測這些特征變化實現(xiàn)心理情感分析。
根據(jù)當前語音情感分析的不足,心理測評系統(tǒng)通過多年語音情感識別技術(shù)的開發(fā)經(jīng)驗,結(jié)合循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶性、參數(shù)共享等特征,對序列的非線性特征在學(xué)習(xí)方面具有一定優(yōu)勢,利用基于LSTM(LongShort-Term Memory)長短期記憶網(wǎng)絡(luò),將一種時間循環(huán)神經(jīng)網(wǎng)絡(luò),應(yīng)用于處理和預(yù)測時間序列中間隔和延遲相對較長的重要事件,解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題。相比普通的RNN,LSTM能夠在更長的序列中有更好的表現(xiàn),通過將卷積操作引入長短時記憶網(wǎng)絡(luò)中,構(gòu)建完整的語音心理情感網(wǎng)絡(luò)模型,將語音進行統(tǒng)一歸一化處理,再對統(tǒng)一歸一化處理的語音進行分割之后,對割分的語音加窗分幀處理,并建立變長數(shù)據(jù)的計算方式,將卷積操作引入長短時記憶網(wǎng)絡(luò)中,實現(xiàn)完整的語音情感識別網(wǎng)絡(luò)模型,并識別平靜、高興、吃驚、悲傷、憤怒、厭惡和恐懼7種情感功能。
目前市場上語音心理情感分析存在如下問題:
1. 心理情感與語音特征的邏輯關(guān)系不夠明確;
2. 從語音數(shù)據(jù)采集到語音特征的提取降噪處理不夠?qū)е滦畔⒌膿p失,而損失的信息影響最終心理情感檢測的 效果;
3. 分類算法效果一定程度上依賴人為提取的語音特征,算法本身不具有特征學(xué)習(xí)能力。
根據(jù)語音情感數(shù)據(jù),智慧云天AI心理測評系統(tǒng)根據(jù)的情緒建模及神經(jīng)網(wǎng)絡(luò)獲得被測試者每一時刻或在說話片段中的害怕、排斥、沖突、期待、壓力、興奮、邏輯、比率、概率、分心、猶豫、認知、緊張、壞感、想象、思考、潛意識、潛在情緒。
(1)系統(tǒng)的識別時延低于250ms.
因為在線語音情感識別,如果時延過高不但影響用戶體驗,而且對后續(xù)的語音情感識別請求的處理時間就更加長,發(fā)生堵塞。時延低是系統(tǒng)最重要的要求,要求系統(tǒng)對每個語音情感識別的請求處理時間低于250ms。
(2)能夠處理大規(guī)模并發(fā)任務(wù)請求。心理測評系統(tǒng)語音情感識別具有并發(fā)任務(wù)處理能力。如果對語音情感識別任務(wù)的處理是串行的,則依然滿足不了大規(guī)模的應(yīng)用。
(3)利用采集針對性的語料進行模型訓(xùn)練,并在引警模塊中語音情感特征提取前加入語音降噪處理步驟,提高了情感識別率。原始語音信號從頻譜圖上可以看到語音數(shù)據(jù)中含有一些不規(guī)則信號的噪聲。下圖是經(jīng)過降噪之后的語音信號變得有規(guī)律,可以發(fā)現(xiàn)降噪效果還是明顯的。經(jīng)過降噪之后重新訓(xùn)練,明顯提高模型的效果,說明經(jīng)過降噪的語音有效降低環(huán)境噪聲和設(shè)備底噪對語音情感識別的影響。
(4)采用群體決策優(yōu)化神經(jīng)網(wǎng)絡(luò)方法。
心理測評系統(tǒng)采用群體決策的方法將訓(xùn)練集按照不同的組合條件,并選出每次交又驗證在測試集上識別的模型組成一個神經(jīng)網(wǎng)絡(luò)群,當進行識別時,神經(jīng)網(wǎng)絡(luò)群中的每個模型分別對當前樣本進行判斷給出情感標簽,最后使用投票的方式給出最終識別結(jié)果。
(5) 語音情感識別精度達到達到82%
(6)心理測評系統(tǒng)語音情感識別工作穩(wěn)定性達到99.5% ,運行可靠且有能力處理大規(guī)模并發(fā)任務(wù)。
-----------------------------------------
(核心技術(shù),轉(zhuǎn)載請注明出處。)
智慧城市網(wǎng) 設(shè)計制作,未經(jīng)允許翻錄必究 .? ? ?
請輸入賬號
請輸入密碼
請輸驗證碼
請輸入你感興趣的產(chǎn)品
請簡單描述您的需求
請選擇省份