娇小w搡bbbb搡bbb,《第一次の人妻》,中国成熟妇女毛茸茸,边啃奶头边躁狠狠躁视频免费观看

重慶大學:研究用于語音識別和交互的機器學習輔助可穿戴傳感系統

發布者:EnchantedDreams最新更新時間:2025-06-26 來源: elecfans關鍵字:語音識別  機器學習 手機看文章 掃描二維碼
隨時隨地手機看文章

背景介紹

人體會產生豐富的生物信號,這些信號可以被人體檢測、數字化、分析并與外界設備交互。其中,人類的語音尤其具有豐富的時域、頻域和幅度信息傳輸能力。這種豐富的信息承載能力使聲音成為生物通信、人機交互(HMI)和物聯網(IoT)應用(包括智能家居、遠程控制、身份識別和語音系統)的重要組成部分。然而,基于空氣振動的語音通信容易受到背景噪聲(如路邊、商場、車站等嘈雜環境)和聲學介質(如火災、醫院、水下等特殊場景)的干擾和阻礙。此外,發聲過程依賴于器官的協調系統,任何因肌萎縮側索硬化癥(ALS)、中風、帕金森病或喉癌等疾病引起的損傷都會嚴重影響語音清晰度和識別效率。為了應對這些挑戰,研究人員開發了先進的降噪算法和多麥克風系統來增強語音處理能力。然而,這些解決方案的有效性受到聲音信號質量和多特征參數復雜性的限制。例如,單麥克風系統無法捕捉空間特征,難以提供高信噪比的音頻信號。雖然多麥克風系統和相關算法可以改善語音信號處理,但它們需要復雜的工程設計并占用更多空間。


最近,基于面部和嘴唇運動的視覺語音識別已成為一種在嘈雜環境中增強語音感知的方法。雖然這種方法可以在具有挑戰性的聲學條件下提高語音感知質量,但它需要額外的攝像頭,這增加了系統的復雜性并降低了實用性。近年來,直接監測面部運動狀態的可連接傳感器作為無聲語音識別的解決方案引起了人們的關注。雖然面部特征可以在一定程度上補充音頻信號,但它們在捕捉音高、音色和聲音強度等聲學參數方面存在很大的局限性。相反,將傳感器直接放置在發聲器官區域是一種實現全面聲音信息收集的有效方法。用于監測聲音信號的傳統可穿戴設備通常使用綁帶或粘性貼片附著在身體上。然而,它們的剛性和扁平形狀限制了實際應用。柔性材料和傳感技術的發展為隱形皮膚可穿戴設備鋪平了道路。目前,安裝在發聲器官中的柔性傳感技術主要包括石墨烯、柔性表面肌電圖電極、壓阻和摩擦電。與傳統的剛性麥克風相比,這些技術佩戴更舒適,可以無縫融入日?;顒又小1M管這些傳感器有諸多優勢,但它們通常依賴于有線硬件,限制了它們在日常使用中的適應性。

為了克服這些挑戰,集成信號處理和傳輸單元的柔性可穿戴設備對于充分利用各種機電特性的潛力至關重要。微機電系統 (MEMS) 制造技術的進步為改善可穿戴設備的集成帶來了希望。一項值得注意的創新是將商用 MEMS 加速度計芯片整合到可穿戴設備中,從而能夠連續監測機械聲音信號,例如語音、吞咽、呼吸和心臟運動。然而,目前的傳感器無法滿足寬頻帶范圍和平坦度的要求,限制了信號頻譜的能量分布。此外,檢測皮膚加速度只能提供肌肉運動模式數據,而忽略了發聲器官的關鍵振動信息。由于缺乏生物特征信息,在監測小幅度肌肉運動時,機械聲音信號相對較弱。這種限制對于皮膚組織較厚(例如甲狀腺腫大)或喉部受傷的用戶尤其不友好。因此,有必要開發一種新的便攜式語音交互系統來解決這些問題并提高用戶體驗和HMI。

本文亮點

1. 本工作提出了一種可穿戴無線柔性貼膚聲學傳感器(SAAS),能夠捕捉發聲器官的振動和皮膚運動,從而實現惡劣聲學環境下的語音識別和人機交互(HMI)。

2. 該系統采用壓電微機械超聲換能器(PMUT),具有高靈敏度(-198 dB)、寬帶寬(10 Hz-20 kHz)和優異的平坦度(±0.5 dB)等特點。柔性封裝提高了佩戴時的舒適性和適應性,同時與殘差網絡(ResNet)架構的集成顯著提高了喉部語音特征的分類,準確率超過 96%。

3. 在多個 HMI 場景中展示了 SAAS 的數據收集和智能分類能力。語音識別系統能夠通過深度學習模型以 99.8% 的準確率識別參與者所說的日常句子。

圖文解析


wKgZPGfSu-SAWa47ABLWJVRB1_s612.png

圖1. 用于惡劣聲學環境下語音識別的無線、柔性、可附著式聲學傳感器。

a 實現HMI的語音識別系統示意圖。b 可附著式聲學傳感系統爆炸圖。c PMUT結構示意圖。d 處理發聲器官振動和肌肉運動信號的步驟流程圖,包括信號處理、控制、無線通信和顯示終端。e SAAS在語音識別與交互中的應用示意圖。

wKgZPGfSu-WARauxAAuLGS6ykyc681.png

圖2. 裝置設計原理及特性描述。

a 基于SOI晶片的聲學傳感器三維結構剖面圖。b PZT、AlN、ScAlN及對應三種形狀的聲學傳感器相關參數的有限元仿真對比。c PMUT正面(I)和背面(II)的照片。d 制備的聲學芯片的光學顯微鏡圖像和微元件的特寫細節。e 制備的聲學芯片的Mo/ScAlN/Mo薄膜結構的SEM剖面圖。f 空氣中MEMS芯片的電阻抗幅值與相位的諧振頻率響應。g 水中封裝后的MEMS傳感器在低頻寬帶范圍內的靈敏度測試曲線。h 柔性器件在未變形(I)、扭曲(II)、彎曲(III)和拉伸(IV)下的圖像顯示。

wKgZPGfSu-WACEl5ABBU5EYCH4Y496.png

圖3. 惡劣聲學環境下的語音檢測對比實驗。

a 安靜環境(I)、嘈雜環境(II)和戴口罩(III)下同一項對比測試的照片。b 當受試者在安靜環境(I)、嘈雜環境(II)和戴口罩(III)下說“CQU”時,SAAS顯示聲音信號的時域波形和頻譜信息。c 當受試者在安靜環境(I)、嘈雜環境(II)和戴口罩(III)下說“CQU”時,商用參考麥克風顯示聲音信號的時域波形和頻譜信息。d 受試者在9種喉部附著位置和動作下的照片。e 通過 SAAS 在 9 個喉嚨附著位置和動作中說“完美”時獲得的時域波形。

wKgZPGfSu-WAJ8vgAAlAGkSij_k494.png

圖4. 基于SAAS的身份識別演示。

a–c音素、聲調、同音詞分類任務的混淆矩陣。d通過數據采集、深度學習和實時顯示實現的身份識別系統示意圖。e不同參與者說“hello world”時的聲音信息。f身份識別的混淆矩陣。

wKgZPGfSu-aAIWdTAA7IXHVlAYs643.png

圖5. 使用SAAS控制虛擬游戲和機器狗。

a實時無線HMI控制系統示意圖。b吃豆人游戲中語音指令上下左右命令演示。c遠程無線控制機器狗通過語音命令執行動作:“站起來”、“跳舞”、“側翻”、“爬樓梯”。

wKgZPGfSu-aAbuxFAAnSMkFICqY403.png

圖6. 基于SAAS的語音識別系統在人機交互中的應用。

a通過數據處理、分類和實時顯示實現的交互系統示意圖。b 使用卷積神經網絡從參與者的日常對話中收集到的 10 個句子樣本的波形和相應的頻譜圖。c 句子識別任務的混淆矩陣。d 60 個 epoch 迭代過程中訓練和測試數據的歸一化準確率。e 經過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。f 經過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。


關鍵字:語音識別  機器學習 引用地址:重慶大學:研究用于語音識別和交互的機器學習輔助可穿戴傳感系統

上一篇:智能眼鏡電源管理芯片:續航革命背后的隱形戰場
下一篇:MSPM0C1104:全球最小MCU的技術解析與應用場景

推薦閱讀最新更新時間:2025-07-03 17:36

語音識別設置能刪除嗎_語音識別系統工作流程
  語音識別設置能刪除嗎   語音識別設置是可以刪除的。   win7系統的操作方法如下:   1、單擊開始,然后單擊控制面板 雙擊“區域和語言選項” ;   2、單擊語言 選項卡,然后單擊詳細信息 ;   3、在“已安裝的服務”下,單擊語音識別,單擊刪除,然后單擊確定 單擊確定,以應用所作的全部更改。   通過上述步驟就可以刪除電腦語音識別功能。   語音識別系統工作流程   語音識別是以語音的研究為對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。   語音識別系統本質上是一種模式識別系統,包括特征提取、模式匹配、參考模式庫等三個基本單元。   一套完整的語音識別系統,工作過程分為7步:   1.對語音信
[嵌入式]
特斯拉OTA再升級:語音識別、路線規劃都更加本土化了
9月3日,特斯拉OTA軟件版本發布大更新,包括語音識別、路線規劃及車載APP在內,共升級十余項車機功能,大幅提升老車主的用車體驗。具體的更新有哪些呢?我們一起來看: 在此次更新的2023.26.9 軟件版本中,特斯拉通過OTA共帶來13項車機功能升級,4項變化值得關注。 第一,提升了中文語音識別能力:特斯拉現在能聽懂更多更簡單的中文口語指令。比如,車主可直接說“故宮博物院”來開啟導航,或者說“空調22”來設置溫度,還可以繼續說“再低點兒”來調節溫度。 第二,特斯拉也對路線規劃功能進行了一次重要升級。在出發時,導航可更加及時地獲取地圖實時路網狀況,比如哪條路線限行、哪條路線紅綠燈數目多等信息,并為車主提供更優路線
[汽車電子]
特斯拉OTA再升級:<font color='red'>語音識別</font>、路線規劃都更加本土化了
谷歌醫療顧問Toby Cosgrove預測:醫療領域的下一個重要技術應用將是語音識別
通過外媒資訊獲悉,在美國“新聞&世界報道醫療保健會議” (News & World Report Healthcare)上,谷歌顧問、前克利夫蘭診所首席執行官Toby Cosgrove預測,除了已經在醫療領域站穩腳跟的人工智能等新技術外,醫療領域的下一個重要技術將是“語音識別”。 Cosgrove在會議期間提出了他對當前醫療保健服務領域創新的看法。他表示:“語音識別將是醫療保健領域的下一個‘殺手級’應用?!碑斎?,谷歌、亞馬遜和蘋果這些硅谷的大腕們已經開發和改進了語音識別工具,包括Google Home、Alexa和Siri等。 Cosgrove表示,語音識別只是技術不斷發展的一個例子和表現,它可以建立在繁瑣的EHR(電子健康記錄)
[醫療電子]
BrainChip機器學習芯片在22nm FDSOI上成功流片
BrainChip日前在GlobalFoundries 22nm的FD-SOI工藝上成功流片AKD1500 機器學習芯片。 該參考設計是一個關鍵里程碑,是跨不同工藝和代工廠驗證BrainChip IP 的一部分。BrainChip一直在與瑞薩合作,將名為 Akida 的 IP 集成到上個月流片的芯片中。 AKD1500 使用 BrainChip AI IP 的最新功能,結合超低泄漏 FDX22 工藝,適用于 AIoT、工業、消費和汽車市場中始終開啟的傳感器應用或其他低功耗嵌入式應用。 對于傳感器始終在線的 AI,Akida 可以在不使用 CPU 的情況下卸載前饋網絡,從而實現極其節能的智能傳感器。 對于其他低功耗嵌入式
[嵌入式]
LD3320嵌入式語音識別系統應用電路設計
  語音交互系統是比較人性化的人機操作界面,它需要語音識別系統的支持。LD3320是一款語音識別芯片。本文介紹了LD3320芯片的工作原理及應用,給出了LD3320與微處理器的硬件接口電路及軟件程序。隨著高檔MCU 的不斷出現,以 MCU ?為核心的嵌入式語音交互系統會有非常好的應用前景。   特定人語音識別( ASR ,Auto Speech RecognitiON)技術是基于“關鍵詞語列表”的識別技術,它是對大量的語音數據(相當于對數千人采集的數萬小時的有效聲音數據)經語言學家語音模型分析,建立數學模型,并經過反復訓練提取基元語音的細節特征,以及提取各基元間的特征差異,得到在統計概率最優化意義上的各個基元語音特征,最后才由資深
[電源管理]
LD3320嵌入式<font color='red'>語音識別</font><font color='red'>系統</font>應用電路設計
基于DSP的語音識別計算器電路設計
隨著電子技術的高速發展,現代普通民用計算器在保留基本的加減乘除等運算外,加入了大量如三角函數、冪函數等比較復雜的運算。但是其基本的操作沒有發生變化,依然是運用手指操作,對于需要進行實時數字計算的一些特殊人群(殘疾人士)或是在一些特殊場合在無法手動操作計算器的情況下,用加入了語音識別模塊的計算器來進行實時數字計算就有相當的必要。 語音識別技術是人機最自然、最簡潔的交流方式,它就是讓機器能夠自動識別并理解說話人要表達的意思,將語音信號轉變為正確的文本或者命令的高科技技術。根據實際的應用,語音識別可以分為:特定人與非特定人的識別、孤立詞與連續詞的識別、中小詞匯量與無限詞匯量的識別。 考慮到成本及使用范圍因素,本文中應用的是基
[嵌入式]
基于DSP的<font color='red'>語音識別</font>計算器電路設計
三星選中Sensory為嵌入式語音識別技術的主要供貨商
三星將在手機、可穿戴設備和相機上廣泛搭載Sensory語音識別技術。 Marketwired 2014年9月5日美國加州圣克拉拉消息----為消費電子產品提供語音和視覺技術的行業領先者Sensory公司高興地宣布,其開創性的TrulyHandsfree(TM)語音技術將廣泛應用于三星標志性的Galaxy產品線,包括智能手機、平板電腦、相機和可穿戴設備。 TrulyHandsfree(TM)是領先的永遠開啟、持續偵聽語音控制解決方案,允許用戶通過超低功耗的語音觸發器激活和使用手機。TrulyHandsfree(TM)語音控制技術還支持超高精度命令集,不需要湊近麥克風,不需要房間安靜,甚至不需要說得完全正確。三星把這些
[手機便攜]
基于語音識別的汽車空調控制系統
引言 現在汽車上使用的電器越來越多,駕駛員需要手動操作的電器開關也越來越多,不但增加了駕駛員的負擔,還影響了行車安全。本文以STM32F103VET6(以下簡稱STM32)芯片為控制核心,采用高性能LD3320語音識別芯片,設計基于語音識別的汽車空調控制系統。該系統可以用語音有效控制汽車空調,減輕了駕駛員的操作負擔,保證行車過程中的安全。 1 系統硬件設計 運用語音識別技術,結合各種傳感器對車身內外的環境(如氣溫、陽光強度等)以及制冷壓縮機的狀態等多種參數進行實時檢測,與設定參數相比較,微控制器經過運算處理做出判斷,輸出相應的調節和控制信號。執行機構經過實時調整和修正,實現對車廂內空氣環境全方位、多功能的調節和控制。系統
[單片機]
基于<font color='red'>語音識別</font>的汽車空調控制<font color='red'>系統</font>
小廣播
最新嵌入式文章
何立民專欄 單片機及嵌入式寶典

北京航空航天大學教授,20余年來致力于單片機與嵌入式系統推廣工作。

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發圈

 
機器人開發圈

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
主站蜘蛛池模板: 肥西县| 赫章县| 永顺县| 黄石市| 肥城市| 伊吾县| 贡觉县| 乌兰察布市| 浠水县| 广河县| 杭锦旗| 凤凰县| 措勤县| 霍林郭勒市| 蓝田县| 崇礼县| 金门县| 田林县| 哈密市| 新源县| 大城县| 奉化市| 奉新县| 阳朔县| 凯里市| 武宣县| 蒙山县| 高唐县| 汝南县| 筠连县| 仲巴县| 岗巴县| 云安县| 文登市| 平和县| 逊克县| 公主岭市| 大同市| 察雅县| 和平县| 洪湖市|