據外媒報道,首爾國立大學(Seoul National University,SNU)研究團隊開發(fā)出了一種新穎的聽覺技術,僅使用一個麥克風即可識別人體位置。即使在嘈雜的工廠環(huán)境中,這項技術也能促進人機之間基于聲音的交互。
圖片來源: 首爾國立大學
該研究團隊通過聲源定位和聲學通信技術,成功實現了全球首個“用耳朵感知空間”的3D聽覺傳感器。該研究成果發(fā)表在《Robotics and Computer-Integrated Manufacturing》期刊上。研究團隊包括首爾國立大學工程學院機械工程系Sung-Hoon Ahn教授的團隊。
在工業(yè)和災害救援環(huán)境中,“聲音”起著至關重要的作用。即使在視覺傳感器或電磁通信因高溫、灰塵、煙霧、黑暗或障礙物而失效的情況下,聲波仍然可以傳遞重要信息。
然而,現有的聲學傳感技術存在精度限制或需要復雜的設備配置,使得實際的工業(yè)應用面臨挑戰(zhàn)。因此,盡管聲音具有巨大的潛力,但其作為一種傳感資源尚未得到充分利用。
尤其是在工廠等高噪聲環(huán)境中,先進的聲學傳感技術至關重要,因為準確識別人體位置或使機器人識別口頭指令極其困難。此外,傳統的通信方式在缺乏網絡基礎設施的環(huán)境中也面臨挑戰(zhàn),這凸顯了利用聲音進行機器人間通信的新型技術的必要性。
為了解決這些根本性問題,研究團隊開發(fā)了全球首個基于元結構的3D聽覺傳感器,該傳感器僅使用單個傳感器即可實現位置識別。該傳感器集成了兩項核心技術:即使在噪聲環(huán)境中也能估算人體或物體3D位置的3D聲學感知技術;以及基于聲波的雙通信技術,該技術能夠實現人與機器人以及機器人之間的全新交互方式。
Ahn教授的團隊專注于研究蝙蝠和海豚的生物學機制,這些生物能夠識別周圍環(huán)境并僅通過聲音進行交流。他們尤其致力于改造聽覺能力,使其能夠“選擇性地聆聽來自特定方向的聲音”,從而能夠在復雜的噪聲中分離出所需的聲音。
為了實現這一目標,他們設計了一種基于元結構的相位抵消機制,可以人工調整來自不同路徑的聲波的相位,從而放大來自特定方向的聲音,同時抵消其他方向的聲音。
通過將該機制與單個麥克風和旋轉裝置相結合,該團隊將3D聲源追蹤功能(此前只有多傳感器系統才能實現)集成到單個傳感器中。他們將該系統命名為3DAR(3D Acoustic Ranging,3D聲學測距)。此外,受海豚雙頻通信原理的啟發(fā),研究人員設計了一個雙聲學通道,將可聽頻率和不可聽頻率范圍分開。這種結構允許人類和機器人使用可聽頻率(人類可以聽到的聲音)進行通信,而機器人之間則使用不可聽頻率(人類聽不到的聲音)進行通信。這種設計最大限度地減少了干擾,并在機器人之間提供了獨立的通信路徑,從而促進了工業(yè)環(huán)境中更復雜的協作場景。
這兩項技術集成在一個單一的元結構3D聽覺傳感器系統中,研究團隊已成功將其應用于實際的機器人平臺。現場測試已在工廠和日常環(huán)境中進行。值得注意的是,配備該系統的四足機器人成功地通過聲音與人類進行了互動,并通過聲音探測了氣體泄漏的位置。
本研究開發(fā)的技術預計將廣泛應用于各個領域,包括追蹤工廠內工人的位置、實現基于語音的人機協作,以及協助機器人在災難期間識別和響應人類的救援呼叫。此外,與現有系統相比,該傳感器成本低廉、設計緊湊,使其易于在工業(yè)環(huán)境中部署。
這項技術在基于單元的自主制造工廠中尤其被寄予厚望。通過利用這項技術,實時追蹤工人位置可以防止與機器人發(fā)生碰撞,并且無需手勢或按鈕,僅通過聲音與機器人進行通信可以增強工人的身體自由度,從而實現更高效的協作。
此外,機器人之間通過聲音進行通信,無需依賴傳統網絡,因此無需復雜的通信基礎設施,即可在多個機器人之間實現靈活、有機的協調。
該技術預計還將對24小時無人工廠監(jiān)控產生巨大價值。它可以自動檢測并定位指示管道泄漏、機械異?;蚬と耸鹿实穆曇簦瑥亩鴮崿F即時響應。此外,由于其基于單個傳感器的低成本緊湊設計,該系統具有多功能性,可輕松應用于其他正在邁向自動化的工業(yè)場所。
Sung-Hoon Ahn教授強調了聽覺技術的潛力,他指出:“傳統通信技術中使用的電磁波會被墻壁或障礙物阻擋,而聲音可以穿過狹窄的縫隙并被聽到,這使得它成為一種極具潛力的新型交互方式?!?p>
論文第一作者、博士生Semin Ahn回顧了研究過程:“以前,利用聲音確定位置需要多個傳感器或進行復雜的計算。開發(fā)一種僅使用一個旋轉麥克風就能精確定位聲源的3D傳感器,為聲學傳感技術開辟了新的途徑。”
首爾國立大學創(chuàng)新設計與集成制造實驗室的博士生Semin Ahn目前正在研究基于智能結構的“聲學帶通濾波器(Acoustic Band-Pass Filter)”。該技術旨在即使在高噪聲環(huán)境中也能選擇性地捕捉特定頻率的聲音。
未來的計劃是將3DAR系統增強為更先進的機器人聽覺系統,將其與基于大型語言模型(LLM)的認知系統相結合,使機器人能夠像人類一樣理解聲音的含義,并將其應用于人形機器人。
上一篇:第10萬臺機器人下線 普渡機器人領航全球服務機器人規(guī)?;慨a
下一篇:最后一頁
- 熱門資源推薦
- 熱門放大器推薦
- 使用STLUX385A數字控制器的100 W LED路燈評估板
- 【立創(chuàng)開發(fā)板】wygxjs的游戲機
- LTC3816EUHF 演示板,4.5V VIN 28V,VOUT = 高達 1.5V @ 25A
- TEA1721ADB1059: TEA1721 Non-Isolated Buck Converter Demo Board
- SI82XX-KIT,Si8235 評估板,2 輸入,4A,5 kV 雙 ISO 驅動器
- AM6TW-4803SH35Z 3.3V 6瓦單路輸出DC-DC轉換器的典型應用
- BTS5210L智能高端電源開關典型應用電路
- 用于 2.8V 輸出的 150mA RF ULDO 穩(wěn)壓器的典型應用
- LT8631IFE 12V、1A、降壓轉換器的典型應用電路
- AP7313 150mA、低靜態(tài)電流、快速瞬態(tài)低壓差線性穩(wěn)壓器的典型應用