中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      三易生活 1小時前

      可識別唇語,蘋果的新專利可能會解救頭戴設(shè)備

      為了挽救 Vision Pro,蘋果又出招了。日前有消息源曝光了他們獲批的一個新專利,顯示其未來的頭戴式設(shè)備將支持讀取唇語,所以用戶無需發(fā)出聲音,就可通過讀取唇部動作來接收命令。

      在這份名為 " 帶有語音輸入結(jié)構(gòu)的電子設(shè)備 " 專利相關(guān)文件中,蘋果描述了在佩戴者無法說話的場景下,通過內(nèi)置的視覺傳感器讀取唇語以實現(xiàn)語音輸入。如果這個專利真的能落地,或?qū)δ壳耙磺蓄^戴設(shè)備都有著巨大的積極作用。

      就在小米和阿里先后下場之后,這一輪 AI 眼鏡熱潮已經(jīng)到來。然而在烈火烹油的局面下,這類產(chǎn)品其實也面臨著不小的危機。根據(jù) VR Vision 的統(tǒng)計,僅僅在抖音電商,AI 眼鏡的平均退貨水平就達到了 40%-50%。而在網(wǎng)友們將其列為 " 吃灰神器 " 的一眾原因里,除了元器件變多會增加佩戴負擔(dān)外,語音交互則是另一個被集中反饋的痛點。

      對于智能音箱這類使用場景基本集中在家庭環(huán)境的設(shè)備,它與語音交互可以說是天作之合,但 AI 眼鏡、XR 頭顯則截然不同,畢竟后者在使用時會有相當(dāng)一部分是公共場合。

      誠然,在 AI 大模型相關(guān)技術(shù)跨越式發(fā)展的當(dāng)下,這類智能設(shè)備都擁有了不錯的語義識別能力,能夠理解用戶語句背后的含義,再輔以降噪引擎,可以在各種各樣的聲音中分辨所需要的語音流,從而精準識別來自佩戴者的指令。

      盡管拾音和語義理解都不是問題,但真正的痛點就在于,不是所有人都能克服在大庭廣眾之下對著空氣說話帶來的羞恥感。再加上由于公共場合的聲音環(huán)境更加復(fù)雜,所以即便降噪技術(shù)再先進,也需要用戶用更高的音量來操控設(shè)備??墒窃诠矆龊细呗曅鷩W,顯然就與公序良俗相背。再加上語音交互就需要用一定音量說出需求,但不少人并不希望自己的隱私被暴露。

      十年前,馬化騰在談及騰訊沒有做語音助手時就曾表示," 我們沒有作為重點去做,這個功能看起來方便,其實未必,比如一個人對著手機說我要去干嘛干嘛,好傻,人一多我都不好意思這么說,而且也不私密,寧可多按幾下。"

      要知道支持拍攝功能的 AI 眼鏡本身就存在巨大的隱私爭議,因為不是所有人都能接受活在鏡頭下。再加上 AI 眼鏡普遍以語音交互為核心,就會給用戶在公共場合使用帶來巨大的心理負擔(dān)。此外,音頻的信息量要遠大于圖文,但信息量大并不總是一件好事,因為用戶分析和篩選需要花費更多的時間,并且聽覺相對視覺在上下文聯(lián)想方面對于人腦更不友好,這就會使得用戶在用語音交互時需要耗費更多的精力。

      那么問題就來了,難道 AI 眼鏡、XR 頭顯的廠商不知道語音交互的缺陷嗎?其實答案是語音交互已經(jīng)是當(dāng)下最有性價比的解決方案了。但語音交互的一大痛點就是用戶必須要發(fā)出聲音,可要強化 ASR(語音識別)、NLP 自然語義處理、遠場拾音,并捕捉用戶壓低聲音說話的聲紋,成本就必然會大幅度提升,進而又會導(dǎo)致潛在受眾群體變少??扇绻档统杀?,大聲說話帶來的社交壓力又客觀存在。

      在語音交互之前,智能眼鏡類產(chǎn)品的主要交互方式是鏡腿觸控模式??墒窃谘坨R腿上進行交互并不符合人體工學(xué),其缺陷在于需要將手舉到頭部與眼鏡對齊,但頻繁舉手就會讓人感到疲勞。而 TWS 耳機能用觸控交互的原因,是用戶并不會頻繁調(diào)整音量或者開啟降噪,所以低頻場景的觸控操作反而可行。

      在觸控交互不適合頭戴設(shè)備,語音交互有缺陷的情況下,蘋果這一識別唇語的無聲輸入模式就有望成為一個兩全其美的解決方案。用戶無需發(fā)出聲音,讀取唇部動作來接收命令的方式,就解決了用戶在公共場合與設(shè)備交互帶來的一系列痛點。更何況識別唇語如今也不是什么黑科技,只需搭配一個成熟的 AI 視覺模型就可解決。

      通過向 AI 模型灌輸不同語言的用戶說話時的唇部動作,在經(jīng)過充分的預(yù)訓(xùn)練后,就能夠讓搭載了 AI 模型的設(shè)備知道用戶到底在說什么。只要解決識別率的問題,AI 眼鏡、XR 頭顯被廣泛應(yīng)用于公共場合的最大一塊絆腳石,就可能會被搬開。

      一旦用戶能夠毫無顧忌地使用 AI 眼鏡、XR 頭顯,這類產(chǎn)品也就有了從小眾嘗鮮群體專屬變?yōu)榇蟊娀M電子產(chǎn)品的契機。

      【本文圖片來自網(wǎng)絡(luò)】

      相關(guān)標(biāo)簽