致力于追求卓越
全球70%用戶的共同選擇
Cimon介紹
Cimon聲學軟件,基于業界領先且量產驗證的成熟技術,為客戶提供多種真實應用場景下“聽清、聽懂、能言”式的智能交互能力,廣泛應用于智能家居、智能會議、智能教育、智能醫療、智能制造、智能汽車、金融科技、能源電力、智慧法院、智能交通和機器人等領域,提供智能控制、智能問答、智能推薦等多種服務,提升服務效率和質量。
核心技術
遠場聲學處理
前沿聲學技術優勢,擁有完全自主知識產權;包括回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成等;
遠場語音喚醒
業內頂尖喚醒技術之一,實時響應,讓機器聽到人類指令;支持雙名喚醒、離線語音喚醒、抗強噪語音喚醒、聲紋認證喚醒、Open AEC喚醒等,可定制級喚醒詞、快捷命令詞等;
遠場語音識別
業內頂尖語音識別技術之一,精準、快速和穩定,讓機器聽懂人類語言;覆蓋局部場、近遠場、超遠場、分布場多種場景,深度匹配辦公、家居、出行等垂直場景交互需求,支持Free-ask、One-shot、VAN等技術;
遠場語音合成
業內頂尖語音合成技術之一,讓機器擁有說話的能力; 提供更發音更自然、更專業、更符合場景需求的語音合成服務,支持多種音色定制,可自定義音量、語速等;
獨有技術
單麥克風降噪
麥克風陣列降噪
自定義喚醒
離線喚醒
離線命令詞識別
InverseArray
倒置麥克風陣列技術
Dualwake
雙名喚醒
Penetrated DOA
穿透式波達方向估計
VAN
垂直場景抗強躁
AKS
抗強躁聲喚醒
SSP
空間認知
SSA
空間感知
OneShot
一句連控
Free-cut
隨時打斷
Free-ASK
隨時喚醒
TVNS
TV Noise Suppression
OpenAEC
開放聲場回聲消除
VibratedAEC
動態聲場回聲消除
產品體驗
混響抑制
去混響算法
去除房間混響導致語音拖尾的去混響算法
有效去除由于房間混響造成的語音拖尾現象,增強語音清晰度,提升遠場語音識別率。
  • BEFORE
  • AFTER



  • HZ
    時間(s)



  • HZ
    時間(s)
  • 回聲消除
    AEC算法
    針對喚醒引擎深度優化的回聲消除算法
    收斂時間小于0.5s,回聲抑制量超過35dB,即使在DoubleTalk情況下算法仍然魯棒,并且針對聲智科技的喚醒引擎進行深度優化,可以有效提升音樂狀態或TTS狀態下的喚醒率。
    • BEFORE
    • AFTER



  • HZ
    時間(s)



  • HZ
    時間(s)
  • 波束形成
    Beamforming算法1
    去除空調、胎噪等平穩噪聲的Beamforming算法
    主方向語音不失真的前提下,有效去除空調、胎噪等平穩噪聲,平穩噪聲抑制量大于30dB。
    • BEFORE
    • AFTER



  • HZ
    時間(s)



  • HZ
    時間(s)
  • 波束形成
    Beamforming算法2
    去除環境中的語音、電視等非平穩噪聲的Beamforming算法
    在保護主方向語音的同時,去除環境中的語音、電視噪聲等非平穩干擾,其中非平穩噪聲抑制量大于20dB,在噪音環境下可以大幅提升遠場語音識別率。
    • BEFORE
    • AFTER



  • HZ
    時間(s)



  • HZ
    時間(s)
  • SoundAI 雙工通話算法效果對比
    抑制散射式背景噪聲,消除雙方同時講話產生的回聲,讓對方能清楚聽見您,又可以同時講話,保持自然清晰的聽覺感受。
    • BEFORE
    • AFTER



  • HZ
    時間(s)



  • HZ
    時間(s)
  • 語音識別演示視頻
    遠場語音識別技術是在聲源和麥克風距離較遠的情況下,通過麥克風陣列前端處理算法,有效降低噪音,同時對目標說話人聲音進行增強,使得智能家居、智能硬件、機器人語音交互等場景下的遠場語音也可準確識別。聲智科技的遠場語音識別技術可保證即使聲源在三至十米的距離也能被智能產品準確識別,語音喚醒率達95%以上,支持Duel-wake(雙名喚醒)、Free-cut(隨時打斷、隨時喚醒)、OpenAEC(大噪聲下有限參考信號語音喚醒)、AKS(抗強噪聲喚醒)等功能。能夠實現全方向(5米360°)精準喚醒,減少無序喚醒干擾,正確率達到96%以上。并且深度匹配辦公、家居、出行等垂直場景交互需求,達到了行業領先水平,能更大程度優化用戶的使用體驗,讓語音交互更順暢自然。
    聲紋識別演示視頻
    聲紋同指紋一樣,是每個人唯一的生理特征。聲紋識別也稱為說話人識別,是一種通過聲音判別說話人身份的技術。隨著技術的不斷迭代進步,未來可以根據聲音條件識別出不同的使用者,不只可以保證服務的安全性和私密性,更是可以實現“千人千面”的個性化服務,依據用戶行為進行內容設定與推薦。其中,聲智科技語音擴展技術提供了豐富的信息分析和挖掘服務,支持聲紋識別、年齡識別、情緒識別、性別識別、哼唱識別、異響檢測等功能。在未來,聲智科技將持續更新和迭代技術,解決更復雜聲學場景下的遠場聲紋識別等影響用戶體驗的關鍵問題。
    福彩三天计划彩之魂