北京声加科技有限公司 成立于2018年1月,专注于通信声学核心技术,已先后通过中关村高新技术企业认证和北京市高新技术企业认证。为B端客户提供复杂场景下的近场、中场、远场语音交互技术方案,以及从芯片、模组、PCBA到工业设计的一站式产品方案。
声加团队中既有研究界的执牛耳者、亦有在工业及音频领域有着丰富经验的职业经理人。主要研发人员来自于中科院声学所、清华大学、南京大学和中国科学院大学等国内一流科研院所。核心团队成员亦大多师出于中科院声学所,平均在业界拥有超过十五年工作经验。
声加创始团队凭借在声学和语音领域十余年的技术积累,其回声抵消、噪声抑制、声源定位、混响消除、波束形成、语音唤醒等核心技术在行业内一直处于领先水平。合作伙伴包括华为、小米、OPPO、万魔、歌尔、科沃斯、Harman、Anker等数十家知名企业。已授权终端设备千万套以上,为华为和荣耀TWS耳机、小米TWS耳机、小米户外蓝牙音箱等通信产品和智能穿戴产品提供领先的解决方案。未来,声加科技还将为客户提供模组、芯片等多种形态的产品。
作为智能听觉的引领者和创新者,声加致力于在复杂场景下,为人与人通信、人与机器交互提供更清晰、更舒适、更自由的使用体验,最终实现人机完全交融的愿景。
主要产品
面向全场景的用户,提供软硬一体化的语音前端拾音解决方案,包括麦克风阵列的算法、模组以及麦克风阵列,关键词唤醒(KWS)以及唤醒词定制训练模型。并可提供产品设计等定制化方案以帮助用户加速产品上市。
代表产品一
智能音箱语音前端解决方案
声加麦克风阵列麦克风阵列是一款针对B端客户开发的有自主知识产品的远场语音交互方案。此方案利用麦克风阵列的空域滤波特性,通过对唤醒人的角度定位,形成定向拾音波束,并对波束以外的噪声进行抑制,以保证较高的录音质量。
目前声加科技基于Amlogic的A113X(ARM cotexA53 4核)平台开发了一套智能音箱麦克风阵列。麦克风阵列由麦克风阵列板、核心板、功放板三部分组成,采用8至18V直流电源(>1A)供电,提供wifi/BLE接口、UART调试接口、USB固件升级接口、双通道喇叭接口。核心板集成512MB Flash和512MB RAM。麦克风阵列板可选:4cm半径 6+1 环形阵列、2cm半径 6+1 环形阵列、2cm距离8麦克阵列。
代表产品二
蓝牙耳机语音处理方案
通过在蓝牙耳机中植入回音消除、声源定位、干扰噪声降噪、风噪抑制等语音处理算法,可以使蓝牙耳机在复杂环境中仍然能提供优异的语音通话品质。目前此方案已经应用在某知名企业TWS(真无线)蓝牙耳机上,可提供实际成品测听评估。
应用场景
客厅场景 / 厨房场景
智能电视:提高智能电视对用户语音的识别效果,针对待机场景提供低功耗方案;
机顶盒应用:轻松实现可“近”可“远”的人机语音交互并提高识别效果;
智能音箱应用:可实现强大的抗外部噪声与远场唤醒能力,识别性能优异;丰富的音箱结构设计经验打造优质的重放音质;能快速完成不同硬件平台适配;可提供低功耗方案。
智能厨房应用:可迅速嵌入智能开关、厨房助手、扫地机器人等智能家居设备,同时提供关键词唤醒功能,低功耗设计可以保证移动设备的续航时间。
办公室场景 / 餐厅场景 / 商场场景
电脑/笔记本应用:实现在各种嘈杂环境下的语音唤醒,让用户体验更智能的语音输入方式,低功耗方案保证设备待机时间。
会议终端设备应用:即使是在人声的办公环境中,也可以准确识别说话人的声音方位,采集到清晰的语音信号。
机器人语音交互应用:应用在机场、银行、酒店、博物馆等场景中,可与机器人实现语音命令交互,体验完善的智能控制与对话。
轿车场景 / 公交、地铁场景
智能车载应用:实现车内的拾音降噪,真正解放双手,满足辅助驾驶的导航,电话,娱乐,咨询,社交等需求。
手机、平板等智能移动设备应用:超低功耗解决方案专为移动智能设备打造,在保证续航的前提下提供自动增益控制、回声消除、噪声抑制等功能,可以在任何场合享受清晰通话体验。
街头场景 / 大风场景
耳机 / TWS耳机应用:通过回声消除、声源定位、干扰噪声降噪、风噪抑制等语音处理算法,使体积日益缩小的蓝牙耳机在复杂环境中仍然能提供优异的语音通话品质。
可穿戴产品应用:超低功耗解决方案,在保证续航的前提下提供自动增益控制、回声消除、噪声抑制等功能,实现多噪音环境中的清晰拾音。
核心技术
回声消除 AEC
支持单声道和立体回声抵消
支持单声道和立体声回声抵消。支持大音量、重低音情况下的回声抵消,可实现音响大音量(100dB)情况下非线性噪声残留抑制,可以解决在麦克风与大音量喇叭距离较近时(比如一些小型智能音箱)以及一些低成本喇叭失真所带来的AEC性能下降的痛点。
混响抑制
去除房间混响导致的语音拖尾
房间混响是在封闭空间内进行语音通信时,语音信号从声源到达传声器的多径反射所造成的,其中到达传声器较晚的反射波称作晚期混响,晚期混响会对语音造成自掩蔽和重叠掩蔽效应,因而影响语音的可懂度。语音去混响技术可以去除房间混响导致的语音拖尾。
声源定位
实现360°全方位语音信号采集
利用麦克风阵列,实现360°全方位语音信号采集,并通过声源定位来确定目标说话人的方向,支持多声源情况的定位,根据语音及唤醒词特性,可在干扰噪声存在时准确定位目标语音方向。
定向拾音
大幅提升远场语音识别率
在保护主方向语音的同时,去除环境中的语音、电视噪声等非平稳干扰,其中非平稳噪声抑制量大于20dB,在噪音环境下可以大幅提升远场语音识别率。
噪声抑制
去除空调 胎噪等平稳噪声
去除空调、胎噪等平稳噪声以及环境中的语音、电视等非平稳噪声的波束成形算法。
关键词唤醒 KWS
极致速度 同时支持多轮对话功能
用户通过说出关键词,可以将麦克风阵列从休眠状态唤醒。目前支持Dual-wake、Free-cut、One-shot等独有的定制功能,具有低于500毫秒的机器应答响应的极致速度,同时支持多轮对话功能。