专注于音视频处理及流媒体开发!

罗索

  • [『音频智能』] 语音识别是什么?语音识别技术常用方法和应用 日期:2022-03-14 17:46:34 点击:194 好评:0

    语音识别——人机交互的入口,指的是机器或者是程序能够接收、解释声音甚至理解和执行人类口头命令的能力。在当前的大数据和智能化时代,更多的场景在设计个性化的交互界面时,采用对...

  • [『音频智能』] 中文(语音结果)的文本纠错综述 Chinese Spelling Ch 日期:2022-03-14 17:39:19 点击:67 好评:0

    中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等。这边简单梳理下对于这个任务的调研结果。...

  • [『音频智能』] 语音识别ai应用场景哪些?ai语音识别技术难点分 日期:2022-03-14 16:59:55 点击:175 好评:0

    ai语音识别技术在公检法领域应用场景众多,重点包括智慧庭审、虚拟法官、声纹研判、智能接警、警务智能语音服务以及电信反诈骗。...

  • [『音频智能』] 语音识别技术的原理及研究难点 日期:2022-03-14 16:52:40 点击:172 好评:0

    今天,语音识别在移动端和音箱的应用上最为火热,语音聊天机器人、语音助手等软件层出不穷。许多人初次接触语音识别可能归功于苹果手机的语音助手Siri。...

  • [『音频智能』] [深度学习概念]·主流声学模型对比 日期:2021-07-01 15:57:10 点击:259 好评:0

    本文由搜狗语音交互中心语音技术部负责人陈伟来为大家分享伴随着本轮人工智能浪潮下语音识别建模技术的演进,希望能够帮大家理清主流的识别建模脉络以及背后的思考。...

  • [『音频智能』] 音频编解码标准 日期:2021-06-03 10:58:24 点击:218 好评:0

    PCMU(G.711U) 类型:Audio 制定者:ITU-T 所需频宽:64Kbps(90.4) 特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。 优点:语音质量优 缺点:占用的带宽较高 应用领域:...

  • [『音频智能』] 音视频开发基础知识 日期:2021-06-03 10:54:03 点击:84 好评:0

    今天学习一下音视频的基础知识,日常工作中都会接触到音视频的开发,比如目前工作中都会涉及到 TSPlayer、IjkPlayer、MediaPlayer 提供播放能力,不管是什么 Player,其上层调用都是大同小异...

  • [『音频智能』] Voice Activity Detection(VAD)的过去时与现在时 日期:2021-05-13 13:53:25 点击:149 好评:0

    VAD 可应用于低码率编码静音段数据减少网络数据传输,要知道在语音通话中超过 60% 的数据是 silence。在语音增强领域,处理加性背景噪音最流行的方法之一是谱减法 spectral subtraction[1, 2]:...

  • [『音频智能』] 解码转换QQ微信的SILK v3编码音频为MP3或其他格式 日期:2021-01-30 16:24:19 点击:240 好评:0

    SILK v3编码是Skype向第三方开发人员和硬件制造商提供免版税认证(RF)的Silk宽带音频编码器,Skype后来将其开源。具体可见 Wikipedia 。 但是现在很难找齐源码,或者说懒得找。 一年前寻找的时候,...

栏目列表
推荐内容
织梦二维码生成器