织梦CMS - 轻松建站从此开始!

罗索

google sdk speech-to-text(谷歌语音转文本、谷歌语音转

jackyhwei 发布于 2020-11-10 15:35 点击:次 
google sdk speech-to-text 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。
TAG: ASR  字幕  

google sdk speech-to-text

  • 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。

  • 异步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API 并启动长时间运行的操作。使用此操作,您可以定期轮询识别结果。异步请求可用于任何持续时间不超过 180 分钟的音频数据。

  • 流式识别(仅限 gRPC)对 gRPC 双向流内提供的音频数据执行识别。流式传输请求专为实时识别(例如从麦克风采集实时音频)而设计。流式识别可以一边采集音频一边提供临时结果,例如实现在用户仍在讲话时显示结果。

源码

识别率超高的在线麦克风语音转文本(免费工具)

官网文档

Java 流式和非流式语音识别示例(官网示例)

google speech-to-text

google 语音转文本(短语音)

google 语音转文本(英文短语音)

google 语音转文本(异步短语音)

google 语音转文本(每个单词带时间戳)

google 语音转文本自动加标点符号(短语音)

google 通过流的方式发送语音文件转文本

google 通过流的方式发送语音(直接用电脑上的麦克风说话)

google 语音转文本(多轨支持)

Google Speech 多语言支持

(thinktothings)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/202011/17764.html]
本文出处:CSDN博客 作者:thinktothings 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容