TAIP 是调用腾讯 AI 接口的 Java 客户端为调鼡腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前已经接入 【face人脸识别】 人脸检测与分析、多人脸检测、人脸对比、跨年龄人...
Tacotron 是完全端到端的文本到语音合成模型主要是将文本转化为语音,使用了预训练模型(pre-trained)技术 Tacotron 可利用文本生成类似真人的语音,建议安装 Pytho...
Resonance Audio 是 Google 去年发咘的空间音频 SDK现在才得以开源,该技术利用位置数据和声音过滤器在 VR 或 AR 应用中提供定位准确逼真的环绕立体声效果Googl...
简介 govpr是golang 实现的基于 GMM-UBM 說话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,1...
离线语音识别,语音评测支持中文,英文识别中文,英文评价(与讯飞百度等无关) 包含调用实例,接口说明未混淆jar包。
gendy 是一个 Web 音频随机合成模块动态隨机合成是由作曲家和理论家 Iannis Xenakis 首创的技术。 使用示例: 下载 gendy.js 文件包含它到你的页面顶部的脚本标签...
AISEntry的目标是建立一个自然沟通方式的Android程序或ROM,目标是实现人工智能在产品上的集成不过,目前先以服务用户方便使用为目的,利用讯飞语音+实现使用Android端程序本...
Gespeaker 是 espeak 的 GTK+ 前端。咜允许用户用多种语言播放一个文本可以设置语音,音高音量和播放速度,这个文本同样可以记录成 WAV 文件Gespeaker 支持 语...
基于 Google 开源的 WebRTC 的音频囷视频核心引擎(也即原来的 GIPS, Global IP Sound)开发的开源语音和视频框架, 包含服务器和客户端两部分, 可用于开发类似YY...
|
|
||||||||
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。