摘要: from https://zhuanlan.zhihu.com/p/45063012 2清水小虾https://www.zhihu.com/question/280235834/answer/412407487 很巧,我最近也在调研和题主相似的方向,我关注的是物体姿态估计相关的一些网络结构。还在写总 阅读全文
posted @ 2019-12-05 11:58 cheatingdeath 阅读(479) 评论(0) 推荐(0) 编辑
摘要: from https://zhuanlan.zhihu.com/p/65400509 1. 引言 1.1 论文的问题描述 输入一张图片,6D Pose Estimation这个问题的目标是检测出物体在3D空间中的位置和姿态。随着计算机视觉算法的提升,对3D空间中物体状态的检测越来越受关注。在2018 阅读全文
posted @ 2019-12-05 11:56 cheatingdeath 阅读(637) 评论(0) 推荐(0) 编辑
摘要: from https://zhuanlan.zhihu.com/p/90187724 TTS(Text-to-speech)入门 https://www.zhihu.com/question/269258229/answer/429919536来源:知乎 为什么tacotron生成语音时需要先生成M 阅读全文
posted @ 2019-12-05 11:34 cheatingdeath 阅读(389) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/88502449 from zhihu 最近研究了一段时间的TTS模型。然后将自己的一些成果研究分享一下下,有不对的地方还请忽略。 一、Merlin语音合成系统。 这个系统应该可以说是历史比较长久的一套系统了,其搭配了三个声码器,WORLD\ 阅读全文
posted @ 2019-12-05 11:31 cheatingdeath 阅读(197) 评论(0) 推荐(0) 编辑
摘要: from:https://zhuanlan.zhihu.com/p/91968492 《A 2019 Guide to Speech Synthesis with Deep Learning》 人类语音的人工产生被称为语音合成。这种基于机器学习的技术适用于文本到语音,音乐生成,语音生成,启用语音的设 阅读全文
posted @ 2019-12-05 11:28 cheatingdeath 阅读(175) 评论(0) 推荐(0) 编辑