变压器-TTSPytorch实现与众所周知的saco2seq模型(如tacotron)相比,该模型的训练速度快约3至4倍,并且合成语音的质量几乎相同。
通过实验确认,每步花费约0.5秒。
我没有使用波网声码器,而是使用tacotron的CBHG模型学习了后网络,并使用griffin-lim算法将频谱图转换为原始波。
要求安装python3安装pytorch==0.4.0安装要求:pipinstall-rrequirements.txt数据我使用了LJSpeech数据集,该数据集由成对的文本脚本和wav文件组成。
完整的数据集(13,100对)可在下载。
我将和用作预处理代码。
预训练模型您可以下载预训练的模型(AR模型为160K,Postnet为100K)在检查点/目录中找到预训练的模型。
留意图约15k步后出现对角线对齐。
以下留意图以16
2016/5/8 12:34:51 1.51MB text-to-speech deep-learning pytorch tts
1
NumpywxPythonpytorchtorchvisionPILUsage:$pythonStyleTransferGui.pybutton:contentimg:选择内容图片styleimg:选择风格图片Start:启动风格转换程序ModelChoice:选择模型Preferences->hyperparameter:设置训练超参数
2015/6/2 4:24:20 1003KB 图像风格迁移
1
更新2021/03/27:(1)发布语义分割的预训练模型,其中PointNet++可以达到53.5%的mIoU。
(2)发布预训练模型用于分类和部分分割log/。
2021/03/20:更新分类代码,包括:(1)添加训练ModelNet10数据集的代码。
使用--num_category10.(2)添加仅在CPU上运行的代码。
使用--use_cpu.(3)增加离线数据预处理代码,加速训练。
使用--process_data.(4)添加用于均匀采样训练的代码。
使用--use_uniform_sample.2019/11/26:(1)修复了之前代码中的一些错误并增加了数据加强技巧。
现在只用1024分就可以达到92.8%!(2)增加了测试代码,包括分类和分割,以及可视化的语义分割。
(3)将所有模型整理成./models文件,方便使用。
2021/5/22 10:51:13 130.98MB pointnet2 pointnet++ 点云算法 算法升级
1
PyTorch民间教程中文版.pdf
2018/1/11 23:27:47 11.91MB
1
基于pytorch的UNet分割网络demo实现,及训练本人的数据集。
包括对相关报错的分析。
收集了几个比较好的前辈的网址。
2016/11/24 18:08:04 276KB unet 目标分割 pytorch 多分类
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡