擅长领域:有声小说,自媒体,爽文有声书
GPT-SOVITS模型配音效果
鉴于GPT-SOVITS模型自回归特性,即其配音情绪高度依赖于所提供的参考音频,特此说明:本视频所展示的配音情绪仅为采用某一特定参考音频时的效果示例,并不全面反映GPT-SOVITS模型能够生成的全部情绪范围及最终配音质量的上限。模型的最终表现将随着不同参考音频的输入而展现出多样化。
模型下载
训练日志
2024-08-22 11:20:20,978 熊猫人配音 INFO {'train': {'log_interval': 100, 'eval_interval': 500, 'seed': 1234, 'epochs': 25, 'learning_rate': 0.0001, 'betas': [0.8, 0.99], 'eps': 1e-09, 'batch_size': 11, 'fp16_run': True, 'lr_decay': 0.999875, 'segment_size': 20480, 'init_lr_ratio': 1, 'warmup_epochs': 0, 'c_mel': 45, 'c_kl': 1.0, 'text_low_lr_rate': 0.4, 'pretrained_s2G': 'GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth', 'pretrained_s2D': 'GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2D2333k.pth', 'if_save_latest': True, 'if_save_every_weights': True, 'save_every_epoch': 25, 'gpu_numbers': '0'}, 'data': {'max_wav_value': 32768.0, 'sampling_rate': 32000, 'filter_length': 2048, 'hop_length': 640, 'win_length': 2048, 'n_mel_channels': 128, 'mel_fmin': 0.0, 'mel_fmax': None, 'add_blank': True, 'n_speakers': 300, 'cleaned_text': True, 'exp_dir': 'logs/熊猫人配音'}, 'model': {'inter_channels': 192, 'hidden_channels': 192, 'filter_channels': 768, 'n_heads': 2, 'n_layers': 6, 'kernel_size': 3, 'p_dropout': 0.1, 'resblock': '1', 'resblock_kernel_sizes': [3, 7, 11], 'resblock_dilation_sizes': [[1, 3, 5], [1, 3, 5], [1, 3, 5]], 'upsample_rates': [10, 8, 2, 2, 2], 'upsample_initial_channel': 512, 'upsample_kernel_sizes': [16, 16, 8, 2, 2], 'n_layers_q': 3, 'use_spectral_norm': False, 'gin_channels': 512, 'semantic_frame_rate': '25hz', 'freeze_quantizer': True, 'version': 'v2'}, 's2_ckpt_dir': 'logs/熊猫人配音', 'content_module': 'cnhubert', 'save_weight_dir': 'SoVITS_weights_v2', 'name': '熊猫人配音', 'version': 'v2', 'pretrain': None, 'resume_step': None}
2024-08-22 11:20:22,574 熊猫人配音 INFO loaded pretrained GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth
2024-08-22 11:20:22,791 熊猫人配音 INFO loaded pretrained GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2D2333k.pth
2024-08-22 11:20:57,705 熊猫人配音 INFO Train Epoch: 1 [0%]
2024-08-22 11:20:57,705 熊猫人配音 INFO [2.810685396194458, 2.024726390838623, 9.361888885498047, 24.621904373168945, 0.0, 2.6947414875030518, 0, 9.99875e-05]
2024-08-22 11:21:14,312 熊猫人配音 INFO ====> Epoch: 1
2024-08-22 11:21:29,846 熊猫人配音 INFO ====> Epoch: 2
2024-08-22 11:21:45,417 熊猫人配音 INFO ====> Epoch: 3
2024-08-22 11:22:01,844 熊猫人配音 INFO ====> Epoch: 4
2024-08-22 11:22:14,434 熊猫人配音 INFO Train Epoch: 5 [76%]
2024-08-22 11:22:14,434 熊猫人配音 INFO [2.750002861022949, 2.119581460952759, 9.507615089416504, 21.994375228881836, 0.0, 1.9197168350219727, 100, 9.993751562304699e-05]
2024-08-22 11:22:17,343 熊猫人配音 INFO ====> Epoch: 5
2024-08-22 11:22:32,493 熊猫人配音 INFO ====> Epoch: 6
2024-08-22 11:22:47,415 熊猫人配音 INFO ====> Epoch: 7
2024-08-22 11:23:02,241 熊猫人配音 INFO ====> Epoch: 8
2024-08-22 11:23:16,917 熊猫人配音 INFO ====> Epoch: 9
2024-08-22 11:23:26,086 熊猫人配音 INFO Train Epoch: 10 [52%]
2024-08-22 11:23:26,086 熊猫人配音 INFO [2.5023202896118164, 2.431929111480713, 9.813006401062012, 20.781333923339844, 0.0, 1.321624994277954, 200, 9.987507028906759e-05]
2024-08-22 11:23:31,970 熊猫人配音 INFO ====> Epoch: 10
2024-08-22 11:23:46,143 熊猫人配音 INFO ====> Epoch: 11
2024-08-22 11:24:00,482 熊猫人配音 INFO ====> Epoch: 12
2024-08-22 11:24:14,778 熊猫人配音 INFO ====> Epoch: 13
2024-08-22 11:24:29,226 熊猫人配音 INFO ====> Epoch: 14
2024-08-22 11:24:35,016 熊猫人配音 INFO Train Epoch: 15 [29%]
2024-08-22 11:24:35,016 熊猫人配音 INFO [2.276317596435547, 2.484264850616455, 10.95496940612793, 21.12187957763672, 0.0, 1.393489122390747, 300, 9.981266397366609e-05]
2024-08-22 11:24:44,022 熊猫人配音 INFO ====> Epoch: 15
2024-08-22 11:24:58,311 熊猫人配音 INFO ====> Epoch: 16
2024-08-22 11:25:12,453 熊猫人配音 INFO ====> Epoch: 17
2024-08-22 11:25:26,407 熊猫人配音 INFO ====> Epoch: 18
2024-08-22 11:25:40,959 熊猫人配音 INFO ====> Epoch: 19
2024-08-22 11:25:43,787 熊猫人配音 INFO Train Epoch: 20 [5%]
2024-08-22 11:25:43,788 熊猫人配音 INFO [2.3324265480041504, 2.481949806213379, 9.625996589660645, 20.00206756591797, 0.0, 1.5336836576461792, 400, 9.975029665246193e-05]
2024-08-22 11:25:56,360 熊猫人配音 INFO ====> Epoch: 20
2024-08-22 11:26:11,124 熊猫人配音 INFO ====> Epoch: 21
2024-08-22 11:26:25,661 熊猫人配音 INFO ====> Epoch: 22
2024-08-22 11:26:40,250 熊猫人配音 INFO ====> Epoch: 23
2024-08-22 11:26:52,882 熊猫人配音 INFO Train Epoch: 24 [81%]
2024-08-22 11:26:52,883 熊猫人配音 INFO [2.303035259246826, 2.4766767024993896, 10.46125316619873, 20.506593704223633, 0.0, 1.735398292541504, 500, 9.970043085494672e-05]
2024-08-22 11:26:55,117 熊猫人配音 INFO ====> Epoch: 24
2024-08-22 11:27:09,556 熊猫人配音 INFO Saving model and optimizer state at iteration 25 to logs/熊猫人配音/logs_s2\G_233333333333.pth
2024-08-22 11:27:10,383 熊猫人配音 INFO Saving model and optimizer state at iteration 25 to logs/熊猫人配音/logs_s2\D_233333333333.pth
2024-08-22 11:27:12,100 熊猫人配音 INFO saving ckpt 熊猫人配音_e25:Success.
2024-08-22 11:27:12,100 熊猫人配音 INFO ====> Epoch: 25
如何使用配音模型
1,gpt-sovits模型本地部署(适合有显卡的用户)
2,gpt-sovits模型云端部署
https://aiaf.cc/gpt-sovits-yunduan/
如果您想一对一远程教学模型安装、模型训练,请联系微信 xiaoming1870
声音版权使用声明
本网站所展示的AI声音模型,源自站长及AI模型工作室的精心创作与提供。我们秉持非商业性使用的原则,仅以此平台作为娱乐非商业使用,同时,我们高度重视并严格遵守版权所有者的合法权益。特此声明,我们未获得亦不声称拥有这些声音模型的任何直接使用权或授权。
对于因模型整理、发布、声音转换效果制作及视频教学制作而产生的相关费用,我们明确其仅覆盖上述服务成本,绝不包含对模型版权本身的任何收费。我们承诺,所有活动均在法律框架内进行,尊重版权,合理且合法地使用与分享这些宝贵的AI声音资源。
若您对上述模型或我们的服务存在任何疑问、需要进一步的版权信息,或是有任何宝贵的建议与反馈,我们诚挚邀请您随时与我们取得联系。我们期待与您共同探讨,促进AI声音艺术的健康发展与尊重版权的良好氛围。
重要提示:在利用AI声音模型进行任何活动之前,我们强烈建议您深入了解并遵守相关版权与知识产权法律法规,确保您的行为合法且合规,共同维护良好的创作生态。
请登录后查看评论内容