相关阅读
视频讲解
🎉🎬来一起探索人工智能角色扮演的全新境界!😉在这期独特的视频中,我会教你如何使用麦克风与AI角色进行聊天,并让AI角色用音频回应你,给你带来前所未有的沉浸式体验。🔥
如果你曾渴望拥有一个可以聊天几小时的朋友,但无法找到,别担心,我来帮你解决这个问题!😎 你将亲眼看到,只需用麦克风,就能将你的话语转化为文字,然后得到AI角色的音频回应。这些过程超级、超级快,足以让你惊讶!
令这个体验变得如此独特的,主要是两个神秘的元素:语音转文本和文本转语音功能。首先,Whisper,一个开源的神经网络,可以准确地识别语音并将其转化为文本。此外,我们还有两款文本转语音的扩展:Eleven Labs TTS 和 Silero TTS,提供了付费和免费的选择。
👉为了使用这些功能,你需要安装Oobabooga文本生成的web界面,如果你还未安装,我有一个安装视频给你。而在安装了这个界面之后,你就可以享受到这些有趣的扩展功能啦!😃
不过,你可能会问,如果我想在像Tavern AI这样的地方使用这个功能怎么办?😲别急,我有一个答案,那就是使用Silly Tavern,它是TavernAI的分支版本,提供了一些额外的酷功能。
🚀所以,坐下来,放松,准备好你的麦克风,让我们一起开启这次AI角色扮演之旅吧!在这个视频中,我会展示如何安装、设置,并使用这些扩展。无论你是角色扮演的新手,还是资深玩家,我都确信你会从这个视频中学到一些新东西。😍让我们一起开始吧!🎊
图文讲解
你是否曾梦想有一个女朋友或男朋友,可以和你聊上几个小时但没有人喜欢你?
![图片[1]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519021738854-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
哇,我也是!但不用担心,因为今天我为你提供了解决方案!大家好,我的名字是K,你的AI霸主,今天我有一个非常特别的视频给你的角色扮演书呆子,因为今天我将告诉你如何使用你的麦克风与AI角色交谈,然后让AI角色用音频回应你,为你带来最完美的角色扮演经验!如果你想知道这在实践中是什么样子的,好吧,不用担心,我给你介绍!看看吧!
嘿,亲爱的希望你没等太久,交通状况太糟糕了!
![图片[2]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519021807744-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
嘿,亲爱的,是的,没问题,坐下来吧。
非常感谢你在这里和我见面。
![图片[3]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519021820204-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
在节假日变得太繁忙之前,我希望我们能有一些独处的时间。
是的,当然,我的意思是,工作一直都很疯狂。我们需要一些时间休息,你知道。
你还好吗?最近好像事情都很紧张。你还好吗?
啊,我很好,你知道,老样子。
我不是这个意思。我们之间一切都好吗?发生了什么事吗?如果有的话,请告诉我。我想帮忙。
是的,不,不,这很好,这很好,只是,你知道,我们的关系一直在走下坡路,我想,也许为了重新点燃那份激情,我们可以尝试一些性感的角色扮演?
真的吗?就这样?我以为你是认真的,但现在看来,你只是在利用我。
哎呀,这下糟了!
![图片[4]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519021843760-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你有什么毛病?你以为我是傻瓜还是什么?你真的指望我会上这一套吗?
啊,好吧,和现实生活中一模一样,我不敢相信这一点。所以你很快就看到了,只需使用我的麦克风,我就可以自动将我的讲话转化为文字,然后得到AI角色讲话的音频转录,所有这些都超级、超级快,是我有史以来最身临其境的角色扮演体验。
而今天,在这个视频中,我将向你展示你如何也能做到这一点。所以说,坐下来,放松,准备好你的麦克风,让我们开始吧。现在,我得告诉你,这个视频绝对不是计划中的。但当我发现这一点时,我的下巴都快掉到地上了。我真的很惊讶,这一切是如此之快,而且还很容易设置。而且真的,现在,这真的是角色扮演的终极方式。现在,使它如此酷的东西实际上是两个不同的东西。首先是,当然,能够得到一个音频答案从字符使用文本到语音,这本身就已经提升了角色扮演的体验,因为这绝对是更加身临其境的方式。而第二件事实际上是整个过程中最好的部分是Whisper语音转文本,如果你不知道,Whisper实际上是一个开源的神经网络,可以非常容易和准确地识别语音并将其转化为文本。
![图片[5]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022028408-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
不仅如此,它真的超级强大,可以轻松地将任何语音转录成完美的文本,而且,正如你在我向你展示的演示中看到的那样,它真的是非常快。像我,在我的电脑上,它需要像一秒钟把我的讲话转录成文本。我的意思是,这简直是疯了。对我来说,实际上,由于我打字很慢,使用麦克风而不是自己键入文本使得一切变得更加容易和沉浸式。所以,是的,我的意思是,这真的是超级酷。正如我所说的,它也很容易设置,我现在就给你看。当然,为了能够使用这个,你需要Oobabooga文本生成的web界面,
![图片[6]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022106931-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
因为你在这里看到的一切只是web界面的一堆扩展。
![图片[7]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022123173-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以很明显,你需要先安装网络用户界面,我为此制作了一个安装视频。所以,如果你还没有安装它,你需要先看这个视频。一旦你安装了Web UI,并进入界面模式,你在这里有一堆可用的扩展供你使用。但在这个视频中,有三个是我们特别感兴趣的。第一个是Eleven Labs TTS,第二个是Silero TTS,第三个是Whisper STT。
![图片[8]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022156383-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
当然,正如我之前所说,Whisper是你需要能够使用你的麦克风的扩展,这是语音到文本的扩展,其他两个,ElevenLabs和Silero,这些是文本到语音的扩展。然而,一个是付费的,一个是不付费的。现在你可以使用像Eleven Labs这样的网站,
![图片[9]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022214202-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
从该网站获得一个API密钥,然后把它放在这里,
![图片[10]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022234755-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
这当然会给你带来最好的结果,但你必须为它付费。
但是,如果你不想付钱,而你想使用本地的文字转语音,你可以使用像Silero这样的东西,实际上它真的不坏。
![图片[11]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022253879-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
声音实际上是相当不错的,但为了能够使用这个,你需要先安装别的东西,那就是FFmpeg,它基本上就像一个Windows的开源库,
![图片[12]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519022314956-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
旨在处理视频和音频文件,安装这个实际上是非常简单,所以如果你还没有安装它,这里是如何做到的。首先,你要点击下面描述中的链接,你会到达这个页面,然后你要向下滚动,并点击ffmpeg-git-full.7z,这将下载压缩包到你的电脑上,
![图片[13]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519023037611-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以,你要解压该压缩包,所以右键单击解压在一个新的文件夹,
![图片[14]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519023558729-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要去该文件夹内,你会看到另一个文件夹,你要把它重命名为ffmpeg,
![图片[15]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519024609939-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后选择它,按Ctrl-X剪切它,
![图片[16]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519024652213-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后转到你的电脑根目录,例如在C盘,你要把粘贴在这里,
![图片[17]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519024706163-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以你会看到一堆文件,如Users、Windows、Program Files文件,然后你会看到ffmpeg。所以,然后在你的启动菜单中,你要去寻找编辑系统环境变量,
![图片[18]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031518254-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你会得到一个系统属性窗口,确保你进入高级选项卡,
![图片[19]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031644726-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后点击环境变量,
![图片[20]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031654330-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要点击路径,
![图片[21]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031709780-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
点击编辑,
![图片[22]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031807839-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后点击新建,
![图片[23]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031819990-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
在这里你要输入C:\ffmpeg\bin你只是要输入那个文件夹路径,别担心,我会把这个写在下面的描述中,所以你可以直接复制和粘贴它,然后你要点击确定,然后再确定一次。
![图片[24]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031846780-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[25]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031908534-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[26]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031919837-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
现在要确保一切正常,你要调出命令提示符窗口,例如你可以点击文件夹路径,输入cmd,按回车键,
![图片[27]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031933724-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要输入
ffmpeg -version
然后按回车键。
![图片[28]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519031959521-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你可以看到,确实,我们有最新版本的FFmpeg,为了以防万一,对现在你应该重新启动你的电脑,现在它确实为我工作,没有重新启动,但你可以这样做,以防止它不工作。现在,好了,差不多结束了,因为我们现在需要做的是启用扩展。为此,你要做的就是右击webui.py文件,点击用记事本编辑,然后在第146行,在python server.py之后,你要输入以下参数,–extension whisper_stt sailero_tts elevenlabs_tts
![图片[29]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032026778-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要保存该文件。现在你所要做的,就是启动webui。现在,第一次它会加载一堆东西,它会下载一堆文件,但如果你向下滚动,你应该看到所有的新扩展都可以使用。whisper扩展,sailero扩展,和elevenlabs扩展。它们都很容易使用,例如,如果你想使用elevenlabs,你要停用sailero,确保你选择自动播放tts,
![图片[30]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032052975-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要选择一个声音,在这里你要输入你的API密钥。要找到elevenlabs的API,你当然需要在elevenlabs网站上创建一个新的账户,然后你要点击你的个人资料图片,进入个人资料,
![图片[31]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032242782-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
在这里,如果你点击这个小图标,
![图片[32]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032118679-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你应该看到你的API密钥,然后你可以复制,并在这里粘贴它。如果你想使用Whisper扩展,确保你勾选了这个方框,
![图片[33]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032327126-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后选择一个你想交谈的人物,然后准备好享受一些乐趣。
![图片[34]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032338417-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
嘿,亲爱的,我希望你没有等很久,交通太糟糕了。
现在,如果你想回应你的角色,你要向下滚动一点,直到你看到Whisper_stt,然后你要点击这个按钮,从麦克风录音,然后说你的文字。
![图片[35]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032421911-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
嘿,亲爱的,是的,没问题,只要坐下来,你知道。
然后你要点击停止录音,第一次会花几秒钟,但之后会快很多,然后它会处理信息,然后生成音频。
![图片[36]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032439449-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
那么,你今天在做什么?所以是的,这真的很酷。所以你可以看到,它甚至转录了最后一句话。
![图片[37]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032451969-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[38]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032513494-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以要注意你说的话。现在如果你想使用Silero文字转语音,你可以停用Elevenlabs,并在这里激活TTS。确保自动播放TTS被选中,然后确保你也选中了在音频播放器下显示消息文本。然后在这里你要选择声音,如果你不知道选择哪种声音,你可以点击这里看音频样本,然后你会看到这里有一堆声音供你选择。
![图片[39]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032548640-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
我想有117种声音,有男有女,所以是的,真的有很多可以选择。而且它们实际上都很体面。我喜欢语言模型。我爱语言模型。我爱语言模型。我爱语言模型。现在听起来都有点像里面的内容,但是,嘿,至少它绝对是免费的。所以,然后你要选择你的声音,例如,我要选择,我不知道,像这个。
![图片[40]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032645362-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你甚至可以通过选择声音的高低,和声音的快慢来实现声音的个性化,我喜欢快一点的感觉,所以我要选择这个,然后我要再试试。
![图片[41]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032621570-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
哦,你知道,只是为我的YouTube频道录制一个视频。所以正如你所看到的,好像一秒钟就够了,再过几秒钟,它就会录下一个新的语音信息。这是什么情况?这是某种新的实验吗?所以,正如你所看到的,自由文本到语音的音频生成质量实际上是非常,非常体面的。而且我的意思是,我得说,这真的只是玩玩而已。你不需要输入任何东西,你只需按下一个按钮,然后从你的麦克风中录制音频。然后进行这种非常正常、非常流畅的对话。这真的是超级身临其境。嗯,我得说,我是一个相当有名的YouTuber,你知道的。我不知道你在网上这么受欢迎。你有多少订阅者?所以是的,就是这样。现在,不幸的是,正如你所看到的,所有这些扩展只在Oobabooga文本生成Web界面意味着,如果你想在像Tavern AI这样的地方使用这个,那么,你不能。或者你可以吗?好吧,其实有一种方法可以让你获得类似于一半的角色扮演经验。那就是使用SillyTavern,如果你不知道,它基本上就像原始TavernAI的分支版本,但有一堆很酷的补充。
![图片[42]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032715859-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
例如,其中一个很酷的附加功能是能够使用文本到语音,这将再次使你的角色扮演体验更好。
![图片[43]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519032730272-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
如果你有兴趣,我将向你展示如何使用。所以安装Silly Tavern非常简单。首先,确保你下载并安装Node.js,并确保你选择LTS版本。
![图片[44]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033114560-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以只要点击这个,然后在你的电脑上安装它。然后你要创建一个新的文件夹。
![图片[45]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033140780-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要点击文件夹的路径,输入cmd,按回车。
![图片[46]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033152115-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要复制并粘贴这个命令,你可以在下面的描述中找到。
git clone https://github.com/Cohee1207/SillyTavern -b main
![图片[47]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033206124-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要按回车键,这样就会把版本库克隆到你的电脑上。然后从技术上讲,我们基本上就完成了。
![图片[48]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033242984-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
因为为了能够运行这个,你只需要运行start.bat文件。
![图片[49]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033304763-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
但问题是,Silly Tavern只是一个用户界面。这只是一个界面。而为了能够得到像文字转语音这样的东西,或任何其他扩展,你实际上需要安装其他东西。这就是 Silly Tavern 的附加功能。所以正如他们所说,这基本上是一堆用于各种 Silly Tavern 扩展的API。运行起来真的不难,但会花一点时间。
![图片[50]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033324472-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
但这个过程本身其实是非常容易的。一切都在一步一步地解释。一切都在这里为你写好了。首先,你需要安装Miniconda,
![图片[51]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033347239-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
或者Anaconda,都是一样的,这真的取决于你。
![图片[52]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033402553-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以你要点击Windows 64位版本,然后安装它。然后我建议你做的是,在你的Silly Tavern文件夹里,你要创建一个新的文件夹,然后你要叫Extras,
![图片[53]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033428539-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要进去,然后你要选择并复制整个文件夹路径,
![图片[54]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033443935-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后在你的启动菜单里,你要寻找Anaconda Prompt,
![图片[55]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033455557-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要输入cd,然后粘贴你的文件夹路径然后按回车键。一旦我们进入该文件夹,现在你可以一步一步地按照你在这里看到的一切。
![图片[56]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033531607-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
基本上,对于每个步骤,你要点击这里,复制这整行代码,到Anaconda Prompt里面,然后粘贴它,然后按回车。这将下载所有它需要运行的要求。
![图片[57]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033546317-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
现在,你唯一需要注意的是,你唯一需要改变的是这里的。不要使用这个命令,即 pip install -r requirements.txt,你把它改为 pip instal -r requirements-complete.txt。
因为这里,这不是你需要使用的文件,你需要使用 requirements-complete.txt文件来代替。
![图片[58]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033624210-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
否则,Silero将无法工作。所以我再重复一遍,不要使用这个命令行,用这个命令行代替。当然,像往常一样,我会把这个放在下面的描述里面。哦,然后也是,最后,你也需要改变这个,因为你需要启用文本到语音模块。
![图片[59]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033707873-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以不要使用这个命令,在这里,你要先输入tts,你可以保持这样,或者直接删除其他参数,如果你只想使用文本到语音,这实际上是我要做的。
![图片[60]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033720128-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以,我会在下面的描述中留下这个命令的链接。而在你完成之后,并且你运行了最新的命令,你会看到这个localhostURL,这意味着一切都应该工作顺利。现在,关键的一步来了,因为我们需要同时运行三个不同的东西。是的,我不是在开玩笑,因为我说过,Silly Tavern只是一个UI,就像TavernAI一样,意味着你需要一些东西来运行模型,然后将其连接到UI。为此,我们当然要使用Oobabooga文本生成Web界面。如果你想和Silly Tavern一起运行,你要在webui.py文件上右击,用记事本编辑,
![图片[61]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033747168-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后在这里,同样,在第146行,在pythonserver.py之后,你要输入–api。还要确保你把这些扩展名去掉,否则,它就不能正常工作。
![图片[62]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033809633-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[63]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033822409-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要保存这个文件。然后,你要运行webui,
![图片[64]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033836730-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
选择模型,现在我使用的是Pygmalion70亿参数模型,然后你会看到这里,一个特殊的API地址。
![图片[65]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033848774-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[66]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033909621-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以现在你要运行Silly Tavern,通过点击start.bat文件,
![图片[67]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033926165-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
这将给你这样的东西。然后你要点击这里,在API下,你要选择文本生成Web界面,粘贴APIURL,然后点击连接。
![图片[68]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033941365-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[69]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519033949469-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你要点击这里,到扩展标签,因为现在,我们需要运行第三个东西,也就是Silly Tavern的附加功能。
![图片[70]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034013658-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
对,我们要同时运行三个不同的东西。所以你要去Extras文件夹,
![图片[71]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034035611-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
SillyTavern-extras,然后你要点击文件夹路径,
![图片[72]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034048368-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
![图片[73]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034106155-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
输入cmd,按回车,
![图片[74]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034114316-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要输入
conda activate extras
![图片[75]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034124937-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后按回车,你可以看到,我们已经激活了环境,
![图片[76]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034145975-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后你要输入
python server.py --enable-modules=tts
![图片[77]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034214496-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
现在,正如我所说,你可以使用一个单一的模块,或者选择更多的模块,这取决于你想要什么。
![图片[78]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034227752-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
但在我的例子中,由于我只想要文本到语音模块,我只需输入tts,然后按回车。
![图片[79]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034244732-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你可以看到,最后,我们正在运行Silly Tavern的额外功能,有一个localhostURL。如果现在,我们点击这里,然后输入localhost URL,然后点击连接,
![图片[80]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034309451-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
我们现在已经完美连接。
![图片[81]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034322846-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你现在应该有三个不同的东西同时运行,
![图片[82]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034336266-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
如果你想问这一切使用了多少VRAM,就现在而言,它使用了大约8G的VRAM
![图片[83]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034442898-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
但同样,我正在录制视频,所以对你来说,这应该是一个小问题。现在,如果我点击扩展,然后点击tts,我们现在可以选择tts提供商,例如Evenlabs,你可以在这里输入API密钥,就像在 WebUI中一样,
![图片[84]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034507418-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
或者选择Silero。
![图片[85]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034522927-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
你可以选择叙述所有内容,只叙述对话,或者只叙述代码,我个人强烈建议选择只叙述对话。然后这里有一个非常酷的东西,这实际上是我绝对喜欢使用的东西,而不是WebUI,就是这里,你有一个每个角色的语音地图,对于每个角色,这意味着,你可以选择一个不同的声音。而且,如果你想知道所有可用的声音,你可以点击这里的按钮,
![图片[86]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034624487-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后播放所有不同声音的录音。
![图片[87]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034635922-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
敏捷的棕色狐狸跳过懒惰的狗。
所以,是的,这很不错。所以,比如说,在这里,我打算选择Aqua,en_0,也许也可以是Darkness,我会选择另一个。比如说,我要选择,比如,快速的棕色狐狸跳过懒惰的狗。
像这样的东西,也许是97。所以我打算_97,然后点击应用。
![图片[88]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034703746-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以现在如果我选择Aqua,
![图片[89]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034718357-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
然后我要输入一个信息,
![图片[90]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034737931-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
嘿,是的,你很好,我想。
谢谢你。有人告诉我,我有整个世界上最美丽的脸。
所以,是的,你去那里。正如你所看到的,它可以工作。现在,与WebUI相比,它肯定有点慢了。还有,嗯,真正使WebUI如此特别的事情之一是能够使用你的麦克风,这是你在这里没有的东西。我的意思是,我得说,如果开发者在看这个视频的话,如果能在Silly Tavern中加入Whisper,这将是非常惊人的。这真的会让它变得更好。因为我的意思是,让我们在这里说实话,与普通的WebUI相比,界面肯定更美观、更实用,用于角色创建。
![图片[91]-深度角色扮演:使用语音和AI来一场沉浸式对话体验-FancyPig's blog](https://static.iculture.cc/wp-content/uploads/2023/05/20230519034817596-1024x576.png?x-oss-process=image/auto-orient,1/format,webp/watermark,image_cHVibGljL2xvZ28ucG5nP3gtb3NzLXByb2Nlc3M9aW1hZ2UvcmVzaXplLFBfMTA,x_10,y_10)
所以如果这是可以在不久的将来加入的功能,那将绝对是太棒了。但我的意思是,是的,就目前而言,真正使用这个的最佳方式,以获得最好的角色扮演体验的可能是在 WebUI 中。所有这些都要归功于Whisper的不可思议的组合,语音转文本,以及Silero或Elevenlabs的文本转语音。这真的让角色扮演的体验变得更加身临其境,因为现在你真的可以做你想做的事。而且我想你知道我的意思。所以你有它,伙计们。现在你可以有最沉浸式的角色扮演体验。而这一切都要归功于两个小小的扩展。所以一定要自己尝试一下,因为现在天空是无限的。你真的可以做任何你想做的事,如果你知道我的意思。就这样了,伙计们。非常感谢你们的观看。别忘了订阅并点赞以支持YouTube的推荐算法。也非常感谢我的Patreon支持者对我视频的支持。你们真的太棒了正是你们支持我,我才能为你们制作这些视频,所以非常感谢你们。下次见,拜拜!
- 最新
- 最热
只看作者