AITTS是一款文字转语音和智能AI配音WordPress插件,支持所有主要的文本到语音服务,它配备了可定制的音频播放器、用于监控对文本转语音服务的 API 调用的专用仪表板以及许多定制选项。
支持的TTS服务
SPEECHSYNTHESIS(网络语音 API)
此选项用于使用浏览器包含的文本转语音功能,而无需订阅云服务。
从技术上讲,文本到语音的转换是使用 Web 的 SpeechSynthesis 界面执行的语音 API。现在,SpeechSynthesis 已成为任何生产网站的可行解决方案,因为所有主要浏览器现在都支持它。
SpeechSynthesis 提供的自定义选项可在AITTS插件设置中找到:
- 语言 – 使用此选项,您可以选择话语的语言。
- 语音 – 选择用户浏览器中可用的语音之一。
- 音高 – 音高值决定所生成语音的感知“高”或“低”。
- 速率 – 选择说话的速度。
- 音量 – 这决定了音量值
AMAZON POLLY
Amazon Polly 是一项云服务,可将文本转换为语音,属于 Amazon Web Services (AWS)。
它支持几乎所有语言的多种标准 (TTS) 和神经 (NTTS) 语音选择。
在AITTS插件中,我们包含了充分利用 Amazon Polly 的所有基本选项。具体来说,您将能够配置:
- AWS 区域 – 您希望使用的 AWS 区域。
- 语音 ID – 选择 Amazon Polly 中提供的多种语音之一。
- 引擎 – 在标准和神经之间选择。我们建议使用神经引擎来生成最自然、最像人类的文本转语音声音。
- 语言代码 – 选择 Amazon Polly 支持的语言代码之一。
- 词典名称 – 在这里,您可以设置要在合成过程中应用的词典名称。
- 输出格式 – 您可以选择 mp3 或 ogg_vorbis。
- 采样率 – 提供多种采样率。
- 文本类型 – 支持纯文本或 SSML。
谷歌文本转语音人工智能
Text-to-Speech AI 是 Google Cloud 中提供的一项服务,可将文本转换为自然语言- 使用由 Google 最佳 AI 技术提供支持的 API 进行听起来动听的语音。
此服务支持大量语音和语言。谷歌根据生成声音的技术对声音进行分类。
使用真实语音设置中包含的选项可以轻松配置 Google Text-to-Speech AI 生成的音频:
- 音频编码 – 此选项允许您选择音频文件的编码。
- 说话速度 – 在这里,您可以选择说话的速度。
- 音高 – 选择声音的相对高低。
- 增益 – 应用于生成的音频的音量增益。
- 效果配置文件 ID – 使用此选项,您可以将特定的音频配置文件应用于生成的语音。
- 语言代码 – 在这里,您可以选择话语的语言。
- 语音名称 – 使用此字段选择服务提供的多种语音之一。
AZURE 文本转语音
文本转语音是Microsoft Azure中提供的一项服务,可将文本转换为逼真的语音。
这项强大的服务提供了各种各样的声音,您可以在语音库中进行测试。
让我们看看AITTS插件中包含的 Azure 文本转语音选项:
- 区域 – 选择最适合您需求的 Azure 区域。
- 用户代理 – 用于识别AITTS插件向云服务执行的请求的自定义值。
- 输出格式 – 音频文件的编码格式。该选项决定生成的音频文件的质量和占用的空间。
ElevenLabs
ElevenLabs 是一家利用人工智能和深度学习开发自然语音合成和文本转语音软件的软件公司。
此服务可以使用以下 AI 模型生成多种语言的音频多种语言
在AITTS中,我们包含以下 ElevenLabs 选项:
- 语音 ID – 此选项确定要使用的语音。
- 优化流媒体延迟 – 使用此选项优化 AI 的生成过程。
- 稳定性 – 选择语音的稳定性以及每代之间的随机性。
- 相似度增强 – 优化以获得清晰、无伪影的声音或增强说话者的相似度。
- 风格 – 选择声音风格。
自定义音频播放器
我们构建了一个自定义 HTML 音频播放器,用户可以通过插件设置对其进行自定义。
例如,您可以配置音频播放器中显示的所有元素的颜色,并通过设置自定义字体大小、字体样式、字体粗细、行高和字体系列来配置音频播放器的排版。您甚至可以从 Google Fonts 加载音频播放器的自定义字体系列。我们还添加了创建阴影并确定其颜色的功能。
我们的自定义音频播放器也具有响应能力。从插件选项中,您可以设置用于将播放器 UI 从桌面切换到移动设备的响应断点。
从专用仪表板监控您的 API 调用
此仪表板菜单允许您监控插件发送到用于生成文章音频版本的云服务的请求。
具体来说,在这里您可以:
- 读取摘要统计信息,例如特定时间段内的请求总数和发送的字符数。
- 以折线图可视化对 API 的请求。
- 从分页表中浏览单个 API 请求。在这里,您可以找到云服务返回的记录消息。
- 通过选择特定时间间隔或考虑的文本到语音转换器来过滤数据。
配置插件行为
对于AITTS插件,我们使用 React 构建了一个设置菜单,目前有 65 个自定义选项。以下是您可以从此菜单执行的操作。
配置要添加音频播放器的文章类型
该插件允许您仅在特定的文章类型上启用音频播放器。例如,如果您想要将文本转语音音频播放器添加到博客文章中并排除标准页面,请在此选择器中添加“文章”。
在音频播放器之前或之后添加自定义文本
您可以选择在播放器之前或之后显示自定义消息。例如,该消息可用于通知访问者收听文章音频版本的可能性。
显示说出的单词
您可以选择显示玩家当前所说的话。请注意,此功能仅适用于 SpeechSynthesis 音频播放器。
附加音频内容
配置应在文章内容之前或之后说出的特定文本。
阅读标题
自动将文章标题添加到应说出的内容之前。
自动生成音频文件
该插件允许您在网站前端查看文章时手动或自动生成包含文章音频版本的音频文件。您可以使用专用选项来控制此行为。
定制能力
通过设置自定义 WordPress 功能来配置谁有权访问特定插件功能。例如,您可以允许编辑者从文章编辑器生成音频文件,仅允许站点管理员访问包含统计信息的仪表板等等。