aeneas
#### 產品特色
* 支持解析文本格式:parsed/plain/subtitles/munparsed及mplain
* 多级文本处理:支持段落/句子/单词层级的递归对齐
* 高效语音特征计算:MFCC与DTW算法优化,支持动态参数配置
* 多语言支持:覆盖38种语言的语音识别与对齐
* 灵活TTS引擎:集成AWS Polly、eSpeak、Festival等主流语音合成器
#### 主要功能、特點
aeneas提供端到端的音频文本对齐解决方案,支持多格式文本输入与多种音频输出格式。核心功能包括:1. 通过MFCC与DTW算法实现高精度语音特征提取 2. 支持多级文本处理,可从段落到单词层级进行自动对齐 3. 提供自定义TTS引擎接口,支持动态参数配置 4. 具备抗噪能力,能有效处理背景噪声和突发音浪 5. 支持批量处理多个音频/文本对,可下载YouTube视频进行实时对齐
#### 指令
“`bash
# 無常用指令 (自動生成)
“`
#### 軟體截圖

