admin管理员组文章数量:1130349
asr
data_list: 主要为了存储数据集的标签文本。(st_cmds,thchs30)
general_function:
包括:feature_extract.py:主要用来计算语谱图。features_extract.py: 该脚本用于提取语音特征,包括MFCC、FBANK以及语谱图特征; 该脚本是对标签数据进行处理;pinzhen.py:拼帧file_wav.py:此函数是为了提取语音的文件列表以及文件字典的脚本,为后续的文件处理做准备;dict.txt:1421+1(字典:拼音以及对应的字)file_dict.py:此函数是用作于加载字典里面的符号,用于声学模型的训练以及语言模型的训练;ctcDecoder_tf.py:用tf定义一个专门ctc解码的图和会话,就不会一直增加节点了,速度快了很多edit_distance.py:用于计算测试集的准确率。
model_language:
包括:dic_pinyin.txt:163406+1(拼音字典:两个字拼音)language_model1.txt:6880+1(单个字)language_model2.txt:58648+1(两个字的词汇)
get_language_model.py:加载已经训练过的语言模型
get_pinyin.py:加载dic_pinyin.txt
##LanguageModel.py: 创建基于隐马尔可夫的语言模型
##LanguageModel2.py:隐马尔可夫语言模型(拼音到文字)
readdata.py:用于读取数据集(thchs30)
model_language_test.py (拼音转为汉字)
test.py
asr
data_list: 主要为了存储数据集的标签文本。(st_cmds,thchs30)
general_function:
包括:feature_extract.py:主要用来计算语谱图。features_extract.py: 该脚本用于提取语音特征,包括MFCC、FBANK以及语谱图特征; 该脚本是对标签数据进行处理;pinzhen.py:拼帧file_wav.py:此函数是为了提取语音的文件列表以及文件字典的脚本,为后续的文件处理做准备;dict.txt:1421+1(字典:拼音以及对应的字)file_dict.py:此函数是用作于加载字典里面的符号,用于声学模型的训练以及语言模型的训练;ctcDecoder_tf.py:用tf定义一个专门ctc解码的图和会话,就不会一直增加节点了,速度快了很多edit_distance.py:用于计算测试集的准确率。
model_language:
包括:dic_pinyin.txt:163406+1(拼音字典:两个字拼音)language_model1.txt:6880+1(单个字)language_model2.txt:58648+1(两个字的词汇)
get_language_model.py:加载已经训练过的语言模型
get_pinyin.py:加载dic_pinyin.txt
##LanguageModel.py: 创建基于隐马尔可夫的语言模型
##LanguageModel2.py:隐马尔可夫语言模型(拼音到文字)
readdata.py:用于读取数据集(thchs30)
model_language_test.py (拼音转为汉字)
test.py
本文标签: asr
版权声明:本文标题:asr 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://it.en369.cn/jiaocheng/1700048610a330781.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。


发表评论