暑假实习日记2

Jimmy 发表于 2007-08-01 13:33:31

昨天下了个巨大无比的Microsoft Visual Studio 2005
好像学校里的ftp上居然还没下载。。哎
于是只好到eMule上面去下,不过还是满速下完的,eMule果然是好东西=v=
但是导致的结果是硬盘空间再次告急,E盘只剩下400M了,最大的F盘也只有4G了
要抓紧时间把剩下的DVDRip做完了 =。= 昨天压了个奈叶StrikerS,结果发现预告部分居然没有压进去OTL
本来还想使用AAA.avs消除锯齿的,结果后来发现,用了AAA后,X264压制1-pass就要花1天半的时间OTL
为什么会这样呢。。我压720x540的奈叶第一部都也只不过花了6个小时而已

发现跑题了。。打住打住
今天把VS2005装到实验室的机器,还要打上vista的补丁,真麻烦
一开始的时候给的一个很简单的C++程序都跑不起来,还以为是64位机器的原因,结果后来重新搞了个源代码就好了
现在手上的东西是夏普公司提供的一个语音识别器testdll,可以跑出来像下面的结果

#!MLF!#
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_001.rec"
0 300000 sent-start -203.463776
300000 6700000 jing4yin1 -4035.382568
6700000 7100000 sent-end -248.560059
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_002.rec"
0 200000 sent-start -150.746948
200000 8000000 shan1chu2 -5307.023438
8000000 8500000 sent-end -276.437622
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_003.rec"
0 200000 sent-start -159.515427
200000 6800000 guan1ji1 -4380.168457
6800000 7100000 sent-end -167.720520
.

这个的意思就是说,有三个输入文件,可以识别出三个词语,分别是“静音”、“删除”、“关机”,嗯很好,很强大
不过这东西词汇量很小=v=b。。有个vocabulary的文件,就存了200个单词。。
嗯接下来就是要搞懂以下几个步骤
(1)首先是从麦克风中收集数据,格式应该是wav文件
(2)在收集的过程中要建立一个buffer,buffer的大小还要进行测试,当buffer满了以后将文件送到电脑中
(3)此时应该是wav文件,调用某些指令提取特征文件,将其变成mfc文件
(4)调用testdll得到结果
关键词(Tag): 语音识别 htk


收藏: QQ书签 del.icio.us 订阅: Google 抓虾

最新评论

发表评论

* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 
 

分类小组论坛
杂谈, 娱乐、八卦, 文学、艺术, 体育, 旅游、同城, 象牙塔, 情感, 时尚、生活, 星座, 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定