真相永远只有一个! » 日志 » 暑假实习日记2
暑假实习日记2
Jimmy 发表于 2007-08-01 13:33:31
昨天下了个巨大无比的Microsoft Visual Studio 2005
好像学校里的ftp上居然还没下载。。哎
于是只好到eMule上面去下,不过还是满速下完的,eMule果然是好东西=v=
但是导致的结果是硬盘空间再次告急,E盘只剩下400M了,最大的F盘也只有4G了
要抓紧时间把剩下的DVDRip做完了 =。= 昨天压了个奈叶StrikerS,结果发现预告部分居然没有压进去OTL
本来还想使用AAA.avs消除锯齿的,结果后来发现,用了AAA后,X264压制1-pass就要花1天半的时间OTL
为什么会这样呢。。我压720x540的奈叶第一部都也只不过花了6个小时而已
发现跑题了。。打住打住
今天把VS2005装到实验室的机器,还要打上vista的补丁,真麻烦
一开始的时候给的一个很简单的C++程序都跑不起来,还以为是64位机器的原因,结果后来重新搞了个源代码就好了
现在手上的东西是夏普公司提供的一个语音识别器testdll,可以跑出来像下面的结果
#!MLF!#
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_001.rec"
0 300000 sent-start -203.463776
300000 6700000 jing4yin1 -4035.382568
6700000 7100000 sent-end -248.560059
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_002.rec"
0 200000 sent-start -150.746948
200000 8000000 shan1chu2 -5307.023438
8000000 8500000 sent-end -276.437622
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_003.rec"
0 200000 sent-start -159.515427
200000 6800000 guan1ji1 -4380.168457
6800000 7100000 sent-end -167.720520
.
这个的意思就是说,有三个输入文件,可以识别出三个词语,分别是“静音”、“删除”、“关机”,嗯很好,很强大
不过这东西词汇量很小=v=b。。有个vocabulary的文件,就存了200个单词。。
嗯接下来就是要搞懂以下几个步骤
(1)首先是从麦克风中收集数据,格式应该是wav文件
(2)在收集的过程中要建立一个buffer,buffer的大小还要进行测试,当buffer满了以后将文件送到电脑中
(3)此时应该是wav文件,调用某些指令提取特征文件,将其变成mfc文件
(4)调用testdll得到结果
好像学校里的ftp上居然还没下载。。哎
于是只好到eMule上面去下,不过还是满速下完的,eMule果然是好东西=v=
但是导致的结果是硬盘空间再次告急,E盘只剩下400M了,最大的F盘也只有4G了
要抓紧时间把剩下的DVDRip做完了 =。= 昨天压了个奈叶StrikerS,结果发现预告部分居然没有压进去OTL
本来还想使用AAA.avs消除锯齿的,结果后来发现,用了AAA后,X264压制1-pass就要花1天半的时间OTL
为什么会这样呢。。我压720x540的奈叶第一部都也只不过花了6个小时而已
发现跑题了。。打住打住
今天把VS2005装到实验室的机器,还要打上vista的补丁,真麻烦
一开始的时候给的一个很简单的C++程序都跑不起来,还以为是64位机器的原因,结果后来重新搞了个源代码就好了
现在手上的东西是夏普公司提供的一个语音识别器testdll,可以跑出来像下面的结果
#!MLF!#
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_001.rec"
0 300000 sent-start -203.463776
300000 6700000 jing4yin1 -4035.382568
6700000 7100000 sent-end -248.560059
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_002.rec"
0 200000 sent-start -150.746948
200000 8000000 shan1chu2 -5307.023438
8000000 8500000 sent-end -276.437622
.
"*/D:\zzx\asr\testdll\testdll\data\feature\hyj0_B_003.rec"
0 200000 sent-start -159.515427
200000 6800000 guan1ji1 -4380.168457
6800000 7100000 sent-end -167.720520
.
这个的意思就是说,有三个输入文件,可以识别出三个词语,分别是“静音”、“删除”、“关机”,嗯很好,很强大
不过这东西词汇量很小=v=b。。有个vocabulary的文件,就存了200个单词。。
嗯接下来就是要搞懂以下几个步骤
(1)首先是从麦克风中收集数据,格式应该是wav文件
(2)在收集的过程中要建立一个buffer,buffer的大小还要进行测试,当buffer满了以后将文件送到电脑中
(3)此时应该是wav文件,调用某些指令提取特征文件,将其变成mfc文件
(4)调用testdll得到结果
相关日志:
收藏:
QQ书签
del.icio.us
订阅:
Google
抓虾
