随笔分类 - 其他 语音识别
摘要:shell脚本还是很方便的....几百个音频, 一会就处理好了 实习生, 只能干干打杂的活...有点心累........诶, 心累
阅读全文
摘要:#!bin/bash/python # -*- coding=utf-8 -*- from __future__ import division import threading import wx import wx.media import os.path, os, gc, sys, pyaudio import wave, numpy, codecs, time import pylab...
阅读全文
摘要:可以通过这个简短的例子, 学习, 线程间通信: https://www.cnblogs.com/douzujun/p/10719458.html 主要流程是: 点击按钮, 执行按钮点击事件函数(录音), 函数里开启一个线程, 同时向主线程发送消息, 主线程接收消息, 将消息发给绘图函数, 让其执行
阅读全文
摘要:#!bin/bash # -*- coding=utf-8 -*- from __future__ import division import wx import os.path,os,gc,sys,pyaudio import wave,numpy,codecs,time import pylab as pl #import win32gui from matplotlib.ticker i...
阅读全文
摘要:#-*- coding: utf-8 -*- ################################################################################ ## 使用wxPython的绘图模块wxPyPlot,需要数据可视化的时候,无需再借用其他的库或模块了 ##########################################...
阅读全文
摘要:#!/usr/bin/python # encoding:utf-8 import pyaudio import wave CHUNK = 1024 # 从目录中读取语音 wf = wave.open('mic4.wav', 'rb') # read data data = wf.readframes(CHUNK) # 创建播放器 p = pyaudio.PyAudio() # 获得语音...
阅读全文
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- """ 绘制波形图 plottingWaveform.py """ import wave import pylab as pl import numpy as np print('working') # 打开wav文档 file = wave.open(r"mic4.wav", "rb") #...
阅读全文
摘要:摘抄自:https://zhuanlan.zhihu.com/p/31193859?utm_source=qq&utm_medium=social【笔记|自用】 专业基础 算法基础 声学机理: 包括发音机理、听觉机理和语言机理,发音机理主要探讨人类发声器官和这些器官在发声过程中的作用,而听觉机理主要
阅读全文
摘要:1. 官方形象展示FFT:https://www.bilibili.com/video/av19141078/?spm_id_from=333.788.b_636f6d6d656e74.6 2. 讲解的不错: https://blog.csdn.net/zb1165048017/article/de
阅读全文
摘要:1. 入口函数和程序初始化 1.1 程序从main开始吗? 当程序执行到main函数的第一行时,很多事情都已经完成了: 【证1】如下是一段C语言代码: 代码中可以看到,在程序刚刚执行到main的时候,全局变量的初始化过程已经结束了(a的值已经确定); main函数的两个参数(argc 和 argv)
阅读全文
摘要:工作任务: 前端麦克风阵列算法 1. 熟悉svn 2. 熟悉wav音频文件格式解析 3. 熟悉代码 3.1 tinybf-lz/wtk/core wavehdr.c wtk_wavfile.c:处理wav文件,降噪 wavehdr.c wtk_wavfile.c:处理wav文件,降噪 3.2 tin
阅读全文
摘要:1. WAV格式 wav是微软开发的一种音频文件格式,注意,wav文件格式是无损音频文件格式,相对于其他音频格式文件数据是没有经过压缩的,通常文件也相对比较大些。、 支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和
阅读全文