Android 音视频技术之录音获取实时音量
一、实时音量相关基础知识
说到获取音量,大家首先想到的应该就是分贝(dB),分贝是一个相对单位(是一个比值,是一个数值,是一个纯计数方法)。
在音频领域dB度量的是声音的强度,其计算的公式如下:
在上面的公式中,分子是测量值的声压,分母是参考值的声压(20微帕,人类所能听到的最小声压)。
在Android设备传感器中,我们能获取到的物理值是振幅值,一般使用下面的公式来计算分贝值:
我们从Android SDK中读取了某段音频数据的振幅后,取最大振幅或平均振幅(可以用平方和平均,或绝对值的和平均),代入上述公式的A1。参考的振幅A0取值定为1(这里取1是为了实现方便,如需更加精确建议拿一个标准分贝计做校准参考),作为 Android 麦克风能听到的最小的声音振幅。这样我们就可以计算出分贝值了。
二、Android 获取实时音量
获取音量之前,我们必须先在AndroidManifest.xml文件里面申请相应的权限:
<uses-permission android:name="android.permission.RECORD_AUDIO" />
在Android SDK提供的API中,我们能获取到音频方式有两个:android.media.MediaRecorder 和 android.media.AudioRecord。
1. MediaRecorder
MediaRecorder 是用来录制一段完整的音视频并写入到文件系统中的API。通过它,我们能很简单的通过它的无参方法getMaxAmplitude来获取一小段时间内音频源数据中的最大振幅,此方法是很多录音软件计算音量等级所采用的办法。(注:因为是取最大值,所以存在受到极端数据的影响而导致计算的分贝波动值较大的问题)。
使用MediaRecorder.getMaxAmplitude返回的是0到32767范围的16位整型。如果设置参考振幅为1的话,那么计算出来的分贝值域的正常范围应该为 0dB 到 90.3dB。
核心代码:
/** * 开始录音 使用amr格式 */ public void startRecord() { // 开始录音 /* ①Initial:实例化MediaRecorder对象 */ if (mMediaRecorder == null) mMediaRecorder = new MediaRecorder(); try { /* ②setAudioSource/setVedioSource */ mMediaRecorder.setAudioSource(MediaRecorder.AudioSource.MIC);// 设置麦克风 /* ②设置音频文件的编码:AAC/AMR_NB/AMR_MB/Default 声音的(波形)的采样 */ mMediaRecorder.setOutputFormat(MediaRecorder.OutputFormat.DEFAULT); /* * ②设置输出文件的格式:THREE_GPP/MPEG-4/RAW_AMR/Default THREE_GPP(3gp格式 * ,H263视频/ARM音频编码)、MPEG-4、RAW_AMR(只支持音频且音频编码要求为AMR_NB) */ mMediaRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB); /* ③准备 */ mMediaRecorder.setOutputFile(Environment.getExternalStorageDirectory().getPath() + File.separator + "111.amr"); mMediaRecorder.setMaxDuration(MAX_LENGTH); mMediaRecorder.prepare(); /* ④开始 */ mMediaRecorder.start(); updateMicStatus(); } catch (IllegalStateException | IOException e) { e.printStackTrace(); } } /** * 停止录音 */ private void stopRecord() { if (mMediaRecorder == null) { return; } mMediaRecorder.stop(); mMediaRecorder.reset(); mMediaRecorder.release(); mMediaRecorder = null; } private void updateMicStatus() { if (mMediaRecorder != null) { double ratio = (double) mMediaRecorder.getMaxAmplitude() / 1; // 参考振幅为 1 double db = 0;// 分贝 if (ratio > 1) { db = 20 * Math.log10(ratio); } Log.d(TAG, "计算分贝值 = " + db + "dB"); mHandler.postDelayed(mUpdateMicStatusTimer, 100); // 间隔取样时间为100秒 } }
2. AudioRecord
此API相对MediaRecorder来说更偏底层一点,我们可以使用AudioRecord获得具体的音频数据。
音源数据通过read(byte[] audioData, int offsetInBytes, int sizeInBytes)方法从缓冲区读取到我们传入的字节数组audioData后,我们便可以对其进行操作,如求平方和或绝对值的平均值。这样可以避免个别极端值的影响,使计算的结果更加稳定。求得平均值之后,如果是平方和则代入常数系数为10的公式中,如果是绝对值的则代入常数系数为20的公式中,算出分贝值。
核心代码:
public void getNoiseLevel() { mAudioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, SAMPLE_RATE_IN_HZ, AudioFormat.CHANNEL_IN_DEFAULT, AudioFormat.ENCODING_PCM_16BIT, BUFFER_SIZE); new Thread(new Runnable() { @Override public void run() { mAudioRecord.startRecording(); short[] buffer = new short[BUFFER_SIZE]; while (isGetVoiceRun) { //r是实际读取的数据长度,一般而言r会小于buffersize int r = mAudioRecord.read(buffer, 0, BUFFER_SIZE); long v = 0; // 将 buffer 内容取出,进行平方和运算 for (short value : buffer) { v += value * value; } // 平方和除以数据总长度,得到音量大小。 double mean = v / (double) r; double volume = 10 * Math.log10(mean); Log.d(TAG, "分贝值 = " + volume + "dB"); synchronized (mLock) { try { mLock.wait(100); // 一秒十次 } catch (InterruptedException e) { e.printStackTrace(); } } } mAudioRecord.stop(); mAudioRecord.release(); mAudioRecord = null; } }).start(); }
github地址:https://github.com/renhui/RHAudioVolume/tree/master