vue+科大讯飞语音听写功能

1.查看node版本，本人如下：node 16
本人项目目录，主要用到的画红色圈圈的三个文件

2.添加 package.json 文件版本

"dependencies": {
    enc": "^0.4.0",
    "jquery": "^3.4.1",
    
},
"devDependencies": {
    "crypto-js": "^4.0.0",
    "vconsole": "^3.3.4",
    "vue-template-compiler": "2.6.12",
    "worker-loader": "^2.0.0"
}

配置 vue.config.js 文件

module.exports = {
  configureWebpack: config => {
    config.module.rules.push({
      test: /\.worker.js$/,
      use: {
        loader: 'worker-loader',
        options: { inline: true, name: 'workerName.[hash].js' }
      }
    })
  },
  parallel: false,
  chainWebpack(config) {
    config.output.globalObject('self')
    config.module
        .rule('worker')
        .test(/\.worker.js$/)
        .use('worker-loader')
        .loader('worker-loader')
        .options({ inline: true, name: 'workerName.[hash].js' })

  },

原文链接：https://blog.csdn.net/weixin_39255905/article/details/127907399

创建 transcode.worker.js 文件

// (function(){
self.onmessage = function(e){
      transAudioData.transcode(e.data)
}
let transAudioData = {
      transcode(audioData) {
            let output = transAudioData.to16kHz(audioData)
            output = transAudioData.to16BitPCM(output)
            output = Array.from(new Uint8Array(output.buffer))
            self.postMessage(output)
            // return output
      },
      to16kHz(audioData) {
            var data = new Float32Array(audioData)
            var fitCount = Math.round(data.length * (16000 / 44100))
            var newData = new Float32Array(fitCount)
            var springFactor = (data.length - 1) / (fitCount - 1)
            newData[0] = data[0]
            for (let i = 1; i < fitCount - 1; i++) {
                  var tmp = i * springFactor
                  var before = Math.floor(tmp).toFixed()
                  var after = Math.ceil(tmp).toFixed()
                  var atPoint = tmp - before
                  newData[i] = data[before] + (data[after] - data[before]) * atPoint
            }
            newData[fitCount - 1] = data[data.length - 1]
            return newData
      },
      to16BitPCM(input) {
            var dataLength = input.length * (16 / 8)
            var dataBuffer = new ArrayBuffer(dataLength)
            var dataView = new DataView(dataBuffer)
            var offset = 0
            for (var i = 0; i < input.length; i++, offset += 2) {
                  var s = Math.max(-1, Math.min(1, input[i]))
                  dataView.setInt16(offset, s < 0 ? s * 0x8000 : s * 0x7fff, true)
            }
            return dataView
      },
}
// })()

创建 translation.js 文件，（在语音听写流式API demo js语言讯飞源文件中取 src\pages\index\index.js）



import CryptoJS from 'crypto-js'
// import Enc from 'enc'
// import VConsole from 'vconsole'
import $ from 'jquery'
import TransWorker from './transcode.worker.js'
// import './index.css'

let transWorker = new TransWorker()
//APPID，APISecret，APIKey在控制台-我的应用-语音听写（流式版）页面获取
const APPID = 'd7b51bcb'
const API_SECRET = 'ZTNmZjk3N2FkZTljZjg0YTYzMGZiNmZj'
const API_KEY = '4bc26e6fd3868195919a8c14054eac66'

/**
 * 获取websocket url
 * 该接口需要后端提供，这里为了方便前端处理
 */
function getWebSocketUrl() {
      return new Promise((resolve, reject) => {
            // 请求地址根据语种不同变化
            var url = 'wss://iat-api.xfyun.cn/v2/iat'
            var host = 'iat-api.xfyun.cn'
            var apiKey = API_KEY
            var apiSecret = API_SECRET
            var date = new Date().toGMTString()
            var algorithm = 'hmac-sha256'
            var headers = 'host date request-line'
            var signatureOrigin = `host: ${host}\ndate: ${date}\nGET /v2/iat HTTP/1.1`
            var signatureSha = CryptoJS.HmacSHA256(signatureOrigin, apiSecret)
            var signature = CryptoJS.enc.Base64.stringify(signatureSha)
            var authorizationOrigin = `api_key="${apiKey}", algorithm="${algorithm}", headers="${headers}", signature="${signature}"`
            var authorization = btoa(authorizationOrigin)
            url = `${url}?authorization=${authorization}&date=${date}&host=${host}`
            resolve(url)
      })
}
class IatRecorder {
      constructor({ language, accent, appId } = {}) {
            let self = this
            this.status = 'null'
            this.language = language || 'zh_cn'
            this.accent = accent || 'mandarin'
            this.appId = appId || APPID
            // 记录音频数据
            this.audioData = []
            // 记录听写结果
            this.resultText = ''
            // wpgs下的听写结果需要中间状态辅助记录
            this.resultTextTemp = ''
            transWorker.onmessage = function (event) {
                  self.audioData.push(...event.data)
            }
      }
      // 修改录音听写状态
      setStatus(status) {
            this.onWillStatusChange && this.status !== status && this.onWillStatusChange(this.status, status)
            this.status = status
            console.info('****修改录音听写状态******', this.status)
      }
      setResultText({ resultText, resultTextTemp } = {}) {
            this.onTextChange && this.onTextChange(resultTextTemp || resultText || '')
            resultText !== undefined && (this.resultText = resultText)
            resultTextTemp !== undefined && (this.resultTextTemp = resultTextTemp)
      }
      // 修改听写参数
      setParams({ language, accent } = {}) {
            language && (this.language = language)
            accent && (this.accent = accent)
      }
      // 连接websocket
      connectWebSocket() {
            return getWebSocketUrl().then(url => {
                  console.log(url)
                  let iatWS
                  if ('WebSocket' in window) {
                        iatWS = new WebSocket(url)
                  } else if ('MozWebSocket' in window) {
                        iatWS = new MozWebSocket(url)
                  } else {
                        alert('浏览器不支持WebSocket')
                        return
                  }
                  this.webSocket = iatWS
                  this.setStatus('init')
                  iatWS.onopen = e => {
                        this.setStatus('ing')
                        // 重新开始录音
                        setTimeout(() => {
                              this.webSocketSend()
                        }, 100)
                  }
                  iatWS.onmessage = e => {
                        this.result(e.data)
                  }
                  iatWS.onerror = e => {
                        this.recorderStop()
                  }
                  iatWS.onclose = e => {
                        this.recorderStop()
                  }
            })
      }
      // 初始化浏览器录音
      recorderInit() {
            navigator.getUserMedia =
                navigator.getUserMedia ||
                navigator.webkitGetUserMedia ||
                navigator.mozGetUserMedia ||
                navigator.msGetUserMedia

            // 创建音频环境
            try {
                  this.audioContext = new (window.AudioContext || window.webkitAudioContext)()
                  this.audioContext.resume()
                  if (!this.audioContext) {
                        alert('浏览器不支持webAudioApi相关接口')
                        return
                  }
            } catch (e) {
                  if (!this.audioContext) {
                        alert('浏览器不支持webAudioApi相关接口')
                        return
                  }
            }

            // 获取浏览器录音权限
            if (navigator.mediaDevices && navigator.mediaDevices.getUserMedia) {
                  navigator.mediaDevices
                      .getUserMedia({
                            audio: true,
                            video: false,
                      })
                      .then(stream => {
                            getMediaSuccess(stream)
                      })
                      .catch(e => {
                            getMediaFail(e)
                      })
            } else if (navigator.getUserMedia) {
                  navigator.getUserMedia(
                      {
                            audio: true,
                            video: false,
                      },
                      stream => {
                            getMediaSuccess(stream)
                      },
                      function(e) {
                            getMediaFail(e)
                      }
                  )
            } else {
                  if (navigator.userAgent.toLowerCase().match(/chrome/) && location.origin.indexOf('https://') < 0) {
                        alert('chrome下获取浏览器录音功能，因为安全性问题，需要在localhost或127.0.0.1或https下才能获取权限')
                  } else {
                        alert('无法获取浏览器录音功能，请升级浏览器或使用chrome')
                  }
                  this.audioContext && this.audioContext.close()
                  return
            }
            // 获取浏览器录音权限成功的回调
            let getMediaSuccess = stream => {
                  console.log('getMediaSuccess')
                  // 创建一个用于通过JavaScript直接处理音频
                  this.scriptProcessor = this.audioContext.createScriptProcessor(0, 1, 1)
                  this.scriptProcessor.onaudioprocess = e => {
                        // 去处理音频数据
                        if (this.status === 'ing') {
                              transWorker.postMessage(e.inputBuffer.getChannelData(0))
                        }
                  }
                  // 创建一个新的MediaStreamAudioSourceNode 对象，使来自MediaStream的音频可以被播放和操作
                  this.mediaSource = this.audioContext.createMediaStreamSource(stream)
                  // 连接
                  this.mediaSource.connect(this.scriptProcessor)
                  this.scriptProcessor.connect(this.audioContext.destination)
                  this.connectWebSocket()
            }

            let getMediaFail = (e) => {
                  alert('请求麦克风失败')
                  console.log(e)
                  this.audioContext && this.audioContext.close()
                  this.audioContext = undefined
                  // 关闭websocket
                  if (this.webSocket && this.webSocket.readyState === 1) {
                        this.webSocket.close()
                  }
            }
      }
      recorderStart() {
            if (!this.audioContext) {
                  console.log("11111111")
                  this.recorderInit()
            } else {
                  console.log("22222222")
                  this.audioContext.resume()
                  this.connectWebSocket()
            }
      }
      // 暂停录音
      recorderStop() {
            // safari下suspend后再次resume录音内容将是空白，设置safari下不做suspend
            if (!(/Safari/.test(navigator.userAgent) && !/Chrome/.test(navigator.userAgen))){
                  this.audioContext && this.audioContext.suspend()
            }
            this.setStatus('end')
      }
      // 处理音频数据
      // transAudioData(audioData) {
      //   audioData = transAudioData.transaction(audioData)
      //   this.audioData.push(...audioData)
      // }
      // 对处理后的音频数据进行base64编码，
      toBase64(buffer) {
            var binary = ''
            var bytes = new Uint8Array(buffer)
            var len = bytes.byteLength
            for (var i = 0; i < len; i++) {
                  binary += String.fromCharCode(bytes[i])
            }
            return window.btoa(binary)
      }
      // 向webSocket发送数据
      webSocketSend() {
            if (this.webSocket.readyState !== 1) {
                  return
            }
            let audioData = this.audioData.splice(0, 1280)
            console.log(audioData)
            var params = {
                  common: {
                        app_id: this.appId,
                  },
                  business: {
                        language: this.language, //小语种可在控制台--语音听写（流式）--方言/语种处添加试用
                        domain: 'iat',
                        accent: this.accent, //中文方言可在控制台--语音听写（流式）--方言/语种处添加试用
                        vad_eos: 60*60*1000,
                        dwa: 'wpgs', //为使该功能生效，需到控制台开通动态修正功能（该功能免费）
                  },
                  data: {
                        status: 0,
                        format: 'audio/L16;rate=16000',
                        encoding: 'raw',
                        audio: this.toBase64(audioData),
                  },
            }
            this.webSocket.send(JSON.stringify(params))
            this.handlerInterval = setInterval(() => {
                  // websocket未连接
                  if (this.webSocket.readyState !== 1) {
                        console.log("websocket未连接")
                        this.audioData = []
                        clearInterval(this.handlerInterval)
                        return
                  }
                  if (this.audioData.length === 0) {
                        console.log("自动关闭",this.status)
                        if (this.status === 'end') {
                              this.webSocket.send(
                                  JSON.stringify({
                                        data: {
                                              status: 2,
                                              format: 'audio/L16;rate=16000',
                                              encoding: 'raw',
                                              audio: '',
                                        },
                                  })
                              )
                              this.audioData = []
                              clearInterval(this.handlerInterval)
                        }
                        return false
                  }
                  audioData = this.audioData.splice(0, 1280)
                  // 中间帧
                  this.webSocket.send(
                      JSON.stringify({
                            data: {
                                  status: 1,
                                  format: 'audio/L16;rate=16000',
                                  encoding: 'raw',
                                  audio: this.toBase64(audioData),
                            },
                      })
                  )
            }, 40)
      }
      result(resultData) {
            // 识别结束
            let jsonData = JSON.parse(resultData)
            if (jsonData.data && jsonData.data.result) {
                  let data = jsonData.data.result
                  let str = ''
                  let resultStr = ''
                  let ws = data.ws
                  for (let i = 0; i < ws.length; i++) {
                        str = str + ws[i].cw[0].w
                  }
                  console.log("识别的结果为：",str)
                  // 开启wpgs会有此字段(前提：在控制台开通动态修正功能)
                  // 取值为 "apd"时表示该片结果是追加到前面的最终结果；取值为"rpl" 时表示替换前面的部分结果，替换范围为rg字段
                  if (data.pgs) {
                        if (data.pgs === 'apd') {
                              // 将resultTextTemp同步给resultText
                              this.setResultText({
                                    resultText: this.resultTextTemp,
                              })
                        }
                        // 将结果存储在resultTextTemp中
                        this.setResultText({
                              resultTextTemp: this.resultText + str,
                        })
                  } else {
                        this.setResultText({
                              resultText: this.resultText + str,
                        })
                  }
            }
            if (jsonData.code === 0 && jsonData.data.status === 2) {
                  this.webSocket.close()
            }
            if (jsonData.code !== 0) {
                  this.webSocket.close()
                  console.log(`${jsonData.code}:${jsonData.message}`)
            }
      }
      start() {
            this.recorderStart()
            this.setResultText({ resultText: '', resultTextTemp: '' })
      }
      stop() {
            this.recorderStop()
      }
}

// ======================开始调用=============================
// var vConsole = new VConsole()
let iatRecorder = new IatRecorder()
let countInterval
// 状态改变时处罚
iatRecorder.onWillStatusChange = function(oldStatus, status) {
      // 可以在这里进行页面中一些交互逻辑处理：倒计时（听写只有60s）,录音的动画，按钮交互等
      // 按钮中的文字
      console.info('******oldStatus****', oldStatus)
      console.info('******status****', status)
      let text = {
            null: '开始识别', // 最开始状态
            init: '初始化状态', // 初始化状态
            ing: '正在录音', // 正在录音状态
            end: '结束识别', // 结束状态
      }
      let senconds = 0
      $('#taste-button')
          .removeClass(`status-${oldStatus}`)
          .addClass(`status-${status}`)
          .text(text[status])
      if (status === 'ing') {
            // $('hr').addClass('hr')
            // $('.taste-content').css('display', 'none')
            // $('.start-taste').addClass('flex-display-1')
            // 倒计时相关
            countInterval = setInterval(()=>{
                  senconds++
                  console.log("==========="+senconds)
                  $('.used-time').text(`0${Math.floor(senconds/60)}：${Math.floor(senconds/10)}${senconds%10}`)
                  /*if (senconds >= 60) {
                    this.stop()
                    clearInterval(countInterval)
                  }*/
            }, 1000)
      } else if (status === 'init') {
            $('.time-box').show()
            $('.used-time').text('00：00')
      } else {
            $('.time-box').hide()
            $('hr').removeClass('hr')
            clearInterval(countInterval)
      }
}

$(function(){
// 监听识别结果的变化
      iatRecorder.onTextChange = function(text) {
         $('#result_output').text(text)
          $('.transparent-input').val(text)
      }
      setTimeout(function(){
            $('#taste_button').click(function() {
                  $('#taste_button').css("display","none")
                  $('#end_button').css("display","block")
                  $('.record').addClass('record-indicator')
                  iatRecorder.status = 'init'
                  console.info('*****iatRecorder.status*****', iatRecorder.status)
                  // if (iatRecorder.status === 'end') {
                  //       iatRecorder.stop()
                  // } else {
                        iatRecorder.start()
                  // }
            })
            $('#end_button').click(function(){
                  $('#end_button').css("display","none")
                  $('#taste_button').css("display","block")
                  iatRecorder.stop()
                  $('.record').removeClass('record-indicator')
                  // iatRecorder.status = 'init'
                  console.info('****iatRecorder.status**ed****', iatRecorder.status)
            })

      },10000);

});

创建 translation.vue 文件


    <!-- <div style="position: relative;border: 1px red solid;height: 300px">-->

    <!--      语音识别-->

    <!--      <div class="service-item-content service-item-taste-content">-->
    <!--        <div class="taste-content">-->
    <!--          <button class="taste-button ready-button" id="taste_button">开始识别</button>-->
    <!--        </div>-->
    <!--        <div class="start-taste">-->
    <!--          <div class="start-taste-left">-->
    <!--            <div class="time-box">-->
    <!--              <span class="total-time"><span class="used-time">00: 00</span> / 01: 00</span>-->
    <!--            </div>-->
    <!--            <div class="start-taste-button">-->
    <!--              <button class="taste-button start-button" id="end_button">结束识别</button>-->
    <!--            </div>-->
    <!--          </div>-->
    <!--          <div class="output-box" id="result_output"></div>-->
    <!--        </div>-->
    <!--      </div>-->

    <!--      语音识别-->


    <!--      <iframe src="http://127.0.0.1:5500/example/iat/index.html" width="100%" height="100%"></iframe>-->
    <!--    </div> -->
import './js/translation.js'

posted on 2024-07-02 09:03 芮艺阅读(224) 评论(0) 编辑收藏举报

刷新页面返回顶部

baozhengrui

导航

公告

vue+科大讯飞语音听写功能