摘要:
记录帖。 CMake 以下都是 CMake 函数,用于配置项目的构建系统,说明如下: find_package(package_name):此函数用于查找现有的包配置模块或预定义模块。它查找指定库的安装位置,并设置相关变量。包配置模块是库的安装过程中创建的,用于帮助库的用户找到和链接库。预定义模块是 阅读全文
摘要:
work in process 概述 VQ-VAE (Vector Quantized Variational AutoEncoder):VQ-VAE 是 VAE 的一种变体,它结合了 VQ 和 VAE 的思想。在 VQ-VAE 中,编码器的输出不再是连续的潜在表示,而是离散的符号,这些符号是通过 阅读全文
摘要:
备忘录。 麦克风 科普普及:MEMS麦克风技术和解析 硅麦 //2024.2.23 MEMS,(微机电系统 micro electro mechanical systems)麦克风是基于MEMS技术制造的麦克风,由硅结构材料进行物理拾音,又通过“硅电路”处理,所以又称“硅麦克风”。 Tips on 阅读全文
摘要:
基础 Python是动态类型的语言,Python中任何事物皆对象,如变量、数据结构、函数、类、模块等等,在创建一个对象的时候就会占用内存,Python中对象和引用是分离。Python的内存管理是由Python进程的私有堆空间管理的,所有的Python对象都存储在进程的私有对空间中。 在创建一个对象的 阅读全文
摘要:
yaml [ˈjæməl]: Yet Another Markup Language :另一种标记语言。 yaml 是专门用来写配置文件的语言,非常简洁和强大,这个更直观,更方便,类似于json格式。 参考 Yaml文件的基础知识 python读取yaml配置文件 python:yaml模块 基本语 阅读全文
摘要:
参考大佬博客:python音频处理用到的操作 import wave, os, struct, librosa import numpy as np '''mono-channel audio file''' # wav文件读取 filepath = "./wavs/" filename= os.l 阅读全文
摘要:
笔记。 在Linux服务器直接运行程序,程序运行的时间较长,程序经常会因为网络连接问题异常终止,一直盯着程序运行又费时费力,这时后台运行程序是更好的解决方式。 But,如果服务器重启了,那所有进程都断掉了,只能重新跑代码。 screen 假如遇到一些比较费时间的程序,但是又不能一直开着电脑观察,这时 阅读全文
摘要:
笔记。 超参数搜索 机器学习中四种调参方法总结 (qq.com) 超参数是在建立模型时用于控制算法行为的参数。这些参数不能从常规训练过程中获得。在对模型进行训练之前,需要对它们进行赋值。 包括:传统的手工调参, 网格搜索,随机搜索,贝叶斯搜索。 sklearn.model_selection.Gri 阅读全文
摘要:
日常帖。 PyTorch是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序。它主要由Facebook的人工智能小组开发,不仅能够实现强大的GPU加速,同时还支持动态神经网络,这一点是现在很多主流框架如TensorFlow都不支持的。 PyTorch提供了两个高级功能: 1. 阅读全文
摘要:
记录贴。 import pandas as pd 文件 可结合参考:【album】Python使用笔记 - 博客园 (cnblogs.com) .read_excel pandas.read_excel — pandas 1.3.3 documentation (pydata.org) Pandas 阅读全文
摘要:
记录贴。 f Python f 字符串教程|极客教程 (geek-docs.com) Python f-string 是执行字符串格式化的最新 Python 语法。 自 Python 3.6 起可用。 Python f 字符串提供了一种更快,更易读,更简明且不易出错的在 Python 中格式化字符串 阅读全文
摘要:
持续更新中。 基础 语音合成(Text To Speech,TTS),将文字转化为语音的一种技术。 语音合成技术 - 知乎 (zhihu.com) 论文推介:Glow-WaveGAN—学习一种用于高质量语音合成的语音表征 (qq.com) 个性化 应对个性化定制语音合成挑战,微软推出AdaSpeec 阅读全文
摘要:
参考: linux添加环境变量4种方法 (360doc6.net) Linux vi/vim | 菜鸟教程 (runoob.com) 学会这21条,你离 Vim 大神就不远了! (qq.com) 【Linux】Vim修改tab为4个空格 关于“.bash_profile”和“.bashrc”区别的总 阅读全文
摘要:
> **参考**: >- [【Linux】软件安装使用【aubio / FFmpeg】 - Skye_Zhao - 博客园 (cnblogs.com)](https://www.cnblogs.com/ytxwzqin/p/14463523.html) >- [FFmpeg 使用命令整理 – 提取音 阅读全文
摘要:
网络/模型压缩 【深度神经网络压缩】Deep Compression (ICLR2016 Best Paper)_AutoVision (by 仙道菜)-CSDN博客 ThiNet算法详解_AI之路-CSDN博客_thinet 复杂度/参数量/显存计算 复杂度计算 卷积神经网络的复杂度分析 参数量计 阅读全文
摘要:
集锦。 自监督学习 监督学习&无监督学习&半监督学习&自监督学习 - 小吴的日常 - 博客园 (cnblogs.com) 自监督学习主要是利用辅助任务(pretext)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。(也就是说自监 阅读全文
摘要:
记录贴。 linux涉及的系统为Ubuntu。 Ubuntu安装管理 参考: 简书文章-Linux软件安装管理之——dpkg与apt-*详解 CSDN博客-Ubuntu 和 Debian 的关系 CSDN博客-Ubuntu和Linux的区别 Debian Linux系统的发行版本非常多,大体上可以分 阅读全文
摘要:
笔记。 参考: New numpy English official website. Numpy 中文网 NumPy是使用Python进行科学计算的基础软件包。包括:1)功能强大的N维数组对象。2)精密广播功能函数。3)集成C/C+和Fortran代码的工具。4)强大的线性代数、傅立叶变换和随机数 阅读全文
摘要:
概述 参考 sklearn.mixture: Gaussian Mixture Models 高斯混合模型(GMM)源代码实现(二) A Gaussian Mixture Model (GMM) is a parametric probability density function represe 阅读全文
摘要:
参考 【librosa】及其在音频处理中的应用 librosa官方文档 liborosa源码 Overview: module code log-spectrogram 计算log-scaled spectrogram,librosa库中并没有现成的函数,需要自行计算。 计算步骤: load → s 阅读全文