摘要:
音频的操作 音乐是人类的通用语言,不分国界不分种族。而从数学角度看,音乐就是时间和频率的关系。声音的本质是波,人类听觉的原理就是波引起了耳朵鼓膜的振动。人们用不同乐器、不同力度,在一段连续时间里敲击,就组合出了时间和频率的关系。一切物体都有自己的频率,所以整个世界也可以理解为声音的盛宴。对于计算机而 阅读全文
摘要:
图像分割与人脸识别 众所周知图像是由若干有意义的像素组成的,图像分割作为计算机视觉的基础,对具有现有目标和较精确边界的图像进行分割,实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类,区别如下: 语义分割:将图像中每个像素赋予一个类别标签,用不同的颜色来表示。例如能够区分人脸与头发 阅读全文
摘要:
抠图 抠图是基本需求,最常见的应用场景就是证件照,每次去拍照,都要用个纯色的幕布,而且要求衣服不能太浅。其实背后是有原因的:为了管理部门更准确识别出人像。许多科幻电影也是要求演员在绿幕前表演,后期抠图合成逼真的电影。抠图工具非常多,例如PhotoShop就是抠图利器,可以很神奇地把图片里的元素单独提 阅读全文
摘要:
文字识别 文字识别是热门研究方向。目前相对成熟的有: •Google的tesseract项目,它能识别100多种语言 •基于机器学习的多个项目,例如百度的paddlehub tesseract使用比较简单,但是配置相对复杂一下。在Ubuntu bionic的安装过程如下。 apt install 阅读全文
摘要:
二维码生成 二维码(Quick Response Code)几乎已经渗透到我们日常生活的每一个角落,它是 1994 年发明的一种矩阵条形码,可以用某种特定的几何图形按一定规律在平面(二维方向上)分布的、黑白相间的、记录数据符号信息的图形。在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比 阅读全文
摘要:
水印 水印是一种常见的图片处理需求。当既需要展示,又需要保护知识产权时,就需要使用文字或者图片来打水印。下面的代码展示了文字水印与图片水印的过程。 --javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown 阅读全文
摘要:
haod使用EXIF信息对相片进行定位 打开华为手机的图库,你会发现已经自动进行人脸识别,相片的归类与聚合等工作,甚至于还可以进行一步根据场景来搜索。当然这些肯定是在用户同意的前提下,对图片进行了操作与计算。事实上,当拿出手机进行拍照的这一刻,很多信息已经记录在案,这就是EXIF信息。Exif的全称 阅读全文
摘要:
九宫格与词云 对图片进行九宫格切割,并且放到微信朋友圈曾经风靡一时。对于python来说,这个也非常简单。 from PIL import Image import math def ninerectanglegrid(inputfilename): """ 实现九宫格切割 Args: inputf 阅读全文
摘要:
使用PIL加工图片 常见的图片操作包括但不限于: •大小进行变化 •旋转 •翻转 •使用滤镜进行处理 •剪切 以下python代码演示了如何将一幅美女图进行多种加工处理,并且汇集在一起,形成一个类似于照片墙的相关操作。 from PIL import Image from PIL import Im 阅读全文
摘要:
使用PIL进行图片格式与尺寸转换 现实世界中,图片是经常需要处理的二进制文件类型。从计算机发展的历史来看,图片的格式丰富多彩,但大体来说分成两类: •位图格式 •矢量格式 矢量格式如svg等,能够随意放大缩小而不变形,原因在于矢量格式描述了如何产生图形的方法。而位图格式(例如BMP/JPEG/PNG 阅读全文