机器视觉开源处理库汇总
从cvchina搞到的机器视觉开源处理库汇总,转来了,很给力,还在不断更新。。。
通用库/General Library
无需多言。
Recognition And Vision Library. 线程安全。强大的IO机制。包含AAM。
很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。
图像,视频IO/Image, Video IO
AR相关/Augmented Reality
基于Marker的AR库
ARToolKit的增强版。实现了更好的姿态估计算法。
实时的跟踪、SLAM、AR库。无需Marker,模板,内置传感器等。
基于特征点检测和识别的AR库。
局部不变特征/Local Invariant Feature
目前最好的Sift开源实现。同时包含了KD-tree,KD-Forest,BoW实现。
基于Naive Bayesian Bundle的特征点识别。高速,但占用内存高。
基于OpenCV的Sift实现。
目标检测/Object Detection
又一个AdaBoost实现。训练速度快。
基于Centrist和Linear SVM的快速行人检测。
(近似)最近邻/ANN
目前最完整的(近似)最近邻开源库。不但实现了一系列查找算法,还包含了一种自动选取最快算法的机制。
另外一个近似最近邻库。
SLAM & SFM
- SceneLib [LGPL]
monoSLAM库。由Androw Davison开发。
图像分割/Segmentation
使用Simple Linear Iterative Clustering产生指定数目,近似均匀分布的Super Pixel。
目标跟踪/Tracking
基于Online Random Forest的目标跟踪算法。
Kanade-Lucas-Tracker
Online Boosting Trackers
直线检测/Line Detection
基于联通域连接的直线检测算法。
- LSD [GPL]
基于梯度的,局部直线段检测算子。
指纹/Finger Print
- pHash [GPL]
基于感知的多媒体文件Hash算法。(提取,对比图像、视频、音频的指纹)
视觉显著性/Visual Salience
Ming-Ming Cheng的视觉显著性算法。
FFT/DWT
- FFTW [GPL]
最快,最好的开源FFT。
- FFTReal [WTFPL]
轻量级的FFT实现。许可证是亮点。
音频处理/Audio processing
- STK [Free]
音频处理,音频合成。
- libsndfile [LGPL]
音频文件IO。
- libsamplerate [GPL ]
音频重采样。
小波变换
快速小波变换(FWT)
BRIEF: Binary Robust Independent Elementary Feature 一个很好的局部特征描述子,里面有FAST corner + BRIEF实现特征点匹配的DEMO:http://cvlab.epfl.ch/software/brief/
http://code.google.com/p/javacv
Java打包的OpenCV, FFmpeg, libdc1394, PGR FlyCapture, OpenKinect, videoInput, and ARToolKitPlus库。可以放在Android上用~
libHIK,HIK SVM,计算HIK SVM跟Centrist的Lib。http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK.htm
一组视觉显著性检测代码的链接:http://cg.cs.tsinghua.edu.cn/people/~cmm/saliency/