【硬核摄影2.0】用线性CCD器件制作扫描相机
本文参考资料:
[1] (Strongly Recommend!) Fundamentals and Experiments of Line Scan Camera: http://www.elm-chan.org/works/lcam/report.html
[2] 线阵 CCD 的使用方法(以 TCD1304 为例): https://zzi.io/?p=1091
工程地址:https://github.com/divertingPan/Line_Scan_Camera
原文地址:https://divertingpan.github.io/post/line_scan_camera
前言
Overview
这篇是接续【硬核摄影】给火车拍个全身照和光流法应用——自适应检测视频火车速度的内容。但是实则整个工程和前作关系又不是那么密切,只能算是精神续作。
实际上,这篇2.0的内容是之前做软件层面的视频扫描代码的精神鼻祖。这个扫描相机的原项目[1]是2011年左右设计的,老潘在大概2018年看到的这个并且尝试复现(失败),但一直对这个项目留有念想。因为已经大致了解了原理,所以就用视频录像做了这个相机的模拟版。结果在2021年的时候突然得知,国内PCB厂商居然开始免费打样,于是老潘决定重启这个项目,告别繁杂的飞线,拆解原来的洞洞板,直接上PCB。
老潘在原来的设计基础上做了一些小改动。本篇主要是为了记录复现过程中趟过的无数大小坑,以及对本项目的改进的一些指南。
本项目完全开源在github上,包括电路,PCB,硬件代码,各种资料等。
老潘不是专业搞硬件开发的,所以肯定很多地方说不明白,希望各位能给予指导或者纠正。
一些效果展示:
这个是手持平移扫过桌上的静物,因为手抖所以会有变形。
这是架在路边拍摄,因为光圈开到最大,对焦在中央车道,近景就会失焦模糊。
一个完整的扫描结果,没有调整长宽比例的原始图像。
火车虽迟但到,可惜这个相机想要准确取景对焦十分考验手感,导致出片率不高。
线性 vs 二维
这种一维相机也能拍照的原理在前面篇章里已经介绍了,如果理解了线性扫描的原理,这个相机的原理是一模一样的。只是利用线性的CCD直接从拍摄(或者说录制视频)这个地方就已经做好了固定位置-连续取帧-逐帧拼接成图这么个过程。
这时候会有人问:既然能用录像机直接录像之后用软件拼图,那毫无必要用线性CCD来做这个?这时候我们应该考虑一下两种方法的优劣,来选择到底用哪种方法。
- 线性CCD器件的分辨率可以轻松做到10000×n,即CCD的单帧覆盖像素可以做到很高,这点在当前的二维传感器上很难实现(即使强如GFX 100可以做到最长边11648×8736分辨率,但是成本爆炸,而且还会带来第二点问题)
- 线性CCD只有1维的数据,在高速采集中对外围电路要求更低(GFX 100和一个线性CCD,同时设计每秒1000帧的采样速度,难度差异显而易见)。有人会说:二维器件的采样率限制可以利用二维平面弥补(即,11648×8736×1帧,采集图像范围等同于11648×1×8736帧),但是前文已经实验证明,利用视频的窄窗来模拟线性扫描的前提是,开窗的尺寸不能太大,否则会出现透视效应。因此,二维CMOS或者CCD器件会有大量数据浪费。
- 承接上条,利用线性CCD可以节约存储空间和IO开销。
- 使用CCD的缺点是,由于存在采样率上限,因此速度超过帧速率上限的物体会发生形变,且丢失的帧细节无法弥补,通过二维器件的录像和后处理,可以利用窄窗弥补。(这里的速度-帧率-窗尺寸关系在前作也有推导,线性CCD设定窗宽度固定为1即可)
- 尽管如此,窄窗仍然会带来以下问题,且很难通过简单的后期手法修正:
- 开窗的窗宽度和目标运动速度紧密相关,并且分正负。
- 带有透视的物体,无法统一开窗宽度。
- 对于变速的物体,对开窗宽度非常敏感。
- 物体受到固定位置的光影反射会产生条纹干扰。
如图所示:
而以上问题在窗宽度等于1像素,即直接使用线性CCD捕捉图像时,可以消除这些缺陷。例如下图所示,拍摄的汽车是属于双向车道的,被白色横线挡住的大卡车是自右向左行驶的,白线前面的车是自左向右行驶的。但是由于每帧像素宽度为1,因此帧排列顺序不会出现上图问题1的效应,只会影响到物体的镜像翻转与否(注意卡车上的字)。
至于物体发生的拉伸形变,可以通过ps缩放简单修正。将运动速度慢而造成影像拉长的物体可以压回正常尺寸,没有信息损失;而运动过快造成的影像缩短,仅使用插值法拉回原本比例则会带来信息损失。
传感器简介
基本原理
整个项目最重要的部分就是传感器了,这里使用的是TCD32D线性单色传感器,具有1024个像素单元,最高捕捉速度可以达到每秒大约2000帧。其实目前的科技已经有最多一万个像元,可以达到更高的分辨率,还支持RGB彩色模式,不过这些东西的原理基本都相通。想要TCD132D输出东西,首先需要给它一些信号,如图所示:
这里SH是控制CCD采集光信号,控制积累由光强度转化成的电信号(即积分)所用的时间长度,遇到一个SH下降沿就使得CCD开始把目前积累的电信号往外搬运。因此可以发现,帧率越大,给每个像元的积分时间就越短,相当于感光度变低。在此同时,\phiϕCCD控制搬运的节奏,这个信号变一次,就让下一个像素的信号出来,直到走完所有的像元。但是这上面并不是所有像元都能捕捉到光信号,只有中间部分的1024个可以,其他的只会打酱油。\phiϕM是总时钟,根据图里的比例可以看到,\phiϕCCD变一次,就要对应\phiϕM变4次,就是说\phiϕM的频率需要是\phiϕCCD的4倍。
而这个传感器能接受的这些信号的频率范围如下表前三行所示。可以看到\phiϕM的频率确实是\phiϕCCD的4倍。而\phiϕCCD每变一次就会输出一个数据,即一个\phiϕCCD周期会有2个数据输出,所以数据速率是\phiϕCCD的两倍。一帧有1024个数据,每秒2M个数据即每秒2k个帧,所以这个传感器的极速就是每秒2千帧左右。
这个TCD132D输出的是模拟信号(一个连续区间的电压值),所以需要一个ADC来把电压值转化到0-255之间的数码值。这也就是说,我们需要一个能够支持每秒转化2M个数据的ADC才行。ADC1173可以达到15MHz。而驱动他的方法也很简单,使用一个时钟,在每次时钟下降沿的时候就会把当前的数据采集转化。
Arduino相关实验
老潘早些时候用arduino尝试着去驱动TCD132D以及ADC1173,奈何没有示波器,没法查看输出信号是不是符合期望值,arduino mega上面又不带DMC,数据来不及依次捕捉下来。而且对于如何同步列与列之间的数据,我也没什么头绪。这里示范一下使用arduino+ADC1173来把这个CCD当做光线传感器使用的一个例子吧(无奈)。
好在mega上面有很多定时器可以使用,这些定时器被我拿来当做各个时钟了。配置定时器又涉及到了寄存器操作,我的浅见是寄存器就是一堆功能按钮,按下他就会产生相应的功能,这些功能排列组合出来就成了神奇或者诡异的运行姿态。。。使用对应的寄存器的方法就是通过设置某个变量的名字(一般用到的单片机都会把每个寄存器做好名称和底层地址的对应文件给大家)等于一个二进制的数字,这个二进制数字的每一位都对应了这个寄存器里的一个按钮,1就是按下,0就是不按。通过纷杂迷人眼的来回切换这些按钮,这个机器就运转起来了。
但是一般来说,直接设置某个寄存器就等于某一个数字可能不太妥当。因为有时候我们只想改变这里面好几个按钮中的一个按钮,不想动其他的按钮,如果每次都这样手动的一次设置一大排按钮的状态,容易搞错。所以有些时候可以利用逻辑符号来指定对某一个按钮做操作。
// 让DDRB的第0位和第1位变成1 这里|是按位或 DDRB |= (00000001 | 00000010); // 让ADCSRA的ADPS0:2变成0 这里的&是按位与 ADCSRA &= ~((1 << ADPS2) | (1 << ADPS1) | (1 << ADPS0)); // Arduino里面_BV()的用法等同于设置某个位为1 DDRB和DDB7已经预定义过 DDRB |= _BV(DDB7)
因此arduino里面对于各部分的时钟设置,结合说明书里的指示和网上的例程,可以写出以下:
void setup() { // read one frame (line) // Init the port to output mode DDRB |= _BV(DDB7) | _BV(DDB5) | _BV(DDB4); DDRE |= _BV(DDE3); DDRH |= _BV(DDH3); // LEDCLK (pin 13)(PB7) TCCR0A = _BV(COM0A1) | _BV(WGM01) | _BV(WGM00); TCCR0B = _BV(CS00); OCR0A = 255; // MCLK (pin 11)(PB5) TCCR1A = _BV(COM1A0); TCCR1B = _BV(WGM12) | _BV(CS10); OCR1A = 1; // 4MHz PORTB |= _BV(PORTB5); // start from HIGH // CCD (pin 10)(PB4) TCCR2A = _BV(COM2A0) | _BV(WGM21); TCCR2B = _BV(CS20); OCR2A = 7; // 1MHz // ADCCLK (pin 5)(PE3) TCCR3A = _BV(COM3A0); TCCR3B = _BV(WGM32) | _BV(CS30); OCR3A = 3; // 2MHz TCNT3 = 3; // SH (pin 6)(PH3) total: 1092x500ns = 546us TCCR4A = _BV(COM4A1) | _BV(WGM41); TCCR4B = _BV(WGM42) | _BV(WGM43) | _BV(CS40); OCR4A = 7; ICR4 = 8735; TCNT4 = 18; }
接线如下(懒得画详细的面包板图了,就大概看看图一乐吧)
时序图如下,不知道为什么ADC时钟总是无法对齐,不过只要ADC下降沿在CCD变化的附近即可,这个范围内的CCD输出信号仍然是稳定的。(有待通过示波器考证)
最后通过Arduino采集ADC输出的值,可以看出一定的响应规律。实验中发现传感器在亮光时输出低电位,无光时输出高电位,和一般数字图像里的情况刚好反过来。
另外还写了个用Arduino做呼吸灯的无聊代码,就是板上13号口自带的那个灯。但是这个呼吸灯是用的定时器,以及变化规律是正弦的(感觉还是毫无用处呵)。
void led_blink() { for (float i = 0; i < 5000; i++) { int t = 255 * 0.5 * (1 + sin(i / 5000 * 2 * PI)); OCR0A = t; } }
CCD的老化
如果在很暗的环境下捕获图像,之后通过调整曲线或者色阶将图片提亮后,有可能会看到这种条纹。根据参考链接[2],这个现象是因为CCD传感器内部的两个放大器的微小误差导致的。
事实上,大多数线阵 CCD 为了提高输出频率,都具有多个 Shift Register 结构的设计,在这一点上理论与实际的差异可以用于解释在线阵 CCD 寿命快要结束时,往往得到的信号会出现奇怪的周期性(伪信号)的现象。比如说 TCD1304 有两套 Shift Register,因此在使用很长时间之后,两个 Shift Register 对应的模拟放大器的老化情况不一致,因此输出的信号中,每个偶数像素的信号比相邻的奇数像素的信号总是高一些,或者总是低一些)
线性相机实施细节
这一节按照顺序讲述一下在抄作业的时候可能遇到的各种坑,以免抄作业都抄不好。
说在最前面,这里的元件用贴片还是接插件都影响不大。(我自己为了制作方便,能用直插件都用了,实际试验没发现太大问题)
显示部分替换为SSD1306模组
原作者所用的各种元件,我在当时基本都能集齐,并且花费不是太多。唯独他所用的OLED显示屏完全找不到。所以这部分干脆就直接用淘宝白菜价的OLED模块就行。经过一番研究,这里是用了4线的SPI和OLED通信,所以要买那种7个针脚的OLED模块。这样一来,原来设计里面的显示屏供电部分也可以去掉了,因为模块上面就带有供电管理。但是这样还不够,因为原作的OLED驱动芯片和淘宝常见的不一样,所以要改代码。
好在店家当时给了SSD1306的例程,并且改的地方比较简单,只是改一下初始化参数。在原作的disp.c里面的233行是这样的:
static const BYTE ini[] = { /* Initialization parameters for UG-2832ASWAG or UG-2864ASWAG */ 0xDB, 0x3F, /* Vcom level */ 0xD9, 0x1F, /* Pre/Dis-charge period */ 0xA1, /* Column direction (L/R inverted) */ 0xC8, /* COM direction (U/D inverted) */ 0xDA, 0x12, /* COM scan alt mode */ 0xA8, 0x3F, /* Mux ratio (2832:1F, 2864:3F) */ 0xD5, 0xF0, /* Clock */ 0x81, 0x64, /* Contrast (2832:0x14, 2864:0x64) */ 0xD3, 0x00, /* Display offset (0) */ 0xAD, 0x8A, /* Internal DC-DC (off) */ 0xA6, /* Display invert mode (normal) */ 0xA4, /* Entire display (0) */ 0x40 /* Display start line (0) */ };
如果把这里的初始化参数改成SSD1306的,并且按照我修改的电路图中的连线方式,直接插上模块就可以正常使用了:
static const BYTE ini[] = { /* Initialization parameters for SSD1306 */ 0xAE,//--turn off oled panel 0x00,//--set low column address 0x10,//--set high column address 0x40,//--set start line address Set Mapping RAM Display Start Line (0x00~0x3F) 0x81,//--set contrast control register 0xCF,//--Set SEG Output Current Brightness 0xA1,//--Set SEG/Column Mapping 0xa0: horizonal reverse 0xa1: none 0xC8,//--Set COM/Row Scan Direction 0xc0: vertical reverse 0xc8: none 0xA6,//--set normal display 0xA8,//--set multiplex ratio(1 to 64) 0x3f,//--1/64 duty 0xD3,//--set display offset Shift Mapping RAM Counter (0x00~0x3F) 0x00,//--not offset 0xd5,//--set display clock divide ratio/oscillator frequency 0x80,//--set divide ratio, Set Clock as 100 Frames/Sec 0xD9,//--set pre-charge period 0xF1,//--Set Pre-Charge as 15 Clocks & Discharge as 1 Clock 0xDA,//--set com pins hardware configuration 0x12, 0xDB,//--set vcomh 0x40,//--Set VCOM Deselect Level 0x20,//--Set Page Addressing Mode (0x00/0x01/0x02) 0x02,// 0x8D,//--set Charge Pump enable/disable 0x14,//--set(0x10) disable 0xA4,//--Disable Entire Display On (0xa4/0xa5) 0xA6,//--Disable Inverse Display On (0xa6/a7) 0xAF //--turn on oled panel };
但是这里仍然有一些小问题,用这个方法屏幕虽然能显示,但是有2像素的偏移。注意看左上角的一个],其实那是右上角的电池标志的最右边的框。虽然这个无伤大雅,但是我不知道如何修正这个bug。
代码编译
作者给了一个Makefile文件,因此只要配置好编译环境,进入源文件路径直接执行make命令即可。但是有一个小细节是,Linux环境里必须先配置好arm-linux-eabi-gcc编译器(可以直接使用sudo apt-get install gcc-arm-none-eabi
,和apt-get install lsb-core
)才可以顺利的make。最终编译成功会在路径下生成一个obj文件夹,里面会有一个hex文件,终端里会显示这样。
hex下载进主控
这里出了大问题,原本我死活连不上这个单片机,一度以为是焊接的时候烧坏了芯片(好巧不巧的是我从原来的电路拆这个芯片,以及往新板上装这个芯片的时候都搞了半天才弄好)。结果看了一下多年前自己留下的记录才知道,下载的时候需要给芯片复位并且拉低某个引脚,进入ISP模式才行。具体操作是:将P2.10(ISP)置为低,同时让reset为低,然后先放开RST,再放开ISP,以加载BootLoader,不然flash magic识别不了芯片(LOW on this pin while RESET is LOW forces on-chip bootloader to take over control of the part after a reset.)
。判断方法是:使用flash magic,如果点击ISP-Read Device Signature能够出设备的ID,那就是成功连上了。
对于两个引脚的操作,需要自己手动用插线去接插这两个针脚到任意的GND上。当时画PCB的时候没有留意这部分的操作,当然你也可以拿去图纸,自己把这部分加两个按钮上去。下载器的TX口和RX口要接在主控板上面的RX和TX脚上。
另外,在下载程序时,尽量把另外两块板拿掉,我发现在Control Board上插着Analog Board的时候,在下载程序途中总是失败断开。有可能是供电不足的问题?
LC4256V
这部分原作者只给了一个abl文件,需要用ispLEVER classic操作一下,但是我在当年已经做过了操作,并且得到了直接往器件里面写的二进制文件。这部分代码确实是触及到了我的知识盲区,我实在改不动什么,所以就没有再仔细研究。至于下载的方法,首先用lattice下载线,接好线之后需要单独给主控板通电,下载线是不能供电的。之后利用软件操作。软件部分的编译下载等操作根据说明书操作即可。说明书也在github里面了。
调零
这里需要调整变阻器分压来控制传感器在最暗的环境下输出的信号强度,或者理解为零点校准。我们期望在完全无光的环境时图像值为0。如果需要调整曝光,希望在很暗的环境下也输出有一定亮度的图片也可以在这里调整。通过改变这个变阻器的阻值,遮住镜头,观察屏幕上的亮度强度到自己希望的位置即可(正常状态下,黑暗时屏幕上的光线曲线也在中央虚线位置)。但是要注意先设置算法层面的增益调为0再调整变阻器。
FS ERROR
开机是必需要插入内存卡的,不然会报错。但是如果你插了内存卡还是报错,检查你的内存卡格式,需要为FAT32才可以。现在的新内存卡都比较大,一般都是exFAT格式并且windows系统自带的右键格式化没法格式化为FAT32,可以用DiskGenius格式化,注意格式化前检查好数据情况。
最大记录长度
在lcam.h的第一行就是设定最大记录长度的参数,当相机的任意按钮被按下,或者达到最大记录长度时,记录停止。原始设定是100000,但是你可以改更大。不过注意,FAT32系统支持的最大文件大小是4GB。同时,BMP格式文件头里面通过bfSize定义文件大小,bfSize占4个字节,因此支持的最大文件存储也是4GB。
BMP图像转存PNG
当图像超过一定大小后,用普通的照片查看器甚至是Photoshop都可能无法正常打开文件,但是使用Windows自带的画图就可以查看。不能用PS编辑简直震怒,但是既然有些软件能查看有些没法查看,而且PS本身编辑操作很大的图片都没有问题,于是猜测可能是因为BMP编码的问题。因为这个BMP里面的颜色表信息是自定义的,也许PS对这方面的支持不是很好。
所以可以把原数据用python先读进内存,然后再转存成更加通用的PNG格式,既能压缩体积还能让PS编辑。代码非常简单。总共就几行,如下。懒得复制粘贴的话github里也有。
import cv2 image_path = 'Y0023.BMP' image = cv2.imread(image_path) cv2.imwrite('{}_modified.png'.format(image_path[:-4]), image)
光路与镜头
首先要确保镜头的像场能够覆盖CCD的长度。其次要根据所用镜头的卡口对应法兰距来设计机身法兰盘的外平面到传感器的距离。这里有一个灵魂手绘尺寸图,仅供参考。
机身我直接搞了个纸盒来装电路以及卡镜头,但是机身需要密闭不漏光,如果盒子上有漏光的窟窿(尤其是离传感器近的位置)最好补住。关于如何获得法兰盘,可以通过低价收废旧相机拆法兰盘,或者买最便宜的卡口转接环来获得。但是挑转接环时要注意法兰盘的公母之分。
图像撕裂问题
如果你用比较旧/杂牌/便宜的内存卡,会发现经常出现下面这种情况,
车尾部的断层说明这里的数据有卡顿,采集到的数据没有及时被存下来造成了丢帧。老潘使用过一个捡来的写速度相当慢的内存卡,经常出现这种情况。使用了一个新买的U1速度的内存卡,偶尔会出现这种情况。使用一个U3的内存卡,极少出现这种情况。
相机操作方法
在原作者的博客里面详细介绍了。此处无必要再次复制粘贴。
黑白拍照心得
老潘顺便还参悟了一些关于黑白摄影的体验。很多人说摄影是用光的艺术,尤其在黑白摄影里面,没有颜色加持,光线这一点就相当重要。例如这里的火车,因为是背光所以整个背光区域就显得非常平,没有质感,车体的棱条完全没感觉。但是车顶的布受光很好,显得起伏明显,光影变化很丰富。