摘要:
自stable diffusion开源之后AIGC绘画方向定制化百花齐放百家争鸣。而c站 https://civitai.com/ 也聚集了全球爱好者的各种微调训练模型分享。 其中以lora为首,应用最广泛。 而这些模型是怎么训练出来的,细节到底是什么样的,没有多少人能说得清楚。 而就博主知道的, 阅读全文
摘要:
引子 博主很长一段时间都没有发文,确实是在忙一些技术研究。 如标题所示,本篇博文主要把近段时间的研究工作做一个review。 看过各种相关技术的公关文章,林林总总,水分很多。 也确实没有多少人能把一些技术细节用一些比较通俗的语言阐述清楚。 故此,再一次冠以大话为题,对AI绘画主要是stable di 阅读全文
摘要:
引子 经常有朋友询问博文以及开源相关问题, 但由于博文写后内容一般没有同步更新,而相关代码是有变更或者偶尔会有地址失效之类的问题。 故此觉得有必要写一篇博文大纲,用于整合更新大纲信息,后续便于统一回复一些常见的问题。 基础学习 Windows下C,C++开发环境搭建指南 分享用于学习C++音频处理的 阅读全文
摘要:
博主根据自身多年的深度学习算法研发经验,整理分享以下十条必知。 含参考资料链接,部分附上相关代码实现。 独乐乐不如众乐乐,希望对各位看客有所帮助。 待回头有时间再展开细节说一说深度学习里的那些道道。 有什么技术需求需要有偿解决的也可以邮件或者QQ联系博主。 邮箱QQ同ID:gaozhihan@vip 阅读全文
摘要:
很久没写博文,写这个,只是纯粹为了吐槽tf越升级,问题越多。 自TensorFlow 2.6 至 TensorFlow 2.9.1 各个IDE工具的tf.keras 自动补全失效了。 修正办法: 修改python的tensorflow包初始化文件: site-packages\tensorflow\ 阅读全文
摘要:
在这个特别日子里,举国欢庆,什么都可以缺席,大礼包不行。 本次开源针对CelebAMask-HQ中发丝部分进行细化的数据集。 该数据集可用于发丝分割等方向的研究和探索。 在过去的一年时间里,疫情改变很多人的工作和生活, 博主在过去一年里,大部分精力,扎在一个让人头疼的领域, 手机上实时发丝级别语义分 阅读全文
摘要:
引子 近一个月都在与字体打交道,查阅了不少资料。 发现国内很少有这方面的一些资源,有点奇怪。 故此,想稍微梳理一下这方面的一些资料以及信息,方便对这方面感兴趣的朋友参阅。 文字渲染的组成 文字渲染严格意义上来说包含几个主要的核心模块,分别是: 1.字体光栅化 FreeType 它是一个软件字体引擎, 阅读全文
摘要:
前言 2017年底时候写了这篇《集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序》 这也算是学习过程中比较有成就感的一个算法。 自2015年做算法开始到今天,还有个把月,就满五年了。 岁月匆匆,人生能有多少个五年。 这五年里,从音频图像到视频,从传统算法到深度学习,从2D到3D各 阅读全文
摘要:
Windows下C,C++开发环境搭建指南 前情提要 基于近一段时间很多网友发邮件反馈,说一些项目编译出现问题,诸如此类的情况。 就觉得很有必要写一篇C,C++开发环境的小指南,统一回复。 1.君欲善其事必先利其器 1.1.辅助开发利器推荐 作为一个老码农,有一些个人长期使用的辅助工具,分享给大家, 阅读全文
摘要:
近期比较忙, 抽空出来5.1开源献礼. 但凡学习音频降噪算法的朋友,肯定看过一个算法. <<语音增强-理论与实践>> 中提及到基于对数的最小均方误差的降噪算法,也就是LogMMSE. 资料见: <<Speech enhancement using a minimum mean-square erro 阅读全文