人工智能杂感
怎么让电脑理解“坐”这个概念,如"坐在椅子上"、“坐在石头上”?“臀部的支撑感?” :-) 电脑可能又问了“可是什么是臀部?” 等发明了电臀,再教“苹果是脆的,好吃的“,”吃砒霜会死人的“,电脑又该问问题了,接着发明电子舌头吧。等各种感觉器官都发明完了,四肢等等也得优化…… 这比生个孩子再教他/她还要费劲嘛。而且以人脑来研究人脑,我怀疑不能整得非常明白。所以窃以为对国家来说,教育比AI更重要。
人的五官和四肢有很大局限性。雷达(Radio Detection and Ranging System)可以穿过云雾看到很远的地方。高档的图像识别也许可以用来引导导弹攻击隐形飞机,它又不是可见光隐形。How Radar Works (bom.gov.au)
图像识别、语音识别、矿井里"闻"有没有瓦斯等等等等,都很有意义。随着计算能力的飞速提高,准确率比以前也高了很多。可惜现在模型搞得非常巨大,像刷榜一样刷数字。好像准确率降一点,模型可以小不少。
Image recognition is the ability of a computer powered camera to identify and detect objects or features in a digital image or video. 有图像识别这个叫法,为啥还要有计算机视觉computer vision? 没有计算机听觉这个词啊。我倒不反对计算机视觉,不过真正爱一行的都是能耐住清贫长期研究的。到处拉经费就可疑了。
昆虫有复眼,电子仿生学应该还是比较靠谱的。
80年代就有人想做生产线自动挑出质量不好的牙签,以当时的计算能力不现实。再如电视吹走空肥皂盒的笑话,不一定啥都要图像识别吧。"过去工人要盯着强光挑牙签,现在只要标出坏牙签的图片即可"。1. 哦,靠人标数据啊。2. 标完不失业?
啥都放在云上,网断了咋办?在厂子里摆一台服务器,贴上封条,通过网络能远程升级行不行?配有紧急情况下使用的license。比如每分钟600个口罩,它们的图像/特征值不必传到遥远的云。服务器每1小时把license传到云,AI云服务厂商能知道工厂在用紧急或盗版的license. 部分代码用FPGA实现,终端用户盗不了版。互联网精神是啥?抓别人数据的时候喊开放,自己的数据则捂得死死的?开放共享1TB的数据大家拼算法啊?100TB的话小玩家可能下载不起。
补充: 计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息。哦,语音识别好像不强调立体声双耳朵。声纳也能定位啊。Sonar (sound navigation and ranging) is a technique that uses sound propagation (usually underwater, as in submarine navigation) to navigate, communicate with or detect objects on or under the surface of the water, such as other vessels. 名字咋就这么朴实涅?
还有: 判断整张图片是不是(一只)猫和判断图片中含不含猫,含几只猫好像不太一样。语音识别好像还没有做到3个人的声音混杂在一起,不仅能都识别出来,还能把人也标出来,即:Speaker+Speech Recognition, SSR, or 4S: Superb Simultaneous. I'm kidding, 只是觉得名字很气派。
Kinect was the controller-free interface for the Xbox 360. Although Kinect set a world record for the fastest-selling consumer electronics device in its first 60 days (eight million units), manufacturing ceased in late 2017. As Cult of Mac reveals, PrimeSense (who developed the technology behind the Kinect, and who do in fact still own the design and the IP, free of Microsoft influence) had developed some of the key systems inside Kinect in mid-2008. 如此牛B,何必外购?
踏雪点圣火,冰雕刻五环!揭秘全球刷屏的冬奥开幕式黑科技 北京冬奥从开幕式就黑科技爆了!
发展历程-京东方官网 (boe.com) 价值与理念-京东方官网 (boe.com)
Understanding Human Motion with 3D Athlete Tracking (intel.com)
百度AI开放平台-全球领先的人工智能服务平台 (baidu.com)
The MPEG-7 visual standard for content description - an overview - Circuits and Systems for Video Technology, IEEE Transactions on (columbia.edu) MPEG-7于1998年10月提出。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?