Skip to main content

人脑处理视觉信息与CNN 处理视觉信息

人看东西是从轮廓到细节,而 CNN 是从细节到大体。
人识别车牌的过程大体是:看见车,到差不多的位置去看车牌,再阅读车牌的内容,某些看不清的字符还可以结合其他知识来辨识,比如所在城市。如果光线不好看不清车的轮廓,还可以因为看清了车牌而增强识别车的自信度。似乎不同的知识可以彼此增强。
CNN似乎是自底层向上传递信息,目前还没看到过上面的信息会增强底层信息的架构;这可能是一个很好的提升模型的切入点:能否设计出神经网络的结构类似于人脑处理视觉?

还有个问题是:人脑/眼真的是先识别轮廓吗?


Comments

Popular posts from this blog

404

如果你清楚地记得一件事曾经发生,但是已经找不到任何记录,没有照片、没有视频、没有痕迹,那么,这件事真的发生过吗? 如果一群人虚构了一个朝代或者一段文明,后代如何证伪?

博览群书的傻子

现在是2024年底。我对于当前的AI评价就如标题描述。大语言模型让自然语言搜索变得顺畅,但是知识体系仍然基于训练集的正确性。 我在了解iPhone越狱现状时发现了一批假工具,在GitHub有介绍但是没源码,下载时需要先付费给某商店。当我为此询问AI助手时,它总结并引用了我见过的那些假工具,"不假思索"地。 不过仍认为现在的神经网络走对了方向,只是道路还很漫长。

阿拉伯谚语

我们不能随便生气。生气的时候,你会使出真本领。这样,别人就会知道你的真本领很烂。