Skip to main content

人脑处理视觉信息与CNN 处理视觉信息

人看东西是从轮廓到细节,而 CNN 是从细节到大体。
人识别车牌的过程大体是:看见车,到差不多的位置去看车牌,再阅读车牌的内容,某些看不清的字符还可以结合其他知识来辨识,比如所在城市。如果光线不好看不清车的轮廓,还可以因为看清了车牌而增强识别车的自信度。似乎不同的知识可以彼此增强。
CNN似乎是自底层向上传递信息,目前还没看到过上面的信息会增强底层信息的架构;这可能是一个很好的提升模型的切入点:能否设计出神经网络的结构类似于人脑处理视觉?

还有个问题是:人脑/眼真的是先识别轮廓吗?


Comments

Popular posts from this blog

博览群书的傻子

现在是2024年底。我对于当前的AI评价就如标题描述。大语言模型让自然语言搜索变得顺畅,但是知识体系仍然基于训练集的正确性。 我在了解iPhone越狱现状时发现了一批假工具,在GitHub有介绍但是没源码,下载时需要先付费给某商店。当我为此询问AI助手时,它总结并引用了我见过的那些假工具,"不假思索"地。 不过仍认为现在的神经网络走对了方向,只是道路还很漫长。

社会函数

人类社会互利互惠只会出现在比较初级的阶段,一旦引入竞争,就会出现损害他人利益的情况。但我认为这并不是注定或者说性本恶,而是每个个体都在做 argmax ,在不同资源配置下的不同输出。 所以地球上只有马斯克在朝正确方向前进,征服了其他星球,互利互惠的合作模式才能再次出现。