Skip to main content

人脑处理视觉信息与CNN 处理视觉信息

人看东西是从轮廓到细节,而 CNN 是从细节到大体。
人识别车牌的过程大体是:看见车,到差不多的位置去看车牌,再阅读车牌的内容,某些看不清的字符还可以结合其他知识来辨识,比如所在城市。如果光线不好看不清车的轮廓,还可以因为看清了车牌而增强识别车的自信度。似乎不同的知识可以彼此增强。
CNN似乎是自底层向上传递信息,目前还没看到过上面的信息会增强底层信息的架构;这可能是一个很好的提升模型的切入点:能否设计出神经网络的结构类似于人脑处理视觉?

还有个问题是:人脑/眼真的是先识别轮廓吗?


Comments

Popular posts from this blog

亦弟亦师

柯洁跟阿发狗学习围棋策略,自称非常痛苦,但是变得更强。 我现在把以前写的烂代码拿出来让AI继续开发修罢鸽,然后学习他是怎么修改的。

赛博佛主

现在的大语言模型越来越厉害,甚至可以在博士水平的考试中答满分。各个领域的人都可以寻求AI的帮助。 慢慢地,人们发现自己的诸事都可以不过脑,在 AI 指导下高质量完成,大脑逐渐退化成原始人。AI 在吸取了人类知识库的全部知识后,仍然可以自我博弈飞速进步。 到那个时候,人类中的大多数已经理解不了 AI 了,AI 成为无所不能的神,赛博佛主。 是否缺少文字或文物的断代文明,也是类似情况呢?

社会函数

人类社会互利互惠只会出现在比较初级的阶段,一旦引入竞争,就会出现损害他人利益的情况。但我认为这并不是注定或者说性本恶,而是每个个体都在做 argmax ,在不同资源配置下的不同输出。 所以地球上只有马斯克在朝正确方向前进,征服了其他星球,互利互惠的合作模式才能再次出现。