Skip to main content

模块化 还是 End-to-End

似乎近期的论文卖点都是 End-to-End 大模型,堆上数据硬 train 一发,效果还比较好。

精心地改架构调参数,怎么总觉得是玄学呢?

我总希望神经网络真正走向只能那一天,揭晓的答案会是"模块化"的,即特定神经网络解决特定的问题,还有上层的网络负责决定选择哪些神经网络参与进来,如何参与,有点像当今的AutoML;但另一方面又反复地思考人脑怎样学会复杂的事情,似乎又并非"模块"化,因为人脑不会额外长出一个脑组织来学新知识,但在衰老以前总是能学会新的知识,并且似乎并非 End-to-End 训练,往往是先学会这步,再学下一步,"分段训练"

我一直认为,所谓神经网络的训练应该等同于人类的研究过程。


Comments

Popular posts from this blog

亦弟亦师

柯洁跟阿发狗学习围棋策略,自称非常痛苦,但是变得更强。 我现在把以前写的烂代码拿出来让AI继续开发修罢鸽,然后学习他是怎么修改的。

赛博佛主

现在的大语言模型越来越厉害,甚至可以在博士水平的考试中答满分。各个领域的人都可以寻求AI的帮助。 慢慢地,人们发现自己的诸事都可以不过脑,在 AI 指导下高质量完成,大脑逐渐退化成原始人。AI 在吸取了人类知识库的全部知识后,仍然可以自我博弈飞速进步。 到那个时候,人类中的大多数已经理解不了 AI 了,AI 成为无所不能的神,赛博佛主。 是否缺少文字或文物的断代文明,也是类似情况呢?

社会函数

人类社会互利互惠只会出现在比较初级的阶段,一旦引入竞争,就会出现损害他人利益的情况。但我认为这并不是注定或者说性本恶,而是每个个体都在做 argmax ,在不同资源配置下的不同输出。 所以地球上只有马斯克在朝正确方向前进,征服了其他星球,互利互惠的合作模式才能再次出现。