Skip to main content

模块化 还是 End-to-End

似乎近期的论文卖点都是 End-to-End 大模型,堆上数据硬 train 一发,效果还比较好。

精心地改架构调参数,怎么总觉得是玄学呢?

我总希望神经网络真正走向只能那一天,揭晓的答案会是"模块化"的,即特定神经网络解决特定的问题,还有上层的网络负责决定选择哪些神经网络参与进来,如何参与,有点像当今的AutoML;但另一方面又反复地思考人脑怎样学会复杂的事情,似乎又并非"模块"化,因为人脑不会额外长出一个脑组织来学新知识,但在衰老以前总是能学会新的知识,并且似乎并非 End-to-End 训练,往往是先学会这步,再学下一步,"分段训练"

我一直认为,所谓神经网络的训练应该等同于人类的研究过程。


Comments

Popular posts from this blog

404

如果你清楚地记得一件事曾经发生,但是已经找不到任何记录,没有照片、没有视频、没有痕迹,那么,这件事真的发生过吗? 如果一群人虚构了一个朝代或者一段文明,后代如何证伪?

博览群书的傻子

现在是2024年底。我对于当前的AI评价就如标题描述。大语言模型让自然语言搜索变得顺畅,但是知识体系仍然基于训练集的正确性。 我在了解iPhone越狱现状时发现了一批假工具,在GitHub有介绍但是没源码,下载时需要先付费给某商店。当我为此询问AI助手时,它总结并引用了我见过的那些假工具,"不假思索"地。 不过仍认为现在的神经网络走对了方向,只是道路还很漫长。

阿拉伯谚语

我们不能随便生气。生气的时候,你会使出真本领。这样,别人就会知道你的真本领很烂。