这篇论文自4月30日发布,短短五一期间,一周时间,已经在paperwithcode上获得了7248个标星,可以说是非常火了,而且其声称可以用来替代MLP,而且作者单位麻省理工,所以阅读一下做一些笔记。
关键词:替代MLP、人工智能可解释性、参数效率
基本内容
为了解决什么问题?
MLPs在非线性回归、数据拟合、偏微分方程求解以及科学发现中存在一些限制,如固定激活函数的局限性、参数效率低、可解释性差等。
论文原话:如在transformer中:MLPs consume almost all non-embedding parameters and are typically less interpretable (relative to attention layers) without post-analysis tools.(mlp消耗了几乎所有的非嵌入参数,并且在没有分析后分析工具[5]的情况下,相对于注意层通常更难以解释)。
...大约 11 分钟