您的位置: 首页> 大数据> 读大语言模型07高维数学

读大语言模型07高维数学

时间:2025-09-04 10:15:01 来源:互联网

1. 高维数学

1.1. 数学作为人类最重要的智慧成果之一,有望帮助我们揭示大语言模型和人脑的运作奥秘

1.2. 深度学习网络是一种完全透明且可用数学方法分析的复杂数学函数

1.3. 当前,一个专注于探索这些网络模型在高维空间中的几何特性和统计性质的数学新纪元已经来临

1.4. 把各自领域推向一个由海量数据构成的高维空间世界,也就是我们现在所处的时代

1.5. 机器学习早期的目标比人工智能要谦逊得多

1.6. 新数学

2. 尚未得到解释的矛盾现象悖论

2.1. 悖论1:陷入局部最小值

2.2. 悖论2:参数过多

3. 高维空间的福音

3.1. 确实存在一些随维度增加而变得更加困难的问题

3.2. 在动态规划(一种用于解决航线调度等优化问题的方法)中,理查德·贝尔曼发现,问题的难度会随着维度的增加而呈指数级增长,他将这种现象称为“维数灾难”​

3.3. 深度学习却展现出截然不同的特性:一些困难的问题反而会随着空间维度的增加而变得更容易解决,这就是所谓的“维度福音”​

3.4. 探索一个全新的函数类别通常需要几代数学家的持续努力

3.5. 如今,深度学习网络和Transformer作为一种新的函数类别,其数学理论研究才刚刚起步,很可能会推动数学领域出现一个全新的分支

4. 大型神经网络的几何特性

4.1. 当任务重复进行时,虽然每次的活动轨迹都不尽相同,但都会限制在高维空间特定的轨迹束内

4.2. 不同实验室在研究各种任务时都发现,轨迹束的维度通常为4~6个

4.3. 在某些任务中大脑活动呈现低维特性是可以预见的,因为大脑能够用相同的神经元执行多种动作而不会混淆

4.4. 数学家们对被称为流形的轨迹几何特性进行了深入研究

4.5. 流形理论

5. 因果关系

5.1. 虽然神经元活动与行为确实存在相关性,但这并不能证明两者之间存在因果关系

5.2. 要验证这一假设,一个方法是干扰神经元活动,观察是否会按预期影响行为表现

5.3. 如果其行为确实发生改变,解释结果就变得困难了,因为在具有复杂反馈通路的大脑中,抑制某一区域的活动可能会影响到其他区域的输入信号

5.4. 损毁实验还存在一个问题:可能会破坏通过损毁区域的通路纤维,这些纤维是连接远距离脑区的长程神经纤维

5.5. 预见到分子工具能让神经科学家以与大脑精细结构相匹配的精确度来探索大脑

5.6. 相关性与因果性的区别

5.7. 解释损伤

5.8. 新技术与通路纤维

5.9. 克里克的远见

5.10. 人工智能领域的因果推理

上一篇:MySQL 30 用动态的观点看加锁 下一篇:【顶会论文】时序数据库 Apache IoTDB 论文获 VLDB 2025 录用,集群秒级扩容性能“解密”

相关文章

相关应用

最近更新