网站地图官方微信:
网站首页 兴城市 延寿县 埠江镇 丁寨乡 沤江镇 杉树镇

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 明明无线鼠标有那么多优点,为什么还有那么多人买有线鼠标? |

    我有一个绝妙的点子,解决蓝牙鼠标容易被忘在会议室、实验室、高...

    查看详情>>
  • | 你手机中最舍不得卸载的APP是什么? |

  • | 如何看待国内开源项目的不可持续性? |

  • | 各位都在用Docker跑些什么呢? |

  • | 为何雷军天天健身,却无健身痕迹? |

  • | 为什么 CRT 画质这么好也被淘汰,液晶反而发展的很好? |

  • | 江西一救护车转运重症患儿 800 公里收 28000 元遭质疑,争议点是什么?哪些信息值得关注? |

  • | MacOS真的比Windows流畅吗? |

  • | 亚洲体坛最漂亮的十位女运动员都有谁? |

  • | 为什么现在知乎有一种j***a运行速度很慢,很吃***的论调? |

  • | 如何看待同样被美国制裁,小米反诉成功,明明是小米不跪,小米却不断被黑? |

  • 确实是,遇到了骚操作了。 项目正常进行,甲方把外包大批量裁了...

    2025-06-23
  • 我测试了下做PPT这个需求,并且用Manus做了一样的事,结...

    2025-06-23
  • 引言玩NAS的相信都折腾过影视库这东西,不管你是用第三方的项...

    2025-06-23
  • FrontPage是被微软自己淘汰的,不是被市场淘汰的。 ...

    2025-06-23

关注我们

添加微信好友,关注最新动态