网站地图官方微信:
网站首页 南票区 宋店乡 毗卢镇 轸溪乡 廖场乡 wjj

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | postgres集群的选择? |

    我们需要谈谈困扰我几个月的事情。 我一直看到独立黑客和初创公...

    查看详情>>
  • | 自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵? |

  • | 2025年,为什么很多程序员都扔掉了Mac和Linux,开始拥抱Win11了? |

  • | PC电脑能不能当服务器用? |

  • | 学编程要不要买电脑? |

  • | Golang与Rust哪个语言会是今后的主流? |

  • | 都说时尚是一个轮回,有哪些老电视剧里面的穿搭到现在都还是很潮的呢? |

  • | 为什么感觉现在的国产电视剧越来越不堪入目? |

  • | 为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)? |

  • | 最近突发奇想,想做以NAS为主的家用媒体中心。下面是我做的一个草图,各位大神看看可行吗? |

  • | 有一个***约你出去,你会去吗? |

  • 我只能说,真正切题的回答来了,比回答里那些个美女来的切题的多...

    2025-06-25
  • 我养了13年的龟仔上周死了,它很活泼,很亲人,会跟着我走来走...

    2025-06-25
  • 看了完整版再来说两句,现在整个人是麻的。 果然还是那句话:比...

    2025-06-25
  • jenkins 部署 docker swarm服务一、Jen...

    2025-06-25

关注我们

添加微信好友,关注最新动态