New Book - GPT Explained

正在写一本大概没人看的书:《GPT Explained》。

地址在这里:

https://www.soasme.com/gpt-explained/

但是,怎么说呢,是真的有点料啊。

当然,会的人大概不会看。不会的人看了也不一定就会了。知识嘛,从左耳进去,再从不知道哪里流走了。不含餐。

有点像我看完 3Blue1Brown 的 Transformer 视频。

看的时候:嗯嗯,是这样子的,没错,attention,QKV,softmax,残差连接,懂了懂了。

看完之后:刚才讲啥来着?

Karpathy 的 microGPT 其实还不错。但是啊,我发现我的问题不是“没人讲清楚”,而是“不自己写一遍就记不住”。

毕竟本人脑子长在手指头上。

以前是手指头敲一遍,脑子就多少会一点。现在 AI 来了,手指头都快废了。摔,不是脑残啊喂。

本书从 tokenization 开始,到 embedding,到 attention,到 transformer block,到训练。

很多年前,老耿头来 Auckland,问我:

“书写咋样了?”

嗨,还能咋样。

这么多年也没屙出什么来。

不过话说回来,没有 AI 我都不知道我这么能写书呢哈?

新书构造中。