New Book - GPT Explained
正在写一本大概没人看的书:《GPT Explained》。
地址在这里:
https://www.soasme.com/gpt-explained/
但是,怎么说呢,是真的有点料啊。
当然,会的人大概不会看。不会的人看了也不一定就会了。知识嘛,从左耳进去,再从不知道哪里流走了。不含餐。
有点像我看完 3Blue1Brown 的 Transformer 视频。
看的时候:嗯嗯,是这样子的,没错,attention,QKV,softmax,残差连接,懂了懂了。
看完之后:刚才讲啥来着?
Karpathy 的 microGPT 其实还不错。但是啊,我发现我的问题不是“没人讲清楚”,而是“不自己写一遍就记不住”。
毕竟本人脑子长在手指头上。
以前是手指头敲一遍,脑子就多少会一点。现在 AI 来了,手指头都快废了。摔,不是脑残啊喂。
本书从 tokenization 开始,到 embedding,到 attention,到 transformer block,到训练。
很多年前,老耿头来 Auckland,问我:
“书写咋样了?”
嗨,还能咋样。
这么多年也没屙出什么来。
不过话说回来,没有 AI 我都不知道我这么能写书呢哈?
新书构造中。