Date: 2022-10-17 02:03 pm (UTC)
dmm: (Default)
From: [personal profile] dmm
Чем дальше читаю, тем больше там интересных деталей (фазовые переходы, и как процесс тренировки самостоятельно переоткрывает преобразование Фурье, и всякое такое):

https://www.alignmentforum.org/posts/N6WM6hs7RQMKDhYjB/a-mechanistic-interpretability-analysis-of-grokking

Очень, очень интересно...

*******

Но, в целом, народ в этой области по-прежнему вполне слеп и глух; вот эта замечательная и, вроде бы, очень известная работа Anthropic прошлого года:

https://transformer-circuits.pub/2021/framework/index.html

совсем мало всё это цитируется:

https://scholar.google.com/citations?user=GLnX3MkAAAAJ&hl=en&oi=ao

Ну, может, дойдёт со временем... (Но, пока что, те, до кого дойдёт раньше, чем до толпы, будут иметь большое преимущество.)
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

dmm: (Default)
Dataflow matrix machines (by Anhinga anhinga)

May 2025

S M T W T F S
    123
456 78910
11 121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 20th, 2025 12:02 am
Powered by Dreamwidth Studios