Dataflow matrix machines (by Anhinga anhinga) (
dmm
) wrote
2022-10-17 02:03 pm (UTC)
no subject
Чем дальше читаю, тем больше там интересных деталей (фазовые переходы, и как процесс тренировки самостоятельно переоткрывает преобразование Фурье, и всякое такое):
https://www.alignmentforum.org/posts/N6WM6hs7RQMKDhYjB/a-mechanistic-interpretability-analysis-of-grokking
Очень, очень интересно...
*******
Но, в целом, народ в этой области по-прежнему вполне слеп и глух; вот эта замечательная и, вроде бы, очень известная работа Anthropic прошлого года:
https://transformer-circuits.pub/2021/framework/index.html
совсем мало всё это цитируется:
https://scholar.google.com/citations?user=GLnX3MkAAAAJ&hl=en&oi=ao
Ну, может, дойдёт со временем... (Но, пока что, те, до кого дойдёт раньше, чем до толпы, будут иметь большое преимущество.)
(
5 comments
)
Post a comment in response:
From:
Anonymous
This account has disabled anonymous posting.
OpenID
Identity URL:
Log in?
Dreamwidth account
Account name
Password
Log in?
If you don't have an account you can
create one now
.
Subject
HTML doesn't work in the subject.
Formatting type
Casual HTML
Markdown
Raw HTML
Rich Text Editor
Message
[
Home
|
Post Entry
|
Log in
|
Search
|
Browse Options
|
Site Map
]
no subject
https://www.alignmentforum.org/posts/N6WM6hs7RQMKDhYjB/a-mechanistic-interpretability-analysis-of-grokking
Очень, очень интересно...
*******
Но, в целом, народ в этой области по-прежнему вполне слеп и глух; вот эта замечательная и, вроде бы, очень известная работа Anthropic прошлого года:
https://transformer-circuits.pub/2021/framework/index.html
совсем мало всё это цитируется:
https://scholar.google.com/citations?user=GLnX3MkAAAAJ&hl=en&oi=ao
Ну, может, дойдёт со временем... (Но, пока что, те, до кого дойдёт раньше, чем до толпы, будут иметь большое преимущество.)