о фундаментальном / Politics / Telegram Index

Open in telegram

☆☆☆☆☆

⚑ Report channel

318 @o_fundamentalnom

Description

Если это одновременно просто, важно, мощно, красиво, естественно, восхитительно, общо и всепронизывающе — или если для полного изъяснения вам не хватает языка и вы вдруг находите его в каком-то диалекте математики — значит это о фундаментальном.

Advertising

We recommend to visit

Kadyrov_95

2,061,197 @rkadyrov_95

Любите Пророка, читайте салават!

https://t.me/RKadyrov_95?boost
https://t.me/boost/kadyrov_95chat
Vkontakte: https://vk.com/ramzan
Twitter: https://twitter.com/rkadyrov

Last updated 2 weeks, 1 day ago

Дмитрий Медведев

1,383,649 @medvedev_telegram

Last updated 2 months, 2 weeks ago

ЛОРД

1,326,451 @mdaudov_95

Команда КРА

Председатель Правительства ЧР
Герой России
Магомед Даудов

ВК: https://vk.com/magomeddaudov

Last updated 1 month ago

2 months, 3 weeks ago

вдруг осознал, что reinforcement learning — это ближайший родственник разностных уравнений.

(кстати разностные уравнения — ближайшие родственники дифференциальных уравнений)

RL policies — это всё, что у нас обычно в диффурах стоит в правой части.

а если вы говорите про higher order RL-policies (Meta RL, HRL, Multi-Level Policies, L2L, RL-policies of RL-policies), то всё это как бы — про системы дифференциальных уравнений высшего порядка.

Хотелось написать "Вот и всё." в конце.
Нет, конечно. Не всё.

Одно из главных отличий между RL и системой диффуров — RL сразу бросают в холодные пучины недифференцируемых поверхностей.

RL — это скорее про системы стохастических дифференциальнных уравнений

P.S. я выше писал, что человеческие эмоции — это просто RL-policies у нас, у кожаных мешков. Ну, вот, получилось, что эмоции — это просто производные разных порядков в системе кожаных стохастических дифференциальных уравнений.

259 #

4 months, 1 week ago

У меня вполне внушительный опыт в программировании -- 35 лет. Писал на многих языках, и ещё на многих читал.

Вчера был второй день моей жизни, когда я весь день программировал на человеческих языках.

Боюсь, пришла эра, когда т.н. высокоуровневые языки программирования начнут уходить "под капот". Может не в той же мере, в какой ушёл под капот ассемблер, но изменение будет колоссальным, тектоническим.

Не удивлюсь, если в резюме программисты станут не стесняясь писать "язык программирования -- английский, другими не владею"

Нынешние языки программирования останутся, но станут более нишевыми профессиональными скилами, какими нынче являются знания библиотек, фреймворков и платформ.

Эра силиконовых языков капсулизируется. Гусеницы силиконовых языков превращаются в куколки.

Какие бабочки ожидаются?

522 #

4 months, 2 weeks ago

Мы хотим пользоваться лучшими ИИ.
Это задаёт эволюцию в ИИ.
Лучшие модели выживают, худшие уходят в небытие.
Однако мы, люди — это очень медленный фидбек этого эволюционного RL-цикла в ИИ.

Не нужно быть семи пядей во лбу, чтобы понять, что человек вскоре будет выкинут из эволюционного цикла ИИ — чтобы модели стали круче, чтобы крутые модели появлялись раньше, чтобы специализированных моделей стало не просто больше, а чтобы их стало во намного раз больше, чем людей.

в один день мы осозна́ем, что ИИ-агенты уже эволюционируют без нас, что там уже своя атмосфера развития, и эта атмосфера понятна нам лишь кое-где — так же, как нам понятен машинный код откомпилированной программы — лишь чуть-чуть, лишь кое-где.

Эволюция ИИ еще толком не началась, но старт очень близок

537 #

6 months, 1 week ago

предсказание следующей буквы в тексте стало ключевым в целеполагании для громадного успеха LLM.

вангую, что установка на предсказание следующих текстов в хронологически отсортированных текстах станет не меньшим потрясением.

отношение порядка для букв играет ключевую роль для развития нарратива текста. Но для понимания и предсказания того, куда мы идем в историческом масштабе важно сортировать не только буквы.

текст — это одномерная структура, а множество текстов, пусть даже отсортированных во времени — все же нет. Отчасти и поэтому, уверен, что в этом контексте опять будут востребованы идеи, которые использовали в Stable Diffusion моделях.

Каждый текст — это как цветной многомерный пиксель в историческом кино. Мы знаем приблизительно на каком кадре этого кино этот текстовый пиксель появился. А еще, в отличие от обычного кино, "цветовое" (векторное) значение этих текстовых пикселей не любит исчезать со временем.

Историческое кино как бы все время растет в своей размерности, ибо старые кадры проглядываются сквозь свежие.

272 #

6 months, 3 weeks ago

а вот и вторая — о том, чем именно распоряжаются эмоциональные состояния.

довольно очевидно, что эмоциональные состояния (читайте RL-policies) — это про "казначейство" энергии, которой располагает агент. Но это лишь при первом поверхностном взгляде. Если энергия не является дефицитным для агента(*) ресурсом, то остается другой более фундаментально дефицитный ресурс.

Это истинно дефицитный ресурс — время.

Даже если у агента кроме дешевого доступа к энергии есть еще широкие возможности для дешевого распараллеливания, то все равно прогнозирование сугубо последовательных процессов будет пожирать ваш самый дефицитный ресурс — время.

Другими словами, возможно самым важным ресурсом, относительно которого происходит казначейство в "эмоциях" агента — это именно время, а лишь вслед за этим идет казначейство вычислительной материи и энергии, необходимой на вычисления.

—
() агент* — это просто термин для обозначения 'динамическая система, обособленная в своих границах относительно окружающей среды'

260 #

7 months ago

комрад @Silveroboros скинул мне перл. Это пример фундаментального взгляда на историю диффуров (предположительно цитата Ю.С. Ильяшенко, ноэтонеточно) :

История дифференциальных уравнений:

1 Ньютон: «Дано уравнение. Решить его»;
2 Пуанкаре: «Дано уравнение. Описать свойства его решений, не находя их, не пытаясь их вычислить»;
3. Андронов: «Не дано дифференциальное уравнение. Описать свойства его решений»;

358 #

8 months, 2 weeks ago

когда вы впервые задумались о том,

что существует всего лишь 2 (два!) распространенных способа универсально задать закон распределения случайной величины?
"универсально" — то есть, не опираясь на существование моментов и не опираясь на конечность случайной величины?
Эти способы — это функция распределения (CDF) и характеристическая функция (CF)
а о том, что CF обычно опирается на скалярное произведение евклидвого пространства, а скалярное произведение евклидового пространства — это просто частный случай скалярного произведения в гильбертовых пространствах?

Другими словами, вы можете ввести туеву хучу разных собственных скалярных произведений и "вырастить" на них свои необычные характеристические функции?

Например, вы можете положить вейвлеты в основу ваших CF.

что работа с CDF не требует гильбертовости, и даже не требует линейности от вашего топологического векторного пространства, т.е CDF работает в любых векторных пространствах, где есть отношение порядка для каждой координаты.

И все это за довольно символическую плату в одномерном случае: эффективная работа с CDF потребует сортировку, т.е. вычислительная сложность будет O(n*log(n)), где n — это число наблюдений. В то время как для CF вычислительная сложность будет O(n), но от вас потребуют полноценную гильбертовость!

664 #

11 months, 2 weeks ago

Если вас спросят, что такое диффузия, то попробуйте зарядить вот такой ответ:

Diffusion is a multi-resolution multi-headed gradient descent

513 #