Нейронные наброски

Description
Статьи и мысли о DL, RL и NLP (а может и еще о чем-то)

Делаю LLM для кода в poolside https://www.linkedin.com/in/nzinov/
We recommend to visit

Community chat: https://t.me/hamster_kombat_chat_2

Website: https://hamster.network

Twitter: x.com/hamster_kombat

YouTube: https://www.youtube.com/@HamsterKombat_Official

Bot: https://t.me/hamster_kombat_bot

Last updated 1 week ago

Your easy, fun crypto trading app for buying and trading any crypto on the market.
📱 App: @Blum
🤖 Trading Bot: @BlumCryptoTradingBot
🆘 Help: @BlumSupport
💬 Chat: @BlumCrypto_Chat

Last updated 5 months, 3 weeks ago

Turn your endless taps into a financial tool.
Join @tapswap_bot


Collaboration - @taping_Guru

Last updated 3 weeks, 1 day ago

3 months, 1 week ago
Как обычно много работы, поэтому статей …

Как обычно много работы, поэтому статей тут не так много, но держите хотя бы новости про нас https://poolside.ai/checkpoint/unveiling-our-partnership-with-aws

4 months, 2 weeks ago
А в этой статье интересным образом …

А в этой статье интересным образом пытаются развязать выучивание знаний и выучивание "навыков" на этапе finetuning https://arxiv.org/abs/2410.19290

4 months, 2 weeks ago
Очень неплохая статья, которую стоит прочесть, …

Очень неплохая статья, которую стоит прочесть, чтобы узнать о том, как можно использовать scaling laws для подбора оптимальной архитектуры и гиперпараметров, избежав при этом дорогих абляций на больших моделях. Конкретные детали не так важны, как общая концепция muTranssfer + scaling law + гридсерч по семействам маленьких моделей https://arxiv.org/abs/2304.06875v4

5 months, 1 week ago

А вот вышло хорошее интервью нашего фаундера на подкасте 20VC

5 months, 2 weeks ago

Очень любопытная статья, позволяет взглянуть на alignment с новой (как минимум для меня) стороны

7 months, 3 weeks ago

Очень неплохая статья, где пробуют теоретически объяснить, почему DPO и подобные offline алгоритмы (где мы не семплируем из политики а только учимся на уже имеющихся примерах) работают хуже, чем online алгоритмы. И, что еще лучше, предлагают простой способ побороться с этим: давайте во время обучения DPO семплировать on policy примеры и просто считать на них не реворд какой-нибудь, а KL дивергенцию с исходной политикой, и добавлять в лосс

We recommend to visit

Community chat: https://t.me/hamster_kombat_chat_2

Website: https://hamster.network

Twitter: x.com/hamster_kombat

YouTube: https://www.youtube.com/@HamsterKombat_Official

Bot: https://t.me/hamster_kombat_bot

Last updated 1 week ago

Your easy, fun crypto trading app for buying and trading any crypto on the market.
📱 App: @Blum
🤖 Trading Bot: @BlumCryptoTradingBot
🆘 Help: @BlumSupport
💬 Chat: @BlumCrypto_Chat

Last updated 5 months, 3 weeks ago

Turn your endless taps into a financial tool.
Join @tapswap_bot


Collaboration - @taping_Guru

Last updated 3 weeks, 1 day ago