Unlock a World of Free Content: Books, Music, Videos & More Await!

Kyryl opens ML

Description
Advertising
We recommend to visit

просто блог 18-річного про заробіток, криптовалюту і життя

Реклама: @reklama_rdeni
Власник: @rostikdeni

Last updated 2 months ago

Офіційний канал Binance 🇺🇦

🔸Telegram https://t.me/BinanceUkrainian
🔸TikTok https://www.tiktok.com/@binanceukraine
🔸Instagram www.instagram.com/binanceukraine
🔸Twitter www.twitter.com/BinanceUkraine
🔸YouTube https://www.youtube.com/c/BinanceUkraine

Last updated 4 days, 10 hours ago

- Ф‘ючерсна торгівля та сигнали🔸
- Новини,факти,думки🔸
- Як торгувати,купляти та заробляти на Крипті🔸
- Корисні поради по ринку,аналіз монет 🔸

🤝 Реклама/ Співпраця :
@spasitelCEO

Last updated 9 months, 2 weeks ago

1 month, 3 weeks ago

Не забудьте поставити будильник на 10 am PT сьогодні!

Уже через декілька годин відбудеться нова презентація від OpenAI, на яку я чекаю з нетерпінням. Ми вже давно не отримували ніяких оновлень від них. Останнім часом про це ходить багато чуток, і існує переважно дві точки зору:

1️⃣ Ми можемо бути на стадії вичерпання можливостей AI
Ця думка походить з різних джерел, але ось мої два улюблені:

👉 Has Generative AI Already Peaked? - Computerphile
👉 Evidence that LLMs are reaching a point of diminishing returns — and what that might mean2️⃣ На нас чекає наступний величезний стрибок
Ця точка зору в основному виходить з виступів CEO OpenAI та загадкового Chat-GPT2. Хороша новина - те, що ви будуєте, покращиться з цими новими апдейтами, погана - нові апдейти повністю замінять ваш продукт.

👉 The Possibilities of AI , Which Companies Will Be Steamrolled by OpenAI?
👉 gpt2-chatbot

В якому ви таборі? Я чув, що деякі люди навіть роблять ставки на це!

YouTube

Has Generative AI Already Peaked? - Computerphile

Bug Byte puzzle here - https://bit.ly/4bnlcb9 - and apply to Jane Street programs here - https://bit.ly/3JdtFBZ (episode sponsor). More info in full description below ↓↓↓ A new paper suggests diminishing returns from larger and larger generative AI models.…

2 months, 1 week ago

Новий спосіб "тренування" LLM

Ми всі знайомі з кількома філософіями тренування LLM.

1️⃣ Full Fine-Tuning — тренуйте всі свої параметри
2️⃣ PEFT (LoRA, DoRA тощо) - тренуйте лише невелику частину потрібних матриць.

💡Але є ще й новий спосіб, про який я дізнався тільки нещодавно: Representation Fine-Tuning (ReFT) — основна ідея полягає в тому, що ви навчаєтесь змінювати репрезентацію вхідних даних замість параметрів моделі!

В 10-50 разів менший за будь-який PEFT спосіб, при цьому перевершуючий його!
👉 https://github.com/stanfordnlp/pyreft

Виглядає дуже багатообіцяюче!

GitHub

GitHub - stanfordnlp/pyreft: ReFT: Representation Finetuning for Language Models

ReFT: Representation Finetuning for Language Models - stanfordnlp/pyreft

**Новий спосіб "тренування" LLM**
2 months, 4 weeks ago

Чому всі бенчмарки брешуть

Як ви уже знаєте, я обожнюю драми в індустрії, і одна з останніх стосується TensorFlow/Flax та PyTorch.

В чому суть: команда TensorFlow/Flax створила бенчмарк, який включав PyTorch. Команда PyTorch не погодилася з результатами, тому вони перезапустили бенчмарки та отримали кращі результати.

Цікаво спостерігати за цим публічно. +1 доказ того, що, хоча публічні бенчмарки можуть бути корисними гайдами, але вам завжди слід перевіряти їх самостійно для вашого конкретного випадку.

Оригінальні твіти були видалені,
- https://twitter.com/JeffDean/status/1774638521657196767
- https://twitter.com/soumithchintala/status/1776311683385880983
і я думаю, що обидві команди, яких я вважаю дуже крутими, працюють над публікацією нових, більш узгоджених бенчмарків разом!

Тут сказано про це: https://twitter.com/soumithchintala/status/1776431955845759222

X (formerly Twitter)

Jeff Dean (@🏡) (@JeffDean) on X

Important caveat: I'm told the Pytorch development team hasn't fully vetted these benchmarks yet, so take the native Pytorch results with a grain of salt. I would mostly use these as a comparison of the performance of different backends for Keras.

3 months, 3 weeks ago

PR по фактах

Зараз багато шуму навколо Devin від Cognition. Вчора команда опублікувала деякі деталі: час виконання, TTD та потенційні проблеми з даними в тренувальному датасеті.

Я люблю глибше занурюватися в оригінальне джерело; в твітері і лінкедині дуже багато BS, але код і коміти ніколи не брешуть (майже).

Давайте подивимось на цей PR. Вражає! Автори не прийняли його і закрили подібну фічу через “human mande” PR, але все одно це гарна спроба + коментарі веселі!

Зараз слідкую - замерджить Andrej Karpathy цей PR чи ні.

Linkedin

Cognition | LinkedIn

Cognition | 519 followers on LinkedIn. We are an applied AI lab focused on reasoning, and code is just the beginning. | Makers of Devin, the first AI software engineer. We are an applied AI lab focused on reasoning. We’re building AI teammates with capabilities…

**PR по фактах**
3 months, 3 weeks ago

Triton inference server і компанїї на його основі

Я люблю компанії, які розроблять продукти в open-source і заробляють за допомогою додаткових оферингів на його основі. І, звичайно, намагаються уникати проблем, подібних до Elastic з AWS.

Одним з помітних винятків тут є Triton Inference Server - публічний inference server від Nvidia, який має відносини один до багатьох: існує кілька компаній, що створюють продукти на його основі.

Я знайшов принаймні чотири:
1️⃣ Seldon
2️⃣ ClearML
3️⃣ AWS SageMaker
4️⃣ І, звичайно, сама Nvidia.

Безсумнівно, їх набагато більше! Мені цікаво, чи колись команда Triton сама ініціює створення власної компанії.

Elastic Blog

Amazon: NOT OK - why we had to change Elastic licensing

We've had a few questions about our recent license change to Elasticsearch and Kibana....

**Triton inference server і компанїї на його основі**
4 months ago

Компанії-розробники AI чіпів

Nvidia зі своїм hardware (Nvidia GPU, H100, A100 тощо) + software(CUDA) є стандартом для тренування та деплою ML моделей, але існує і багато інших чіпів. Наприклад, зовсім нещодавно Groq представила LPU, і багато інших.

Ось невеликий список стартапів і великих технологічних компаній, які займаються розробкою чіпів для ML, і за якими я слідкую:

Startups
🟢 Public:
- Cerebras (WSE-2)
- GraphCore (IPU)

🟥 Internal:
- Groq (LPU) - available only via LLM API

Big Tech
🟢 Public:
- AWS Graviton
- AWS Trainium
- AWS Inferentia
- Google TPUs
- Intel habana

🟥 Internal:
- Meta: MTIA 
- Tesla: FSD Chip and Dojo Chip
- Microsoft: Maia 100

Якщо ви хочете глибше зануритись - перегляньте цю серію публікацій: AI Accelerators — Part IV: The Very Rich Landscape від Adi Fuchs.

Те, чого я особисто вважаю не вистачає - неупереджені та зрозумілі бенчмарки для різних чіпів і задач. Існують деякі від HF, наприклад, але схоже, що ця робота ще в процесі.

www.graphcore.ai

IPUs in the Cloud

Cloud service providers around the globe now offer Graphcore IPU services, enabling innovators everywhere to make new breakthroughs in machine intelligence with the flexibility of the cloud

**Компанії-розробники AI чіпів**
4 months ago

Відсоткові ставки, tech cooldown та як це впливає на інженірінг

Підвищення ставок та уповільнення IT принесли багато негативу: масові звільнення, ускладнення пошуку нової роботи, і тп.

Але це також принесло щонайменше одну позитивну зміну: інженерні практики стають набагато більш прагматичними, простішими та реалістичними. Відійти від тисяч мікросервісів, не використовувати красиві, але недоцільні інструменти, та менше overengineering.

Більше про це тут - "The end of 0% interest rates: what it means for software engineering practices" (потрібна платна підписка, але основні висновки зрозумілі навіть з частини тексту).

На жаль, це все ще не стосується ML/AI. Всі додають LLM & RAG, незалежно від того, потрібні вони вам чи ні.

Pragmaticengineer

The end of 0% interest rates: what it means for software engineering practices

Could we see monoliths favored over microservices, full-stack tools over platform specific ones and pragmatic, simpler architecture as a response to 10+ years of 0% interest rates ending?

**Відсоткові ставки, tech cooldown та як це впливає на інженірінг**
4 months, 1 week ago

Погляд в LegalLens

Нещодавно нашу статтю LegalLens було прийнято на головну конференцію EACL. Я хотів би показати, як можна почати з нуля та розробити власні рішення для legal NLP.

Проста класифікація: LegalLensNLI, ви отримуєте 2 рядки та маєте класифікувати їх до 3 класів, легко почати з нуля, використовуючи приклад HF для класифікації тексту.

Просте завдання розпізнавання іменованих сутностей (NER): LegalLensNER. Ви отримуєте один рядок і маєте знайти 3 сутності, почніть з нуля з прикладом HF для класифікації токенів.

На мою думку, одна з найскладніших речей у ML - це створення датасетів, і ви вже його маєте!

Linkedin

Our paper is accepted to EACL 2024! LLMs for NLP detection by Darrow. | Ben Hagag posted on the topic | LinkedIn

I am incredibly excited to announce that our paper, "LegalLens: Leveraging LLMs for Legal Violation Identification in Unstructured Text," has been accepted to…

**Погляд в LegalLens**
4 months, 1 week ago

PaaS наносить удар у відповідь

Останнім часом я помітив нову хвилю PaaS компаній:
▶️ Render
▶️ Railway
▶️ Fly.io

Зараз про них чути зі всіх боків і вони замінюють такі застарілі варіанти, як Heroku. Ідеально, коли ви хочете розпочати маленький, швидкий проєкт і вам не хочеться займатись інфраструктурою.

Але згодом настає момент, що ваш проєкт стає настільки великим, що вам потрібен набагато більший контроль над ним, і ви наймаєте команду інфраструктури та переходите на щось на кшталт Kubernetes.

Цікаво, яке майбутнє чекає на PaaS компаній у такому випадку?

Render

Cloud Application Hosting for Developers | Render

Render is a unified cloud to build and run all your apps and websites with free TLS certificates, global CDN, private networks and auto deploys from Git.

**PaaS наносить удар у відповідь**
5 months, 4 weeks ago

Чудове рев'ю про бази даних у 2023

Людина, за якою варто слідкувати, якщо ви цікавитесь DB - Andy Pavlo, кожен рік випускає рев'ю всього, що сталось за цей час у світі баз даних.

Рев'ю за 2023 тут - роздуми про векторні бази даних, в SQL додали графи і багато-багато драми!

Цитата:
You don't need to watch movies or television shows for entertainment! You can get all the drama you need in your life through databases!

Ottertune

Databases in 2023: A Year in Review | OtterTune

From the rise of vector databases to SQL:2023 to MariaDB troubles and the FAA outage, 2023 was an exciting year in database history.

[**Чудове рев'ю про бази даних у 2023**](https://ottertune.com/blog/2023-databases-retrospective)
We recommend to visit

просто блог 18-річного про заробіток, криптовалюту і життя

Реклама: @reklama_rdeni
Власник: @rostikdeni

Last updated 2 months ago

Офіційний канал Binance 🇺🇦

🔸Telegram https://t.me/BinanceUkrainian
🔸TikTok https://www.tiktok.com/@binanceukraine
🔸Instagram www.instagram.com/binanceukraine
🔸Twitter www.twitter.com/BinanceUkraine
🔸YouTube https://www.youtube.com/c/BinanceUkraine

Last updated 4 days, 10 hours ago

- Ф‘ючерсна торгівля та сигнали🔸
- Новини,факти,думки🔸
- Як торгувати,купляти та заробляти на Крипті🔸
- Корисні поради по ринку,аналіз монет 🔸

🤝 Реклама/ Співпраця :
@spasitelCEO

Last updated 9 months, 2 weeks ago