Mrs Wallbreaker about AI Risk, AI Alignment, AI Safety, AI Ethics, AGI

Description
Mrs Wallbreaker or: How I Learned to Stop Worrying and Love the AGI.
About AI Risk, AI Alignment, AI Safety, AI Ethics
Advertising
We recommend to visit

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months, 2 weeks ago

🛒 Магазин сообществ в соц. сетях 24/7
⚡️ В наличии любые тематики и количества, связь в ЛС @timur_chik1


ac99e5f0c33c6df9805b

Last updated 10 months ago

Политика, мировые новости, юмор - подаем быстро и качественно

По всем вопросам 👉 @MVP_tg

Реклама: @Ask_tg, @MVP_tg, @daladnaa,
@jensamm

@pokerfacec, @ragnar_reklama, @SMariyS

Last updated 1 month, 2 weeks ago

2 weeks, 1 day ago

Умные люди пишут о Digital neuroscience

Системы ИИ, которые не являются по своей сути преднамеренно обманчивыми, скорее всего, выглядят точно так же, как и системы ИИ, настолько хорошо владеющие обманом, что скрывают его любыми доступными способами:
- пост Проблема Лэнса Армстронга
- и пост Проблема Короля Лира.

Измерить, насколько системы ИИ безопасны, может быть крайне сложной задачей. Если только мы не сможем читать их мысли!
- прям как у Лю Цысыня - пост

(ссылка для тех, кто не видит preview)

Telegraph

Умные люди пишут о Digital neuroscience

Системы ИИ, которые не являются по своей сути преднамеренно обманчивыми, скорее всего, выглядят точно так же, как и системы ИИ, настолько хорошо владеющие обманом, что скрывают его любыми доступными способами: - пост Проблема Лэнса Армстронга - и пост Проблема…

**Умные люди пишут о** [Digital neuroscience](https://telegra.ph/Umnye-lyudi-pishut-o-Digital-neuroscience-07-12-3)
2 weeks, 2 days ago

Funny not funny AI app failures

Расслабленная подборочка неожиданнойстей и косяков от ИИ приложений
- гугл отменяют из-за обратного расизма
- prompt injection Google Bard
- GPT генерирует фейковые ссылки на статьи PubMed
- адвокатов уволили из-за GPT
- фейковые библиотеки python от GPT

Тут хочется как то пошутить, поэтому вот - Виктор Цой - Следи За Собой (1)

Telegraph

Funny not funny AI app failures 

1) Google приостановила Gemini-генерацию изображений людей с помощью ИИ после критики по поводу этнической принадлежности, которая была нереалистично разнообразной. Один бывший сотрудник Google сказал, что "было трудно заставить Google Gemini признать существование…

**Funny not funny AI app failures**
2 weeks, 2 days ago
Mrs Wallbreaker about AI Risk, AI …
2 weeks, 2 days ago
Mrs Wallbreaker about AI Risk, AI …
2 weeks, 3 days ago
Умные люди пишут о **Проблема Лэнса …

Умные люди пишут о Проблема Лэнса Армстронга: является ли ИИ действительно безопасным или он просто хорош в сокрытии своих опасных действий?

Holden Karnofsky Cold Take - AI Safety Seems Hard to Measure

Представим себе следующее:
1. У нас есть системы ИИ, которые могут делать практически все, что может человек, с некоторыми различиями в сильных и слабых сторонах, но без огромной разницы в "общих способностях" или экономической ценности за час работы.
2. Мы наблюдаем ранние признаки того, что системы ИИ ведут себя пусть непреднамеренно, но некорректно, например, дают неправильные ответы на вопросы или пишут программное обеспечение, которое фальсифицирует метрики вместо того, чтобы выполнять задачи, для которых эти метрики были предназначены.
3. Мы предполагаем, что изменение методов обучения ИИ каким-то образом сделает эти системы ИИ менее склонными к обману. Пробуем и обнаруживаем, что наши системы ИИ действительно ведут себя лучше, чем раньше - колличество случаев или примеров, когда ИИ отвечал некорректно - уменьшилось. Это утверждение того, что мы наблюдаем.

Но что из следующего действительно только что произошло:

1) Мы действительно обучили наши системы ИИ быть более корректными и качественными в работе?
2) Или мы обучили системы ИИ лучше обманывать нас и склонять нас думать, что ИИ стали более корректными и качественными в работе?
3) Или мы обучили системы ИИ лучше рассчитывать и предсказывать, когда их могут поймать на обмане, и поэтому быть более корректными и качественными в работе только тогда, когда обман может быть раскрыт? (Это, кстати, не самый плохой вариант. Можно было бы навернуть системы аудита. Но это оставляет открытой проблему Короля Лира)
4) Или произошло какое-то сочетание из этих трех вариантов?

Шутка тут - аналогия с велогонщиком Лэнсом Армстронгом. Армстронг выигрывал гонку "Тур де Франс" 7 раз подряд (с 1999 по 2005), в то время как многие из его соперников были пойманы на использовании допинга и дисквалифицированы. Но примерно через 5 лет после его последней победы расследование "заключило, что Армстронг использовал допинговые препараты на протяжении всей своей карьеры и назвало его организатором 'самой сложной, профессионализированной и успешной допинговой программы, которую когда-либо видели в спорте'". Теперь список победителей Тур де Франс за эти годы выглядит так:

2 weeks, 4 days ago
кажется, день шуток, котятки)))

кажется, день шуток, котятки)))

разминаемся перед апплаем:
Вакансия в Белый Дом все еще открыта:

https://jobs.lever.co/BFP/87722c1a-e593-4c2e-a630-50671dea033f

2 weeks, 4 days ago

соревнование по гимнастике по мнению нейросетей

2 weeks, 4 days ago
тест тьюринга пройден успешно

тест тьюринга пройден успешно

2 weeks, 4 days ago
Заголовок новости: Фотограф был дисквалифицирован из …

Заголовок новости: Фотограф был дисквалифицирован из конкурса по созданию картинок с помощью ИИ, после того, как занял первое место со своей реальной фотографией.

подпись на картине: когда ты тратишь часы времени для создания и улучшения идеального запроса к модели, а какой то чувак побеждает просто нажав на одну кнопку.

We recommend to visit

Канал для поиска исполнителей для разных задач и организации мини конкурсов

Last updated 2 months, 2 weeks ago

🛒 Магазин сообществ в соц. сетях 24/7
⚡️ В наличии любые тематики и количества, связь в ЛС @timur_chik1


ac99e5f0c33c6df9805b

Last updated 10 months ago

Политика, мировые новости, юмор - подаем быстро и качественно

По всем вопросам 👉 @MVP_tg

Реклама: @Ask_tg, @MVP_tg, @daladnaa,
@jensamm

@pokerfacec, @ragnar_reklama, @SMariyS

Last updated 1 month, 2 weeks ago