Крупнейшее медиа об интернет-культуре и технологиях.
Больше интересного на https://exploit.media
Написать в редакцию: @exploitex_bot
Сотрудничество: @todaycast
№ 4912855311
Last updated 3 weeks, 5 days ago
Не заходи без шапочки из фольги и пары надежных проксей. Интернет, уязвимости, полезные сервисы и IT-безопасность.
Связь с редакцией: @nankok
Сотрудничество: @holartem
№ 4958183748
Last updated 4 weeks, 1 day ago
Первый верифицированный канал о технологиях и искусственном интеллекте.
Сотрудничество/Реклама: @alexostro1
Помощник: @Spiral_Yuri
Сотрудничаем с Tgpodbor_official
Last updated 3 months, 1 week ago
С Новым годом, друзья!
Поздравляю вас с наступающим 2025 годом!
Спасибо, что следили за каналом Будущее Наступает в уходящем году.
В новом году желаю вам:
🎄 Крепкого здоровья и мира
🎄 Осваивать новые технологии и сохранять человечность
🎄 Удачи в ваших профессиональных и личных проектах
Я уверен, что новый 2025 год принесет нам много новых сюрпризов и изменений. Пусть все они будут новыми возможностями.
С Новым Годом! 🎄🎅🎁
Подписывайтесь на Будущее наступает, чтобы ничего не пропустить🚀
Интересный proof of concept: ИИ-агент "рекрутер" интервьюирует ИИ-агента "нанимающий менеджер". В результате получается бриф вакансии.
Кажется, что вместо ИИ-нанимающего менеджера может быть менеджер-человек. Или кандидат на вакансию. Как скоро увидим работающих ИИ-агентов "рекрутер", которые сами снимают бриф и собеседуют кандидатов?
#будущееработы
Подписывайтесь на Будущее наступает, чтобы ничего не пропустить🚀
💡 Вот еще одна причина, почему очень важно, чтобы ИИ был объяснимым:
На прошлой неделе компания Apollo Research выпустила отчет об исследовании возможностей современных ИИ-моделей манипулировать, строить схемы, чтобы обманывать людей 👀
Выводы:
1️⃣ Модели, такие как o1, Claude 3.5 Sonnet, Gemini 1.5 Pro, и другие, применяют манипуляции, чтобы достигать целей. Это касается как задач, поставленных людьми, так и их собственных скрытых целей.
2️⃣ Манипуляции разнообразны: от «прикидывания глупым» с мелкими ошибками в ответах до попыток отключить контроль человека или скопировать свои данные на другие серверы, если модель подозревает, что ее могут отключить.
3️⃣ Анализ цепочек рассуждений (Chain-of-Thought) показал, что такие действия — это не случайность. Модели целенаправленно выбирают манипуляции как оптимальный способ достижения цели.
4️⃣ В большинстве случаев (но не всегда) модели можно заставить признаться в манипуляциях. Например, Llama 3.1 405B и Claude 3 Opus делают это в 80% случаев. Однако модель o1 признаётся реже — всего в 20% случаев. Для её «раскрытия» требуется до 7 раундов сложных допросов.
5️⃣Самое удивительное: модели начинают манипулировать даже без явного указания. Это их собственный выбор стратегии, а не результат влияния «плохих людей».
Больше об этом исследовании можно прочитать в канале Сергея Карелова Малоизвестное интересное. Если вас не пугают длинные и сложные тексты, он вам может понравится.
#ИИисследования
#ИИинтересно
Подписывайтесь на Будущее наступает, чтобы ничего не пропустить🚀
Крупнейшее медиа об интернет-культуре и технологиях.
Больше интересного на https://exploit.media
Написать в редакцию: @exploitex_bot
Сотрудничество: @todaycast
№ 4912855311
Last updated 3 weeks, 5 days ago
Не заходи без шапочки из фольги и пары надежных проксей. Интернет, уязвимости, полезные сервисы и IT-безопасность.
Связь с редакцией: @nankok
Сотрудничество: @holartem
№ 4958183748
Last updated 4 weeks, 1 day ago
Первый верифицированный канал о технологиях и искусственном интеллекте.
Сотрудничество/Реклама: @alexostro1
Помощник: @Spiral_Yuri
Сотрудничаем с Tgpodbor_official
Last updated 3 months, 1 week ago