Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 2 weeks, 2 days ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 1 month ago
За почти 4 года существования этого канала в нём не было рекламы, репостов и политики. Сегодня я нарушу последнее правило.
Я бы и сейчас промолчал, так как считаю что большинство таких постов бесполезны и пишутся лишь для самоуспокоения и самооправдания. Поэтому я не буду вспоминать своих ближайших украинских родственников и друзей, прекрасно проведённое там время, и описывать собственный психологический дискомфорт в данный момент.
Но я решил написать, потому что подумал, что многим людям в Украине, которые сейчас испуганы, растеряны и жутко злы на всех нас, людям, которым приходится ночевать в метро и бомбоубежищах в родных городах, может быть важным прочитать, что не все из нас агрессоры, и что множество людей в России и во всём мире ищут возможности вам помочь.
Я считаю, что происходящее сейчас отвратительно и ужасно; военная агрессия недопустима, и её необходимо прекратить.
Совершенно не успеваю сюда писать, и это, конечно же, безобразие.
Поэтому выдам вам пачку странных ссылок для чтения на выходных:
А если вам не хочется читать, напомню, что в эти выходные заканчивается выставка «Код искусства» в Солянке, где, в том числе, есть и мой стенд. В последний день, воскресенье, Елена Никоноле будет делать там кураторскую экскурсию (вход на выставку платный, 300 рублей, вроде бы).
Недавно прошёл NaNoGenMo 2021, традиционный месяц написания генераторов текстов (я писал про него раньше). Поучаствовать в этом году не успел, хотя было несколько неплохих идей; но там и без меня нашлось на что посмотреть. Я бегло пролистал работы и поделюсь с вами моим персональным топом:
John Lambert собрал систему, которая нарезает музыкальные клипы на отдельные кадры, прогоняет их через генератор описаний и собирает текст, пересказывающий происходящее в клипе. В итоге получилась книжка из 22 таких пересказов.
Kevan Davis нарезал текст Моби Дика на кусочки (издеваться над Моби Диком -- давняя традиция NaNoGenMo) и соединил их в интерактивное приключение в духе книги-игры. Получилось вполне неплохо.
Mark Sample использовал нестареющий приём — перевёл "Гордость и предубеждение" автопереводчиком по следующему циклу: English->Russian->Chinese->Portuguese->English. В итоге получилась книга под названием "Pride and Injury".
John Ohno, впечатлённый сериалом Dark Shadows, собрал генератор под названием Shark Dadoes, производящий диалоги, состоящие из уклончивых ответов и ответов вопросом на вопрос.
Были и другие забавные штуки, вроде генерации синопсисов к фильмам по названию, режиссёру и актёрам; замене всех подходящих слов в Моби Дике на эмоджи; или нейросети, обученной на текстах Филлипа Дика.
А если вам такое не по душе, можно почитать работу про 58 способов визуализировать структуры в тексте Алисы в Стране Чудес или наш свежий пост о том, как выбирать и проверять валидационные метрики в задачах классификации (по мотивам нашей статьи на NeurIPS 2021).
Я иногда пишу компьютерно-археологические посты, например, о происхождении клавиатурных раскладок и графических разрешений, о том как появился r-pentomino, или там про первоапрельские RFC. Сегодня напишу немного про этимологию разных около-компьютерных терминов.
Все знают, что слово модем происходит из комбинации слов модулятор
и демодулятор
— названий двух устройств, переводящих цифровую информацию в вид, удобный для передачи по аналоговым сетям связи и обратно. Аналогичное происхождение у слова кодек (кодер
+декодер
) и менее широко известных жаргонных терминов балун (balanced
+unbalanced
) и сердес (serializer
+deserializer
).
Похожее на кодек
по написанию и звучанию название компании Kodak, зарегистрированное в 1888 году, имеет другую природу. Основатель компании, George Eastman, специально придумывал новое, короткое, легко узнаваемое и произносимое на разных языках слово, по легенде используя для этого набор букв из игры Anagrams (бабушка игры Scrabble). Одним из критериев для Джорджа было использование его любимой буквы К, составляющей в итоге 40% всего названия. Затея придумать новое слово удалась не вполне: в 1896 году на страницах журнала Amateur Photographer разгорелась переписка читателей, пытающихся выяснить его происхождение. Обнаружилось, например, что на хиндустани это слово, пришедшее из персидского, означает "мальчик", а один из читателей указывал на созвучие с ивритским Kahdak
.
Слово bit в смысле минимального количества информации впервые появилось в публикациях в статье Клода Шеннона 1948 года «Математическая теория связи». При этом сам Клод ссылался на авторство математика Джона Тьюки, который использовал bit как сокращение к binary [information] digit
во внутренних документах Bell Labs. Под словом byte (байт
, искажённое английское укус/кусок
) принято понимать минимальный объём обрабатываемой за раз или непосредственно адресуемой информации. Впервые оно было использовано Вернером Бухгольцем в 1956 в проектной документации на систему IBM Stretch. В разных системах байты бывали разных размеров, например, 4, 6 или 9 бит, а также переменной величины. Чтобы точно указать на размер байта в 8 бит, принято использовать термин октет
.
По инженерным причинам в компьютерах эффективнее работать с числами, кратными степеням двойки. Поэтому под словом kilobit
инженеры чаще понимают 1024 бита (2^10), но в некоторых случаях его используют для обозначения 1000 бит (10^3, как и с другими мерами, вроде метров). Например, в Encyclopedia of Library and Information Science издания 1968 года на одной и той же странице написано, что килобит это 1000 бит, а килобайт это 1024 байта. Аналогичная история с приставками мега-, гиги- и так далее. Вся эта путаница происходила до конца 1998 года, когда наконец пришла Международная электротехническая комиссия и всё исправила (нет). С тех пор по международным стандартам килобит должен означать 1000 бит, а для 1024 бит надо использовать термин kibibit
(кибибит
). Но, например, по российскому «Положению о единицах величин» от 2009 года термин килобайт фиксируется всё равно в значении 1024 байта.
Для измерения скорости передачи данных помимо всяких килобайт/сек
и килобит/сек
иногда используются термины, основанные на похожем слове бод (например, килобод
). Под бодом в современной связи обычно понимается количество изменений несущей частоты в секунду, поэтому если, например, несущая использует два уровня сигнала, то 1 бод это 1 бит/сек. Но это не точно, потому что биты тут считаются брутто, т.е. включают в себя всякую служебную информацию, вроде коррекции ошибок. Эти самые боды названы в честь Жана Мориса Эмиля Бодо, французского инженера, который в 1870 году придумал базовую кодировку для телетайпов (aka международный телеграфный код №1).
А ещё, оказывается, что слово android почти втрое старше слова robot, которому в прошлом году исполнилось 100 лет.
Когда-то мы с Бориславом Козловским пытались придумать, как бы нам сделать визуализатор описаний литературных персонажей (как писали классики, «дверь отворилась, и на пороге появился стройный мускулистый человек в мохнатой кепке и тёмных очках»). Потом, как водится, отвлеклись, но от затеи осталось несколько тысяч словесных описаний героев, нагрепанных из разных книг; а также самописная эвристика по генерации текстов розыскных ориентировок.
Недавно вспомнил про это всё и решил попробовать генерировать по ним картинки разными доступными сетями для сравнения. С литературными описаниями никто вообще не справился, а по ориентировкам уже что-то вырисовывается, не слишком близкое к тексту, но забавное. На картинке пример (попробуйте угадать, где какая сеть), а если захотите сами поразвлекаться — вот вам 1000 сгенерированных ориентировок, можно контест на них устроить.
Раз уж мой колаб пошёл в народ, напишу и тут — я недавно выложил демо-блокнот для автоматического создания анимаций типа тех, что были в прошлом посте. Картинки в твиттере, код на гитхабе, обсуждение в дискорде pixray.
Кроме того, начался ноябрь, а значит и National Novel Generation Month 2021 — месяц автоматической генерации прозы. Не уверен, что в этом году я что-то интересное успею сделать, но если у вас есть время/навыки/идеи, и вы хотите что-то сделать вместе, пишите в личку. И вот несколько полезных ресурсов: большой датасет всяких слов и названий, собранных в списки (имена, города, животные, мифологические существа, виды спорта и т.п.); удобный питонячий интерфейс к нему; параллельный датасет смешных/несмешных новостных заголовков; язык текстовой разметки кулинарных рецептов CookLang.
Или почитайте, какими узлами и по какому стандарту NASA связываются пучки кабелей на марсоходе Curiosity (и других).
Architec.Ton is a ecosystem on the TON chain with non-custodial wallet, swap, apps catalog and launchpad.
Main app: @architec_ton_bot
Our Chat: @architec_ton
EU Channel: @architecton_eu
Twitter: x.com/architec_ton
Support: @architecton_support
Last updated 2 weeks, 2 days ago
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 1 month ago