Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 1 week ago
DCGM-Exporter
Экспортер метрик NVIDIA GPU для Prometheus с использованием DCGM
Чтобы собирать метрики на узле с GPU, просто запустите контейнер dcgm-exporter:
```
docker run -d --gpus all --rm -p 9400:9400 nvcr.io/nvidia/k8s/dcgm-exporter:3.3.8-3.6.0-ubuntu22.04
curl localhost:9400/metrics
# HELP DCGM_FI_DEV_SM_CLOCK SM clock frequency (in MHz).
# TYPE DCGM_FI_DEV_SM_CLOCK gauge
# HELP DCGM_FI_DEV_MEM_CLOCK Memory clock frequency (in MHz).
# TYPE DCGM_FI_DEV_MEM_CLOCK gauge
# HELP DCGM_FI_DEV_MEMORY_TEMP Memory temperature (in C).
# TYPE DCGM_FI_DEV_MEMORY_TEMP gauge
...
DCGM_FI_DEV_SM_CLOCK{gpu="0", UUID="GPU-604ac76c-d9cf-fef3-62e9-d92044ab6e52"} 139
DCGM_FI_DEV_MEM_CLOCK{gpu="0", UUID="GPU-604ac76c-d9cf-fef3-62e9-d92044ab6e52"} 405
DCGM_FI_DEV_MEMORY_TEMP{gpu="0", UUID="GPU-604ac76c-d9cf-fef3-62e9-d92044ab6e52"} 9223372036854775794
...
```
https://github.com/NVIDIA/dcgm-exporter
Подпишись 👉@i_DevOps
«Грамотный DevOps»: пишем конфигурацию с помощью Emacs, Org и Jinja
Что такое вообще «Грамотный DevOps»?
Если совсем коротко: «грамотный DevOps» (Literate DevOps) – это использование принципов «грамотного программирования» (Literate programming) для работы с инфраструктурой в виде кода. Термин Literate DevOps придумал Говард Абрамс, и он же показал, как реализовать его с помощью Emacs и Org.
Теперь подробнее.
Как все знают, концепцию «грамотного программирования» (мне больше нравится вариант перевода «литературное программирование», он как-то больше соответствует духу этой концепции, но раз уж в Википедии употребляется вариант «грамотное», то пусть будет так) создал великий Дональд Кнут. В этой концепции комментарии и программный код как бы меняются местами: текст программы выглядит не как код, к которому где-то приписаны комментарии, а как связное и последовательное («литературное») описание логики работы, структуры данных и так далее, в которое вставлены блоки программного кода. Далее специальная программа может извлечь из этого текста все блоки кода и расставить их в нужном порядке, создав, таким образом, исходный код, который можно скомпилировать, получив работающую программу. Эта процедура, в терминах Кнута, называется tangle («запутывание»). Другая процедура, под названием weave («сплетение») позволяет из того же текста получить очень красиво отформатированный документ.
https://habr.com/ru/articles/752384/
Подпишись 👉@i_DevOps
Оптимизация масштабируемости и экономичности Kubernetes с помощью Karpenter
В этом посте вы узнаете об основаниях и подходе, которые команда вычислений Miro использовала для повышения масштабируемости и эффективности кластеров Kubernetes. Этого удалось достичь благодаря применению пулов узлов без групп с использованием Karpenter, что помогло снизить затраты на вычисления в непроизводственных кластерах до 60% и повысить эффективность использования ресурсов в производственных кластерах до 95%.
Подпишись 👉@i_DevOps
Программа сообщает о том, что не может найти свой конфиг. Каким образом можно узнать, где она пытается его найти?
line\-buffered
опция которая выведет результат как только найдет
strace \-f
— отслеживание дочерних процессов
strace \-f l ftp sitename | & grep \-\-line\-buffered open | grep /home/user
Либо в самой программе, если удастся найти параметры
/usr/sbin/mysqld \-\-verbose \-\-help | grep \-A 1 «Default options»
Подпишись ?@i_DevOps
Расскажите о ключевом различии между виртуализацией и контейнеризацией
Виртуализация позволяет запустить несколько операционных систем на одном физическом сервере. Контейнеризация работает на одной и той же операционной системе, в которой приложения упакованы в контейнеры и запускаются на одном сервере/виртуальной машине.
Где хранятся тома Docker?
Тома, создаваемые и управляемые Docker (у не-Docker процессов к ним нет доступа), хранятся в файловой системе сервера Docker по пути /var/lib/docker/volumes/. Тома — наиболее эффективный способ сохранения данных в Docker.
Расскажите кратко о жизненном цикле контейнера Docker
Жизненный цикл контейнера:
Создание контейнера
Работа контейнера
Приостановка контейнера
Возобновление работы контейнера
Запуск контейнера
Остановка контейнера
Перезапуск контейнера
Принудительная остановка контейнера
Удаление контейнера
Подпишись ?@i_DevOps
Канал для поиска исполнителей для разных задач и организации мини конкурсов
Last updated 2 months, 1 week ago