Data Explorers Hub

Description
Navigating the Big Data Landscape

personal blog https://blog-vndv.vercel.app/

по всем вопросам @just_vanich
Advertising
We recommend to visit

𝗔𝗹𝗹 𝗱𝗶𝘀𝘀
𝗔𝗹𝗹 𝗻𝗲𝘄 𝘃𝗲𝗿𝗮𝗶𝘁𝘆
𝗩𝗲𝗴/𝗻𝗼𝗻𝘃𝗲𝗴
𝗚𝘂𝗷𝗮𝗿𝘁𝗶/𝗣𝗮𝗻𝗷𝗮𝗯𝗶/𝗦𝗼𝘂𝘁𝗵

𝗞𝗵𝗮𝘁𝗲 𝗷𝗮𝘂 𝗸𝗵𝗮𝘁𝗲 𝗷𝗮𝘂 𝗳𝗼𝗼𝗱 𝗹𝗼𝘃𝗲𝗿 𝗸𝗲 𝗴𝗲𝗲𝘁 𝗴𝗮𝘁𝗲 𝗷𝗮𝘂

Last updated 8 months, 3 weeks ago

https://www.instagram.com/daily__moment__/

Last updated 3 years, 3 months ago

Last updated 1 week, 6 days ago

3 weeks, 4 days ago

How to succeed as a data engineer without the burnout

При создании и обслуживании современной платформы данных давление на инженеров данных со стороны бизнеса может быть огромным. Ключ к успеху в этой сложной обстановке не в том, чтобы работать еще усерднее, важно разумно подходить к тому, над чем вы работаете, и к тому, как это реализуется.

Принимая основополагающие принципы DataOps, в том числе хорошо спланированную модульную инфраструктуру, упреждающий мониторинг, надежное управление данными, отказоустойчивость и культуру совместного обучения, инженеры могут обеспечить эффективную и бесперебойную работу платформ данных любого размера с минимальными усилиями по обслуживанию и четкой ценность бизнеса.

В этом руководстве изложен ряд лучших практик, призванных сделать жизнь инженеров данных менее напряженной за счет создания среды, в которой системы работают без сбоев, обслуживание предсказуемо и предоставление ценности является последовательным. Обсуждаемые методы не только делают платформы данных более производительными и ценными с точки зрения бизнеса, но и значительно снижают риск выгорания.

stackoverflow.blog

How to succeed as a data engineer without the burnout - Stack Overflow

**How to succeed as a data engineer without the burnout**
3 weeks, 4 days ago

Redka - это Redis, переработанный с помощью SQLite. Цель проекта - переопределить лучшие части Redis с помощью SQLite, сохраняя при этом совместимость с Redis API. Он включает транзакции ACID, представления SQL для лучшего анализа и репортинг, Redis-совместимые команды и протокол связи и многое другое. Redka не поддерживает сценарии Lua, аутентификацию и списки управления доступом.

По бенчмаркам
Redka в 2–6 раз медленнее Redis (неудивительно, поскольку сравниваем реляционную базу данных с хранилищем данных «ключ-значение»), но она все равно может выполнять 22К операций записи в секунду и 57К операций чтения в секунду, что довольно хорошо.

Автором проекта является Антон Жиянов, у которого есть замечательный курс по оконным функциям в SQL.

GitHub

GitHub - nalgeon/redka: Redis re-implemented with SQLite

Redis re-implemented with SQLite. Contribute to nalgeon/redka development by creating an account on GitHub.

[Redka](https://github.com/nalgeon/redka?utm_source=tldrnewsletter) - это Redis, переработанный с помощью SQLite. Цель проекта - переопределить лучшие части Redis с помощью SQLite, сохраняя при …
3 weeks, 5 days ago

PostgreSQL Index AdvisorЭто расширение PostgreSQL, позволяющее рекомендовать индексы для повышения производительности запросов. Он поддерживает общие параметры и материализованные представления и может идентифицировать таблицы и столбцы.

GitHub

GitHub - supabase/index_advisor: PostgreSQL Index Advisor

PostgreSQL Index Advisor. Contribute to supabase/index\_advisor development by creating an account on GitHub.

**PostgreSQL Index Advisor**Это [расширение](https://github.com/supabase/index_advisor?utm_source=tldrnewsletter) PostgreSQL, позволяющее рекомендовать индексы для повышения производительности запросов. Он поддерживает общие параметры и материализованные представления и …
3 months ago
Всем привет! Разыгрываем книгу для участия …

Всем привет! Разыгрываем книгу для участия нажмите на кнопку и ожидайте розыгрыша. Итоги подведем в следующее воскресенье 18.02

3 months ago
**How to onboard**Уже третий раз натыкаюсь …

How to onboardУже третий раз натыкаюсь на эту статью, но все не добавляю ее в канал, хотя тема очень актуальная.

Во многих компаниях либо нет культуры онбординга, либо все это делается экспромтом.
Пришел новый сотрудник и ему тимлид рассказал, какие сервисы есть.
Через боль и страдания, дерганья коллег, сотрудник узнаёт, как функционирует система.

Как правило, через 3 месяца вы должны рассчитывать на то, что сможете внести весомый вклад в новую команду. Для должностей Senior+ это означает, что к тому времени вы также начнете вносить свой вклад в управление командой.

В данном посте предлагается подход к онбордингу.

3 months ago

SQL for data scientist in 100 Queries

Заметки и рабочие примеры распространенных SQL-запросов.

5 months ago

Сервис для работы с SQL-базами данных Yandex WebSQL вышел в Public Preview. Это значит, что теперь сервис доступен всем пользователям и не тарифицируется.
Yandex WebSQL позволяет работать с управляемыми базами данных PostgreSQL, MySQL и ClickHouse прямо в веб-интерфейсе. Можно просматривать схемы, вносить изменения, писать запросы, пользуясь подсказками и подсветкой ошибок, и многое другое.

cloud.yandex.ru

Yandex WebSQL

Инструмент для работы с SQL-базами данных в Yandex Cloud.

Сервис для работы с SQL-базами данных [Yandex WebSQL](https://click.sender.yandex.ru/l/1252679/1303683/2/L/SWlCY0FDUlFMVlZ3SFJJbEVDWS9ZaXNNU2djRVhRcGxSd3hRV3dCb1ZHZDZWMGtMWW41d2UwRnphUXQ0WG41ZFgxMVlCbklOVm1GNgphRk5BUVZGUkgxQldkVndYWDNVdEtqazNVMHBXT2dFakF6TVdBMU1HRTBzY0xqRVpNa0JkSUYwUVVpSUZVeDRiQmhJMWN3PT06MTE4Mzow/*https://cloud.yandex.ru/services/websql?utm_source=mailing&utm_medium=email&utm_campaign=promo_websql_pp_12_12_2023) вышел в Public Preview. Это значит, что теперь сервис доступен всем пользователям …
5 months ago

BI-AS-CODE

Обычно бизнес пользователи и аналитики создают дашборды при помощи таких инструментов как PowerBI/Tableau/Superset.

В чем проблема с этими инструментами? Они были разработаны с упором на пользовательский интерфейс, чтобы снизить порог входа. Однако такой подход может привести к увеличению технического долга.
Например, как вы можете откатит дашборд и избежать поломки?Нужно помнить, что дашборд, на которой представлены ваши ключевые показатели эффективности (KPI), является программным активом.

Давайте рассмотрим, что предлагают некоторые инструменты , а также их преимущества . Все они имеют некоторые общие черты:

- Открытый исходный код

- Платные или управляемые услуги хостинга

- BI as a code позволяющий управлять версиями и тестировать с помощью стандартных конвейеров CI.

EVIDENCE : SQL + MARKDOWN

Evidence — это легковесный JS фрэймворк, предназначенная для создания data-приложений с с использованием Markdown и SQL. Вы просто создаете свою панель мониторинга, используя существующие компоненты, включаете их с помощью SQL и все готово! Конечным продуктом является статический веб-сайт, который можно разместить где угодно: Vercel, Github Pages или Heroku.

RILL : SQL + YAML

Rill от Rilldata позволяет создавать дашборды, используя только файлы SQL и YAML. Они предлагают удобный интерфейс командной строки для его локального запуска, использования локального веб-интерфейса для составления запросов/дашбордов или для развертывания в своем облаке. Вот интересный факт: Rill создан с использованием DuckDB.

STREAMLIT : PYTHON

Streamlit существует на рынке уже несколько лет и был приобретен Snowflake в первом квартале 2022 года. Основное преимущество (и, возможно, недостаток) Streamlit заключается в том, что он позволяет вам оставаться в рамках рабочего процесса с данными Python и использовать ту же экосистему для разработки ваших данных. Программы. Следовательно, вы создаете свои приложения для обработки данных с помощью Python, и вам нужна среда выполнения Python для хостинга.

Будущее BI

В этом посте мы рассмотрели три разных инструмента, каждый из которых предлагает уникальный подход к BI-как коду.
Вы можете проводить все тесты локально и использовать Git для контроля версий и CI/CD. Ваш дашборд можно легко развернуть или откатить, используя при этом лучшие практики программного обеспечения. BI не обязательно должен быть утомительным и дорогостоящим пользовательским интерфейсом. Приятно видеть новые подходы. Несмотря на то, что некоторые из этих инструментов находятся на ранних стадиях разработки, они показывают интересные возможности.

#bi

evidence.dev

Evidence - Business Intelligence as Code

Evidence is an open source, code-based alternative to drag-and-drop BI tools. Build polished data products with just SQL and markdown.

**BI-AS-CODE**
5 months ago

*🚀 Сквозная аналитика + Modern Data Stack *🚀**

Открытый вебинар 13 декабря в 19:00

*🔸 Бизнес-результат (ценность):*

— Почему владельцы готовы платить за аналитику?
— Оптимизация привлечения и удержания клиентов
— Совершенствование продукта: анализ паттернов и поведения
— С [MDS] 1 человек способен делать, на что ранее требовались целые команды

*🔸 Как создать эту ценность с Modern Data Stack:*

— Расширение списка источников данных: Ads platforms, Clickstream, CRM, Billing, gSheets
— Шаблонизация, макросы и интеллектуальное моделирование с dbt и Clickhouse
— Семантический слой, потребление дата-продуктов и аналитики: Cube
— Визуализации и дашборды, которые живут долго: Datalens, Metabase, Superset

Регистрация: https://artemiy-kozyr.timepad.ru/event/2709562/

Вебинар бесплатный, регистрация обязательна.
Расскажите об этом всем, кому может быть интересно.

#learning

artemiy-kozyr.timepad.ru

Сквозная аналитика + Modern Data Stack / События на TimePad.ru

Практический вебинар о создании ценности для бизнеса, современные практики для аналитиков и инженеров

5 months ago

Upgrading GitHub.com to MySQL 8.0

GitHub успешно обновил свой парк из более чем 1200 серверов MySQL до версии 8.0, что было непростой задачей из-за сложности экосистемы. Ключевые проблемы включали обеспечение обратной репликации и выявление запросов, которые прошли CI, но не удалось выполнить в рабочей среде. В этом посте команда GitHub описывает, как они решили эти проблемы. Этот опыт привел к разработке новых процессов и операционных возможностей для управления парком серверов MySQL с упором на возможности автоматизации и самовосстановления для будущих обновлений.

The GitHub Blog

Upgrading GitHub.com to MySQL 8.0

GitHub uses MySQL to store vast amounts of relational data. This is the story of how we seamlessly upgraded our production fleet to MySQL 8.0.

[Upgrading GitHub.com to MySQL 8.0](https://github.blog/2023-12-07-upgrading-github-com-to-mysql-8-0/)
We recommend to visit

𝗔𝗹𝗹 𝗱𝗶𝘀𝘀
𝗔𝗹𝗹 𝗻𝗲𝘄 𝘃𝗲𝗿𝗮𝗶𝘁𝘆
𝗩𝗲𝗴/𝗻𝗼𝗻𝘃𝗲𝗴
𝗚𝘂𝗷𝗮𝗿𝘁𝗶/𝗣𝗮𝗻𝗷𝗮𝗯𝗶/𝗦𝗼𝘂𝘁𝗵

𝗞𝗵𝗮𝘁𝗲 𝗷𝗮𝘂 𝗸𝗵𝗮𝘁𝗲 𝗷𝗮𝘂 𝗳𝗼𝗼𝗱 𝗹𝗼𝘃𝗲𝗿 𝗸𝗲 𝗴𝗲𝗲𝘁 𝗴𝗮𝘁𝗲 𝗷𝗮𝘂

Last updated 8 months, 3 weeks ago

https://www.instagram.com/daily__moment__/

Last updated 3 years, 3 months ago

Last updated 1 week, 6 days ago