Наука и данные

Description
Дайджест по полезным и интересным инструментам в науке о данных, машинному обучению и визуализации данных. Создан как записная книжка, которая дополняет страницу https://naukaidannye.netlify.app/
Advertising
We recommend to visit

Официальный новостной канал криптобиржи OKX | www.okx.com на русском языке.

? Комьюнити: t.me/okx_russian

?‍? Поддержка: [email protected]

АДМИН: @DaniiOKX
Маркетинг: @CoffeeTrends

Last updated 2 weeks, 3 days ago

Здесь простым языком про TON, DFC и крипту.

Принимаем автоматически.
Ссылка для друзей: https://t.me/+-EOfWx2pRKhmNGE6
Связь: @deftalk_bot

Last updated 1 month ago

#1 канал о блокчейне, криптовалютах и децентрализованных финансах.

🔥 Реклама — @DCTeam

Last updated 8 hours ago

5 days, 11 hours ago
**Solutions Manual (and Beyond) for ggplot2: …

Solutions Manual (and Beyond) for ggplot2: Elegant Graphics for Data Analysis (3e)

Dr. Aditya Dahiya имеет медицинское образование (Harvard University) и увлекается различными визуальными проектами с участием R, которые можно посмотреть на его странице Presentations, Data Viz & More.

Недавно он напомнил о существовании руководства Solutions Manual (and Beyond) за своим авторством к решению задач для книги ggplot2: Elegant Graphics for Data Analysis (3e), которую написали Hadley Wickham, Danielle Navarro и Thomas Lin Pedersen.

1 week, 3 days ago
**5.** [**TheRules.ru**](https://therules.ru/) - правила русского языка.

5. TheRules.ru - правила русского языка.

1 week, 3 days ago
4**.** [**drawDB**](https://www.drawdb.app/editor) - онлайн рисовалка диаграмм …

4. drawDB - онлайн рисовалка диаграмм (+diagrams.net).

3 months ago

IDE Positron ****

Несомненно, одной из главных тем прошедшей недели стал выход IDE Positron. Например, В Positron недавно включили расширение Quarto (не CLI) и поддержку polars для data explorer.

Уже вышло несколько небольших обзорных статей по новой IDE, например:

✔️ Coding in R and Python with Positron

✔️ Notes on Positron

✔️ Maker of RStudio launches new R and Python IDE

? Можно посмотреть интересную дискуссию разработчиков: Positron Impressions

Также, Matt Dancho поделился своим мнением о Positron:

✔️ Introducing the New Data Science IDE for Python (and R) Users

✔️ Reactions After 1 Week of Using This New IDE for Data Scientists ?

? Однако самое интересное, на мой взгляд, это плейлист на YouTube, в котором James Balamuta делится советами по новой IDE Positron.

Будем присматриваться, пока количество багов и пожеланий просто огромно, но удобство для тех, кто работает с несколькими языками программирования (z.B. R, Rust, Lua, Python) одновременно, точно есть. Кто-то прекрасно себя чувствует и на Emacs/NeoVim/Zed... Кстати, с появлением ядра Ark стало возможно запускать R в Zed (пока экспериментально)! Не стоит забывать, что это всего лишь инструменты для достижения цели.

3 months ago

Что было интересного за неделю?

▫️ Обновился хороший курс по пространственному анализу данных на Python: A course on Spatial Data Science (старая версия + новая версия)

▫️ Kyle Walker рассматривает новые функции mapboxapi для R в применении к геокодированию в статье Drag-and-drop address geocoding with Mapbox in Shiny

▫️ Krzysztof Dyba написал хорошую статью How to load and save vector data in R. Надеюсь, географы помнят, почему мы уже не используем формат Shapefile? (+Shapefile must… be replaced) :) Напомню, что перспективным может стать GeoParquet + GeoArrow

▫️ Elio Campitelli работает над тем, чтобы сделать R-обертку для Climate Data Operators (CDO) + запись в блоге

▫️ Interfacing QGIS spatial processing algorithms from R - презентация по взаимодействию R и QGIS

▫️ Мое внимание привлекли два классных дэшборда: U.S. dams: national overview (Observable + R) и Forecast indicates that Donald Trump is likely to beat Joe Biden (Quarto)

▫️ Новая статья в блоге Quarto: Beautiful Tables in Typst

▫️ Приятно выглядит видео-курс CS50's Introduction to Programming with R (Harvard University), можно обратить внимание на курсы от GRAPH

▫️ В R-Universe сделали WebUI для мобильных устройств, можно проверить: пример 1 + пример 2

▫️ Athanasia Mo Mowinckel делится секретами: Improving your GitHub Profile (с помощью R)

▫️ Nicola Rennie сделала презентацию Faster R code with Rust по основам взаимодействия R и Rust (это бывает полезно, см., например)

▫️ r-polars будет полностью переписан. Возможно, это избавит его от тех недостатков, о которых упоминал Илья, но как он впишется по сравнению с существующими решениями: data.table/arrow/collapse/tidytable(?) - посмотрим

3 months, 1 week ago
3 months, 1 week ago

Что нового было за неделю?

▫️ Стала известна повестка докладов конференции posit::conf(2024) на 12-14 августа. Будем ждать видео!

▫️ Помимо тихого анонса Positron IDE, интерес представляет Ark - ядро R для Jupyter приложений.

▫️ A timeline of R's first 30 years - визуализация первых 30 лет R от Jumping Rivers.

▫️ Вышел webR 0.4.0, можно почитать о новых возможностях, но интересно даже не это, а то, что George Stagg на основе webR делает полноценную замену библиотеке {learnr}. Нас ожидают блоки-песочницы с кодом в Quarto с возможностью параметризации, подсветка синтаксиса. Представленные пользователем решения могут быть оценены либо с помощью алгоритмов оценки, написанных на R, либо с помощью библиотеки {gradethis} для сравнения предоставленного учащимся кода с блоком решения. Будет и интеграция с Observable JavaScript и Python. Если еще добавится возможность собирать ответы в единую базу, а webR-загрузка не будет занимать много времени, этот эксперимент станет уникальным конструктором для создания курсов.

▫️ {mapgl} - новая шикарная библиотека для тех, кто делает интерактивные карты: pak::pkg_install("walkerke/mapgl") Как мне кажется, лучше чем {leafgl}. Обязательно сделаю небольшое руководство по {mapgl} когда библиотека заработает в Quarto.

▫️ Библиотека {ggpp} позволяет существенно расширить возможности ggplot2, добавляя аннотации, стрелки, текст и т.д. в рисунки.

▫️ Библиотека {table1} позволяет создавать замечательные таблицы для описательной статистики.

▫️ Josiah Parry написал статью Read a CSV in a production API о том, как происходит обработка файлов при создании API.

▫️ Emil Hvitfeldt в статье Slidecraft 101: Better SCSS files делится советами по улучшению тем в Quarto-презентациях с помощью Sass.

▫️ Небольшая статья по работе R с MotherDuck (Collaborative serverless analytics platform).

▫️ Новое видео Future of DataFrames and Data Systems with Wes McKinney (creator of pandas and Apache Arrow).

▫️ Канал R Programming 101 предлагает достаточно простые объяснения по работе с R, в частности, последнее видео о том, как сделать 3D-интерактивный график на Plotly.

3 months, 1 week ago
We recommend to visit

Официальный новостной канал криптобиржи OKX | www.okx.com на русском языке.

? Комьюнити: t.me/okx_russian

?‍? Поддержка: [email protected]

АДМИН: @DaniiOKX
Маркетинг: @CoffeeTrends

Last updated 2 weeks, 3 days ago

Здесь простым языком про TON, DFC и крипту.

Принимаем автоматически.
Ссылка для друзей: https://t.me/+-EOfWx2pRKhmNGE6
Связь: @deftalk_bot

Last updated 1 month ago

#1 канал о блокчейне, криптовалютах и децентрализованных финансах.

🔥 Реклама — @DCTeam

Last updated 8 hours ago