تحلیلگری عظیم‌داده و کسب‌وکار

Description
?تحلیلگری عظیم داده و کسب و کار؛

?Big Data and Business Analytics

آموزش، پژوهش، اطلاع‌رسانی، ترویج و خدمات مشاوره حوزه تحلیلگری عظیم‌داده

سرپرست کانال: دکتر سعید روحانی، عضو هیأت علمی دانشگاه تهران

وبسایت
www.bdbanalytics.ir

ادمین کانال
@BDBA_UT
Advertising
We recommend to visit

ترید شاهین 💸 | 🕋𝐈𝐍 𝐆𝐎𝐃 𝐖𝐄 𝐓𝐑𝐔𝐒𝐓
آموزش صفر تا 100 کریپتو 📊
❗️معرفی خفن ترین پروژه ها‌ در بازار های مالی به صورت رایگان🐳
سیگنال فیوچرز و اسپات (هولد) رایگان🔥
با ما باشی💯 قدم جلویی رفیق🥂
𝐈𝐍𝐒𝐓𝐀𝐆𝐑𝐀𝐌 :
www.instagram.com/trade_shahin

Last updated 2 days, 18 hours ago

[ We are not the first, we try to be the best ]

Last updated 1 month ago

FAST MTPROTO PROXIES FOR TELEGRAM

Ads : @IR_proxi_sale

Last updated 2 weeks, 6 days ago

2 months, 2 weeks ago

? کتاب بخوانیم؛

? "Artificial Intelligence For Business Analytics: Algorithms, Platforms, and Applications Scenarios"

کتاب: هوش مصنوعی برای تحلیل کسب و کار: الگوریتم‌ها­، پلتفرم‌ها و سناریوهای کاربردی

?فصل سوم: هوش مصنوعی و پلتفرم‌های تحلیلگری کسب و کار

بخش اول از فصل سوم کتاب هوش مصنوعی برای تحلیلگری کسب و کار: الگوریتم‌ها، پلتفرم‌ها و سناریوهای کاربردی، ابتدا به مفاهیم و چارچوب‌های نرم افزاری پایه همچون مدیریت داده‌ها، انبارداده، و دریاچه داده پرداخته شده است و سپس به معرفی ابزارها و پلتفرم‌های مختلف مرتبط با پردازش و تحلیل داده‌های عظیم می‌پردازد.
پلتفرم‌هایی که می‌توانند برای پیاده‌سازی دریاچه داده استفاده شوند عبارتند از:
❇️ فایل سیستم توزیع شده هدوپ (HDFS)
❇️ سرویس ذخیره‌سازی ساده آمازون (S3)، ذخیره‌سازی ابری گوگل، ذخیره‌سازی دریاچه داده Azure
❇️ دریاچه‌های داده همچنین می‌توانند با انبارداده کلاسیک، HBase یا پایگاه داده NoSQL (مانند MongoDB) ترکیب شوند.
?پردازش جریان داده و صف پیام
?سیستم‌های مبتنی بر MapReduce مانند Amazon EMR نمونه‌هایی از پلتفرم‌هایی هستند که از پردازش‌های دسته‌ای پشتیبانی می‌کنند. در مقابل، پردازش جریان نیازمند گرفتن یک دنباله از داده‌ها و به‌روزرسانی تدریجی سنجه‌ها، گزارش‌ها و آمار خلاصه در پاسخ به هر مجموعه داده ورودی است. بنابراین، پردازش جریان برای نظارت و پاسخگویی بلادرنگ مناسب‌تر است.

?امروزه بسیاری از شرکت‌ها با ترکیب دو رویکرد و ایجاد یک لایه بلادرنگ (جریان) و یک لایه دسته ای به طور همزمان یا سری، بر روی مدل‌های ترکیبی کار می‌کنند. داده‌ها ابتدا توسط یک پلتفرم داده جریانی برای ارائه بینش‌های بلادرنگ پردازش می‌شوند و سپس به یک مخزن داده بارگذاری می‌شوند که در آنجا می‌توان آن را تبدیل و برای انواع مختلف موارد استفاده پردازش دسته‌ای استفاده کرد.

?سیستم مدیریت پایگاه داده
?یک سیستم مدیریت داده in-memory (IMDBMS) یک سیستم مدیریت پایگاه داده است که عمدتاً برای ذخیره‌سازی، مدیریت و دستکاری داده‌ها به حافظه اصلی متکی است. این کار تأخیر و سربار ذخیره‌سازی دیسک را حذف می‌کند و مجموعه دستورالعمل‌های مورد نیاز برای دسترسی به داده‌ها را کاهش می‌دهد. برای ذخیره‌سازی و دسترسی کارآمدتر، داده‌ها می‌توانند در یک قالب فشرده ذخیره شوند.

*?آپاچی هدوپ
?*محیط‌های عظیم داده معمولاً نه تنها شامل داده‌های عظیم بلکه انواع مختلفی از داده‌های تراکنش ساختاریافته تا انواع نیمه‌ساختاریافته و بدون ساختار اطلاعات مانند سوابق کلیک، وب سرور و لاگ‌های برنامه‌های موبایل، پست‌های رسانه‌های اجتماعی، ایمیل‌های مشتری و داده‌های سنسور از اینترنت اشیا می‌شوند. فناوری که در ابتدا فقط با نام آپاچی هدوپ شناخته می‌شد، به عنوان بخشی از یک پروژه متن‌باز در بنیاد نرم‌افزار آپاچی (ASF) در حال توسعه است. توزیع تجاری هدوپ در حال حاضر توسط چهار ارائه دهنده اصلی پلتفرم داده‌های عظیم ارائه می‌شود: فناوری‌های آمازون وب سرویس‌ (AWS)، کلودرا، Hortonworks و MapR. علاوه بر این، گوگل، مایکروسافت و سایر فروشندگان خدمات مدیریت مبتنی بر ابر را بر اساس هدوپ و فناوری‌های مرتبط ارائه می‌دهند.

?تحلیل داده و زبان‌های برنامه‌نویسی
?علاوه بر الگوریتم‌ها، تحلیل داده همچنین نیازمند پیاده‌سازی و یکپارچه‌سازی با اپلیکیشن‌های موجود است. زبان‌های برنامه‌نویسی مانند پایتون و R در این راستا مورد استفاده قرار می‌گیرند. R نه تنها توسط کاربران دانشگاهی استفاده می‌شود، بلکه بسیاری از شرکت‌های بزرگ از جمله اوبر، گوگل، ایربی‌ان‌بی، فیس‌بوک و غیره نیز از R استفاده می‌کنند.
? اسکالا (Scala) یک زبان برنامه‌نویسی سطح بالا، چند پارادایمی و همه منظوره است. این زبان یک زبان برنامه‌نویسی شیءگرا است که از رویکرد برنامه‌نویسی تابعی نیز پشتیبانی می‌کند. هیچ داده اولیه‌ای وجود ندارد، زیرا همه چیز در اسکالا یک شیء است. اسکالا برای بیان الگوهای رایج برنامه‌نویسی به شیوه‌ای دقیق، مختصر و type-safe طراحی شده است. برنامه‌های اسکالا می‌توانند به بایت کد تبدیل شوند و روی ماشین مجازی جاوا (JVM) اجرا شوند.
?جولیا (Julia) در سال 2009 ایجاد شد و در سال 2012 به عموم معرفی شد. جولیا با هدف رفع کمبودهای پایتون و سایر زبان‌ها و برنامه‌های محاسبات علمی و پردازش داده طراحی شده است. جولیا از metaprogramming پشتیبانی می‌کند. برنامه‌های جولیا می‌توانند برنامه‌های جولیای دیگر را تولید کرده و حتی کد خود را به روشی شبیه به زبان‌هایی مانند Lisp تغییر دهند.

برای مطالعه خلاصه فصل سوم (بخش اول) به لینک زیر مراجعه بفرمایید.

? https://bdbanalytics.ir/hkis

#کتاب_بخوانیم
#هوش_مصنوعی_برای_تحلیل_کسب‌_و_کار
#فصل_سوم
#فاطمه_مظفری

www.bdbanalytics.ir
@BigData_BusinessAnalytics

2 months, 3 weeks ago

? معرفی ابزار Apache Iceberg

ابزارApache Iceberg یک پروژه اپن سورس است که توسط Apache Software Foundation توسعه یافته است. این ابزار برای مدیریت داده‌های عظیم در قالب جداول به گونه‌ای طراحی شده که به مشکلات متداول در سیستم‌های ذخیره‌سازی داده‌های عظیم پاسخ دهد. در ادامه به جزئیات بیشتری از این ابزار پرداخته می‌شود:

ساختار و معماری
ابزارIceberg یک فرمت ذخیره‌سازی و یک لایه مدیریت فراداده است که برای استفاده در محیط‌های توزیع شده طراحی شده است. این ابزار به نحوی طراحی شده که از نسخه‌بندی داده‌ها، تغییرات تدریجی و بهینه‌سازی عملیات خواندن و نوشتن پشتیبانی کند.

ویژگی‌های کلیدی

? نسخه‌بندی و مدیریت تاریخچه داده‌ها:
امکان مدیریت نسخه‌های مختلف از داده‌ها را فراهم می‌کند. این ویژگی به کاربران اجازه می‌دهد تا به سادگی به نسخه‌های قبلی داده‌ها دسترسی پیدا کنند و تغییرات اعمال شده را بررسی کنند.

? تقسیم بندی (Partitioning) پیشرفته:
از سیستم تقسیم‌بندی پیشرفته‌ای استفاده می‌کند که امکان مدیریت بهتر داده‌ها و بهینه‌سازی جستجو و بازیابی داده‌ها را فراهم می‌کند. این سیستم به صورت خودکار تقسیم‌بندی‌ها را بهینه می‌کند تا عملکرد بهتری داشته باشد.

? پشتیبانی از فرمت‌های مختلف داده:
از فرمت‌های داده‌ای مانند Parquet، Avro و ORC پشتیبانی می‌کند. این پشتیبانی از فرمت‌های متنوع به کاربران امکان می‌دهد که از Iceberg در محیط‌های مختلف با فرمت‌های داده‌ای مختلف استفاده کنند.

? همکاری با موتورهای پردازش داده:
به راحتی با موتورهای پردازش داده‌ای مانند Apache Spark، Apache Hive، و Trino (PrestoSQL) یکپارچه می‌شود. این یکپارچگی به کاربران اجازه می‌دهد تا از ابزارهای تحلیلی محبوب خود با Iceberg استفاده کنند.

مزایای استفاده از Apache Iceberg

? مدیریت آسان داده‌ها: با استفاده از Iceberg، مدیریت و نگهداری عظیم داده‌ها آسان‌تر می‌شود.

?بهینه‌سازی عملکرد: با بهینه‌سازی خودکار تقسیم‌بندی و فهرست‌بندی، عملکرد خواندن و نوشتن داده‌ها بهبود می‌یابد.

?انعطاف‌پذیری در تحلیل داده‌ها: Iceberg به کاربران اجازه می‌دهد تا به سادگی تحلیل‌های پیچیده و گسترده‌ای را بر روی عظیم داده‌ها انجام دهند.

کاربردها

?تحلیل عظیم داده‌ها: شرکت‌ها می‌توانند از Iceberg برای تحلیل عظیم داده‌ها استفاده کنند.
?مدیریت داده‌های تاریخی: با قابلیت نسخه‌بندی و مدیریت تاریخچه داده‌ها، Iceberg برای کاربردهایی که نیاز به دسترسی به داده‌های تاریخی دارند، مناسب است.
?بهینه‌سازی عملیات خواندن و نوشتن: Iceberg به دلیل بهینه‌سازی‌های پیشرفته خود، برای محیط‌هایی که نیاز به عملیات خواندن و نوشتن سریع دارند، ایده‌آل است.

می‌توانید این مطلب را در لینک زیر نیز مطالعه فرمایید.

? https://bdbanalytics.ir/sfdm

#معرفی_ابزار
#داده‌های_عظیم
#فاطمه_مصلحی
#Apache_Iceberg

@BigData_BusinessAnalytics
www.bdbanalytics.ir

2 months, 4 weeks ago

?معرفی کتاب

? دایرةالمعارف فناوری‌های عظیم‌داده

"Encyclopedia of Big Data Technologies"

? نویسندگان: Sherif Sakr, Albert Zomaya

?این کتاب در سال ۲۰۲۰ توسط Springer انتشار یافته است.

?دایرةالمعارف فناوری‌های عظیم‌داده توسط کارشناسان موضوعی از سراسر جهان، هم در صنعت و هم در دانشگاه، تالیف شده است، طیف گسترده ای از موضوعات عظیم داده را با عمق و دقت بی نظیری پوشش می‌دهد. هیئت نویسندگان، متشکل از ۳۵ محقق برجسته، تضمین می‌کنند که هر بخش به طوری طراحی شده تا مناسب‌ترین اصطلاحات را به تصویر بکشد. این کارشناسان مقالات را به شیوه‌ای سازگار و استاندارد توسعه می‌دهند و از محتوای با کیفیت و قابل اعتماد، اطمینان می‌دهند.

?این کتاب مرجع گسترده به نیاز حیاتی برای وجود یک منبع تحقیقاتی جامع در حوزه فناوری‌های عظیم‌داده‌ می‌پردازد، از مرزهای انضباطی فراتر می‌رود و رشته‌های فنی مانند سیستم‌های ذخیره‌سازی عظیم داده، پایگاه‌های داده NoSQL، محاسبات ابری، سیستم‌های توزیع‌شده، یادگیری ماشین و فناوری‌های اجتماعی را در بر می‌گیرد.

ویژگی‌های کلیدی:

?پوشش جامع: این دایرةالمعارف بیش از ۳۰۰ مدخل را ارائه می‌کند که مفاهیم و اصطلاحات کلیدی را در زمینه گسترده عظیم‌داده و یادگیری ماشین پوشش می‌دهد. هر ورودی شامل مقالات عمیق، تعاریف، پیشینه تاریخی، برنامه‌های کاربردی کلیدی و کتابشناسی ست که درک کاملی از موضوع را ارائه می‌دهد.

?ارجاعات متقابل گسترده: برای تسهیل در کشف سریع و کارآمد اطلاعات، دایرةالمعارف شامل ارجاعات متقابل گسترده است که به خوانندگان امکان می‌دهد به طور یکپارچه در موضوعات مرتبط به هم حرکت کنند.

?رویکرد میان رشته‌ای: دایرةالمعارف صرفاً بر یک رشته یا حوزه تحقیقاتی تمرکز نمی‌کند بلکه جنبه‌ها و فناوری‌های مختلف مربوط به عظیم داده را پوشش می‌دهد، از جمله فناوری‌های فعال، یکپارچه‌سازی داده‌ها، ذخیره‌سازی و نمایه‌سازی، فشرده‌سازی داده‌ها، مدل‌های برنامه‌نویسی، سیستم‌های SQL، سیستم‌های جریان، پردازش داده‌های معنایی، تجزیه و تحلیل گراف، مدیریت داده‌های مکانی، تجزیه و تحلیل، تجزیه و تحلیل فرآیند کسب‌وکار، پردازش بر روی سخت افزار مدرن، برنامه‌های امنیت و حریم خصوصی.

?با درک پتانسیل بالای تجزیه و تحلیل عظیم داده، جوامع تحقیقاتی، شرکت‌ها و بخش‌های دولتی به طور مداوم در این حوزه پیشرفت می‌کنند. هدف "دایرةالمعارف فناوری‌های عظیم داده" ارائه یک نمای کلی جامع از این پیشرفت‌ها است و اطمینان حاصل می‌کند که مدخل‌ها به طور مرتب به روز می‌شوند تا آخرین پیشرفت‌ها را منعکس کنند. همچنین با مشارکت بسیاری از رهبران در این زمینه، دایرةالمعارف مطالب خواندنی ارزشمندی را برای طیف گسترده‌ای از مخاطبان، از محققان متخصص و مهندسان نرم افزار گرفته تا دانشجویان و پژوهشگران جوان ارائه می‌دهد.

این کتاب را می‌توانید در لینک زیر دریافت فرمایید.

? https://bdbanalytics.ir/2vk7

#معرفی_کتاب
#عظیم_داده
#زهرا_رفیعی‌پور

@BigData_BusinessAnalytics
http://www.bdbanalytics.ir

3 months ago

? معرفی کسب و کار داده محور

?شرکت Airbnb یکی از بزرگ‌ترین پلتفرم‌های اجاره کوتاه‌مدت در دنیا است. این شرکت از داده‌ها به طور گسترده‌ای استفاده می‌کند تا خدمات خود را بهینه‌سازی کند، تجربه کاربران را بهبود بخشد و تصمیم‌گیری‌های هوشمندانه‌تری انجام دهد. در این مقاله، به بررسی چگونگی استفاده از داده‌ها در این شرکت می‌پردازیم.

? پلتفرم Airbnb یک بازار آنلاین است که افراد می‌توانند از طریق آن محل اقامت خود را به اشتراک بگذارند یا مکان‌هایی را برای اقامت خود اجاره کنند. این پلتفرم از سال 2008 آغاز به کار کرده و از آن زمان به یکی از بزرگ‌ترین پلتفرم‌های اجاره کوتاه‌مدت در جهان تبدیل شده است. موفقیت Airbnb به عوامل متعددی از جمله استفاده هوشمندانه از داده‌ها وابسته است.

?انواع داده‌های مورد استفاده در Airbnb
این پلتفرم از انواع مختلف داده‌ها برای بهینه‌سازی خدمات خود استفاده می‌کند. برخی از مهم‌ترین این داده‌ها عبارتند از:
1️⃣ داده‌های کاربران: شامل اطلاعات پروفایل کاربران، تاریخچه رزروها، نظرات و امتیازات کاربران.
2️⃣ داده‌های میزبان‌ها: شامل اطلاعات پروفایل میزبان‌ها، ویژگی‌های ملک‌ها، قیمت‌گذاری و دسترسی‌ها.
3️⃣ داده‌های مکانی: شامل موقعیت جغرافیایی ملک‌ها، جاذبه‌های محلی و اطلاعات حمل‌ونقل.
4️⃣ داده‌های بازار: شامل تحلیل عرضه و تقاضا، روندهای بازار و قیمت‌گذاری رقابتی.

?این پلتفرم از تکنیک‌های پیشرفته تحلیل داده و یادگیری ماشین برای بهبود خدمات خود استفاده می‌کند. برخی از کاربردهای اصلی این تکنیک‌ها در Airbnb عبارتند از:
?پیش‌بینی قیمت‌ها
?توصیه‌گرها
?تشخیص تقلب
?شخصی‌سازی تجربه کاربر
?بهینه‌سازی قیمت‌گذاری
?تطبیق بهتر مهمان و میزبان
?بهبود تجربه کاربران با استفاده از داده‌ها:
?بهینه‌سازی جستجو
الگوریتم‌های جستجوی Airbnb با استفاده از داده‌های کاربران و ملک‌ها، نتایج جستجوی بهتری را ارائه می‌دهند. این الگوریتم‌ها با تحلیل کلمات کلیدی، ترجیحات کاربران و تاریخچه جستجوها، نتایج مرتبط‌تری را به کاربران نمایش می‌دهند.
?پشتیبانی مشتریان
پلتفرم Airbnb از داده‌ها برای بهبود خدمات پشتیبانی مشتریان استفاده می‌کند. با تحلیل داده‌های تماس‌ها و مشکلات گزارش‌شده، این شرکت می‌تواند مشکلات رایج را شناسایی و راه‌حل‌های مناسبی ارائه دهد. این تحلیل‌ها به بهبود فرآیندهای پشتیبانی و افزایش رضایت مشتریان کمک می‌کند.
?بهینه‌سازی عملیات و فرآیندهای داخلی
علاوه بر بهبود تجربه کاربران، Airbnb از داده‌ها برای بهینه‌سازی عملیات و فرآیندهای داخلی خود نیز استفاده می‌کند. برخی از کاربردهای اصلی داده‌ها در این زمینه عبارتند از:
1️⃣ مدیریت موجودی
2️⃣ تحلیل عملکرد

?چالش‌ها و فرصت‌های آینده
استفاده از داده‌ها در Airbnb با چالش‌هایی نیز همراه است. برخی از این چالش‌ها عبارتند از:
?حفظ حریم خصوصی
یکی از مهم‌ترین چالش‌ها در استفاده از داده‌ها، حفظ حریم خصوصی کاربران است. Airbnb باید اطمینان حاصل کند که داده‌های کاربران به صورت ایمن نگهداری و استفاده می‌شوند و حریم خصوصی آنها رعایت می‌شود.
?مدیریت داده‌های عظیم
این شرکت با حجم زیادی از داده‌ها سروکار دارد و مدیریت این داده‌ها یکی از چالش‌های مهم است. بنابراین باید از ابزارها و تکنولوژی‌های مناسب برای ذخیره، پردازش و تحلیل این داده‌ها استفاده کند.
?بهبود مداوم الگوریتم‌ها
الگوریتم‌های تحلیل داده و یادگیری ماشین نیاز به بهبود و به‌روزرسانی مداوم دارند. Airbnb باید از تیم‌های متخصص و منابع کافی برای بهبود مداوم این الگوریتم‌ها استفاده کند.

?نتیجه‌گیری
استفاده از داده‌ها در Airbnb یکی از عوامل اصلی موفقیت این شرکت است. این شرکت با استفاده از داده‌های مختلف، تحلیل‌های پیشرفته و الگوریتم‌های یادگیری ماشین، خدمات خود را بهینه‌سازی کرده و تجربه کاربران را بهبود می‌بخشد. با وجود چالش‌های موجود، Airbnb همچنان به بهره‌برداری از داده‌ها برای رشد و نوآوری ادامه می‌دهد.

برای مطالعه این مطلب به لینک زیر مراجعه بفرمایید.

? https://bdbanalytics.ir/kka0

#محمدرضا_مرادی
#کسب_و_کار_داده_محور
#Airbnb

@BigData_BusinessAnalytics
www.bdbanalytics.ir

3 months, 3 weeks ago

? بیست و سومین شماره فصلنامه گروه تحلیلگری عظیم‌داده و کسب‌وکار

#فصلنامه_الکترونیک
#بهارنامه

www.bdbanalytics.ir
@BigData_BusinessAnalytics

3 months, 3 weeks ago
***?*** بهارنامه

? بهارنامه

فایل بیست و سومین شماره فصلنامه گروه تحلیلگری عظیم‌داده و کسب‌وکار (بهار 1403) در پست بعد قابل دریافت می‌باشد.

#فصلنامه_الکترونیک
#بهارنامه

www.bdbanalytics.ir
@BigData_BusinessAnalytics

4 months, 1 week ago

?معرفی مقالات حوزه عظیم داده‌ها
❇️ نام مقاله:

A Tutorial on Federated Learning from Theory to Practice: Foundations, Software Frameworks, Exemplary Use Cases, and Selected Trends

✍️ نویسندگان:

M. Victoria Luzón, Nuria Rodríguez-Barroso, Alberto Argente-Garrido , Daniel Jiménez-López, Jose M. Moyano, Javier Del Ser, Weiping Ding, Francisco Herrera

? سال انتشار: ۲۰۲۴
? ژورنال:
IEEE/CAA Journal of Automatica Sinica

?مقاله با این مقدمه آغاز شده که هنگامی که حفظ حریم خصوصی داده‌ها به عنوان یک ضرورت در نظر گرفته می‌شود، یادگیری مشارکتی (فدرال FL) به عنوان یک زمینه هوش مصنوعی مرتبط برای توسعه مدل‌های یادگیری ماشین در یک محیط توزیع شده و غیرمتمرکز ظاهر می‌شود.

? یادگیری مشارکتی اجازه می‌دهد تا مدل‌های ML بر روی دستگاه‌های محلی بدون نیاز به انتقال داده متمرکز آموزش داده شوند، در نتیجه به دلیل توانایی ذاتی خود در بهبود مسائل مربوط به حفظ حریم خصوصی و کارایی یادگیری توزیع شده، توجه پژوهشگران زیادی را به خود جلب کرده است . بعلاوه این رویکرد بسیار مقیاس پذیر بوده  چراکه می‌تواند شرکت کنندگان متعددی را که هر کدام منابع داده خود را دارند، پوشش دهد. این مساله می‌تواند به ویژه در سناریوهایی با تولید مداوم داده مفید باشد، به عنوان مثال، در دستگاه‌های حسگر اینترنت اشیا. در نتیجه، FL به یک زمینه مهم هوش مصنوعی تبدیل شده است و علاقه محققان، توسعه دهندگان و دانشمندان داده را در مطالعات نظری و عملی و بخصوص برنامه هایی که با داده‌های حساس سروکار دارند، به خود جلب کرده است.

?اولین برنامه موفق FL توسط Google برای پیش‌بینی ورودی متن کاربر توسعه داده شد بطوریکه داده‌ها به صورت محلی در ده‌ها هزار دستگاه Android، نگهداری می‌شد. از آن زمان، FL برای طیف گسترده‌ای از کاربردها در زمینه‌های مختلف، از مهندسی صنایع گرفته تا مراقبت های بهداشتی به کار گرفته شده است.

?مقاله پس از ذکر مقدمات ، در بخش 2 به چرایی و چگونگی FL پرداخته و تاکید می‌کند که یادگیری ماشین یکی از زمینه‌های پرکاربرد هوش مصنوعی است که به دلیل افزایش تقاضا از نظر حجم و تنوع داده‌ها منجر به چالش‌های متعددی در رابطه با حریم خصوصی داده‌ها و پردازش چنین حجم زیادی از داده‌ها شده است. در حقیقت چالش‌هایی نظیر حفظ حریم خصوصی، ارتباطات و دسترسی به داده‌ها منجر به شکل گیری رویکرد یادگیری مشارکتی (فدرال) یا FL شده است. 

?در بخش 3، مقاله ضمن بررسی زیرساخت یادگیری مشارکتی و عناصر کلیدی آن، 2 معماری اصلی در این حوزه و وجه تمایز آنها را شرح داده و قسمت بعد به توضیح امنیت داده در این رویکرد می‌پردازد.

? در بخش چهارم، مقاله به معرفی مجموعه داده‌ها و چارچوب‌های نرم افزاری پیشرفته در این حوزه پرداخته و پرکاربردترین مجموعه داده‌ها در ادبیات موضوع را برای انجام آزمایشات FL ارائه کرده و سپس طیف وسیعی از چارچوب‌های نرم‌افزاری پیشرفته برای طراحی چنین مطالعاتی را از زوایای مختلف مورد تجزیه و تحلیل قرار داده است .

? در بخش پنجم مقاله، دستورالعمل‌های روش شناختی برای شبیه‌سازی سناریوهای FL ارائه شده است.

?بخش ششم مقاله به پاسخ به این پرسش می‌پردازد که اساسا" زمانی که داده‌ها بین چندین کلاینت توزیع می‌شود، آیا FL نسبت به رویکرد دیگر (غیر FL)  مزیتی دارد یا خیر و به ارائه یک مقایسه عملکرد بین استراتژی‌های FL و غیرFL می‌پردازد.

? در بخش هفتم مقاله به ارائه شش مورد مطالعاتی در زمینه بکارگیری FL  می‌پردازد و پیاده‌سازی راه حل را با استفاده از 3 فریمورک مختلف (TFF, Flower و FATE) نشان می‌دهد.

?  در نهایت در بخش هشتم روندهای مطالعاتی در حوزه FL ارائه شده که می‌تواند چشم اندازهای تحقیقاتی مناسبی را برای پژوهشگران معرفی نماید.  

? این مقاله سعی کرده تا با نگاه جامعی که به مفهوم و کاربردهای FL دارد، بتواند به عنوان مرجعی برای پژوهشگران این حوزه مطرح شود. 

?در صورت تمایل، می‌توانید فایل مقاله را از لینک زیر دریافت فرمایید.

? https://bdbanalytics.ir/oyip

#معرفی_مقاله
#تحلیل_عظیم_داده
#صبا_بزرگی
www.bdbanalytics.ir
@BigData_BusinessAnalytics

4 months, 2 weeks ago

?معرفی کتاب

? تحلیل افراد در زمانه‌ی عظیم‌داده

"People Analytics in the Era of Big Data: Changing the Way You Attract, Acquire, Develop, and Retain Talent”

? نویسندگان: Jean Paul Isson, Jesse S. Harriott

?این کتاب در سال ۲۰۱۶ و توسط Wiley انتشار یافته است.

?این کتاب را می‌توان به عنوان راهنمایی کامل استفاده از تحلیل عظیم داده در فرایندهای مختلف منابع انسانی در نظر گرفت که با تمرکز بر مدیریت استعداد و استفاده از داده‌های افراد در فرایندهای مختلف نگاشته شده است.
?کتاب به ۱۴ فصل تقسیم شده که ۳ فصل اولیه به مقدمات تحلیل افراد، فصول ۴ تا ۱۲ به بررسی جداگانه‌ی فرایندهای منابع انسانی و استفاده از تحلیل افراد در آن‌ها پرداخته شده و در نهایت در دو فصل آخر ترکیب عظیم داده و تحلیل افراد و آینده‌ی تحلیل افراد را بررسی می‌کند. ساختار کتاب به گونه‌ای است که در هر فصل علاوه‌ بر توضیح مفاهیم، شامل مصاحبه با صاحب‌نظران هر حوزه در استفاده از تحلیل افراد در آن حوزه و مطالعه‌ موردی‌های مختلف در پیاده‌سازی‌های موفق تحلیل افراد در آن حوزه‌ها می‌شود.

?کتاب ۷ ستون اصلی موفقیت تحلیل افراد را به صورت زیر معرفی می‌کند و در نهایت ترکیب این مفاهیم را با اهرم تحلیل عظیم‌داده مورد بررسی قرار می‌دهد:

? تحلیل برنامه‌ریزی افراد.
?تحلیل‌های منبع‌یابی.
?تحلیل‌های جذب و استخدام.
?آنبورد افراد، سازگاری فرهنگی و مشارکت کارکنان.
?ارزیابی عملکرد، توسعه و ارزش طول عمر کارکنان.
?خروج و نگهداشت کارکنان.
?سلامتی، بهداشت و امنیت کارکنان.

?نگارندگان سعی داشته‌اند داده‌محور شدن تصمیم‌های مدیران منابع انسانی و مبتنی بر واقعیت شدن آن‌ها را با توجه به رشد روزافزون حجم، تنوع و سرعت داده‌ها که عظیم‌داده را شکل می‌دهند در این کتاب هدف قرار دهند که با توجه به ساختار موجود در کتاب می‌توان نتیجه گرفت تا میزان زیادی به این مهم دست پیدا کرده‌اند.

این کتاب را می‌توانید در لینک زیر دریافت فرمایید.

? https://bdbanalytics.ir/qrp3

#معرفی_کتاب
#عظیم_داده
#احسان_نگهدار

@BigData_BusinessAnalytics
http://www.bdbanalytics.ir

We recommend to visit

ترید شاهین 💸 | 🕋𝐈𝐍 𝐆𝐎𝐃 𝐖𝐄 𝐓𝐑𝐔𝐒𝐓
آموزش صفر تا 100 کریپتو 📊
❗️معرفی خفن ترین پروژه ها‌ در بازار های مالی به صورت رایگان🐳
سیگنال فیوچرز و اسپات (هولد) رایگان🔥
با ما باشی💯 قدم جلویی رفیق🥂
𝐈𝐍𝐒𝐓𝐀𝐆𝐑𝐀𝐌 :
www.instagram.com/trade_shahin

Last updated 2 days, 18 hours ago

[ We are not the first, we try to be the best ]

Last updated 1 month ago

FAST MTPROTO PROXIES FOR TELEGRAM

Ads : @IR_proxi_sale

Last updated 2 weeks, 6 days ago