طبق آمارهای منتشر شده ، ما تقریباً ۲٫۵ اگزابایت (۲٫۵ × ۱۰۱۸ بایت) داده در روز تولید میکنیم که تا سال ۲۰۲۰ این مقدار به ۴۰ یُتا بایت (۴۰ × ۱۰۲۴ بایت) خواهد رسید که به معنای ۵۲۰۰ گیگابایت به ازای هر نفر است. بسیاری از این دادههای تولیدی حاصل از دستگاههای مرتبط با بسترهای مبتنی بر اینترنت اشیاء مانند حسگرها، RFIDها، تراکنشهای تجاری، محرکها[۱](مانند ماشینآلات و تجهیزاتی که به انواع حسگرها مجهز شده و به منظور کار روی معادن، استخراج نفت و عملیات ساخت استفاده میشوند)، لوازم هوشمند مصرف کنندگان مانند تلفن همراه و تلویزیون و همچنین الگوهای کلیک کاربران و رسانه-شبکههای اجتماعی است.
سهم بسیار زیاد اینترنت اشیاء از چالشهای مطرح در زمینهی کلاندادهها سبب پیدایش مفهومی با نام کاربردهای کلانداده در اینترنت اشیاء[۲](IoTBDAs) در حوزه هایی چون سلامت، شهر هوشمند، تولید هوشمند و شبکههای انرژی هوشمند شده است. حجم زیاد داده و یا به تعبیر دیگر کلاندادهها را به تنهایی نمیتوان پدیده ای نوین دانست بلکه ظهور بسترهای نرمافزاری مناسب برای کار با کلاندادهها با معرفی پارادیامهای برنامه نویسی کارا و هستههایی بهینه شده جهت سازماندهی حجم عظیم دادهها در انواع فرایندهای ذخیره، بازیابی، دریافت/ ارسال بلادرنگ و پردازش کارای این دادهها، علوم کار با کلاندادهها را تعریف میکند. در حالی که سالهای زیادی از ظهور این بسترها نگذشته است و در ابتدای راه پیشرفت خود قرار دارد بسیاری از شرکتهای بزرگ از جمله گوگل، فیسبوک، توئیتر، لینکد-این و بسیاری از شرکتهای مخابراتی بزرگ سرمایه گذاریهای کلانی در این عرصه انجام دادهاند و در بخشهای مختلفی از سرویسهای خود از این بسترها و متدها جهت تشکیل زیرساخت پردازشی و توسعهی برنامههای خود استفاده کرده و همچنین با تشکیل تیمهایی تخصصی پروژه هایی انحصاری و غیر انحصاری را برای پیشرفت هر چه بیشتر در این عرصه تشکیل دادهاند.
در فروردینماه ۹۶، دانشکدهی کامپیوتر دانشگاه اصفهان پس از برگزاری موفق اولین کنفرانس بینالمللی اینترنت اشیاء و ردیابی چالشهای مطرح در این حوزه و الزاماتی که برای ورود کشور به این عرصه وجود دارد یکی از اولین آزمایشگاههای تخصصی اینترنت اشیاء را با پشتوانهی کارگروهی تخصصی از اساتید صاحبنظر دانشکدهی کامپیوتر دانشگاه اصفهان بنا گذاشت. مسائل مطرح شده در پاراگراف پیشین به عنوان یکی از انگیزههای مهم سبب شد در همین راستا گروه کلان دادهی دانشگاه اصفهان با سرپرستی سه تن از اساتید گروه کامپیوتر شامل دکتر محمدعلی نعمتبخش، دکتر افسانه فاطمی و دکتر احمد زائری که در چند سالهی اخیر یکی از زمینههای اصلی فعالیتهای خود را در زمینهی کلان دادهها قرار دادهاند، پس از فعالیت چند ساله در حوزههای مختلف علوم کلان دادهها، به عنوان یکی از اولین خوشههای پژوهش و توسعهی فعال، در آزمایشگاه اینترنت اشیاء دانشگاه اصفهان به ادامهی فعالیت خود بپردازد. در حال حاضر این گروه متشکل از ۳ عضو هیئت علمی، ۹ دانشجوی دکتری و ۴ دانشجوی ارشد است که هر کدام به صورت فردی و یا گروهی بر روی بخشی از اکوسیستم کار با کلان دادهها و در قالب پروژهها و پایاننامههای ارشد و دکتری مشغول پژوهش و توسعه در فناوریهای مربوطه هستند. از جمله موضوعات تحقیقاتی که در این گروه پیش برده میشود میتوان به ارائهی الگوریتمها و شاخصها جهت تجزیه و تحلیل دادههای رفتاری بازیکنان در بازیهای برخط با تعداد انبوه بازیکن[۳] MMOG در قالب بسترهایی چون اسپارک و به طور خاص SparkR و پارادیامهای برنامه نویسی مطرح در اکوسیستم هادوپ چون نگاشت-کاهش[۴] و همچنین تجزیه و تحلیل دادههای تراکنشی حجیم مرتبط در بسترهای نام برده، تحلیل دادههای جریانی شبکههای حسگر با استفاده از بسترهای پردازش جریان دادهای چون Spark Streaming به منظور پشتیبانی از بسیاری از بسترهای هوشمند مبتنی بر اینترنت اشیاء، توسعهی الگوریتمهای تجزیه و تحلیل احساسات در محیط اسپارک و هادوپ، تحلیل و پردازش کلانگرافها با استفاده از بسترهای مرکزیت راس[۵] TLAV و بهینهسازیهای مرتبط، توسعهی الگوریتمهای یادگیری ماشین بستر اسپارک و همچنین ایجاد انبارههای دادهای با استفاده از بسترهایی چون HBase و دیگر پایگاههای دادهای NoSQL مطرح اشاره نمود. در حال حاضر این گروه با پیکربندی کلاسترهای اختصاصی ذخیرهسازی و پردازش کلاندادهها متشکل از بسیاری از اجزای اکوسیستم کار با کلاندادهها ظرفیت کافی برای انجام پروژههای صنعتی و دانشگاهی در سطوح مختلف را دارا بوده و پذیرای هر گونه همکاری در این زمینه است.
گروه کلاندادهی دانشگاه اصفهان به عنوان یکی از گروههای پیشگام در عرصهی علوم کلانداده در کشور در نظر دارد با استفاده از نیروهای جوان دانشگاهی و غیردانشگاهی در اولویت اول تربیت نیروهای متخصص در حوزههای مرتبط را در دستور کار قرار داده و همزمان با آن با قبول و انجام پروژههای صنعتی مورد نیاز کشور، گام موثری در جهت آَشتی میان صنعت و دانشگاه برداشته باشد.
[۱] Actuators
[۲] IoT Big Data Applications
[۳] Massively multiplayer online game
[۴] Map-Reduce
[۵] Think like a vertex