-
-
۱۷۹۹
اهمیت و ارزش اطلاعات
داده چیست؟ تلقی عموم مردم از دادهها (بالأخص دادههای رایانهای) شامل متنهای طولانی از حروف و عدد بر روی مانیتورهای کامپیوتر است که با صفحهکلید و موشواره به کامپیوتر واردشدهاند. برای آنها که بازتر به موضوع نگاه میکنند، عکس، صوت و فیلم نیز میتواند از اشکال دیگر داده باشد. ولی واقعیت این است که در حال حاضر، داده در معنای کلی آن بسیار وسیعتر و پیچیدهتر از این تلقی ساده است. ظهور شبکههای هوشمند در دهه اخیر باعث شده است که تلقی سنتی هم از داده و هم از دستگاههای ورودی داده دچار تغییر اساسی شود. درواقع در فضای مجازی امروز، دادهها شامل هر جزء کوچکی از دانستههایی است که میتواند از راههای بسیار متنوعی به دست بیاید. انواع دادههایی که امروزه با آن سروکار داریم میتواند شامل این موارد باشد:
- دادههای وب: دادههای رفتار سطح وب مشتریان مانند بازدید صفحات، جستوجوها، خواندن نقد و بررسیها، خریدها و حتی میزان مکثی که در هر صفحه وب یا اجزای صفحه صورت میگیرد.
- دادههای متنی: مانند ایمیلها، اخبار، محتواهای متنی وب، اسناد و دیگر موارد.
- دادههای چندرسانهای: شامل تصویر و فیلم
- دادههای زمانی و مکانی: اطلاعات GPS، شبکههای تلفنهای موبایل و اتصالات وایفای
- دادههای حسگرها و شبکههای هوشمند: این دادهها امروزه از خودروهای هوشمند، تلفنهای هوشمند و دیگر وسایل ارتباطی، تأسیسات زیرساختی مانند خطوط انتقال نفت و توربینهای بادی و دیگر حسگرهای استفادهشده در پروژههای اینترنت اشیا جمعآوری میگردد
- دادههای شبکههای اجتماعی: مجموعه تعاملات افراد در شبکههای اجتماعی، علاقهمندیها، جستجوها، تأییدها و رد کردنها، منتشر کردن نظرات دیگران یا دیگر اقداماتی که فرد در این شبکهها انجام میدهد، منبع عظیمی از دادهها را تولید میکند.
بخشی از این دادهها آگاهانه و توسط کاربر بارگذاری میشود مانند ایمیلی که فرد بر روی سایت جیمیل بارگذاری میکند یا مطلبی که در شبکههای اجتماعی ارسال میکند و بخش دیگری از این اطلاعات بدون آگاهی کاربر جمعآوری و ارسال میگردد مانند مجموعه اطلاعاتی که حسگرهای موبایل جمعآوری میکنند یا دادههای مربوط به اقدامات و تعاملات کاربر در محیط سایتها و شبکههای اجتماعی که بهطور مستمر رصد و جمعآوری میشود یا فرادادههایی که بدون اجازه و دخالت کاربر توسط دستگاههای مختلف ایجاد و همراه دیگر دادهها ارسال میگردد.
نوع اطلاعات سرقت شده و بیگ دیتا
نکته دیگری که باید به آن توجه ویژهای مبذول داشت عبارت است از آنکه چه نوع اطلاعاتی از مردم جامعه سرقت میشود و تجمیع این اطلاعات، چه امکاناتی را فراروی دشمنان کشور قرار میدهد. ازاینرو باید به نکاتی چند توجه شود:
1. سرقت اطلاعات بدون اجازه کاربر
همانگونه که سابقا در پایگاه بصیرت رسانه مرشدخان بیان شد، برخی اطلاعات با اجازه کاربر و با اراده او در اختیار خدمات دهندگان قرار میگیرد. اما برخی اطلاعات بدون اجازه کاربر جمعآوری میشود که بسیار خطرناک است. برخی از مهمترین اطلاعاتی که بدون اجازه کاربر سرقت میشوند عبارت است از:
- گرفتن عکس و فیلم با استفاده از دوربین جلویی و پشتی دستگاه ارتباطی (در هر لحظه ممکن است)
- ضبط صدا ( در هرلحظه ممکن است)
- رصد دائم محل تردد کاربر
- کل اطلاعات ذخیرهشده روی حافظه جانبی و حافظه دستگاه ارتباطی
- فهرست مخاطبین
- فهرست تماس و تاریخچه آن
- پیامکهای کاربر
- سایر حسابهای کاربری مانند ایمیلها
2. فراداده، دادههایی پنهان در دل دیگر دادهها
اصطلاح فراداده یا متادیتا معمولاً به دادههایی اطلاق میشود که جزئیات خاصی را راجع به دیگر دادههای تولیدشده شرح میدهد. این دادهها که بهصورت خودکار تولید میشوند بهطورمعمول توسط عموم کاربران قابلدیدن و ویرایش نیستند و تنها با کندوکاو بیشتر به چشم میآیند. بهطور مثال، عکس تهیهشده توسط یک دوربین دیجیتال را در نظر بگیرید. دوربین دیجیتالی به همراه هر عکسی که ایجاد میکند، مجموعهای از دادهها شامل: ابعاد عکس، عمق رنگ، رزولوشن، تاریخ ثبت تصویر، مدل دوربین، سرعت شاتر، اطلاعات توصیفی عکس (با کمک کلمات کلیدی) و... نیز تولید مینماید که این اطلاعات متنی در داخل فایل اصلی عکس ذخیره میشود. درواقع با انتقال هر عکس، مجموعهای از دادههای متنی که در داخل فایل عکس ذخیره شده و در حالت عادی قابلدیدن نیست هم منتقل میشود. حال اگر دوربین دیجیتال فوق به اطلاعات مکانی نظیر جیپیاس (سیستم موقعیتیاب جهانی) نیز دسترسی داشته باشد، (مانند دوربینهای دیجیتال گوشیهای هوشمند)، اطلاعات دقیق مربوط به مکان عکس گرفته شده نیز منتقل میشود.
فرادادهها تقریباً در تمام اسنادی که ما ایجاد میکنیم وجود دارند. مثلاً در فایلهای متنی، اطلاعاتی از قبیل تعداد صفحات، نویسنده، تاریخ نگارش، خلاصهای از محتوای سند و ... و در فایلهای تصویری اطلاعاتی نظیر مدتزمان، بیت ریت، سال انتشار، سبک یا ژانر و … در قالب متادیتا ذخیره میشود.
فرادادههای مستتر در اسناد بهطورمعمول قابلحذف یا ویرایش نیستند و برای آن بخشی از آنها که قابلیت حذف یا ویرایش دارند نیز باید از نرمافزارهای مخصوص استفاده کرد.
موتورهای جستجو و نرمافزارهای مدیریت داده معمولاً از این فرادادهها برای افزایش کارآمدی نتایج جستجوهای درخواستی استفاده میکنند. ولی برای شرکتهای تبلیغاتی یا مؤسسات امنیتی کارکرد فراداده بسیار گستردهتر است.
3. اقیانوس دادهها؛ تنوع راههای جمعآوری داده
یک سایت پخش فیلم و کلیپ را در نظر بگیرید. کاربر در سایت جستجو میکند، کلیپ موردعلاقه خود را پیدا کرده و آن را پخش میکند. در ظاهر یک بده بستان ساده دادهای رخ داده است. کاربر نام یا بخشی از نام یا مشخصات ویدئوی مورد نظرش را در اختیار سایت قرار میدهد و سایت با جستجو، نزدیک نتیجهای که ممکن است را نمایش میدهد. ولی آیا کاربر تنها همین اطلاعات را در اختیار سایت قرار داده است؟ ظاهراً کاربر اطلاعات دیگری را وارد نمیکند ولی در حقیقت مدیران سایت از مجموعه تعاملات کاربر با سایت دادههای خیلی بیشتری میتوانند به دست آوردند. دادههایی مانند: آیا کاربر از نتیجه جستجو راضی است؟(کلیپ را پخش کرده؟) بهطور کامل پخش کرده یا پس از دیدن ابتدای کلیپ آن را قطع کرده است؟ کاربر برای بار چندم است این کلیپ را میبیند؟ کاربر چه موضوعی را بلافاصله بعدازاین ویدئو جستجو کرده است؟ آیا کاربر کلیپ را کامل دیده یا بهصورت منقطع؟ آیا دنبال قسمت خاصی از کلیپ میگشته؟ آیا پس از دیدن کلیپ، بر روی نشر دهنده آن کلیک کرده تا کلیپهای دیگر آن نشر دهنده را ببیند؟ بازخورد ارادی (با ثبت لایک و نظر) او از کلیپ چیست؟ کاربر چه بازخوردی را میخواسته منتشر کند ولی بدون ارسال آن را حذف کرده است؟...
این دادهها، بخشی از دادههایی است که معمولاً با تعامل آگاهانه با کاربر جمعآوری میشود. حال فرض کنید دسترسی به وب کم[1] کاربر یا دسترسی به اطلاعات درون حافظه دستگاه کاربر و... برای سرپرست سایت فیلم فراهم باشد. در این صورت او میتوان اطلاعات دیگری را جمعآوری کند که در آن تعامل فعال کاربر نقشی ندارد. بهطور مثال عکسالعملهای غیرارادی و زبان بدن کاربر در مواجه با کلیپ موردنظر میتواند از طریق وب کم جمعآوری شود. یا در صورت دسترسی به حافظه دستگاه، لیست فیلمها و کلیپهایی که در رایانه یا گوشی فرد موردنظر موجود است میتواند یک داده جدید باشد.
در هنگام استفاده از رایانه، اصولاً هر چیزی که شما فکرش را میکنید بالقوه یک داده است. و البته هر چیزی که شما فکرش را نمیکنید!
4. فضای ابری رایگان، لطف شرکتهای اینترنتی یا پروژه سازمانهای اطلاعاتی؟
فضای ابری، فضایی برای ذخیرهسازی دادهها بهصورت آنلاین است. این امر بدین معنی است که کاربران اطلاعات خود را بهجای اینکه بر روی حافظههای داخل رایانه یا گوشی هوشمند خود ذخیره کنند، آنها را بر روی اینترنت و درواقع بر روی سرورهایی که شرکتهای اینترنتی به همین منظور ایجاد کردهاند بارگذاری میکنند. از مزایای ظاهری این سرویسها این است که کاربر در هرجایی که اینترنت وجود داشته باشد به اطلاعات خود دسترسی دارد و اگر در اثر اتفاق یا حادثهای رایانه شخصی یا ابزار ذخیرهسازیاش دچار ایراد شود و دادههای ذخیرهشدهاش از بین برود، دادهها در فضای ابری و در سرورهای شرکت خدمات دهنده حفظ میشود. این دو مشخصه باعث شده است تا بسیاری از مردم در دنیا از فضای ابری برای ذخیرهسازی اطلاعات ارزشمند خود استفاده کنند. بهطور مثال بسیاری از مردم از فضای ابری برای ذخیرهسازی عکسهای خانوادگی شخصی یا اطلاعت کاری، نوشتهها، تحقیقات و پژوهشهایی که برایشان اهمیت زیادی دارد استفاده میکنند.
شرکتهای زیادی در اینترنت خدمات فضای ابری ارائه میدهند که ازجمله مهمترین آنها گوگل (با سرویس گوگل درایو)، مایکروسافت (با سرویس وان درایو)، اپل (با سرویس آی کلود)، دروپ باکس و... است. نکته جالبتوجه در این مسئله این است که بسیاری از این سرویسها بهصورت رایگان یا با هزینههای بسیار کم در اختیار کاربران قرار میگیرد. یعنی کمپانی مانند گوگل بهطور پیشفرض فضایی معادل 15 گیگابایت فضای ابری رایگان را در اختیار کاربران قرار میدهد و با هزینه بسیار اندک ماهی 2 دلار این میزان فضا را به 100 گیگابایت افزایش میدهد. البته هیچ ارزانی بیحکمت نیست! درآمدی که گوگل میتواند از تحلیل و فروش دادههای ذخیرهشده ببرد بسیار بیشتر از هزینههای این سرویس میتواند باشد و سازمانهای اطلاعاتی بهعنوان مشتری اصلی این دادهها، مشتریان خوشحسابی هستند.
تبیین چیستی دادهکاوی[2] اطلاعات و نتایج حاصل از آن
با توجه به مطالبی که تاکنون عنوان شد، لازم است با مفهوم دادهکاوی و نتایج حاصل از آن نیز آشنا شویم. فهم این نکته، موجب درک اهمیت پرداختن به آسیبهای آیندهپژوهانه میشود.
1. مفهوم دادهکاوی
دادهکاوی به معنی استخراج اطلاعات معتبر، قابلاتکا و سودمند از میان دریای دادههای جمعآوریشده از منابع مختلف است. این کار بهطورمعمول با استفاده از روشهای گوناگون تجزیهوتحلیل و آنالیز داده صورت میگیرد. در عصر حاضر شرکتها و مؤسسات خصوصی و دولتی با انبوهی از دادههای در ظاهر نامربوط و غیرقابل استفاده مواجهاند که به شیوههای مختلفی جمعآوریشده است. به مثال سایت پخش کلیپ برگردیم. فرض کنید مدیر سایت پخش کلیپ، با دست باز و دسترسی کامل بتواند دادههای تعاملی و غیرتعاملی کاربران را به روشهای مختلف جمع کند او سپس با تجزیهوتحلیل این اطلاعات میتواند تا میزان زیادی به سلیقه، علایق و روحیات کاربران پی ببرد و سایت را طوری تنظیم کند تا دفعه بعد پس از ورود کاربر، کلیپهایی نمایش داده شود که مطابق سلیقه و علاقه اوست. امروزه این کار بهصورت روتین و گسترده در سایتهای پخش فیلم و کلیپ، شبکههای اجتماعی و سایتهای خرید آنلاین صورت میگیرد. اصولاً اکثر پیشنهادهایی که در این سایتها به کاربر صورت میگیرد، محصول تجزیه تحلیل دادههای تعاملی آن فرد یا مجموعهای از کاربران شبیه به او است (البته این مورد صرفاً در مسائل غیر ایدئولوژیک صحت دارد. در فصل آتی، توضیحات مبسوطتری ارائه خواهد شد).
از طرف دیگر جمعآوری دادهها از کاربران به هر نحو ممکن و آنالیز آنها، فقط بهقصد استفاده در سایت موردنظر و بهینهسازی جستجو و دسترسی نیست. بلکه بسیاری از این اطلاعات بهآسانی در اختیار شرکتها و کمپانیهای دیگر قرار میگیرد و اصولاً هر کس پول خوبی بدهد میتواند دادههای موردنیاز خود را خریداری کند. افشای رسواییهای متعدد شرکتهای مختلف ارائهدهنده خدمات اینترنتی نظیر [3]AT&T، گوگل و Facebook در فروش اطلاعات کاربران خود به شرکتهای دیگر و آژانسهای اطلاعاتی، مؤید این نکته است که رصد، جمعآوری، ذخیره و فروش اطلاعات و تعاملات کاربران در اینترنت امری روتین بوده است و یک استثنا یا مورد خاص نیست
2. از پیشنهاد فیلم تا تحلیل افکار دشمن
دادهکاوی در طیف گستردهای از فعالیتهای تجاری و غیرتجاری صورت میگیرد. از شناسایی الگوی خرید مشتریان در سایتهای خرید آنلاین گرفته تا تحلیل علایق افراد در شبکههای اجتماعی. ولی گستردهترین کاربرد دادهکاوی در سازمانهای اطلاعاتی صورت میگیرد جایی که دادهکاوی بر روی دادههای بزرگ (اَبَردادهها) انجام میگیرد که بهطور گسترده از کشورهای هدف و از تمام منافذ و منابع اطلاعاتی ممکن جمعآوریشده است.
یکی از اقداماتی که سازمانهای اطلاعاتی (علیالخصوص NSA آمریکا) با کمک فضای مجازی و ابزارهای مرتبط با آن - ازجمله تلفن همراه، رایانهها و دستگاههای جانبی - انجام میدهند، تهیه یک پرونده الکترونیک برای هر یک از افراد دنیا با جمعآوری کوچکترین جزئیات از زندگی هر فرد شامل خصوصیات ظاهری و فیزیولوژیک (حتی اسکن عنبیه توسط دوربین و اسکن اثرانگشت توسط حسگر اثرانگشت) و علایق و خصوصیات روانی (با توجه به مجموعه تعاملات و انتخابهای فرد در فضای مجازی) و عقاید و اندیشهها (با توجه به اظهارنظرها و خودسانسوریهای فرد در انجمنهای مجازی و شبکههای اجتماعی) است. جمعآوری دادهها به حدی گسترده است که شبکههای اجتماعی حتی نظرات نوشتهشده ولی منتشرنشدهای که فرد قبل از ارسال از انتشار آن منصرف میشود و حذف میکند را نیز در پایگاههای داده خود ذخیره میکنند تا میزان خودسانسوری افراد را از طریق آن مورد سنجش قرار دهند.[4] مجموعه این اطلاعات، به سازمانهای اطلاعاتی کمک میکند تا با تحلیل روحیات، علایق، انگیزهها و نقاط قوت و ضعف فرد مورد هدف، ابزارهای مؤثر برای تأثیرگذاری بر آن فرد را پیدا کرده و مورداستفاده قرار دهند.
اطلاعات بهدستآمده از دادهکاوی ابردادههای بهدستآمده از تک افراد هر جامعه درمجموع منجر به تحلیل اجتماعی دقیقی از فرهنگ و وضعیت روانی جامعه موردبررسی نیز میشود که میتوان از آنها برای اثرگذاری بر جامعه هدف استفاده کرد. تجربه موجآفرینیهای صورت گرفته در فضای مجازی ایران در 10 سال اخیر نشان داده که هرقدر دسترسی سرویسهای اطلاعاتی به دادههای تعاملی مردم ایران بیشتر شده است، امکان طراحی شکافهای قومیتی، مذهبی، طبقاتی و عقیدتی مؤثرتری برای آنان فراهم گشته است که نقطه اوج این طراحیها در حوادث سال 96 نمایان گردیده است.