پایگاه تحلیلی فضای مجازی و آموزش سواد رسانه مبتنی بر مبانی امامین انقلاب

اهمیت و ارزش اطلاعات

  • ۱۷۸۷

اهمیت و ارزش اطلاعات

داده چیست؟ تلقی عموم مردم از داده‌ها (بالأخص داده‌های رایانه‌ای) شامل متن‌های طولانی از حروف و عدد بر روی مانیتورهای کامپیوتر است که با صفحه‌کلید و موشواره به کامپیوتر واردشده‌اند. برای آن‌ها که بازتر به موضوع نگاه می‌کنند، عکس، صوت و فیلم نیز می‌تواند از اشکال دیگر داده باشد. ولی واقعیت این است که در حال حاضر، داده در معنای کلی آن بسیار وسیع‌تر و پیچیده‌تر از این تلقی ساده است. ظهور شبکه‌های هوشمند در دهه اخیر باعث شده است که تلقی سنتی هم از داده و هم از دستگاه‌های ورودی داده دچار تغییر اساسی شود. درواقع در فضای مجازی امروز، داده‌ها شامل هر جزء کوچکی از دانسته‌هایی است که می‌تواند از راه‌های بسیار متنوعی به دست بیاید. انواع داده‌هایی که امروزه با آن سروکار داریم می‌تواند شامل این موارد باشد:

  • داده‌های وب: داده‌های رفتار سطح وب مشتریان مانند بازدید صفحات، جست‌وجوها، خواندن نقد و بررسی‌ها، خریدها و حتی میزان مکثی که در هر صفحه وب یا اجزای صفحه صورت می‌گیرد.
  • داده‌های متنی: مانند ایمیل‌ها، اخبار، محتواهای متنی وب، اسناد و دیگر موارد.
  • داده‌های چندرسانه‌ای: شامل تصویر و فیلم
  • داده‌های زمانی و مکانی: اطلاعات GPS، شبکه‌های تلفن‌های موبایل و اتصالات وای‌فای
  • داده‌های حسگرها و شبکه‌های هوشمند: این داده‌ها امروزه از خودروهای هوشمند، تلفن‌های هوشمند و دیگر وسایل ارتباطی، تأسیسات زیرساختی مانند خطوط انتقال نفت و توربین‌های بادی و دیگر حس‌گرهای استفاده‌شده در پروژه‌های اینترنت اشیا جمع‌آوری می‌گردد
  • داده‌های شبکه‌های اجتماعی: مجموعه تعاملات افراد در شبکه‌های اجتماعی، علاقه‌مندی‌ها، جستجوها، تأییدها و رد کردن‌ها، منتشر کردن نظرات دیگران یا دیگر اقداماتی که فرد در این شبکه‌ها انجام می‌دهد، منبع عظیمی از داده‌ها را تولید می‌کند.

بخشی از این داده‌ها آگاهانه و توسط کاربر بارگذاری می‌شود مانند ایمیلی که فرد بر روی سایت جیمیل بارگذاری می‌کند یا مطلبی که در شبکه‌های اجتماعی ارسال می‌کند و بخش دیگری از این اطلاعات بدون آگاهی کاربر جمع‌آوری و ارسال می‌گردد مانند مجموعه اطلاعاتی که حس‌گرهای موبایل جمع‌آوری می‌کنند یا داده‌های مربوط به اقدامات و تعاملات کاربر در محیط سایت‌ها و شبکه‌های اجتماعی که به‌طور مستمر رصد و جمع‌آوری می‌شود یا فراداده‌هایی که بدون اجازه و دخالت کاربر توسط دستگاه‌های مختلف ایجاد و همراه دیگر داده‌ها ارسال می‌گردد.


 نوع اطلاعات سرقت شده و بیگ دیتا

نکته دیگری که باید به آن توجه ویژه‌ای مبذول داشت عبارت است از آنکه چه نوع اطلاعاتی از مردم جامعه سرقت می‌شود و تجمیع این اطلاعات، چه امکاناتی را فراروی دشمنان کشور قرار می‌دهد. ازاین‌رو باید به نکاتی چند توجه شود:

1. سرقت اطلاعات بدون اجازه کاربر

همان‌گونه که سابقا در پایگاه بصیرت رسانه مرشدخان بیان شد، برخی اطلاعات با اجازه کاربر و با اراده او در اختیار خدمات دهندگان قرار می‌گیرد. اما برخی اطلاعات بدون اجازه کاربر جمع‌آوری می‌شود که بسیار خطرناک است. برخی از مهم‌ترین اطلاعاتی که بدون اجازه کاربر سرقت می‌شوند عبارت است از:

  • گرفتن عکس و فیلم با استفاده از دوربین جلویی و پشتی دستگاه ارتباطی (در هر لحظه ممکن است)
  • ضبط صدا ( در هرلحظه ممکن است)
  • رصد دائم محل تردد کاربر
  • کل اطلاعات ذخیره‌شده روی حافظه جانبی و حافظه دستگاه ارتباطی
  • فهرست مخاطبین
  • فهرست تماس و تاریخچه آن
  • پیامک‌های کاربر
  • سایر حساب‌های کاربری مانند ایمیل‌ها
2. فراداده، داده‌هایی پنهان در دل دیگر داده‌ها

اصطلاح فراداده یا متادیتا معمولاً به داده‌هایی اطلاق می‌شود که جزئیات خاصی را راجع به دیگر داده‌های تولیدشده شرح می‌دهد. این داده‌ها که به‌صورت خودکار تولید می‌شوند به‌طورمعمول توسط عموم کاربران قابل‌دیدن و ویرایش نیستند و تنها با کندوکاو بیشتر به چشم می‌آیند. به‌طور مثال، عکس تهیه‌شده توسط یک دوربین دیجیتال را در نظر بگیرید. دوربین دیجیتالی به همراه هر عکسی که ایجاد می‌کند، مجموعه‌ای از داده‌ها شامل: ابعاد عکس، عمق رنگ، رزولوشن، تاریخ ثبت تصویر، مدل دوربین، سرعت شاتر، اطلاعات توصیفی عکس (با کمک کلمات کلیدی) و... نیز تولید می‌نماید که این اطلاعات متنی در داخل فایل اصلی عکس ذخیره می‌شود. درواقع با انتقال هر عکس، مجموعه‌ای از داده‌های متنی که در داخل فایل عکس ذخیره شده و در حالت عادی قابل‌دیدن نیست هم منتقل می‌شود. حال اگر دوربین دیجیتال فوق به اطلاعات مکانی نظیر جی‌پی‌اس (سیستم موقعیت‌یاب جهانی) نیز دسترسی داشته باشد، (مانند دوربین‌های دیجیتال گوشی‌های هوشمند)، اطلاعات دقیق مربوط به مکان عکس گرفته شده نیز منتقل می‌شود.

فراداده‌ها تقریباً در تمام اسنادی که ما ایجاد می‌کنیم وجود دارند. مثلاً در فایل‌های متنی، اطلاعاتی از قبیل تعداد صفحات، نویسنده، تاریخ نگارش، خلاصه‌ای از محتوای سند و ... و در فایل‌های تصویری اطلاعاتی نظیر مدت‌زمان، بیت ریت، سال انتشار، سبک یا ژانر و … در قالب متادیتا ذخیره می‌شود.

فراداده‌های مستتر در اسناد به‌طورمعمول قابل‌حذف یا ویرایش نیستند و برای آن بخشی از آن‌ها که قابلیت حذف یا ویرایش دارند نیز باید از نرم‌افزارهای مخصوص استفاده کرد.

موتورهای جستجو و نرم‌افزارهای مدیریت داده معمولاً از این فراداده‌ها برای افزایش کارآمدی نتایج جستجوهای درخواستی استفاده می‌کنند. ولی برای شرکت‌های تبلیغاتی یا مؤسسات امنیتی کارکرد فراداده بسیار گسترده‌تر است.

3. اقیانوس داده‌ها؛ تنوع راه‌های جمع‌آوری داده

یک سایت پخش فیلم و کلیپ را در نظر بگیرید. کاربر در سایت جستجو می‌کند، کلیپ موردعلاقه خود را پیدا کرده و آن را پخش می‌کند. در ظاهر یک بده بستان ساده داده‌ای رخ داده است. کاربر نام یا بخشی از نام یا مشخصات ویدئوی مورد نظرش را در اختیار سایت قرار می‌دهد و سایت با جستجو، نزدیک نتیجه‌ای که ممکن است را نمایش می‌دهد. ولی آیا کاربر تنها همین اطلاعات را در اختیار سایت قرار داده است؟ ظاهراً کاربر اطلاعات دیگری را وارد نمی‌کند ولی در حقیقت مدیران سایت از مجموعه تعاملات کاربر با سایت داده‌های خیلی بیشتری می‌توانند به دست آوردند. داده‌هایی مانند: آیا کاربر از نتیجه جستجو راضی است؟(کلیپ را پخش کرده؟) به‌طور کامل پخش کرده یا پس از دیدن ابتدای کلیپ آن را قطع کرده است؟ کاربر برای بار چندم است این کلیپ را می‌بیند؟ کاربر چه موضوعی را بلافاصله بعدازاین ویدئو جستجو کرده است؟ آیا کاربر کلیپ را کامل دیده یا به‌صورت منقطع؟ آیا دنبال قسمت خاصی از کلیپ می‌گشته؟ آیا پس از دیدن کلیپ، بر روی نشر دهنده آن کلیک کرده تا کلیپ‌های دیگر آن نشر دهنده را ببیند؟ بازخورد ارادی (با ثبت لایک و نظر) او از کلیپ چیست؟ کاربر چه بازخوردی را می‌خواسته منتشر کند ولی بدون ارسال آن را حذف کرده است؟...

این داده‌ها، بخشی از داده‌هایی است که معمولاً با تعامل آگاهانه با کاربر جمع‌آوری می‌شود. حال فرض کنید دسترسی به وب کم[1] کاربر یا دسترسی به اطلاعات درون حافظه دستگاه کاربر و... برای سرپرست سایت فیلم فراهم باشد. در این صورت او می‌توان اطلاعات دیگری را جمع‌آوری کند که در آن تعامل فعال کاربر نقشی ندارد. به‌طور مثال عکس‌العمل‌های غیرارادی و زبان بدن کاربر در مواجه با کلیپ موردنظر می‌تواند از طریق وب کم جمع‌آوری شود. یا در صورت دسترسی به حافظه دستگاه، لیست فیلم‌ها و کلیپ‌هایی که در رایانه یا گوشی فرد موردنظر موجود است می‌تواند یک داده جدید باشد.

در هنگام استفاده از رایانه، اصولاً هر چیزی که شما فکرش را می‌کنید بالقوه یک داده است. و البته هر چیزی که شما فکرش را نمی‌کنید!

4. فضای ابری رایگان، لطف شرکت‌های اینترنتی یا پروژه سازمان‌های اطلاعاتی؟

فضای ابری، فضایی برای ذخیره‌سازی داده‌ها به‌صورت آنلاین است. این امر بدین معنی است که کاربران اطلاعات خود را به‌جای اینکه بر روی حافظه‌های داخل رایانه یا گوشی هوشمند خود ذخیره کنند، آن‌ها را بر روی اینترنت و درواقع بر روی سرورهایی که شرکت‌های اینترنتی به همین منظور ایجاد کرده‌اند بارگذاری می‌کنند. از مزایای ظاهری این سرویس‌ها این است که کاربر در هرجایی که اینترنت وجود داشته باشد به اطلاعات خود دسترسی دارد و اگر در اثر اتفاق یا حادثه‌ای رایانه شخصی یا ابزار ذخیره‌سازی‌اش دچار ایراد شود و داده‌های ذخیره‌شده‌اش از بین برود، داده‌ها در فضای ابری و در سرورهای شرکت خدمات دهنده حفظ می‌شود. این دو مشخصه باعث شده است تا بسیاری از مردم در دنیا از فضای ابری برای ذخیره‌سازی اطلاعات ارزشمند خود استفاده کنند. به‌طور مثال بسیاری از مردم از فضای ابری برای ذخیره‌سازی عکس‌های خانوادگی شخصی یا اطلاعت کاری، نوشته‌ها، تحقیقات و پژوهش‌هایی که برایشان اهمیت زیادی دارد استفاده می‌کنند.

شرکت‌های زیادی در اینترنت خدمات فضای ابری ارائه می‌دهند که ازجمله مهم‌ترین آن‌ها گوگل (با سرویس گوگل درایو)، مایکروسافت (با سرویس وان درایو)، اپل (با سرویس آی کلود)، دروپ باکس و... است. نکته جالب‌توجه در این مسئله این است که بسیاری از این سرویس‌ها به‌صورت رایگان یا با هزینه‌های بسیار کم در اختیار کاربران قرار می‌گیرد. یعنی کمپانی مانند گوگل به‌طور پیش‌فرض فضایی معادل 15 گیگابایت فضای ابری رایگان را در اختیار کاربران قرار می‌دهد و با هزینه بسیار اندک ماهی 2 دلار این میزان فضا را به 100 گیگابایت افزایش می‌دهد. البته هیچ ارزانی بی‌حکمت نیست! درآمدی که گوگل می‌تواند از تحلیل و فروش داده‌های ذخیره‌شده ببرد بسیار بیشتر از هزینه‌های این سرویس می‌تواند باشد و سازمان‌های اطلاعاتی به‌عنوان مشتری اصلی این داده‌ها، مشتریان خوش‌حسابی هستند.


 تبیین چیستی داده‌کاوی[2] اطلاعات و نتایج حاصل از آن

با توجه به مطالبی که تاکنون عنوان شد، لازم است با مفهوم داده‌کاوی و نتایج حاصل از آن نیز آشنا شویم. فهم این نکته، موجب درک اهمیت پرداختن به آسیب‌های آینده‌پژوهانه می‌شود.

1. مفهوم داده‌کاوی

داده‌کاوی به معنی استخراج اطلاعات معتبر، قابل‌اتکا و سودمند از میان دریای داده‌های جمع‌آوری‌شده از منابع مختلف است. این کار به‌طورمعمول با استفاده از روش‌های گوناگون تجزیه‌وتحلیل و آنالیز داده صورت می‌گیرد. در عصر حاضر شرکت‌ها و مؤسسات خصوصی و دولتی با انبوهی از داده‌های در ظاهر نامربوط و غیرقابل استفاده مواجه‌اند که به شیوه‌های مختلفی جمع‌آوری‌شده است. به مثال سایت پخش کلیپ برگردیم. فرض کنید مدیر سایت پخش کلیپ، با دست باز و دسترسی کامل بتواند داده‌های تعاملی و غیرتعاملی کاربران را به روش‌های مختلف جمع کند او سپس با تجزیه‌وتحلیل این اطلاعات می‌تواند تا میزان زیادی به سلیقه، علایق و روحیات کاربران پی ببرد و سایت را طوری تنظیم کند تا دفعه بعد پس از ورود کاربر، کلیپ‌هایی نمایش داده شود که مطابق سلیقه و علاقه اوست. امروزه این کار به‌صورت روتین و گسترده در سایت‌های پخش فیلم و کلیپ، شبکه‌های اجتماعی و سایت‌های خرید آنلاین صورت می‌گیرد. اصولاً اکثر پیشنهادهایی که در این سایت‌ها به کاربر صورت می‌گیرد، محصول تجزیه تحلیل داده‌های تعاملی آن فرد یا مجموعه‌ای از کاربران شبیه به او است (البته این مورد صرفاً در مسائل غیر ایدئولوژیک صحت دارد. در فصل آتی، توضیحات مبسوط‌تری ارائه خواهد شد).

از طرف دیگر جمع‌آوری داده‌ها از کاربران به هر نحو ممکن و آنالیز آن‌ها، فقط به‌قصد استفاده در سایت موردنظر و بهینه‌سازی جستجو و دسترسی نیست. بلکه بسیاری از این اطلاعات به‌آسانی در اختیار شرکت‌ها و کمپانی‌های دیگر قرار می‌گیرد و اصولاً هر کس پول خوبی بدهد می‌تواند داده‌های موردنیاز خود را خریداری کند. افشای رسوایی‌های متعدد شرکت‌های مختلف ارائه‌دهنده خدمات اینترنتی نظیر [3]AT&T، گوگل و Facebook در فروش اطلاعات کاربران خود به شرکت‌های دیگر و آژانس‌های اطلاعاتی، مؤید این نکته است که رصد، جمع‌آوری، ذخیره و فروش اطلاعات و تعاملات کاربران در اینترنت امری روتین بوده است و یک استثنا یا مورد خاص نیست

2. از پیشنهاد فیلم تا تحلیل افکار دشمن

داده‌کاوی در طیف گسترده‌ای از فعالیت‌های تجاری و غیرتجاری صورت می‌گیرد. از شناسایی الگوی خرید مشتریان در سایت‌های خرید آنلاین گرفته تا تحلیل علایق افراد در شبکه‌های اجتماعی. ولی گسترده‌ترین کاربرد داده‌کاوی در سازمان‌های اطلاعاتی صورت می‌گیرد جایی که داده‌کاوی بر روی داده‌های بزرگ (اَبَرداده‌ها) انجام می‌گیرد که به‌طور گسترده از کشورهای هدف و از تمام منافذ و منابع اطلاعاتی ممکن جمع‌آوری‌شده است.

یکی از اقداماتی که سازمان‌های اطلاعاتی (علی‌الخصوص NSA آمریکا) با کمک فضای مجازی و ابزارهای مرتبط با آن - ازجمله تلفن همراه، رایانه‌ها و دستگاه‌های جانبی - انجام می‌دهند، تهیه یک پرونده الکترونیک برای هر یک از افراد دنیا با جمع‌آوری کوچک‌ترین جزئیات از زندگی هر فرد شامل خصوصیات ظاهری و فیزیولوژیک (حتی اسکن عنبیه توسط دوربین و اسکن اثرانگشت توسط حسگر اثرانگشت) و علایق و خصوصیات روانی (با توجه به مجموعه تعاملات و انتخاب‌های فرد در فضای مجازی) و عقاید و اندیشه‌ها (با توجه به اظهارنظرها و خودسانسوری‌های فرد در انجمن‌های مجازی و شبکه‌های اجتماعی) است. جمع‌آوری داده‌ها به حدی گسترده است که شبکه‌های اجتماعی حتی نظرات نوشته‌شده ولی منتشرنشده‌ای که فرد قبل از ارسال از انتشار آن منصرف می‌شود و حذف می‌کند را نیز در پایگاه‌های داده خود ذخیره می‌کنند تا میزان خودسانسوری افراد را از طریق آن مورد سنجش قرار دهند.[4] مجموعه این اطلاعات، به سازمان‌های اطلاعاتی کمک می‌کند تا با تحلیل روحیات، علایق، انگیزه‌ها و نقاط قوت و ضعف فرد مورد هدف، ابزارهای مؤثر برای تأثیرگذاری بر آن فرد را پیدا کرده و مورداستفاده قرار دهند.

اطلاعات به‌دست‌آمده از داده‌کاوی ابرداده‌های به‌دست‌آمده از تک افراد هر جامعه درمجموع منجر به تحلیل اجتماعی دقیقی از فرهنگ و وضعیت روانی جامعه موردبررسی نیز می‌شود که می‌توان از آن‌ها برای اثرگذاری بر جامعه هدف استفاده کرد. تجربه موج‌آفرینی‌های صورت گرفته در فضای مجازی ایران در 10 سال اخیر نشان داده که هرقدر دسترسی سرویس‌های اطلاعاتی به داده‌های تعاملی مردم ایران بیشتر شده است، امکان طراحی شکاف‌های قومیتی، مذهبی، طبقاتی و عقیدتی مؤثرتری برای آنان فراهم گشته است که نقطه اوج این طراحی‌ها در حوادث سال 96 نمایان گردیده است.

 



[1] دوربین جلوی رایانه، لپ‌تاپ و گوشی

[2]. Data mining

[3]. https://news.asis.io/content/نقض-حریم-خصوصی-نظارت-گسترده-بر-روی-داده‌های-تلفن-همراه-توسط-شرکت-att?page=0%2C0%2C0%2C0%2C3

پاسخ به شبهات و سوالات