بالکل 'بگ ڈیٹا' کیا ہے؟

اور یہ کیوں بڑا سودا ہے؟

'بگ ڈیٹا' غیر منظم شدہ اعداد و شمار کی بڑی مقداروں کا مطالعہ کرکے انسانی رویے کو سمجھنے اور پیشن گوئی کا نیا سائنس ہے. بگ ڈیٹا 'پیش گوئی تجزیات' کے طور پر بھی جانا جاتا ہے.

ٹویٹر پوسٹز، فیس بک فیڈز، ای بے کی تلاش، GPS ٹریکرز اور اے ٹی ایم مشینیں کا تجزیہ کچھ بڑا ڈیٹا مثال ہے. سیکیورٹی ویڈیوز، ٹریفک کے اعداد و شمار، موسم کے پیٹرن، پرواز کی آمد، سیل فون ٹاور لاگز، اور دل کی شرح ٹریکرز کا مطالعہ دیگر اقسام ہیں. بڑا ڈیٹا ایک گندا نیا سائنس ہے جو ہفتے میں تبدیل ہوتا ہے، اور صرف چند ماہرین یہ سب سمجھتے ہیں.

باقاعدہ زندگی میں بگ ڈیٹا کی کچھ مثالیں کیا ہیں؟

اسکرین شاٹ http://project.wnyc.org/transit-time

جبکہ بڑے اعداد و شمار کے منصوبوں میں بہت غیر معمولی ہے، انفرادی افراد، کمپنیوں اور حکومتوں کی روزمرہ زندگی کو متاثر کرنے والے بڑے اعداد و شمار کے کامیاب مثال ہیں:

وائرس کے پھیلنے کا دعوی: سماجی-سیاسی ڈیٹا، موسم اور آب و ہوا کے اعداد و شمار، اور ہسپتال / کلینیکل کے اعداد و شمار کا مطالعہ کرتے ہوئے، یہ سائنسدان اب ڈینگی بخار کے پھیلنے کی پیشکش کررہے ہیں.

قتل عام کی نگرانی: واشنگٹن ڈی سی میں اس بڑے ڈیٹا پروجیکٹ کی پروفائل کا شکار افراد، شکایات، اور مجرمین. مقتول اور لوگوں کے لئے بیداری کے وسائل کے اعزاز کا راستہ دونوں کے طور پر، یہ بڑا ڈیٹا پروجیکٹ دلچسپ ہے.

ٹرانزٹ ٹریولنگ پلاننگ، این این سی: ڈبلیو سی سی ریڈیو پروگرامر اسٹیو میلنیز نے سفر کے سفر کے سافٹ ویئر کے ساتھ آن لائن سب ویڈ شیڈول کو مشترکہ کیا. ان کی تخلیق کو نیویارک کے نقشے پر اپنے مقام پر کلک کرنے کی اجازت دیتا ہے، اور ٹرینوں اور سب وے کے لئے سفر کا وقت کی پیش گوئی ظاہر ہوگی.

زیروکس نے اپنے محافظ کو نقصان پہنچایا ہے: مرکز کا کام جذباتی طور پر ختم کرنا ہے. زیروکس نے پیشہ ورانہ تجزیہ کاروں کی مدد سے اعداد و شمار کے ریاموں کا مطالعہ کیا ہے، اور اب وہ پیش گوئی کرسکتے ہیں کہ کال سینٹر پر کتنے لمبے عرصے سے کمپنی کے ساتھ رہنے کا امکان ہے.

انسداد دہشت گردی کی حمایت کرتے ہوئے : سماجی میڈیا، مالی ریکارڈ، پرواز کے تحفظات اور سیکورٹی کے اعداد و شمار کا مطالعہ کرتے ہوئے قوانین نافذ کرنے والے دہشت گرد شکایات کی پیشن گوئی کرسکتے ہیں اور اس سے پہلے کہ وہ اپنے شرعی اعمال کرتے ہیں.

سماجی میڈیا کے جائزے پر مبنی برانڈ مارکیٹنگ کو ایڈجسٹ کرنا : بلاشبہ لوگوں کو فوری طور پر اور فوری طور پر ان کے آن لائن خیالات پب، ریستوران، یا فٹنس کلب پر شریک کریں. یہ لاکھوں سوشل میڈیا پوزیشنوں کا مطالعہ کرنا ممکن ہے اور اس کمپنی کو فیڈریشن فراہم کریں جو لوگ ان کی خدمات کے بارے میں سوچتے ہیں.

کون بڑا ڈیٹا استعمال کرتا ہے؟ وہ اس کے ساتھ کیا کرتے ہیں؟

بہت سے اخلاقی کارپوریشنز ان کے پیشکش اور قیمتوں کو ایڈجسٹ کرنے کے لئے بڑے اعداد و شمار کو استعمال کرتے ہیں تاکہ گاہک کی اطمینان کو زیادہ سے زیادہ کریں.

بگ ڈیٹا اتنا بڑا سودا کیوں ہے؟

4 چیزیں بڑے ڈیٹا کو اہم بناتی ہیں:

1. اعداد و شمار بڑے پیمانے پر ہے. یہ ایک ہی ہارڈ ڈرائیو پر فٹ نہیں، ایک USB چھڑی بہت کم ہے. اعداد و شمار کا حجم اس سے کہیں زیادہ ہے کہ انسانی دماغ کو سمجھا جا سکتا ہے (ایک بلین بلین میگا بائٹس کے بارے میں سوچیں، اور پھر زیادہ اربوں کی طرف سے).

2. اعداد و شمار گندا اور غیر معمولی ہے. بڑے ڈیٹا کا کام 50٪ سے 80٪ تک تبدیل اور معلومات کو صاف کر رہا ہے تاکہ یہ تلاش اور سایڈست ہو. ہمارے سیارے پر صرف چند ہزار ماہرین کو یہ معلوم ہے کہ یہ ڈیٹا صاف کرنے کا طریقہ کار کیا ہے. ان ماہرین کو بھی ان کے دستکاری کرنے کے لئے، خاص طور پر HPE اور Hadoop بہت ہی مخصوص اوزار کی ضرورت ہے. شاید 10 سالوں میں بڑے اعداد و شمار کے ماہرین ایک درجن کی دہائی بن جائیں گے، لیکن اب تک، وہ تجزیہ کار کا ایک بہت ہی غیر معمولی پرجاتی ہیں اور ان کا کام اب بھی انتہائی غیر معمولی اور محتاط ہے.

3. ڈیٹا ایک اجناس بن گیا ہے ** جو فروخت اور خریدا جا سکتا ہے. ڈیٹا مارکیٹوں میں موجود ہے جہاں کمپنیاں اور افراد سوشل میڈیا اور دیگر اعداد و شمار کے ٹربائٹس خرید سکتے ہیں. زیادہ سے زیادہ اعداد و شمار بادل پر مبنی ہیں، کیونکہ یہ کسی بھی ہارڈ ڈسک پر فٹ ہونے کے لئے بہت بڑا ہے. ڈیٹا خریدنے میں عام طور پر ایک رکنیت فیس شامل ہے جہاں آپ بادل سرور فارم میں پلگ ان کرتے ہیں.

** بڑے ڈیٹا کے اوزار اور خیالات کے رہنماؤں ایمیزون، گوگل، فیس بک اور یاہو ہیں. کیونکہ ان کمپنیوں نے ان کی آن لائن سروسز کے ساتھ بہت سے لاکھوں افراد کی خدمت کی ہے، اس سے یہ سمجھتا ہے کہ وہ مجموعہ پوائنٹ اور بڑے اعداد و شمار کے تجزیات کے پیچھے نقطہ نظر ہوں گے.

4. بڑے اعداد و شمار کے امکانات لامتناہی ہیں. ممکنہ طور پر ڈاکٹروں کو ایک دن میں ہونے والے افراد کے لئے دل کے حملوں اور اسٹروکس کی پیش گوئی کی جائے گی. ہوائی جہاز اور آٹوموبائل کی تباہی ان کے میکانی اعداد و شمار اور ٹریفک اور موسم کے پیٹرن کے پیش گوئی تجزیہ کی طرف سے کم ہوسکتی ہیں. آن لائن ڈیٹنگ بہتر ہو سکتا ہے کہ آپ کے لئے مطابقت پذیر شخصیات کے بڑے اعداد و شمار کے پیش گوئی ہونے کی وجہ سے. موسیقار ہدف کے سامعین کے تبدیل ذائقہ کے لئے سب سے زیادہ خوشگوار موسیقی کی ساخت میں بصیرت حاصل کر سکتے ہیں. غذائیت پسندوں کی پیشن گوئی کی جاتی ہے کہ کس طرح کے جمع کردہ کھانے کی چیزوں کا مجموعہ کسی شخص کی طبی حالتوں میں اضافہ کرے گا یا اس کی مدد کرے گی. سطح صرف چھڑکا گیا ہے، اور بڑے اعداد و شمار میں دریافت ہر ہفتے ہوتا ہے.

بڑا ڈیٹا گستاخ ہے

مونٹی Rakusen / گیٹی

بگ ڈیٹا پیشن گوئی تجزیہ ہے: تلاش اور ترتیب میں کچھ بڑے پیمانے پر غیر منظم کردہ ڈیٹا کی تبدیلی. یہ ایک گندا اور غیر معمولی جگہ ہے جو ایک خاص قسم کی علم اور صبر کی ضرورت ہوتی ہے.

مثال کے طور پر اخلاقی UPS ترسیل کی خدمت کریں. UPS پر پروگرامرز ان کے ڈرائیوروں کے GPS اور اسمارٹ فونز سے اعداد و شمار کا مطالعہ کرتے ہیں جو ٹریفک بھیڑ پر منسلک کرنے کے لئے سب سے زیادہ موثر طریقوں کا تجزیہ کرتے ہیں. یہ GPS اور اسمارٹ فون ڈیٹا بہت بڑا ہے، اور خود کار طریقے سے تجزیہ کیلئے تیار نہیں ہے. یہ ڈیٹا مختلف سمارٹ فون ہارڈ ویئر کے آلات کے ذریعہ مختلف جی پی ایس اور میپ ڈیٹا بیسس سے ہے. یو پی ایس کے تجزیہ کار نے اس اعداد و شمار کو ان اعداد و شمار کو ایک شکل میں تبدیل کیا ہے جو آسانی سے تلاش کی جا سکتی ہے. کوشش اس کے قابل ہے، اگرچہ. آج، UPS نے 8 ملین گیلن ایندھن کو بچایا ہے کیونکہ انہوں نے ان بڑے اعداد و شمار کے تجزیات کا استعمال شروع کر دیا.

کیونکہ بڑے اعداد و شمار گندا ہے اور صاف کرنے اور استعمال کے لئے تیار کرنے کی بہت زیادہ کوشش کی ضرورت ہوتی ہے، اعداد و شمار سائنسدانوں نے ان تمام محنت کے کام کے لئے 'ڈیٹا ڈینجرز' کا نام دیا ہے.

بڑے اعداد و شمار اور پیشن گوئی کے تجزیات کا سائنس ہر ہفتے میں بہتر بناتا ہے. 2025 ء تک ہر شخص کو آسانی سے قابل رسائی بننے کے لئے بڑے اعداد و شمار کی توقع ہے.

پرائیویٹ ڈیٹا ایک پریشان کن خطرے کی رازداری کے لئے نہیں ہے؟

Feingersh / گیٹی

جی ہاں، اگر ہمارے قوانین اور انفرادی رازداری کے تحفظات کو احتیاط سے منظم نہیں کیا جاتا ہے، تو پھر بڑے ڈیٹا ذاتی رازداری میں مداخلت کرتا ہے. جیسا کہ یہ کھڑا ہے، گوگل اور YouTube اور فیس بک نے آپ کی روزانہ آن لائن عادات کو ٹریک کیا ہے . آپ کا سمارٹ فون اور کمپیوٹنگ زندگی ہر دن ڈیجیٹل پیرامیٹرز چھوڑ دیتا ہے، اور جدید ترین کمپنیوں کو اس کے نشان کے نشانات پڑھ رہے ہیں.

بڑے اعداد و شمار کے ارد گرد قوانین تیار کر رہے ہیں. رازداری کی حیثیت یہ ہے کہ اب آپ کو ذاتی ذمہ داری لینا ضروری ہے، کیونکہ آپ اب اسے پہلے سے طے شدہ حق کے توقع نہیں کرسکتے ہیں.

اپنی رازداری کی حفاظت کے لئے آپ کیا کر سکتے ہیں:

آپ کو لے جا سکتا ہے سب سے بڑا واحد مرحلہ ایک وی پی این نیٹ ورک کنکشن کا استعمال کرتے ہوئے اپنے روزانہ کی عادات کو چالو کرنا ہے . ایک وی پی این سروس آپ کے سگنل کو مماثلت کرے گا تاکہ آپ کی شناخت اور مقام کم از کم جزوی طور پر ٹریکرز سے ماسک ہو. یہ آپ کو 100٪ گمنام نہیں بنائے گا، لیکن VPN کافی کم ہو جائے گی کہ دنیا آپ کی آن لائن عادتوں کا کتنا مشاہدہ کرسکتے ہیں.

میں بڑے ڈیٹا کے بارے میں مزید جان سکتا ہوں کہاں؟

مونٹی Raskusen / گیٹی

بڑے ڈیٹا تجزیاتی دماغ اور ٹیک کے لئے محبت کے ساتھ ایک دلچسپ چیز ہے. اگر یہ ہے تو، ضرور ضرور دلچسپ بڑے ڈیٹا منصوبوں کے اس صفحے پر جائیں.