ک- ذرائع کلسٹرنگ کیا ہے؟

K- کے ذریعہ الگورتھم کے ساتھ ڈیٹا کان کنی

K- ذرائع کلسٹرنگ الگورتھم ایک ڈیٹا کان کنی ہے اور مشین سیکھنے کا آلہ ان تعلقات کے کسی بھی سابقہ ​​علم کے بغیر متعلقہ مشاہدوں کے گروپوں میں کلسٹر مشاہدات کے لئے استعمال کیا جاتا ہے. نمونے کی طرف سے، الگورتھم کوشش کرنے کے لئے کونسی قسم، یا کلسٹر میں اعداد و شمار سے تعلق رکھتے ہیں، کلسٹرز کی قدر قیمت کی طرف سے کی گئی ہے .

K- کے ذریعہ الگورتھم ایک آسان کلسٹرنگ تکنیک میں سے ایک ہے اور یہ عام طور پر طبی امیجنگ، بائیو میٹرک اور متعلقہ شعبوں میں استعمال ہوتا ہے. K- ذرائع کلسٹرنگ کا فائدہ یہ ہے کہ یہ آپ کے اعداد و شمار کے بارے میں بتاتا ہے (اس کے ناپسندیدہ فارم کا استعمال کرتے ہوئے) کے بجائے آپ کو شروع میں ڈیٹا کے بارے میں الگورتھم کو ہدایت کرنا (الگورتھم کی نگرانی شدہ شکل کا استعمال کرتے ہوئے).

یہ کبھی کبھی لاویڈ کی الگورتھم کے طور پر کہا جاتا ہے، خاص طور پر کمپیوٹر سائنس کے حلقوں میں، کیونکہ معیاری الگورتھم پہلے 1 9 57 میں سٹورٹ لوڈ کی طرف سے تجویز کی گئی تھی. "ک-معنی" اصطلاح یعقوب جیک میک میکین نے 1967 میں سنائی.

ک کے ذریعہ الگورتھم کام کرتا ہے

K- کے ذریعہ الگورتھم ایک ارتقاء الارورتھم ہے جو اس کے نام سے اس آپریشن کے طریق سے حاصل کرتا ہے. ک گروپوں میں الگورتھم کلسٹر مشاہدات، جہاں ک ان پٹ پیرامیٹر کے طور پر فراہم کی جاتی ہے. اس کے بعد ہر مشاہدے کو کلسٹروں کو کلستر کے معنی کے مشاہدے کی قربت پر مبنی بنا دیتا ہے. کلسٹر کا مطلب پھر سے رگڑا ہوا ہے اور عمل دوبارہ شروع ہوتا ہے. یہاں ہے کہ الگورتھم کیسے کام کرتا ہے:

  1. الگورتھم نے بنیادی طور پر کلسٹر مراکز (معنی) کے طور پر ک پوائنٹس کو منتخب کیا ہے.
  2. ڈیٹا بیس میں ہر نقطہ کو ہر کل اور ہر کلسٹر مرکز کے درمیان ایکلائڈن فاصلے پر مبنی بند کلستر میں تفویض کیا جاتا ہے.
  3. ہر کلسٹر مرکز کو اس کلستر میں پوائنٹس کی اوسط کے طور پر دوبارہ کام کیا جاتا ہے.
  4. مرحلے 2 اور 3 کلسٹر تک متفق ہوجائیں. انفرادی طور پر عمل درآمد کی بنیاد پر بیان کیا جاسکتا ہے، لیکن یہ عام طور پر یہ مطلب ہے کہ کوئی مشاہدات کلسٹر تبدیل نہیں کرتے ہیں جب 2 اور 3 کے مرحلے کو بار بار کیا جاتا ہے، یا تبدیلیوں کو کلسٹروں کی تعریف میں متوازن فرق نہیں بناتا.

کلسٹروں کی تعداد کا انتخاب

کلسترنگ کا بنیادی نقصانات میں سے ایک یہ حقیقت یہ ہے کہ آپ کو کلسٹرز کو الگورتھم کے ان پٹ کے طور پر وضاحت کرنا لازمی ہے. جیسا کہ ڈیزائن کیا گیا ہے، الگورتھم مناسب کلسٹروں کا تعین کرنے کے قابل نہیں ہے اور صارف پر اس سے قبل اس کی شناخت کے لئے انحصار کرتا ہے.

مثال کے طور پر، اگر آپ لوگوں کے گروپ تھے جو بائنری جنس کی شناخت پر مرد یا عورت کے طور پر کلستر کی بنیاد پر ہوتے ہیں تو، ان پٹ ک = 3 کا استعمال کرتے ہوئے K- کے ذریعہ الگورتھم کہتے ہیں جب لوگ صرف تین، یا صرف ایک کل کلسٹرز کو مجبور کریں گے. k = 2 کی ان پٹ ، ایک اور قدرتی فٹ فراہم کرے گا.

اسی طرح، اگر افراد کا ایک گروپ آسانی سے گھر کی حیثیت پر مبنی ہوتا ہے اور آپ ان پٹ = 20 کے ساتھ K- کے ذریعہ الگورتھم کہتے ہیں ، تو نتائج مؤثر ہونے کے لئے بہت عام ہوسکتے ہیں.

اس وجہ سے، اکثر آپ کے اعداد و شمار کے مطابق مناسب قیمت کی شناخت کے لئے ک کے مختلف اقدار کے ساتھ تجربہ کرنے کا ایک اچھا خیال ہے. آپ مشین سیکھنے کے علم کے لئے آپ کی تلاش میں دوسرے ڈیٹا کان کنی الگورتھم کے استعمال کا بھی پتہ لگانا چاہتے ہیں.