সাক্ষাৎকার প্রশ্ন

শীর্ষ 100 মেশিন লার্নিং ইন্টারভিউ প্রশ্ন এবং উত্তর

জানুয়ারী 2, 2022

মেশিন লার্নিং একটি ডেটা বিশ্লেষণ পদ্ধতি যা বিশ্লেষণমূলক মডেল বিল্ডিং স্বয়ংক্রিয় করে। এটি কৃত্রিম বুদ্ধিমত্তার একটি শাখা যা এই ধারণার উপর ভিত্তি করে যে সিস্টেমগুলি ডেটা থেকে শিখতে পারে এবং এটি নিদর্শনগুলি সনাক্ত করতে পারে এবং কম মানুষের হস্তক্ষেপে সিদ্ধান্ত নিতে পারে।

মেশিন লার্নিং ইন্টারনেট সার্চ ইঞ্জিনে ব্যাপকভাবে ব্যবহৃত হয়, স্প্যাম ওয়েবসাইট বাছাই করতে ইমেল ফিল্টার, অস্বাভাবিক বা দুর্নীতিগ্রস্ত লেনদেন শনাক্ত করার জন্য ব্যাঙ্কিং সফ্টওয়্যার, এবং এটি ভয়েস রিকগনিশনের মতো ফোনে প্রচুর অ্যাপে ব্যবহৃত হয়।

সুচিপত্র

মেশিন লার্নিং একটি ক্যারিয়ার?

আশা করা হচ্ছে যে কৃত্রিম বুদ্ধিমত্তা 2022 সালের শেষ নাগাদ প্রায় 4 বিলিয়ন ডলারের ব্যবসায়িক মূল্য তৈরি করবে। এক-তৃতীয়াংশেরও বেশি কোম্পানি ইতিমধ্যেই মেশিন লার্নিং এবং ডেটা সায়েন্সে খরচ করতে শুরু করেছে, অথবা তারা আগামী সময়ে এটি করার পরিকল্পনা করছে। .

আমরা যদি মেশিন লার্নিং ইঞ্জিনিয়ারদের চাকরির সুযোগের কথা বলি, 2015-2018 সময়কালে বিশ্বব্যাপী এই পদের জন্য চাকরি খোলার ক্ষেত্রে 330% এর বেশি বৃদ্ধি পেয়েছে।

আপনি মেশিন লার্নিং চাকরিতে একটি ভাল ক্যারিয়ার তৈরি করতে পারেন। আমরা প্রায়শই জিজ্ঞাসিত মেশিন লার্নিং ইন্টারভিউ প্রশ্ন এবং উত্তর নোট করেছি। নিশ্চিত করুন যে আপনি আমাদের সম্পূর্ণ ব্লগের মধ্য দিয়ে গেছেন যাতে আপনি মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর মিস করবেন না।

শীর্ষ মেশিন লার্নিং ইন্টারভিউ প্রশ্ন এবং উত্তর

1. মেশিন লার্নিং, কৃত্রিম বুদ্ধিমত্তা, এবং গভীর শিক্ষার ব্যাখ্যা করুন?

মেশিন লার্নিং

মেশিন লার্নিংকে কৃত্রিম বুদ্ধিমত্তার একটি উপসেট হিসাবে সংজ্ঞায়িত করা হয়, এবং এতে এমন কৌশল রয়েছে যা কম্পিউটারগুলিকে ডেটা থেকে জিনিসগুলি বাছাই করতে এবং কৃত্রিম বুদ্ধিমত্তা অ্যাপ্লিকেশন সরবরাহ করতে সক্ষম করে।

কৃত্রিম বুদ্ধিমত্তা (AI) হল কম্পিউটার বিজ্ঞানের একটি শাখা যা মূলত স্মার্ট মেশিন তৈরির উপর দৃষ্টি নিবদ্ধ করে যা কিছু নির্দিষ্ট কাজ সম্পাদন করতে পারে যার জন্য প্রধানত মানুষের বুদ্ধির প্রয়োজন হয়। এটি মেশিনে মানুষের বুদ্ধিমত্তার প্রতিলিপি বা অনুকরণ করার উদ্যোগ।

ডিপ লার্নিংকে কৃত্রিম বুদ্ধিমত্তার মেশিন লার্নিং অ্যালগরিদমগুলির একটি শ্রেণী হিসাবে সংজ্ঞায়িত করা যেতে পারে যা প্রধানত প্রদত্ত কাঁচা ইনপুট থেকে উচ্চ-স্তরের বৈশিষ্ট্যগুলি সংগ্রহ করতে একাধিক স্তর ব্যবহার করে।

2. মেশিন লার্নিং কতটা কঠিন?

মেশিন লার্নিং বিশাল এবং এতে অনেক কিছু রয়েছে। অতএব, আপনি যদি প্রতিদিন কমপক্ষে 6-7 ঘন্টা ব্যয় করেন তবে মেশিন লার্নিং শিখতে ছয় মাসেরও বেশি সময় লাগবে। যদি আপনার হাতে ভালো গাণিতিক এবং বিশ্লেষণাত্মক দক্ষতা থাকে, তাহলে ছয় মাস আপনার জন্য যথেষ্ট হবে।

3. আপনি একটি SVM অ্যালগরিদমে কার্নেল ট্রিক ব্যাখ্যা করতে পারেন?

একটি কার্নেল ট্রিক হল এমন একটি পদ্ধতি যেখানে নন-লিনিয়ার ডেটাকে একটি বড় ডাইমেনশন স্পেসে প্রজেক্ট করা হয় যাতে ডেটা শ্রেণীবদ্ধ করা সহজ হয় যেখানে এটি একটি সমতল দ্বারা রৈখিকভাবে ভাগ করা যায়।

4. আপনি কিছু জনপ্রিয় ক্রস-ভ্যালিডেশন কৌশল তালিকাভুক্ত করতে পারেন?

কিছু জনপ্রিয় ক্রস-ভ্যালিডেশন কৌশল নীচে তালিকাভুক্ত করা হয়েছে:

    হোল্ডআউট পদ্ধতি:এই ধরনের কৌশলটি প্রশিক্ষণ ডেটা সেটের অংশটি সরিয়ে প্রয়োজনীয় ভবিষ্যদ্বাণী পেতে অবশিষ্ট ডেটা সেটে প্রশিক্ষিত মডেলটিতে পাঠানোর মাধ্যমে কাজ করে।কে-ফোল্ড ক্রস-ভ্যালিডেশন:এখানে, ডেটাকে k সাবসেটে বিভক্ত করা হয়েছে যাতে প্রতিবার, k সাবসেটের মধ্যে একটিকে একটি বৈধতা সেট হিসাবে ব্যবহার করা যেতে পারে এবং অন্যান্য k-1 উপসেটগুলিকে প্রশিক্ষণ সেট হিসাবে ব্যবহার করা হয়।স্তরিত কে-ফোল্ড ক্রস-ভ্যালিডেশন:এটি ভারসাম্যহীন ডেটাতে কাজ করে।ত্যাগ-পি-আউট ক্রস-ভ্যালিডেশন:এখানে, আমরা n ডেটা পয়েন্টের বাইরে প্রশিক্ষণের ডেটা থেকে p ডেটা পয়েন্টগুলি রেখে দিই, তারপরে আমরা মডেলকে প্রশিক্ষণ দিতে n-p নমুনাগুলি এবং বৈধতা সেটের জন্য p পয়েন্টগুলি ব্যবহার করি।

5. ব্যাগিং এবং বুস্টিং অ্যালগরিদমের মধ্যে পার্থক্য?

ব্যাগিং বুস্টিং
এটি এমন একটি পদ্ধতি যা একই ধরনের ভবিষ্যদ্বাণীকে একত্রিত করে।এটি এমন একটি পদ্ধতি যা বিভিন্ন ধরনের ভবিষ্যদ্বাণীকে একত্রিত করে।
এটি বৈষম্য হ্রাস করে, পক্ষপাত নয়এটা পক্ষপাত কমায়, ভিন্নতা নয়।
প্রতিটি মডেল সমান ওজন পায়মডেলগুলি কর্মক্ষমতা উপর ভিত্তি করে ওজন করা হয়.

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

6. SVM-এ কার্নেলগুলি কী কী? আপনি SVM ব্যবহৃত কিছু জনপ্রিয় কার্নেল তালিকা করতে পারেন?

কার্নেলটি মূলত গাণিতিক ফাংশন সেট করতে ব্যবহৃত হয় যা সমর্থন ভেক্টর মেশিনে ডেটা ম্যানিপুলেট করার জন্য উইন্ডো প্রদান করে ব্যবহার করা হয়। কার্নেল ফাংশন ডেটার প্রশিক্ষণ সেটকে রূপান্তর করতে ব্যবহৃত হয় যাতে একটি নন-লিনিয়ার ডিসিশন সারফেসটি একটি রৈখিক সমীকরণে রূপান্তরিত হয় একটি বৃহত্তর মাত্রার স্থানগুলিতে।

SVM-এ ব্যবহৃত কিছু জনপ্রিয় কার্নেল হল:

  1. বহুপদী কার্নেল
  2. গাউসিয়ান কার্নেল
  3. গাউসিয়ান রেডিয়াল বেসিস ফাংশন (RBF)
  4. ল্যাপ্লেস আরবিএফ কার্নেল
  5. হাইপারবোলিক ট্যানজেন্ট কার্নেল
  6. সিগময়েড কার্নেল
  7. প্রথম ধরনের কার্নেলের বেসেল ফাংশন
  8. ANOVA রেডিয়াল ভিত্তি কার্নেল

7. আপনি OOB ত্রুটি ব্যাখ্যা করতে পারেন?

OBB এরর নামক একটি আউট-অফ-ব্যাগ ত্রুটি, যা একটি আউট-অফ-ব্যাগ অনুমান নামেও পরিচিত, এটি এলোমেলো বন, বুস্টেড সিদ্ধান্ত গাছের পূর্বাভাস ত্রুটি পরিমাপ করার একটি কৌশল। ব্যাগিং প্রধানত প্রতিস্থাপন সহ সাবস্যাম্পলিং ব্যবহার করে মডেলের কাছ থেকে শেখার জন্য প্রশিক্ষণের নমুনা তৈরি করতে।

8. আপনি কি কে-মিনস এবং কেএনএন অ্যালগরিদমের মধ্যে পার্থক্য করতে পারেন?

কে-মানে KNN অ্যালগরিদম
এটি তত্ত্বাবধানহীন মেশিন লার্নিং।এটি তত্ত্বাবধানে মেশিন লার্নিং।
এটি একটি ক্লাস্টারিং মেশিন লার্নিং অ্যালগরিদম।এটি একটি শ্রেণিবিন্যাস বা রিগ্রেশন মেশিন লার্নিং অ্যালগরিদম।
এর কর্মক্ষমতা ধীর।এটা অনেক ভালো পারফর্ম করে।
এটি একটি উত্সাহী শিক্ষার্থী.এটি একটি অলস শিক্ষার্থী।

9. ভ্যারিয়েন্স ইনফ্লেশন ফ্যাক্টর শব্দটির অর্থ ব্যাখ্যা কর?

ভিআইএফ নামে পরিচিত ভ্যারিয়েন্স ইনফ্লেশন ফ্যাক্টর হল একাধিক রিগ্রেশন ভেরিয়েবলের প্রদত্ত সেটে মাল্টিকলিনিয়ারিটির পরিমাপ। এখানে অনুপাত প্রতিটি স্বাধীন ভেরিয়েবলের জন্য গণনা করা হয়। একটি উচ্চ ভিআইএফ এর অর্থ হল সংশ্লিষ্ট স্বতন্ত্র ভেরিয়েবলটি মডেলের অন্যান্য ভেরিয়েবলের সাথে বেশিরভাগই সমান্তরাল।

10. মেশিন লার্নিং-এ SVM (সাপোর্ট ভেক্টর মেশিন) ব্যাখ্যা কর?

SVM নামে পরিচিত Support Vector Machine হল সবচেয়ে বেশি ব্যবহৃত সুপারভাইজড লার্নিং অ্যালগরিদমগুলির মধ্যে একটি যা প্রধানত শ্রেণিবিন্যাসের পাশাপাশি রিগ্রেশন সমস্যার জন্য ব্যবহৃত হয়। এটি প্রাথমিকভাবে মেশিন লার্নিং এর ক্লাসিফিকেশন সমস্যার জন্য ব্যবহৃত হয়।

আরো দেখুন শীর্ষ 100 উত্তরযোগ্য ইন্টারভিউ প্রশ্ন এবং উত্তর

SVM অ্যালগরিদমের প্রধান লক্ষ্য হল সর্বোত্তম সিদ্ধান্তের সীমানা তৈরি করা, যা এন-ডাইমেনশনাল স্পেসকে ক্লাসে বিভক্ত করে যাতে কেউ সহজেই নতুন প্রাপ্ত ডেটা পয়েন্টকে ভবিষ্যতে সঠিক বিভাগে রাখতে পারে।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

11. তত্ত্বাবধান করা এবং আন-সুপারভাইজড মেশিন লার্নিং এর মধ্যে পার্থক্য করুন?

তত্ত্বাবধানে মডেল তত্ত্বাবধানহীন মডেল
এখানে, অ্যালগরিদম একটি লেবেলযুক্ত ডেটাসেটে শেখে,এখানে, এটি লেবেলবিহীন ডেটা প্রদান করে।
এখানে, মডেলগুলিকে ম্যাপিং ফাংশন খুঁজে বের করতে হবে যা আউটপুট ভেরিয়েবল (Y) দিয়ে ইনপুট ভেরিয়েবল (X) ম্যাপ করতে ব্যবহৃত হয়।তত্ত্বাবধানহীন শিক্ষার মূল লক্ষ্য হল প্রদত্ত ইনপুট ডেটা থেকে গঠন এবং নিদর্শন খুঁজে বের করা।

12. Precision এবং Recall শব্দটি ব্যাখ্যা কর?

নির্ভুলতা, একটি ইতিবাচক ভবিষ্যদ্বাণীমূলক মান হিসাবেও পরিচিত, পুনরুদ্ধার করা উদাহরণগুলির মধ্যে প্রাসঙ্গিক দৃষ্টান্তের ভগ্নাংশ হিসাবে সংজ্ঞায়িত করা হয়।

যথার্থতা = TP/TP+FP

যেখানে TP সত্য ইতিবাচক

FP id False Positive

স্মরণ কর, সংবেদনশীলতা হিসাবেও পরিচিত, প্রাসঙ্গিক দৃষ্টান্তগুলির ভগ্নাংশ হিসাবে সংজ্ঞায়িত করা হয় যা পুনরুদ্ধার করা হয়েছিল।

রিকল = TP/TP+FP।

যেখানে TP সত্য ইতিবাচক

FP হল False positive.

13. L1 এবং L2 নিয়মিতকরণের মধ্যে পার্থক্য করুন?

L1 নিয়মিতকরণ L2 নিয়মিতকরণ
একটি রিগ্রেশন মডেল যা L1 নিয়মিতকরণ প্রক্রিয়া ব্যবহার করে তাকে ল্যাসো রিগ্রেশন বলা হয়।একটি রিগ্রেশন মডেল যা L1 নিয়মিতকরণ প্রক্রিয়া ব্যবহার করে তাকে রিজ রিগ্রেশন বলা হয়।
ল্যাসো রিগ্রেশন লস ফাংশনে পেনাল্টি টার্ম হিসাবে সহগের মাত্রার পরম মান যোগ করে।রিজ রিগ্রেশন লস ফাংশনে পেনাল্টি টার্ম হিসাবে সহগের বর্গক্ষেত্রের মাত্রা যোগ করে।
এটি ডেটার মাঝামাঝি অনুমান করার চেষ্টা করে।এটি ডেটার গড় অনুমান করার চেষ্টা করে।

14. ফুরিয়ার রূপান্তর ব্যাখ্যা কর?

ফুরিয়ার রূপান্তর হল সাইন তরঙ্গের একটি গুচ্ছে কিছু বিভক্ত করার একটি উপায়। গণিতের পরিপ্রেক্ষিতে, ফুরিয়ার ট্রান্সফর্ম এমন একটি প্রক্রিয়া যা একটি সংকেতকে তার নিজ নিজ উপাদান উপাদান এবং ফ্রিকোয়েন্সিতে রূপান্তর করতে পারে। ফুরিয়ার ট্রান্সফর্ম শুধুমাত্র সিগন্যাল, রেডিও, অ্যাকোস্টিক ইত্যাদিতে ব্যবহৃত হয় না।

15. F1 স্কোর কি? এটি কিভাবে ব্যবহার করতে?

F1-স্কোর হারমোনিক গড় গ্রহণ করে একটি একক মেট্রিকে একটি শ্রেণিবদ্ধকারীর নির্ভুলতা এবং প্রত্যাহার উভয়কেই একত্রিত করে। এটি দুটি ক্লাসিফায়ারের পারফরম্যান্সের তুলনা করতে ব্যবহৃত হয়। উদাহরণ স্বরূপ, ক্লাসিফায়ার X-এর উচ্চতর প্রত্যাহার রয়েছে এবং শ্রেণীবিভাগ Y-এর উচ্চতর নির্ভুলতা রয়েছে। এখন উভয় শ্রেণিবিন্যাসকারীর জন্য গণনা করা F1-স্কোরগুলি ভবিষ্যদ্বাণী করতে ব্যবহার করা হবে কোনটি ভাল ফলাফল দেয়৷

F1 স্কোর হিসাবে গণনা করা যেতে পারে

2(P*R)/(P+R)

যেখানে P হল নির্ভুলতা।

R হল ক্লাসিফিকেশন মডেলের রিকল।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

16. টাইপ I এবং টাইপ II ত্রুটির মধ্যে পার্থক্য করুন?

টাইপ I ত্রুটি টাইপ II ত্রুটি
এটি একটি মিথ্যা পজিটিভের সমতুল্য।এটি একটি মিথ্যা নেতিবাচক সমতুল্য
এটি অনুমানের অগ্রহণযোগ্যতা বোঝায়এটি অনুমানের গ্রহণযোগ্যতা বোঝায়
এমনকি একটি অনুমোদিত ম্যাচ দিয়েও প্রত্যাখ্যান হতে পারে।এমনকি একটি অননুমোদিত মিলের সাথেও একটি গ্রহণযোগ্যতা থাকতে পারে।

17. আপনি কি ব্যাখ্যা করতে পারেন কিভাবে একটি ROC বক্ররেখা কাজ করে?

FPR (ফলস পজিটিভ রেট) এর বিপরীতে সত্যিকারের ইতিবাচক হার (TPR) প্লট করে ROC বক্ররেখা গ্রাফিকভাবে উপস্থাপন করা হয়। কোথায়

  1. প্রকৃত ইতিবাচক হারকে পর্যবেক্ষণের অনুপাত হিসাবে সংজ্ঞায়িত করা যেতে পারে যা প্রদত্ত সমস্ত ইতিবাচক পর্যবেক্ষণের মধ্যে ইতিবাচক হওয়ার পূর্বাভাস দেওয়া হয়।

(TP/(TP + FN))

  1. মিথ্যা-ইতিবাচক হারকে পর্যবেক্ষণের অনুপাত হিসাবে সংজ্ঞায়িত করা হয় যেগুলি প্রদত্ত সমস্ত নেতিবাচক পর্যবেক্ষণের মধ্যে ইতিবাচক হওয়ার জন্য ভুলভাবে ভবিষ্যদ্বাণী করা হয়।

(FP/(TN + FP))

18. ডিপ লার্নিং এবং মেশিন লার্নিং এর মধ্যে পার্থক্য করুন?

গভীর জ্ঞানার্জন মেশিন লার্নিং
এটি মেশিন লার্নিং এর একটি উপসেটএটি গভীর শিক্ষার একটি সুপারসেট।
এটি জটিল সমস্যার সমাধান করে।এটি নতুন জিনিস শিখতে ব্যবহৃত হয়।
এটি মেশিন লার্নিংয়ের একটি বিবর্তন।এটি AI এর একটি বিবর্তন।
এখানে, অ্যালগরিদমগুলি মূলত ডেটা বিশ্লেষণে স্ব-চিত্রিতঅ্যালগরিদম তথ্য বিশ্লেষক দ্বারা সনাক্ত করা হয়.

19. আপনি বিভিন্ন মেশিন লার্নিং অ্যালগরিদম নাম দিতে পারেন?

বিভিন্ন মেশিন লার্নিং অ্যালগরিদম নীচে তালিকাভুক্ত করা হয়েছে:

  1. সিদ্ধান্ত গাছ,
  2. সাদামাটা বেইস,
  3. এলোমেলো বন
  4. ভেক্টর মেশিনকে সাপর্ট কর
  5. K- নিকটতম প্রতিবেশী,
  6. K- মানে ক্লাস্টারিং,
  7. গাউসিয়ান মিশ্রণ মডেল,
  8. লুকানো মার্কভ মডেল ইত্যাদি

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

20. AI কি?

প্রতি

AI (কৃত্রিম বুদ্ধিমত্তা) মেশিনে মানুষের বুদ্ধিমত্তার অনুকরণকে বোঝায় যা মানুষের মতো প্রতিফলিত করার জন্য এবং তাদের ক্রিয়াগুলি অনুকরণ করার জন্য প্রোগ্রাম করা হয়।

উদাহরণ: মুখ সনাক্তকরণ এবং স্বীকৃতি, Google মানচিত্র, এবং

রাইড-হেলিং অ্যাপ্লিকেশন, ই-পেমেন্ট।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

21. একটি ডেটা সেটে কাজ করার সময় কীভাবে গুরুত্বপূর্ণ ভেরিয়েবল নির্বাচন করবেন?

  1. গুরুত্বপূর্ণ ভেরিয়েবল নির্বাচন করার আগে আপনাকে সম্পর্কযুক্ত ভেরিয়েবলগুলি সরিয়ে ফেলতে হবে।
  2. লিনিয়ার রিগ্রেশন ব্যবহার করুন এবং তাদের p মানের উপর ভিত্তি করে ভেরিয়েবল নির্বাচন করুন।
  3. ফরোয়ার্ড সিলেকশন, স্টেপওয়াইজ সিলেকশন এবং ব্যাকওয়ার্ড সিলেকশন ব্যবহার করুন।
  4. Random Forest, Xgboost, এবং প্লট পরিবর্তনশীল গুরুত্ব চার্ট ব্যবহার করুন
  5. ল্যাসো রিগ্রেশন ব্যবহার করুন
  6. উপলব্ধ বৈশিষ্ট্যগুলির সেটের জন্য তথ্য লাভ পরিমাপ করে আপনাকে শীর্ষ n বৈশিষ্ট্যগুলি নির্বাচন করতে হবে৷

22. কার্যকারণ এবং পারস্পরিক সম্পর্কের মধ্যে পার্থক্য করুন?

দ্য কার্যকারণ স্পষ্টভাবে সেই ক্ষেত্রে প্রযোজ্য যেখানে অ্যাকশন A ক্রিয়া B-এর ফলাফল ঘটায়।

পারস্পরিক সম্পর্ক সহজভাবে একটি সম্পর্ক হিসাবে সংজ্ঞায়িত করা যেতে পারে। যেখানে A এর ক্রিয়াগুলি এর সাথে সম্পর্কিত হতে পারে খ. কিন্তু এখানে একটি ঘটনার জন্য অন্য ঘটনা ঘটার প্রয়োজন নেই।

23. ওভারফিটিং কি?

ওভারফিটিং হল এক ধরনের মডেলিং ত্রুটি যার ফলশ্রুতিতে ভবিষ্যৎ পর্যবেক্ষণগুলি কার্যকরভাবে ভবিষ্যদ্বাণী বা অনুমান করতে ব্যর্থ হয় বা ইতিমধ্যে বিদ্যমান মডেলটিতে অতিরিক্ত ডেটা ফিট করে।

24. স্ট্যান্ডার্ড ডেভিয়েশন এবং ভ্যারিয়েন্স শব্দটি ব্যাখ্যা কর?

প্রতি আদর্শ বিচ্যুতি সংখ্যা হিসাবে সংজ্ঞায়িত করা হয় যা নির্দিষ্ট করে যে মানগুলি কতটা বিস্তৃত। একটি নিম্ন মানক বিচ্যুতি প্রতিনিধিত্ব করে যে বেশিরভাগ সংখ্যা গড় মানের কাছাকাছি। উচ্চতর মান বিচ্যুতির মানে হল মানগুলি বিস্তৃত, বিস্তৃত পরিসরে।

ভিন্নতা মেশিন লার্নিং-এ হল এক ধরনের ত্রুটি যা প্রদত্ত প্রশিক্ষণ সেটে ছোট ওঠানামার প্রতি মডেলের সংবেদনশীলতার কারণে ঘটে।

25. মাল্টিলেয়ার পারসেপ্ট্রন এবং বোল্টজম্যান মেশিন ব্যাখ্যা কর?

একটি মাল্টিলেয়ার পারসেপ্ট্রন (এমএলপি) কৃত্রিম নিউরাল নেটওয়ার্কের একটি শ্রেণী হিসাবে সংজ্ঞায়িত করা হয় যা প্রদত্ত ইনপুটগুলির সেট থেকে আউটপুটগুলির একটি সেট তৈরি করতে পারে। একটি MLP ইনপুট নোডের বেশ কয়েকটি স্তর নিয়ে গঠিত যা ইনপুট এবং আউটপুট স্তরগুলির মধ্যে একটি নির্দেশিত গ্রাফ হিসাবে সংযুক্ত থাকে।

এর মূল উদ্দেশ্য বোল্টজম্যান মেশিন একটি প্রদত্ত সমস্যার সমাধান অপ্টিমাইজ করা হয়. এটি প্রধানত সেই নির্দিষ্ট সমস্যার সাথে সম্পর্কিত ওজন এবং পরিমাণ অপ্টিমাইজ করতে ব্যবহৃত হয়।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

26. বায়াস শব্দটি ব্যাখ্যা কর?

মেশিন লার্নিং-এ ডেটা পক্ষপাত এক ধরনের ত্রুটি হিসাবে সংজ্ঞায়িত করা হয় যেখানে একটি প্রদত্ত ডেটাসেটের কিছু উপাদান অন্যদের তুলনায় বেশি ওজন করা হয়। একটি পক্ষপাতমূলক ডেটাসেট মডেলের ব্যবহারের ক্ষেত্রে সঠিকভাবে উপস্থাপন করবে না এবং এর ফলে নির্ভুলতার মাত্রা কম এবং বিশ্লেষণাত্মক ত্রুটি দেখা দেয়।

27. মেশিন লার্নিং এর প্রকারের নাম বল?

মেশিন লার্নিংয়ের প্রকারগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. তত্ত্বাবধান করা শিক্ষা
  2. তত্ত্বাবধানহীন শিক্ষা
  3. শক্তিবৃদ্ধি শিক্ষা

28. শ্রেণীবিভাগ এবং রিগ্রেশনের মধ্যে পার্থক্য করুন?

শ্রেণীবিভাগ রিগ্রেশন
এটি একটি লেবেল ভবিষ্যদ্বাণী সম্পর্কেএটি একটি পরিমাণ ভবিষ্যদ্বাণী সম্পর্কে
এখানে, ডেটা এক বা একাধিক শ্রেণীতে লেবেল করা হয়।এখানে, আপনাকে ক্রমাগত পরিমাণের পূর্বাভাস দিতে হবে।
এটি একটি অবিচ্ছিন্ন মান ভবিষ্যদ্বাণী করতে পারে।এটি একটি পৃথক মান ভবিষ্যদ্বাণী করতে পারে।
এটি নির্ভুলতা ব্যবহার করে মূল্যায়ন করা যেতে পারে।এটি রুট গড় বর্গাকার ত্রুটি ব্যবহার করে মূল্যায়ন করা যেতে পারে।

29. কনফিউশন ম্যাট্রিক্স কি?

মেশিন লার্নিং ক্ষেত্রে, ক বিভ্রান্তি ম্যাট্রিক্স একটি ত্রুটি ম্যাট্রিক্সও বলা হয়, এটি একটি নির্দিষ্ট টেবিল লেআউট হিসাবে সংজ্ঞায়িত করা হয় যা ব্যবহারকারীকে একটি অ্যালগরিদমের কার্যকারিতা কল্পনা করতে দেয়, প্রধানত একটি তত্ত্বাবধান করা শিক্ষা।

বিভ্রান্তি ম্যাট্রিক্স

30. যখন আপনার ডেটাসেট উচ্চ বৈচিত্র্যের জন্য ভুগছে, আপনি কীভাবে এটি পরিচালনা করবেন?

উচ্চ বৈচিত্র সহ ডেটাসেটের জন্য, আমরা ব্যাগিং অ্যালগরিদম ব্যবহার করতে পারি। ব্যাগিং অ্যালগরিদম র্যান্ডম ডেটা থেকে নমুনা তৈরি করে ডেটাকে বিভিন্ন উপগোষ্ঠীতে বিভক্ত করে। একবার ডেটা বিভক্ত হয়ে গেলে, একটি প্রশিক্ষণ অ্যালগরিদম ব্যবহার করে, র্যান্ডম ডেটা নিয়ম তৈরি করতে ব্যবহার করা যেতে পারে। তারপর আমরা মডেলের সমস্ত পূর্বাভাসিত ফলাফল সংগ্রহ করতে পোলিং কৌশল ব্যবহার করি।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

31. ইন্ডাকটিভ এবং ডিডাক্টিভ লার্নিং এর মধ্যে পার্থক্য কর?

ইন্ডাকটিভ লার্নিং ডিডাক্টিভ লার্নিং
এটি একটি তত্ত্ব বিকাশের লক্ষ্য।এটি একটি বিদ্যমান তত্ত্ব পরীক্ষা করার লক্ষ্য।
এটি নির্দিষ্ট পর্যবেক্ষণ থেকে বিস্তৃত সাধারণীকরণে চলে যায়যদি কোন তত্ত্ব না থাকে, আপনি অনুমানমূলক গবেষণা পরিচালনা করতে পারবেন না।
এটি তিনটি পর্যায় নিয়ে গঠিত, পর্যবেক্ষণ একটি প্যাটার্ন পর্যবেক্ষণ করুন একটি তত্ত্ব বিকাশ করুনএটি চারটি পর্যায় নিয়ে গঠিত: একটি বিদ্যমান তত্ত্ব দিয়ে শুরু করুন বিদ্যমান তত্ত্বের উপর ভিত্তি করে একটি হাইপোথিসিস তৈরি করুন হাইপোথিসিস পরীক্ষা করার জন্য ডেটা সংগ্রহ করুন ফলাফল বিশ্লেষণ করুন

32. প্রদত্ত ডেটাসেটে দূষিত মানগুলির পরিচালনা ব্যাখ্যা কর?

অনুপস্থিত ডেটা হ্যান্ডেল করার উপায় নীচে?

  1. অনুপস্থিত মান সহ সারিগুলি সরান।
  2. অন্য একটি ভবিষ্যদ্বাণীমূলক মডেল তৈরি করুন যাতে আপনি অনুপস্থিত মানগুলির পূর্বাভাস দিতে পারেন।
  3. এমনভাবে একটি মডেল ব্যবহার করুন যাতে এটি অনুপস্থিত ডেটা অন্তর্ভুক্ত করতে পারে।
  4. আপনাকে সমষ্টিগত মান দিয়ে অনুপস্থিত ডেটা প্রতিস্থাপন করতে হবে।
  5. আপনি অনুপস্থিত মান ভবিষ্যদ্বাণী করতে পারেন.
  6. একটি অজানা বিভাগ তৈরি করুন

33. এর মধ্যে কোনটি বেশি গুরুত্বপূর্ণ মডেলের নির্ভুলতা বা মডেল পারফরম্যান্স?

মডেল নির্ভুলতা একটি মেশিন ল্যাঙ্গুয়েজ /এআই মডেলের গুরুত্বপূর্ণ বৈশিষ্ট্য হিসাবে বিবেচিত হয়। যখনই আমরা মডেলের পারফরম্যান্স নিয়ে আলোচনা করি, আমরা প্রথমে স্পষ্ট করি এটা মডেল স্কোরিং পারফরম্যান্স নাকি মডেল ট্রেনিং পারফরম্যান্স।

মডেল কর্মক্ষমতা ডিস্ট্রিবিউটেড কম্পিউটিং ব্যবহার করে এবং প্রদত্ত স্কোর করা সম্পদের সমান্তরালকরণের মাধ্যমে উন্নত করা হয়, তবে মডেল প্রশিক্ষণ প্রক্রিয়ার সময় আমাদের সাবধানে নির্ভুলতা তৈরি করতে হবে।

34. একটি সময় সিরিজ কি?

মেশিন লার্নিং-এ টাইম সিরিজকে এলোমেলো ভেরিয়েবলের একটি সেট হিসাবে সংজ্ঞায়িত করা হয় যা সময়ের সাপেক্ষে অর্ডার করা হয়। টাইম সিরিজগুলি একটি ঘটনাকে ব্যাখ্যা করতে, একটি প্রবণতা, চক্রীয়তার উপাদানগুলি সনাক্ত করতে এবং এর ভবিষ্যত মানগুলির পূর্বাভাস দেওয়ার জন্য অধ্যয়ন করা হয়।

35. এনট্রপি এবং তথ্য লাভের মধ্যে পার্থক্য করুন?

দ্য তথ্য লাভ অন্য র্যান্ডম ভেরিয়েবল পর্যবেক্ষণ করে একটি সংকেত বা র্যান্ডম ভেরিয়েবল সম্পর্কে অর্জিত তথ্যের পরিমাণ হিসাবে সংজ্ঞায়িত করা হয়।

এনট্রপি ডেটার স্টোকাস্টিক উত্স দ্বারা তথ্য তৈরি করা গড় হার হিসাবে সংজ্ঞায়িত করা যেতে পারে, অথবা এটি একটি র্যান্ডম ভেরিয়েবলের সাথে সম্পর্কিত অনিশ্চয়তার পরিমাপ হিসাবে সংজ্ঞায়িত করা যেতে পারে।

36. স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট (SGD) এবং গ্রেডিয়েন্ট ডিসেন্ট (GD) এর মধ্যে পার্থক্য করুন?

ব্যাচ গ্রেডিয়েন্ট ডিসেন্ট প্রতিটি ধাপের সম্পূর্ণ প্রশিক্ষণ সেটের উপর গণনার সাথে জড়িত, যার ফলে খুব বড় প্রশিক্ষণ ডেটাতে খুব ধীর প্রক্রিয়া হয়। তাই, ব্যাচ জিডি করা খুবই ব্যয়বহুল হয়ে পড়ে। যাইহোক, এটি তুলনামূলকভাবে মসৃণ ত্রুটি বহুগুণ জন্য মহান. এছাড়াও, এটি বৈশিষ্ট্যের সংখ্যার সাথে ভালভাবে স্কেল করে।

স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট ব্যাচ গ্রেডিয়েন্ট ডিসেন্টের প্রাথমিক সমস্যাটি সমাধান করার চেষ্টা করে যা প্রতিটি ধাপে গ্রেডিয়েন্ট গণনা করার জন্য সম্পূর্ণ প্রশিক্ষণ ডেটা ব্যবহার করে। SGD প্রকৃতিতে স্টোকাস্টিক মানে এটি প্রতিটি ধাপে প্রশিক্ষণের ডেটার কিছু এলোমেলো দৃষ্টান্ত সংগ্রহ করে এবং তারপরে এটি গ্রেডিয়েন্ট গণনা করে এটি দ্রুততর করে কারণ একটি শটে ম্যানিপুলেট করার জন্য খুব কম ডেটা থাকে,

ব্যাচ গ্রেডিয়েন্ট ডিসেন্ট স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট
এটি সমগ্র প্রশিক্ষণ নমুনা ব্যবহার করে গ্রেডিয়েন্ট গণনা করে।এটি একটি একক প্রশিক্ষণ নমুনা ব্যবহার করে গ্রেডিয়েন্ট গণনা করে।
এটি বিশাল প্রশিক্ষণের নমুনার জন্য সুপারিশ করা যাবে না।এটি বড় প্রশিক্ষণের নমুনার জন্য প্রস্তাবিত হতে পারে।
এটি প্রকৃতিগতভাবে নির্ণয়বাদী।এটি প্রকৃতিতে পরিশীলিত।

37. ডিসিশন ট্রিতে জিনি ইম্পিউরিটি এবং এনট্রপির মধ্যে পার্থক্য করুন?

জিনি এনট্রপি
এটির ব্যবধানের মধ্যে মান রয়েছে [0, 0.5]এটির ব্যবধানের মধ্যে মান রয়েছে [0, 1]
এটা আরো জটিল.এটা জটিল নয়।
এর পরিমাপ হল একটি এলোমেলো নমুনার সম্ভাব্যতা যা সঠিকভাবে শ্রেণীবদ্ধ করা হচ্ছে।এটি তথ্যের অভাব গণনা করার জন্য একটি পরিমাপ,

38 . সিদ্ধান্ত গাছের কিছু সুবিধা ও অসুবিধা উল্লেখ কর?

সিদ্ধান্ত গাছের সুবিধা এবং অসুবিধা

সিদ্ধান্ত গাছের সুবিধা:

  1. অন্যান্য অ্যালগরিদমের তুলনায় ডিসিশন ট্রির প্রাক-প্রক্রিয়াকরণের সময় ডেটা প্রস্তুতির জন্য কম প্রচেষ্টার প্রয়োজন হয়।
  2. একটি সিদ্ধান্ত গাছের ডেটা স্বাভাবিককরণের প্রয়োজন হয় না।
  3. এটি ডেটা স্কেলিং প্রয়োজন হয় না.
  4. ডেটাতে অনুপস্থিত মানগুলি সিদ্ধান্ত গাছ তৈরির প্রক্রিয়াকে প্রভাবিত করে না।
  5. একটি সিদ্ধান্ত গাছ মডেল প্রযুক্তিগত দল এবং স্টেকহোল্ডারদের ব্যাখ্যা করা খুব সহজ।
আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

39. আপনি কি মেশিন লার্নিং-এ এনসেম্বল শেখার কৌশল ব্যাখ্যা করতে পারেন?

এনসেম্বল পদ্ধতি হল একাধিক মডেল তৈরি করতে এবং উন্নত ফলাফল তৈরি করতে তাদের একত্রিত করতে ব্যবহৃত কৌশল। এনসেম্বল পদ্ধতিগুলি সাধারণত একটি একক মডেলের চেয়ে আরও সুনির্দিষ্ট সমাধান তৈরি করে।

ভিতরে এনসেম্বল লার্নিং , আমরা প্রশিক্ষণ ডেটা সেটকে একাধিক উপসেটে ভাগ করি, যেখানে প্রতিটি উপসেট একটি পৃথক মডেল তৈরি করতে ব্যবহৃত হয়। একবার মডেলগুলিকে প্রশিক্ষিত করা হলে, তারা একটি ফলাফলের ভবিষ্যদ্বাণী করার জন্য এমনভাবে একত্রিত হয় যাতে আউটপুটের বৈচিত্র্য হ্রাস পায়।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

40. কোলিনিয়ারিটি এবং মাল্টিকোলিনিয়ারিটি শব্দটি ব্যাখ্যা কর?

বহুসংখ্যা যখন একাধিক স্বাধীন ভেরিয়েবল একটি রিগ্রেশন মডেলে একে অপরের সাথে খুব বেশি সম্পর্কযুক্ত হয়, যার মানে হল যে একটি স্বাধীন পরিবর্তনশীল একটি রিগ্রেশন মডেলের ভিতরে অন্য একটি স্বাধীন পরিবর্তনশীল থেকে ভবিষ্যদ্বাণী করা যেতে পারে।

সমষ্টি প্রধানত ঘটে যখন একটি মাল্টিপল রিগ্রেশনে দুটি ভবিষ্যদ্বাণীকারী ভেরিয়েবলের কিছু পারস্পরিক সম্পর্ক থাকে।

সমষ্টি

41. র্যান্ডম ফরেস্ট এবং গ্রেডিয়েন্ট বুস্টিং মেশিনের মধ্যে পার্থক্য করুন?

এলোমেলো বনের মতো, গ্রেডিয়েন্ট বুস্টিংও সিদ্ধান্ত গাছের একটি সেট। দুটি প্রাথমিক পার্থক্য হল:

    কিভাবে গাছ তৈরি করা হয়:এলোমেলো বনের প্রতিটি গাছ স্বাধীনভাবে নির্মিত হয়, যেখানে গ্রেডিয়েন্ট বুস্টিং একবারে একটি মাত্র গাছ তৈরি করে।সমন্বয় ফলাফল: এলোমেলো বনগুলি গড় করে প্রক্রিয়ার শেষে ফলাফলগুলিকে একত্রিত করে। যেখানে গ্রেডিয়েন্ট বুস্টিং পথ বরাবর ফলাফল একত্রিত করে।

42. Eigenvectors এবং Eigenvalues ​​শব্দটি ব্যাখ্যা কর?

Eigenvectors একক ভেক্টর, মানে তাদের দৈর্ঘ্য বা মাত্রা 1.0 এর সমান। এগুলিকে ডান ভেক্টর বলা হয়, যার অর্থ একটি কলাম ভেক্টর।

Eigenvalues সহগ যা ইজেনভেক্টরগুলিতে প্রয়োগ করা হয় যা ঘুরে, ভেক্টরকে তাদের দৈর্ঘ্য বা মাত্রা দেয়।

Eigenvectors এবং Eigenvalues

43. আপনি অ্যাসোসিয়েটিভ রুল মাইনিং (ARM) ব্যাখ্যা করতে পারেন?

সমিতির নিয়ম খনির (ARM) এর লক্ষ্য হল অ্যাসোসিয়েশনের নিয়মগুলি খুঁজে বের করা যা একটি ডাটাবেস থেকে পূর্বনির্ধারিত ন্যূনতম সমর্থন এবং আত্মবিশ্বাসকে সন্তুষ্ট করবে। AMO প্রধানত নতুন ফিটনেস ফাংশনগুলির সাথে অ্যাসোসিয়েশন নিয়মের সংখ্যা কমাতে ব্যবহৃত হয় যা ঘন ঘন নিয়মগুলিকে অন্তর্ভুক্ত করতে পারে।

44. A/B টেস্টিং কি?

A/B পরীক্ষা একটি মৌলিক এলোমেলো নিয়ন্ত্রণ পরীক্ষা হিসাবে সংজ্ঞায়িত করা হয়। এটি একটি ভেরিয়েবলের দুটি সংস্করণের তুলনা করতে ব্যবহার করা হয় তাদের মধ্যে কোনটি একটি নিয়ন্ত্রিত পরিবেশে ভাল পারফর্ম করে তা খুঁজে বের করতে।

A/B টেস্টিং দুটি মডেলের তুলনা করার জন্য সবচেয়ে ভালো ব্যবহার করা যেতে পারে কোনটি গ্রাহকের কাছে সবচেয়ে ভালো প্রস্তাবিত পণ্য তা পরীক্ষা করতে।

45. প্রান্তিককরণ এবং এর প্রক্রিয়া ব্যাখ্যা কর?

প্রান্তিককরণ হল এমন একটি পদ্ধতি যা অন্য একটি পরিবর্তনশীলের প্রান্তিক অবদান নির্ধারণের জন্য একটি চলকের সম্ভাব্য মানের সমষ্টি প্রয়োজন।

P(X=x) = ∑YP(X=x,Y)

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

46. ​​ক্লাস্টার স্যাম্পলিং কি?

ক্লাস্টারিং

গুচ্ছের আদর্শ নমুনা পদ্ধতির একটি প্রকার হিসাবে সংজ্ঞায়িত করা হয়। ক্লাস্টার স্যাম্পলিংয়ের মাধ্যমে, গবেষকরা সাধারণত জনসংখ্যাকে আলাদা গ্রুপ বা সেটে ভাগ করেন, যা ক্লাস্টার নামে পরিচিত। তারপর, জনসংখ্যা থেকে ক্লাস্টারগুলির একটি এলোমেলো নমুনা বাছাই করা হয়। তারপর গবেষক সংগৃহীত নমুনা ক্লাস্টার থেকে তথ্যের উপর তাদের বিশ্লেষণ পরিচালনা করেন।

47. Curse of Dimensionality শব্দটি ব্যাখ্যা কর?

মাত্রিকতার অভিশাপ মূলত বৈশিষ্ট্যের সংখ্যা বৃদ্ধির সাথে ত্রুটির বৃদ্ধিকে বোঝায়। এটিকে উল্লেখ করা যেতে পারে যে অ্যালগরিদমগুলি উচ্চ মাত্রায় ডিজাইন করার জন্য জোরালো, এবং তাদের প্রায়শই মাত্রায় সূচকীয় চলমান সময় থাকে।

48. ডাটা অ্যানালাইসিস এবং সায়েন্টিফিক কম্পিউটেশনের জন্য ব্যবহৃত পাইথনের কয়েকটি লাইব্রেরির নাম দিতে পারেন?

  1. NumPy
  2. SciPy
  3. পান্ডা
  4. SciKit
  5. ম্যাটপ্লটলিব
  6. সামুদ্রিক
  7. বোকেহ

49. outliers কি? বহিরাগতদের মোকাবেলা করার পদ্ধতিগুলি উল্লেখ করুন?

একটি আউটলিয়ারকে একটি বস্তু হিসাবে সংজ্ঞায়িত করা যেতে পারে যা অন্যান্য বস্তু থেকে উল্লেখযোগ্যভাবে বিচ্যুত হয়। তারা মৃত্যুদন্ডের ত্রুটি দ্বারা সৃষ্ট হতে পারে.

বহিরাগতদের সাথে মোকাবিলা করার তিনটি প্রধান পদ্ধতি নিম্নরূপ:

  1. একক পদ্ধতি
  2. মাল্টিভেরিয়েট পদ্ধতি
  3. Minkowski ত্রুটি

50. কিছু জনপ্রিয় বন্টন বক্ররেখার সাথে পরিস্থিতির তালিকা করুন যেখানে আপনি সেগুলিকে একটি অ্যালগরিদমে ব্যবহার করবেন?

সবচেয়ে জনপ্রিয় বন্টন বক্ররেখা হল:

সমবন্টন একটি সম্ভাব্যতা বন্টন হিসাবে সংজ্ঞায়িত করা যেতে পারে যার একটি ধ্রুবক সম্ভাবনা রয়েছে। উদাহরণ: একটি একক পাশা রোল করা যেহেতু এর একাধিক ফলাফল রয়েছে৷

দ্বিপদ বন্টন শুধুমাত্র দুটি সম্ভাব্য ফলাফল সহ একটি সম্ভাব্যতা হিসাবে সংজ্ঞায়িত করা হয়। উদাহরণ: একটি মুদ্রা টস। ফলাফল হয় মাথা বা লেজ হবে।

স্বাভাবিক বন্টন একটি ভেরিয়েবলের মানগুলি কীভাবে বিতরণ করা হয় তা নির্দিষ্ট করে। উদাহরণ: একটি শ্রেণীকক্ষে ছাত্রদের উচ্চতা।

মাছ বিতরণ যখন আপনি জানেন যে ঘটনাটি কত ঘন ঘন ঘটেছে তা ঘটছে এমন নির্দিষ্ট ইভেন্টগুলির সম্ভাবনার পূর্বাভাস দিতে সাহায্য করে।

সূচকীয় বন্টন নির্দিষ্ট ঘটনা ঘটতে না হওয়া পর্যন্ত সময়ের পরিমাণের সাথে প্রধানত উদ্বিগ্ন। উদাহরণ: একটি গাড়ির ব্যাটারি কতক্ষণ চলতে পারে, মাসে।

মেশিন লার্নিং ইন্টারভিউ প্রশ্ন ও উত্তর

51. আপনি কি লিনিয়ার রিগ্রেশন দিয়ে শুরু করার আগে ডেটা পূরণ করার জন্য অনুমানের তালিকা করতে পারেন?

পূরণ করা অনুমান হল:

  1. রৈখিক সম্পর্ক
  2. বহুমুখী স্বাভাবিকতা
  3. না বা সামান্য মাল্টিকোলিনিয়ারিটি
  4. কোনো স্বয়ংক্রিয় সম্পর্ক নেই
  5. হোমোসেড্যাস্টিসিটি

52. ভ্যারিয়েন্স ইনফ্লেশন ফ্যাক্টর শব্দটির অর্থ ব্যাখ্যা কর?

ভ্যারিয়েন্স ইনফ্লেশন ফ্যাক্টর যা VIF হল একাধিক রিগ্রেশন ভেরিয়েবলের একটি প্রদত্ত সেটে বহুসংখ্যার পরিমাণের পরিমাপ হিসাবে সংজ্ঞায়িত করা হয়।

গাণিতিকভাবে, একটি রিগ্রেশন মডেল ভেরিয়েবলের ভেরিয়েন্স ইনফ্লেশন ফ্যাক্টর চূড়ান্ত মডেল ভ্যারিয়েন্সের সাথে একটি মডেলের ভ্যারিয়েন্সের অনুপাতের সমান যা সেই একক স্বাধীন ভেরিয়েবলকে অন্তর্ভুক্ত করে।

এই অনুপাতটি প্রতিটি স্বাধীন ভেরিয়েবলের জন্য গণনা করা হয়। একটি উচ্চ ভিআইএফ প্রতিনিধিত্ব করে যে সংশ্লিষ্ট স্বাধীন ভেরিয়েবলটি মডেলের অন্যান্য ভেরিয়েবলের সাথে ব্যাপকভাবে সমান্তরাল।

53. আপনি কি আমাদের বলতে পারেন যখন রৈখিক রিগ্রেশন লাইনটি ঘূর্ণন বন্ধ করে বা ডেটাতে লাগানো একটি সর্বোত্তম স্থান খুঁজে পায়?

যে স্থানে সর্বোচ্চ RSquared মান পাওয়া যায় সেখানে লাইনটি বিশ্রামে আসে। RSquared সাধারণত ভার্চুয়াল রৈখিক রিগ্রেশন লাইন দ্বারা ক্যাপচার করা ভ্যারিয়েন্সের পরিমাণকে প্রতিনিধিত্ব করে যা ডেটাসেট দ্বারা ক্যাপচার করা মোট বৈচিত্র্যের সাথে।

54. আপনি কি আমাদের বলতে পারেন কোন মেশিন লার্নিং অ্যালগরিদমটি অলস লার্নার হিসাবে পরিচিত এবং কেন এটি বলা হয়?

কেএনএন মেশিন লার্নিং অ্যালগরিদমকে অলস লার্নার বলা হয়। K-NN-কে একটি অলস শিক্ষার্থী হিসাবে সংজ্ঞায়িত করা হয়েছে কারণ এটি প্রদত্ত প্রশিক্ষণের ডেটা থেকে কোনও মেশিন-লার্নেড মান বা ভেরিয়েবল শিখবে না, তবে গতিশীলভাবে এটি প্রতিবার শ্রেণীবদ্ধ করতে চাইলে দূরত্ব গণনা করে। তাই এটি পরিবর্তে প্রশিক্ষণ ডেটাসেট মুখস্থ করে।

55. আপনি কি আমাদের বলতে পারেন যে ডেটাসেটের বিভিন্ন উপসেটে রিগ্রেশন চালানো হলে একটি নির্দিষ্ট ভেরিয়েবলের বিটা মান প্রতিটি উপসেটে খুব বেশি পরিবর্তিত হলে কী সমস্যা হতে পারে?

প্রতিটি উপসেটের বিটা মানের বৈচিত্রগুলি নির্দেশ করে যে ডেটাসেটটি ভিন্নধর্মী। এই সমস্যাটি কাটিয়ে উঠতে, আমরা প্রদত্ত ডেটাসেটের প্রতিটি ক্লাস্টার সাবসেটের জন্য একটি আলাদা মডেল ব্যবহার করি, অথবা আমরা সিদ্ধান্ত গাছের মতো একটি নন-প্যারামেট্রিক মডেল ব্যবহার করি।

56. কিভাবে একটি প্রশিক্ষণ সেট ডেটা আকারের উপর ভিত্তি করে একটি ক্লাসিফায়ার চয়ন করবেন?

যদি প্রশিক্ষণ সেটটি আকারে ছোট হয়, উচ্চ পক্ষপাতিত্ব বা কম বৈচিত্র্যের মডেল, উদাহরণস্বরূপ, নেভ বেয়েস আরও ভাল পারফর্ম করার প্রবণতা রাখে কারণ তাদের ওভারফিট হওয়ার সম্ভাবনা কম।

যদি প্রশিক্ষণ সেটটি আকারে বড় হয়, নিম্ন পক্ষপাতিত্ব বা উচ্চ ভিন্নতা মডেল, উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন, আরও ভাল পারফর্ম করার প্রবণতা দেখায় কারণ তারা আরও জটিল সম্পর্ক প্রতিফলিত করতে পারে।

57. মেশিন লার্নিং মডেলে ট্রেনিং সেট এবং টেস্ট সেটের মধ্যে পার্থক্য করুন?

প্রশিক্ষণ সেট টেস্ট সেট
মোট ডেটার 70% প্রশিক্ষণ ডেটাসেট হিসাবে নেওয়া হয়।অবশিষ্ট 30% একটি টেস্টিং ডেটাসেট হিসাবে নেওয়া হয়।
এটি একটি মডেল তৈরি করার জন্য বাস্তবায়িত হয়।এটি নির্মিত মডেল যাচাই করতে ব্যবহৃত হয়।
এটি মডেল প্রশিক্ষণের জন্য ব্যবহৃত একটি লেবেলযুক্ত ডেটা।আমরা সাধারণত লেবেলযুক্ত ডেটা ছাড়াই পরীক্ষা করি এবং তারপরে লেবেল দিয়ে ফলাফল যাচাই করি।

58. একটি মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক ব্যাখ্যা করুন এবং সেগুলি কীভাবে তাৎপর্যপূর্ণ?

প্রতি ইতিবাচক মিথ্যা একটি ধারণা যেখানে আপনি একটি প্রদত্ত পরীক্ষার জন্য একটি ইতিবাচক ফলাফল পান যখন আপনার আসলে একটি নেতিবাচক ফলাফল পাওয়া উচিত ছিল। এটিকে মিথ্যা অ্যালার্ম বা মিথ্যা ইতিবাচক ত্রুটিও বলা হয়। এটি মূলত চিকিৎসা ক্ষেত্রে ব্যবহৃত হয়, তবে এটি সফ্টওয়্যার পরীক্ষার ক্ষেত্রেও প্রয়োগ করতে পারে।

মিথ্যা ইতিবাচক উদাহরণ:

  1. একটি গর্ভাবস্থা পরীক্ষা ইতিবাচক, যেখানে প্রকৃতপক্ষে, আপনি গর্ভবতী নন।
  2. একটি ক্যান্সার স্ক্রীনিং পরীক্ষা ইতিবাচক, কিন্তু আপনার রোগ নেই।
  3. আপনার ভ্রূণের কোনো ব্যাধি না থাকলে ডাউনস সিনড্রোমের জন্য প্রসবপূর্ব পরীক্ষাগুলি ইতিবাচক।
  4. আপনার সিস্টেমে ভাইরাস সফ্টওয়্যার ভুলভাবে ক্ষতিকারক প্রোগ্রামটিকে ক্ষতিকারক হিসাবে চিহ্নিত করে৷

প্রতি মিথ্যা নেতিবাচক সংজ্ঞায়িত করা হয় যেখানে একটি নেতিবাচক পরীক্ষার ফলাফল ভুল। সহজ কথায়, আপনি একটি নেতিবাচক পরীক্ষার ফলাফল পান, যেখানে আপনার একটি ইতিবাচক পরীক্ষার ফলাফল পাওয়া উচিত ছিল।

উদাহরণস্বরূপ, একটি গর্ভাবস্থা পরীক্ষা নেওয়ার কথা বিবেচনা করুন এবং আপনি নেতিবাচক হিসাবে পরীক্ষা করবেন (গর্ভবতী নয়)। কিন্তু আসলে, আপনি গর্ভবতী.

খুব তাড়াতাড়ি পরীক্ষা নেওয়া, মিশ্রিত প্রস্রাব ব্যবহার করা বা খুব তাড়াতাড়ি ফলাফল পরীক্ষা করার কারণে মিথ্যা নেতিবাচক গর্ভাবস্থা পরীক্ষার ফলাফল। প্রায় প্রতিটি মেডিকেল পরীক্ষায় মিথ্যা নেতিবাচক হওয়ার ঝুঁকি থাকে।

59. সেমি-সুপারভাইসড মেশিন লার্নিং শব্দটি ব্যাখ্যা কর?

আধা-তত্ত্বাবধানে শিক্ষাকে মেশিন লার্নিংয়ের একটি পদ্ধতি হিসাবে সংজ্ঞায়িত করা হয় যা প্রশিক্ষণ প্রক্রিয়া চলাকালীন লেবেলবিহীন ডেটার সাথে একটি কম পরিমাণ লেবেলযুক্ত ডেটাকে একত্রিত করে। এটি তত্ত্বাবধানহীন শিক্ষা এবং তত্ত্বাবধানে শিক্ষার মধ্যে পড়ে।

60. আপনি কি আমাদের আধুনিক ব্যবসায় তত্ত্বাবধানে মেশিন লার্নিং এর অ্যাপ্লিকেশন বলতে পারেন?

  1. স্বাস্থ্যসেবা নির্ণয়
  2. জালিয়াতি সনাক্তকরণ
  3. ইমেল স্প্যাম সনাক্তকরণ
  4. সংবেদনশীল বিশ্লেষণ

61. আপনি কি ইন্ডাকটিভ মেশিন লার্নিং এবং ডিডাক্টিভ মেশিন লার্নিং এর মধ্যে পার্থক্য করতে পারেন?

ইন্ডাকটিভ মেশিন লার্নিং ডিডাক্টিভ মেশিন লার্নিং
A ⋀ B ⊢ A → B (আবেশ)A ⋀ (A –>B)⊢ B(ডিডাকশন)
এটি দৃষ্টান্তের সেট থেকে পর্যবেক্ষণ করে এবং শেখে এবং তারপরে এটি উপসংহারে আসে।এটি প্রথমে উপসংহারটি বের করে এবং তারপরে এটি পূর্ববর্তী সিদ্ধান্তের উপর ভিত্তি করে কাজ করে।
এটি একটি পরিসংখ্যানগত মেশিন লার্নিং যেমন KNN বা SVM,ডিসিশন ট্রি ব্যবহার করে ডিডাক্টিভ রিজনিং থেকে মেশিন লার্নিং অ্যালগরিদম।

62. মেশিন লার্নিং এ র্যান্ডম ফরেস্ট কি?

এলোমেলো বনকে একটি তত্ত্বাবধানে শিক্ষার অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা যেতে পারে যা শ্রেণীবিভাগ এবং রিগ্রেশনের জন্য ব্যবহৃত হয়। একইভাবে, র্যান্ডম ফরেস্ট অ্যালগরিদম ডেটা নমুনাগুলিতে সিদ্ধান্তের গাছ তৈরি করে এবং তারপরে এটি প্রতিটি নমুনা থেকে ভবিষ্যদ্বাণী পায় এবং অবশেষে ভোটের মাধ্যমে সেরাটিকে নির্বাচন করে।

63. পক্ষপাত ও বৈষম্যের মধ্যে ট্রেড-অফ ব্যাখ্যা কর?

পক্ষপাত হিসাবে সংজ্ঞায়িত করা যেতে পারে লক্ষ্য ফাংশন আনুমানিক সহজ করতে মডেল দ্বারা তৈরি অনুমান.

ভিন্নতা বিভিন্ন প্রশিক্ষণ ডেটার ভিত্তিতে লক্ষ্য ফাংশনের অনুমান পরিবর্তিত হবে এমন পরিমাণ হিসাবে সংজ্ঞায়িত করা হয়।

দ্য ভারসাম্য পক্ষপাত এবং প্রকরণ দ্বারা প্রবর্তিত ত্রুটির মধ্যে উত্তেজনা হিসাবে সংজ্ঞায়িত করা হয়।

64. সিদ্ধান্ত গাছে ছাঁটাই ব্যাখ্যা করুন এবং এটি কীভাবে করা হয়?

ছাঁটাই হল মেশিন লার্নিং এবং সার্চ অ্যালগরিদমের একটি ডেটা কম্প্রেশন প্রক্রিয়া যা গাছের নির্দিষ্ট কিছু অংশকে সরিয়ে দিয়ে সিদ্ধান্ত গাছের আকার কমাতে পারে যেগুলি দৃষ্টান্ত শ্রেণীবদ্ধ করার জন্য অ-গুরুত্বপূর্ণ এবং অপ্রয়োজনীয়। একটি গাছ যা প্রশিক্ষণের ডেটাকে অতিরিক্ত ফিট করার ঝুঁকিপূর্ণ এবং নতুন নমুনাগুলির জন্য খারাপভাবে সাধারণীকরণ করছে৷

ছাঁটাই নিম্নরূপ সঞ্চালিত হতে পারে।

  1. টপ-ডাউন ফ্যাশন (এটি নোডগুলি ভ্রমণ করবে এবং মূল থেকে শুরু করে সাবট্রি ট্রিম করবে)
  2. বটম-আপ ফ্যাশন (এটি লিফ নোড থেকে শুরু হবে)

সিদ্ধান্ত গাছের ছাঁটাইয়ের জন্য আমরা ত্রুটির অ্যালগরিদম কমিয়েছি।

65. সিদ্ধান্ত গাছে ছাঁটাইয়ের জন্য হ্রাসকৃত ত্রুটি অ্যালগরিদমগুলি কীভাবে কাজ করে?

হ্রাসকৃত ত্রুটি অ্যালগরিদম নিম্নরূপ কাজ করে:

  1. এটা ছাঁটাই জন্য প্রতিটি নোড বিবেচনা.
  2. ছাঁটাই = সেই নোডে সাবট্রি অপসারণ, তারপরে এটিকে একটি পাতা তৈরি করুন এবং সেই নোডে প্রধান সাধারণ শ্রেণি নির্ধারণ করুন।
  3. গাছ থেকে একটি নোড সরানো হয় যদি ফলস্বরূপ গাছটি আসলটির চেয়ে খারাপ কাজ করে।
  4. নোডগুলিকে এমনভাবে নোড বেছে নেওয়ার মাধ্যমে পুনরাবৃত্তিমূলকভাবে মুছে ফেলা হয় যেটির অপসারণ বেশিরভাগ ক্ষেত্রে গ্রাফে সিদ্ধান্ত গাছের নির্ভুলতা বাড়ায়।
  5. পরবর্তী ছাঁটাই ক্ষতিকর না হওয়া পর্যন্ত ছাঁটাই চলতে থাকে।
  6. এটি প্রশিক্ষণ, পরীক্ষার সেট এবং বৈধতা ব্যবহার করে। বিপুল পরিমাণ ডেটা উপলব্ধ থাকলে এটি একটি কার্যকর পদ্ধতি।
আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

66. ডিসিশন ট্রি শ্রেণীবিভাগ শব্দটি ব্যাখ্যা কর?

ডিসিশন ট্রি ডিসিশন ট্রি ডেভেলপ করার সময় ডেটাসেটগুলিকে ছোট ছোট উপসেটে বিভক্ত করে একটি গাছের কাঠামো হিসাবে শ্রেণীবিভাগের মডেল তৈরি করে; মূলত, এটি শাখা এবং নোড সংজ্ঞায়িত সহ একটি গাছের মত উপায়। ডিসিশন ট্রি শ্রেণীগত এবং সংখ্যাসূচক উভয় ডেটাই পরিচালনা করে।

67. লজিস্টিক রিগ্রেশন ব্যাখ্যা কর?

লজিস্টিক রিগ্রেশন অ্যানালাইসিস হল একটি কৌশল যা স্বাধীন ভেরিয়েবলের সংযোগ পরীক্ষা করার জন্য একটি দ্বিমুখী নির্ভরশীল ভেরিয়েবলের সাথে পরীক্ষা করে। এটি রৈখিক রিগ্রেশন বিশ্লেষণের বিপরীতে, যেখানে নির্ভরশীল পরিবর্তনশীল একটি অবিচ্ছিন্ন পরিবর্তনশীল।

প্রতিবার লজিস্টিক রিগ্রেশনের আউটপুট 0 বা 1 হয় যার থ্রেশহোল্ড মান 0.5। 0.5-এর উপরে যে কোনও মান 1 হিসাবে নেওয়া হয় এবং 0.5-এর নীচে যে কোনও বিন্দুকে 0 হিসাবে নেওয়া হয়।

68. মাত্রা হ্রাস করার কয়েকটি পদ্ধতির নাম বল?

মাত্রিকতা হ্রাস করার কিছু পদ্ধতি নীচে দেওয়া হল:

  1. ফিচার ইঞ্জিনিয়ারিং এর সাথে ফিচার একত্রিত করে
  2. সমরেখার বৈশিষ্ট্যগুলি সরানো হচ্ছে
  3. অ্যালগরিদমিক মাত্রিকতা হ্রাস ব্যবহার করে।

69. একটি সুপারিশ সিস্টেম কি?

সুপারিশ সিস্টেমগুলি মূলত গ্রাহকের ডেটা সংগ্রহ করে এবং গ্রাহকদের জন্য কাস্টমাইজড সুপারিশ তৈরি করতে এই ডেটা স্বয়ংক্রিয়ভাবে বিশ্লেষণ করে। এই সিস্টেমগুলি মূলত ব্রাউজিং ইতিহাস এবং সাম্প্রতিক কেনাকাটা এবং গ্রাহকের দেওয়া রেটিংগুলির মতো স্পষ্ট ডেটার মতো অন্তর্নিহিত ডেটার উপর নির্ভর করে।

মেশিন লার্নিং প্রশ্ন - সুপারিশ সিস্টেম

70. K নিকটতম প্রতিবেশী অ্যালগরিদম ব্যাখ্যা কর?

K-Nearest Neighbour হল সবচেয়ে সহজ মেশিন লার্নিং অ্যালগরিদম যা সুপারভাইজড লার্নিং টেকনিকের উপর ভিত্তি করে। এটি নতুন কেস বা ডেটা এবং উপলব্ধ কেসের মধ্যে সাদৃশ্য অনুমান করে এবং এটি নতুন কেসটিকে এমন একটি বিভাগে রাখে যা উপলব্ধ বিভাগগুলির অনুরূপ।

উদাহরণস্বরূপ, আমাদের কাছে একটি প্রাণীর একটি চিত্র রয়েছে যা দেখতে একটি বিড়াল এবং একটি কুকুরের মতো, তবে আমরা জানতে চাই এটি একটি বিড়াল না কুকুর। এই সনাক্তকরণের জন্য, আমরা KNN অ্যালগরিদম ব্যবহার করতে পারি, কারণ এটি একটি মিলের ভিত্তিতে কাজ করে। কেএনএন মডেলটি বিড়াল এবং কুকুরের চিত্রগুলির সাথে নতুন ডেটা সেটের মিল খুঁজে পাবে এবং এটি একই বৈশিষ্ট্যগুলির উপর ভিত্তি করে; এটি একটি বিড়াল বা একটি কুকুর বিভাগে এটি রাখা হবে.

71. মেশিন লার্নিং অ্যালগরিদমের একটি প্রদত্ত দীর্ঘ তালিকা বিবেচনা করে, একটি ডেটা সেট দেওয়া হয়েছে, কীভাবে করবেন ইমেইলের স্প্যাম ফিল্টার শত শত ইমেইল দিয়ে খাওয়ানো হবে আপনি কোনটি ব্যবহার করার সিদ্ধান্ত নেন?

একটি অ্যালগরিদম নির্বাচন করা নীচের উল্লিখিত প্রশ্নগুলির উপর নির্ভর করে:

  1. আপনার কাছে কতটা ডেটা আছে এবং সেটি কি ক্রমাগত বা সুনির্দিষ্ট?
  2. সমস্যাটি কি শ্রেণীবিভাগ, ক্লাস্টারিং, অ্যাসোসিয়েশন বা রিগ্রেশনের সাথে সম্পর্কিত?
  3. এটি একটি পূর্বনির্ধারিত পরিবর্তনশীল (লেবেলযুক্ত), লেবেলবিহীন, বা উভয়ের মিশ্রণ?
  4. প্রাথমিক উদ্দেশ্য কি?

উপরের প্রশ্নগুলির উপর ভিত্তি করে, একজনকে তাদের প্রয়োজন অনুসারে সঠিক অ্যালগরিদম বেছে নিতে হবে।

72. আপনি কি আমাদের বলতে পারেন কিভাবে একটি ইমেল স্প্যাম ফিল্টার ডিজাইন করতে হয়?

  1. ইমেলের স্প্যাম ফিল্টারটি শত শত ইমেলের সাথে খাওয়ানো হবে।
  2. এই প্রতিটি ইমেলের একটি লেবেল আছে: 'স্প্যাম' বা 'স্প্যাম নয়'।
  3. তত্ত্বাবধানে থাকা মেশিন লার্নিং অ্যালগরিদম তারপর শনাক্ত করবে যে কোন ধরনের ইমেল স্প্যাম হিসাবে চিহ্নিত করা হচ্ছে যেমন লটারি, নো মানি, ফুল রিফান্ড ইত্যাদির উপর ভিত্তি করে।
  4. পরের বার যখন কোনো ইমেল ইনবক্সে আসে, তখন স্প্যাম ফিল্টার পরিসংখ্যানগত বিশ্লেষণ এবং ডিসিশন ট্রিস এবং এসভিএম-এর মতো অ্যালগরিদম ব্যবহার করে ইমেলটি স্প্যাম হওয়ার সম্ভাবনা কতটা শনাক্ত করবে।
  5. যদি সম্ভাবনা বেশি হয়, তাহলে এটিকে স্প্যাম হিসেবে চিহ্নিত করা হবে এবং ইমেলটি আপনার ইনবক্সে আঘাত করবে না।
  6. প্রতিটি মডেলের নির্ভুলতার উপর ভিত্তি করে, আমরা প্রদত্ত সমস্ত মডেল পরীক্ষা করার পরে সর্বোচ্চ নির্ভরযোগ্যতার সাথে অ্যালগরিদম ব্যবহার করি।

73. কিভাবে আপনি অতিরিক্ত ফিটিং এড়াতে পারেন?

ধাপগুলি অনুসরণ করে ওভারফিটিং এড়ানো হয়:

    ক্রস বৈধতা: এখানে ধারণাটি হল প্রাথমিক প্রশিক্ষণের ডেটা ব্যবহার করে বিভিন্ন ছোট ট্রেন পরীক্ষার স্পিল তৈরি করা। যেখানে এই টেস্ট স্পিলগুলি মডেল টিউন করতে ব্যবহার করা হয়।আরও ডেটা সহ ট্রেন করুন: প্রচুর ডেটা সহ প্রশিক্ষণ অ্যালগরিদমগুলিকে আরও ভালভাবে সংকেত সনাক্ত করতে সাহায্য করতে পারে৷বৈশিষ্ট্য সরান: আপনি ম্যানুয়ালি কিছু বৈশিষ্ট্য মুছে ফেলতে পারেন৷তাড়াতাড়ি থামানো:এটি শিক্ষার্থী নির্দিষ্ট পয়েন্ট অতিক্রম করার আগে প্রশিক্ষণ প্রক্রিয়া বন্ধ করা বোঝায়।নিয়মিতকরণ: এটি কৃত্রিমভাবে মডেলটিকে সহজ হতে বাধ্য করার জন্য কৌশলগুলির একটি বিস্তৃত পরিসরকে বোঝায়৷সমাবেশ: এগুলি হল মেশিন লার্নিং অ্যালগরিদম যা একাধিক পৃথক মডেলের ভবিষ্যদ্বাণীগুলিকে একত্রিত করে৷

74. মেশিন লার্নিংয়ে সিলেকশন বায়াস শব্দটি ব্যাখ্যা কর?

নির্বাচনের পক্ষপাত ঘটে যদি একটি ডেটা সেটের উদাহরণগুলি এমনভাবে বেছে নেওয়া হয় যাতে এটি তাদের বাস্তব-বিশ্বের বিতরণের প্রতিফলন না করে। নির্বাচনের পক্ষপাতিত্ব বিভিন্ন রূপ নিতে পারে।

    কভারেজ পক্ষপাত: এখানে ডেটা প্রতিনিধিত্বমূলকভাবে নির্বাচন করা হয়নি।

উদাহরণ: একটি মডেলকে এমনভাবে প্রশিক্ষিত করা হয় যাতে পণ্যটি কেনা গ্রাহকদের নমুনা নিয়ে পরিচালিত ফোন সমীক্ষার ভিত্তিতে একটি নতুন পণ্যের ভবিষ্যত বিক্রয়ের পূর্বাভাস দেওয়া হয়। ভোক্তারা যারা পরিবর্তে একটি প্রতিযোগী পণ্য কেনার জন্য বেছে নিয়েছিলেন তাদের জরিপ করা হয়নি, এবং ফলস্বরূপ, এই সেটটি প্রশিক্ষণের ডেটাতে প্রতিনিধিত্ব করা হয়নি।

    অ-প্রতিক্রিয়া পক্ষপাত: ডেটা প্রক্রিয়ার সংগ্রহে অংশগ্রহণের ব্যবধানের কারণে এখানে ডেটা অপ্রতিনিধিত্বশীল হয়৷

উদাহরণ: পণ্যটি কেনা গ্রাহকদের নমুনা এবং প্রতিযোগী পণ্য কেনা গ্রাহকদের নমুনা সহ পরিচালিত ফোন সমীক্ষার ভিত্তিতে একটি নতুন পণ্যের ভবিষ্যত বিক্রয়ের ভবিষ্যদ্বাণী করার জন্য একটি মডেলকে এমনভাবে প্রশিক্ষণ দেওয়া হয়। যে সমস্ত গ্রাহকরা প্রতিযোগী পণ্যটি কিনেছেন তারা 80% বেশি সমীক্ষাটি সম্পূর্ণ করতে অস্বীকার করবেন বলে আশা করা হয়েছিল এবং তাদের ডেটা নমুনায় উপস্থাপিত হয়েছিল।

    স্যাম্পলিং পক্ষপাত:এখানে , তথ্য সংগ্রহ প্রক্রিয়ার সময় সঠিক র্যান্ডমাইজেশন ব্যবহার করা হয় না।

উদাহরণ: একটি মডেল যা পণ্যটি কিনেছেন এমন গ্রাহকদের নমুনা এবং প্রতিযোগী পণ্য কিনেছেন এমন গ্রাহকদের নমুনা সহ পরিচালিত ফোন সমীক্ষার ভিত্তিতে একটি নতুন পণ্যের ভবিষ্যত বিক্রয়ের পূর্বাভাস দিতে প্রশিক্ষিত। এলোমেলোভাবে গ্রাহকদের লক্ষ্য করার পরিবর্তে, জরিপকারী প্রথম 200 জন ভোক্তাকে বেছে নিয়েছিলেন যারা তাদের ইমেলে সাড়া দিয়েছিলেন, যারা গড় ক্রেতাদের তুলনায় পণ্য সম্পর্কে বেশি আগ্রহী হতে পারে।

75. সুপারভাইজড লার্নিং এর প্রকারভেদ ব্যাখ্যা কর?

তত্ত্বাবধানে শিক্ষা দুই প্রকার, যথা,

    রিগ্রেশন:এটা হল এক ধরনের তত্ত্বাবধান করা শিক্ষা যা প্রদত্ত লেবেলযুক্ত ডেটাসেট থেকে শেখে, এবং তারপর এটি অ্যালগরিদমে দেওয়া নতুন ডেটার জন্য ক্রমাগত-মূল্যবান আউটপুট অনুমান করতে সক্ষম হয়। এটি এমন ক্ষেত্রে ব্যবহৃত হয় যেখানে একটি আউটপুট প্রয়োজনীয়তা একটি সংখ্যা যেমন অর্থ বা উচ্চতা ইত্যাদি। কিছু জনপ্রিয় তত্ত্বাবধানে শেখার অ্যালগরিদম হল লিনিয়ার রিগ্রেশন, লজিস্টিক রিগ্রেশন।
    শ্রেণীবিভাগ:এটি এমন এক ধরনের শিক্ষা যেখানে অ্যালগরিদমকে আমাদের ডেটাসেটে থাকা দুটি শ্রেণির যেকোনো একটি থেকে প্রাপ্ত নতুন ডেটাতে ম্যাপ করতে হবে। ক্লাসগুলিকে 1 বা 0 তে ম্যাপ করতে হবে, যা বাস্তব জীবনে 'হ্যাঁ' বা 'না'-তে অনুবাদ করে। আউটপুটটি ক্লাসগুলির মধ্যে একটি হতে হবে এবং এটি যেমন ছিল তেমন একটি সংখ্যা হওয়া উচিত নয়। রিগ্রেশনের ক্ষেত্রে। কিছু সুপরিচিত অ্যালগরিদম হল ডিসিশন ট্রি, নেভ বেইস ক্লাসিফায়ার, সাপোর্ট ভেক্টর অ্যালগরিদম।

76. কি অদৃশ্য গ্রেডিয়েন্ট ডিসেন্ট?

মেশিন লার্নিং-এ, ব্যাক প্রোপাগেশনের মতো গ্রেডিয়েন্ট-ভিত্তিক পদ্ধতিগুলির সাথে নিউরাল নেটওয়ার্কগুলিকে প্রশিক্ষণ দেওয়ার সময় আমরা ভ্যানিশিং গ্রেডিয়েন্ট সমস্যার সম্মুখীন হই। এই সমস্যাটি প্রদত্ত নেটওয়ার্কে আগের স্তরগুলির পরামিতিগুলি টিউন করা এবং শিখতে কঠিন করে তোলে৷

অদৃশ্য গ্রেডিয়েন্ট সমস্যাটিকে অস্থির আচরণের একটি উদাহরণ হিসাবে নেওয়া যেতে পারে যা আমরা গভীর নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দেওয়ার সময় সম্মুখীন হতে পারি।

এটি এমন একটি পরিস্থিতি বর্ণনা করে যেখানে গভীর মাল্টিলেয়ার ফিড-ফরোয়ার্ড নেটওয়ার্ক বা পুনরাবৃত্ত নিউরাল নেটওয়ার্ক মডেলের প্রদত্ত আউটপুট প্রান্ত থেকে মডেলের ইনপুট প্রান্তের কাছাকাছি স্তরগুলিতে ফিরে আসা দরকারী গ্রেডিয়েন্ট তথ্য প্রচার করতে সক্ষম হয় না।

77. আপনি কি অদৃশ্য গ্রেডিয়েন্ট সমস্যা কাটিয়ে উঠতে প্রস্তাবিত পদ্ধতির নাম বলতে পারেন?

অদৃশ্য গ্রেডিয়েন্ট সমস্যাগুলি কাটিয়ে উঠতে প্রস্তাবিত পদ্ধতিগুলি হল:

  1. বহু-স্তরের অনুক্রম
  2. দীর্ঘ স্বল্পমেয়াদী স্মৃতি
  3. দ্রুত হার্ডওয়্যার
  4. অবশিষ্ট নিউরাল নেটওয়ার্ক (ResNets)
  5. জীবনবৃত্তান্ত

78. মধ্যে পার্থক্য ডেটা মাইনিং এবং মেশিন লার্নিং?

ডেটা মাইনিং মেশিন লার্নিং
এটি প্রচুর পরিমাণে ডেটা থেকে দরকারী তথ্য বের করে।এটি ডেটার পাশাপাশি অতীত অভিজ্ঞতা থেকে অ্যালগরিদম প্রবর্তন করে।
এটি ডেটা প্রবাহ বোঝার জন্য ব্যবহৃত হয়।এটি কম্পিউটারকে ডেটা প্রবাহ থেকে শিখতে এবং বুঝতে শেখায়।
এটিতে অসংগঠিত ডেটা সহ বিশাল ডেটাবেস রয়েছে।এতে বিদ্যমান ডেটার পাশাপাশি অ্যালগরিদম রয়েছে।
এতে মানুষের হস্তক্ষেপ প্রয়োজন।ডিজাইনের পরে প্রয়োজনীয় মানুষের প্রচেষ্টার প্রয়োজন নেই
ডেটা মাইনিং কৌশল ব্যবহার করে মডেলগুলি তৈরি করা হয়মেশিন-লার্নিং অ্যালগরিদম ডিসিশন ট্রি, নিউরাল নেটওয়ার্ক এবং কৃত্রিম বুদ্ধিমত্তার কিছু অন্যান্য অংশে ব্যবহার করা যেতে পারে
এটি মেশিন লার্নিংয়ের মতো পদ্ধতি ব্যবহার করে গবেষণার বেশি।এটি স্ব-শিক্ষিত এবং সিস্টেমকে বুদ্ধিমান কাজ করতে প্রশিক্ষণ দেয়।

79. মেশিন লার্নিং এর বিভিন্ন অ্যালগরিদম কৌশলের নাম বল?

মেশিন শেখার বিভিন্ন অ্যালগরিদম কৌশল নীচে তালিকাভুক্ত করা হয়েছে:

  1. তত্ত্বাবধানহীন শিক্ষা
  2. আধা-তত্ত্বাবধানে শিক্ষা
  3. ট্রান্সডাকশন
  4. শক্তিবৃদ্ধি শিক্ষা
  5. শিখতে শেখা
  6. তত্ত্বাবধান করা শিক্ষা

80। ‘Unsupervised Learning’-এর কাজ ব্যাখ্যা কর?

  1. এটি ডেটার ক্লাস্টার খুঁজে বের করতে হবে।
  2. তথ্যের নিম্ন-মাত্রিক উপস্থাপনা খুঁজুন
  3. ডেটাতে আকর্ষণীয় দিকনির্দেশ খুঁজে পেতে
  4. আকর্ষণীয় স্থানাঙ্ক এবং পারস্পরিক সম্পর্ক গণনা করতে।
  5. অভিনব পর্যবেক্ষণ বা ডাটাবেস পরিষ্কার খুঁজুন.

81. মেশিন লার্নিং এর ক্লাসিফায়ার শব্দটি ব্যাখ্যা কর?

মেশিন লার্নিং-এ একটি ক্লাসিফায়ারকে একটি অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয় যা স্বয়ংক্রিয়ভাবে ডেটাকে এক বা একাধিক শ্রেণিতে শ্রেণীবদ্ধ করে। সাধারণ উদাহরণগুলির মধ্যে একটি হল একটি ইমেল শ্রেণিবদ্ধকারী যা প্রদত্ত শ্রেণির লেবেলগুলি দ্বারা ফিল্টার করতে ইমেলগুলিকে স্ক্যান করতে পারে: স্প্যাম বা স্প্যাম নয়৷

আমাদের পাঁচ ধরনের শ্রেণিবিন্যাস অ্যালগরিদম রয়েছে, যথা,

  1. সিদ্ধান্ত গাছ
  2. নেভ বেইস ক্লাসিফায়ার
  3. K- নিকটতম প্রতিবেশী
  4. সমর্থন ভেক্টর মেশিন
  5. কৃত্রিম নিউরাল নেটওয়ার্ক

82. জেনেটিক কি? অ্যালগরিদম ?

জেনেটিক অ্যালগরিদমগুলিকে স্টোকাস্টিক অনুসন্ধান অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয় যা সম্ভাব্য সমাধানগুলির জনসংখ্যার উপর কাজ করতে পারে। জেনেটিক অ্যালগরিদমগুলি প্রধানত কৃত্রিম বুদ্ধিমত্তায় ব্যবহার করা হয় সম্ভাব্য সমাধানের একটি স্থান অনুসন্ধান করার জন্য যিনি সমস্যার সমাধান করতে পারেন।

83. আপনি এমন এলাকার নাম দিতে পারেন যেখানে প্যাটার্ন স্বীকৃতি ব্যবহার করা যেতে পারে?

  1. কন্ঠ সনান্তকরণ
  2. পরিসংখ্যান
  3. অনানুষ্ঠানিক পুনরুদ্ধার
  4. বায়োইনফরমেটিক্স
  5. ডেটা মাইনিং
  6. কম্পিউটার ভিশন

84. মেশিন লার্নিং এর Perceptron শব্দটি ব্যাখ্যা কর?

একটি Perceptron বাইনারি ক্লাসিফায়ার তত্ত্বাবধানে শেখার জন্য একটি অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয়. এই অ্যালগরিদম নিউরনগুলিকে শিখতে এবং প্রদত্ত প্রশিক্ষণের উপাদানগুলিকে একবারে একটি সেট করতে সক্ষম করে। দুই ধরনের Perceptrons আছে, যথা।

  1. একক স্তর
  2. বহুস্তর।

85. কি আইসোটোনিক রিগ্রেশন?

আইসোটোনিক রিগ্রেশন আপেক্ষিক বৈষম্য ক্রম রক্ষা করার জন্য আদর্শ দূরত্ব ফিট করার জন্য পুনরাবৃত্তিমূলকভাবে ব্যবহার করা হয়। তত্ত্বাবধানে থাকা মেশিন লার্নিং মডেলগুলির পূর্বাভাসিত সম্ভাব্যতার ভারসাম্য বজায় রাখতে সম্ভাব্য শ্রেণীবিভাগেও আইসোটোনিক রিগ্রেশন ব্যবহার করা হয়।

86. Bayesian নেটওয়ার্ক কি?

একটি Bayesian নেটওয়ার্ক একটি সম্ভাব্য গ্রাফিকাল মডেল হিসাবে সংজ্ঞায়িত করা যেতে পারে যা একটি DAG (নির্দেশিত অ্যাসাইক্লিক গ্রাফ) এর মাধ্যমে ভেরিয়েবলের একটি সেট এবং তাদের শর্তাধীন নির্ভরতা উপস্থাপন করে।

উদাহরণস্বরূপ, একটি Bayesian নেটওয়ার্ক রোগ এবং তাদের উপসর্গের মধ্যে সম্ভাব্য সম্পর্ক প্রতিনিধিত্ব করবে। নির্দিষ্ট উপসর্গের পরিপ্রেক্ষিতে, নেটওয়ার্কটি বিভিন্ন রোগের উপস্থিতির সম্ভাবনা গণনা করতে ব্যবহার করা যেতে পারে।

87. আপনি কি Bayesian লজিক প্রোগ্রামের দুটি উপাদান ব্যাখ্যা করতে পারেন?

বায়েসিয়ান লজিক প্রোগ্রামে প্রধানত দুটি উপাদান রয়েছে।

  1. প্রথম উপাদানটি হল যৌক্তিক: এটি বায়েসিয়ান ক্লজের একটি সেট নিয়ে গঠিত যা ডোমেনের গুণগত কাঠামোকে ক্যাপচার করে।
  2. দ্বিতীয় উপাদানটি পরিমাণগত: এটি ডোমেন সম্পর্কে পরিমাণগত তথ্য এনকোড করে।

88. একটি ensemble মধ্যে একটি ইনক্রিমেন্টাল লার্নিং অ্যালগরিদম কি?

ক্রমবর্ধমান শিক্ষার পদ্ধতিটি ইতিমধ্যে উপলব্ধ ডেটাসেট থেকে শ্রেণিবদ্ধকারী তৈরি হওয়ার পরে উপলব্ধ নতুন ডেটা থেকে শেখার জন্য একটি অ্যালগরিদমের ক্ষমতা হিসাবে সংজ্ঞায়িত করা হয়।

89. আপেক্ষিক মূল্যায়ন কৌশলগুলির উপাদানগুলির নাম বল?

সম্পর্কীয় মূল্যায়ন কৌশলের উপাদানগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. তথ্য অর্জন
  2. স্থল সত্য অধিগ্রহণ
  3. ক্রস-ভ্যালিডেশন টেকনিক
  4. প্রশ্নের ধরন
  5. স্কোরিং মেট্রিক
  6. তাৎপর্য পরীক্ষা

90. আপনি ব্যাখ্যা করতে পারেন এনসেম্বল পদ্ধতিতে শ্রেণীবিন্যাস ত্রুটির পক্ষপাত-ভেরিয়েন্স পচন?

লার্নিং অ্যালগরিদমের প্রত্যাশিত ত্রুটিকে পক্ষপাতিত্ব এবং ভিন্নতায় ভাগ করা যেতে পারে। একটি পক্ষপাত শব্দটি একটি পরিমাপ যা শেখার অ্যালগরিদম দ্বারা উত্পাদিত গড় শ্রেণীবিভাগ কতটা ঘনিষ্ঠভাবে লক্ষ্য ফাংশনের সাথে মেলে। ভিন্নতা শব্দটি বিভিন্ন প্রশিক্ষণ সেটের জন্য শেখার অ্যালগরিদমের ভবিষ্যদ্বাণী কতটা ওঠানামা করে তার একটি পরিমাপ।

91. অনুক্রমিক তত্ত্বাবধানে শিক্ষার বিভিন্ন পদ্ধতির নাম বল?

অনুক্রমিক তত্ত্বাবধানে শেখার জন্য বিভিন্ন পদ্ধতি নীচে দেওয়া হল:

  1. বারবার স্লাইডিং জানালা
  2. লুকানো মার্কো মডেল
  3. সর্বোচ্চ এনট্রপি মার্কো মডেল
  4. শর্তাধীন র্যান্ডম ক্ষেত্র
  5. গ্রাফ ট্রান্সফরমার নেটওয়ার্ক
  6. স্লাইডিং-উইন্ডো পদ্ধতি

92. ব্যাচ পরিসংখ্যান শিক্ষা কি?

একটি প্রশিক্ষণ ডেটাসেট এক বা একাধিক ব্যাচে বিভক্ত। যখন সমস্ত প্রশিক্ষণের নমুনা একটি ব্যাচ তৈরিতে ব্যবহার করা হয়, তখন সেই শেখার অ্যালগরিদমটি ব্যাচ গ্রেডিয়েন্ট ডিসেন্ট হিসাবে পরিচিত। যখন প্রদত্ত ব্যাচটি একটি নমুনার আকার হয়, তখন শেখার অ্যালগরিদমকে বলা হয় স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট।

93. আপনি কি রোবোটিক্স এবং তথ্য প্রক্রিয়াকরণের অঞ্চলগুলির নাম বলতে পারেন যেখানে অনুক্রমিক ভবিষ্যদ্বাণী সমস্যা দেখা দেয়?

রোবোটিক্স এবং তথ্য প্রক্রিয়াকরণের ক্ষেত্রগুলি যেখানে অনুক্রমিক ভবিষ্যদ্বাণী সমস্যা দেখা দেয় নীচে দেওয়া হল

  1. স্ট্রাকচার্ড ভবিষ্যদ্বাণী
  2. মডেল-ভিত্তিক শক্তিবৃদ্ধি শিক্ষা
  3. অনুকরণ শেখা

94. আপনি সিকোয়েন্স শেখার প্রক্রিয়াটি শ্রেণীবদ্ধ করতে পারেন এমন বিভিন্ন বিভাগের নাম বলুন?

বিভিন্ন বিভাগ যেখানে আপনি ক্রম শেখার প্রক্রিয়াটি শ্রেণীবদ্ধ করতে পারেন নীচে তালিকাভুক্ত করা হয়েছে:

  1. সিকোয়েন্স জেনারেশন
  2. ক্রম স্বীকৃতি
  3. ক্রমিক সিদ্ধান্ত
  4. ক্রম পূর্বাভাস

95. অনুক্রম পূর্বাভাস কি?

ক্রম ভবিষ্যদ্বাণীর লক্ষ্য পূর্ববর্তী উপাদানগুলির ভিত্তিতে অনুক্রমের উপাদানগুলির পূর্বাভাস দেওয়া।

একটি ভবিষ্যদ্বাণী মডেল প্রশিক্ষণ ক্রম সেট সঙ্গে প্রশিক্ষিত হয়. প্রশিক্ষণে, মডেলটি সিকোয়েন্স ভবিষ্যদ্বাণী করতে ব্যবহৃত হয়। একটি ভবিষ্যদ্বাণী একটি অনুক্রমের পরবর্তী আইটেমগুলির পূর্বাভাস নিয়ে গঠিত। এই টাস্কটিতে ওয়েব পেজ প্রিফেচিং, আবহাওয়ার পূর্বাভাস, ভোক্তা পণ্যের সুপারিশ এবং স্টক মার্কেটের পূর্বাভাসের মতো অনেকগুলি অ্যাপ্লিকেশন রয়েছে৷

অনুক্রম পূর্বাভাস সমস্যার উদাহরণগুলির মধ্যে রয়েছে:

    আবহাওয়ার পূর্বাভাস. নির্দিষ্ট সময়ে নির্দিষ্ট আবহাওয়া সম্পর্কে পর্যবেক্ষণের একটি ক্রম দেওয়া, এটি আগামীকালের প্রত্যাশিত আবহাওয়ার পূর্বাভাস দেয়।স্টক মার্কেটের পূর্বাভাস. নির্দিষ্ট সময়ের মধ্যে নিরাপত্তার গতিবিধির একটি ক্রম দেওয়া, এটি নিরাপত্তার পরবর্তী আন্দোলনের পূর্বাভাস দেয়।পণ্য সুপারিশ. একটি গ্রাহকের শেষ ক্রয়ের একটি ক্রম দেওয়া, এটি একটি গ্রাহকের পরবর্তী ক্রয়ের পূর্বাভাস দেয়।

96. PAC লার্নিং ব্যাখ্যা কর?

সম্ভবত প্রায় সঠিক, অর্থাৎ, PAC লার্নিং একটি তাত্ত্বিক কাঠামো হিসাবে সংজ্ঞায়িত করা হয় যা একটি প্রদত্ত প্রশিক্ষণ সেটে ত্রুটির পরিপ্রেক্ষিতে শেখার অ্যালগরিদমের সাধারণীকরণ ত্রুটি এবং জটিলতার কিছু পরিমাপ বিশ্লেষণ করার জন্য ব্যবহৃত হয়। এখানে প্রধান লক্ষ্য হল সাধারণত দেখানো যে একটি অ্যালগরিদম উচ্চ সম্ভাবনার সাথে কম সাধারণীকরণ ত্রুটি অর্জন করতে পারে।

97. PCA, KPCA, এবং ICA কি এবং এগুলো কিসের জন্য ব্যবহার করা হয়?

প্রধান উপাদান বিশ্লেষণ (PCA): এটি রৈখিকভাবে মূল ইনপুটগুলিকে নতুন অসম্পর্কিত বৈশিষ্ট্যগুলিতে রূপান্তরিত করে।

কার্নেল-ভিত্তিক প্রধান উপাদান বিশ্লেষণ (KCPA) : এটি কার্নেল পদ্ধতি ব্যবহার করে বিকশিত একটি অরৈখিক PCA।

স্বাধীন উপাদান বিশ্লেষণ (ICA): ICA-তে, মূল ইনপুটগুলি রৈখিকভাবে কিছু বৈশিষ্ট্যে রূপান্তরিত হয় যা পারস্পরিক পরিসংখ্যানগতভাবে স্বাধীন।

98. মেশিন লার্নিং-এ মডেল তৈরির তিনটি ধাপ ব্যাখ্যা কর?

তিনটি পর্যায় হল:

  1. মডেল ভবন
  2. মডেল টেস্টিং
  3. মডেল প্রয়োগ

99. ML-এর হাইপোথিসিস শব্দটি ব্যাখ্যা কর?

মেশিন লার্নিং, বিশেষ করে তত্ত্বাবধানে শিক্ষা, একটি ফাংশন শেখার জন্য উপলব্ধ ডেটা ব্যবহার করার ইচ্ছা হিসাবে নির্দিষ্ট করা যেতে পারে যা ইনপুটগুলিকে আউটপুটগুলিতে সেরা ম্যাপ করে।

টেকনিক্যালি, এই সমস্যাটিকে ফাংশন অ্যাপ্রোক্সিমেশন বলা হয়, যেখানে আমরা একটি অজানা টার্গেট ফাংশন অনুমান করছি যা আমরা অনুমান করি যে এটি বিদ্যমান রয়েছে যা প্রদত্ত ইনপুটগুলিকে সমস্যার ডোমেন থেকে সমস্ত সম্ভাব্য বিবেচনার ভিত্তিতে আউটপুটগুলিতে ম্যাপ করতে পারে।

মডেলের একটি উদাহরণ যা লক্ষ্য ফাংশনকে আনুমানিক করে এবং আউটপুটগুলিতে ইনপুটগুলির ম্যাপিং সঞ্চালন করে যা মেশিন লার্নিংয়ে হাইপোথিসিস হিসাবে পরিচিত।

অ্যালগরিদমের পছন্দ এবং অ্যালগরিদমের কনফিগারেশন মডেলটি গঠন করতে পারে এমন সম্ভাব্য অনুমানের স্থান নির্ধারণ করে।

100. মেশিন লার্নিং-এ Eepoch, Eentropy, Bbias এবং Vvariance শব্দগুলো ব্যাখ্যা কর?

যুগ মেশিন লার্নিংয়ে ব্যাপকভাবে ব্যবহৃত একটি শব্দ যা মেশিন লার্নিং অ্যালগরিদম সম্পূর্ণ প্রশিক্ষণ ডেটাসেটের পাসের সংখ্যা নির্দেশ করে। যদি ব্যাচের আকার পুরো প্রশিক্ষণ ডেটাসেট হয়, তাহলে যুগের সংখ্যা পুনরাবৃত্তির সংখ্যা হিসাবে সংজ্ঞায়িত করা হয়।

এনট্রপি মেশিন লার্নিং-এ ব্যাধি বা অনিশ্চয়তার পরিমাপ হিসাবে সংজ্ঞায়িত করা যেতে পারে। মেশিন লার্নিং মডেল এবং ডেটা সায়েন্টিস্টদের প্রধান লক্ষ্য, সাধারণভাবে, অনিশ্চয়তা হ্রাস করা।

ডেটা পক্ষপাত এটি এমন এক ধরনের ত্রুটি যেখানে একটি ডেটাসেটের কিছু উপাদান অন্যদের তুলনায় বেশি ভারী হয়।

ভিন্নতা একটি ভিন্ন প্রশিক্ষণ ডেটা সেট ব্যবহার করা হলে লক্ষ্য ফাংশনের অনুমান পরিবর্তিত হবে এমন পরিমাণ হিসাবে সংজ্ঞায়িত করা হয়। টার্গেট ফাংশন সাধারণত মেশিন লার্নিং অ্যালগরিদম দ্বারা প্রশিক্ষণ ডেটা থেকে অনুমান করা হয়।

আপনার মেশিন লার্নিং ইন্টারভিউয়ের জন্য সৌভাগ্য কামনা করছি। আমরা আশা করি আমাদের মেশিন লার্নিং ইন্টারভিউ প্রশ্ন এবং উত্তর আপনার জন্য কিছু সহায়ক ছিল। আপনি আমাদের চেক করতে পারেন সাইবারসিকিউরিটি ইন্টারভিউ প্রশ্ন ও উত্তর যা আপনার কিছু সহায়ক হতে পারে।