সাক্ষাৎকার প্রশ্ন

শীর্ষ 100 ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন এবং উত্তর

জানুয়ারী 2, 2022

ডেটা সায়েন্সকে, সহজ ভাষায়, একটি আন্তঃবিভাগীয় ক্ষেত্র হিসাবে সংজ্ঞায়িত করা যেতে পারে যা কাঠামোগত এবং অসংগঠিত ডেটা থেকে অন্তর্দৃষ্টি বের করতে প্রক্রিয়া, সিস্টেম, বৈজ্ঞানিক পদ্ধতি এবং অ্যালগরিদম ব্যবহার করে।

স্বাস্থ্যসেবা সুপারিশ, রোগের পূর্বাভাস, স্বয়ংক্রিয় ডিজিটাল বিজ্ঞাপন, রিয়েল-টাইম অপ্টিমাইজিং শিপিং, লজিস্টিক রুট এবং জালিয়াতি সনাক্তকরণ ইত্যাদির মতো বিভিন্ন ক্ষেত্রে ডেটা সায়েন্স প্রয়োগ করা হয়।

ডেটা সায়েন্সের চাকরিগুলি শিল্পের সবচেয়ে উচ্চ বেতনের চাকরিগুলির মধ্যে একটি এবং তারা প্রতি বছর গড়ে 6,100 উপার্জন করে। এই ক্ষেত্রে দক্ষ সম্পদের অভাব থাকায় আপনি প্রচুর চাকরির সুযোগ খুঁজে পেতে পারেন।

আমরা সবচেয়ে বেশি জিজ্ঞাসিত ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর তালিকাভুক্ত করেছি। নিশ্চিত করুন যে আপনি আমাদের সম্পূর্ণ নিবন্ধটি দেখেছেন যাতে আপনি ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তরগুলির কোনোটি মিস করবেন না।

সুচিপত্র

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

1. আপনি দীর্ঘ এবং প্রশস্ত বিন্যাস তথ্য মধ্যে পার্থক্য ব্যাখ্যা করতে পারেন?

ওয়াইড ফরম্যাট : এখানে, বিষয়ের পুনরাবৃত্তিমূলক প্রতিক্রিয়াগুলি একটি একক সারিতে সংজ্ঞায়িত করা হবে, এবং প্রতিটি প্রতিক্রিয়া একটি পৃথক কলামে নির্দিষ্ট করা হয়েছে৷

দীর্ঘ বিন্যাস : এখানে, প্রতিটি সারি বিষয় প্রতি এক-কালীন পয়েন্ট হিসাবে সংজ্ঞায়িত করা হয়েছে।

2. বোল্টজম্যান মেশিন ব্যাখ্যা কর?

বোল্টজম্যান মেশিন একটি সাধারণ শেখার অ্যালগরিদম প্রয়োগ করে যা ব্যবহারকারীকে আকর্ষণীয় বৈশিষ্ট্যগুলি আবিষ্কার করতে দেয় যা প্রশিক্ষণের ডেটাতে জটিল নিয়মিততার প্রতিনিধিত্ব করে। আমরা একটি প্রদত্ত সমস্যার জন্য পরিমাণ এবং ওজন অপ্টিমাইজ করতে বোল্টজম্যান মেশিন ব্যবহার করি। তারা দুটি ভিন্ন গণনাগত সমস্যা সমাধানে সহায়ক।

3. গ্রেডিয়েন্ট ডিসেন্ট ব্যাখ্যা কর?

আসুন প্রথমে জেনে নেওয়া যাক গ্রেডিয়েন্ট কি:

গ্রেডিয়েন্ট : এটি ত্রুটির পরিবর্তনের সাথে সম্পর্কিত সমস্ত ওজনের পরিবর্তনগুলি পরিমাপ করতে ব্যবহৃত হয়। আপনি একটি ফাংশনের ঢাল হিসাবে গ্রেডিয়েন্টকে কল্পনা করতে পারেন।

গ্রেডিয়েন্ট ডিসেন্টকে পাহাড়ে ওঠার পরিবর্তে উপত্যকার নীচে আরোহণ হিসাবে সংজ্ঞায়িত করা যেতে পারে। এটি একটি মিনিমাইজেশন অ্যালগরিদম যা প্রদত্ত ফাংশনকে ছোট করে।

4. একটি অটো-এনকোডার কি?

অটো-এনকোডারের লক্ষ্য ন্যূনতম ত্রুটি সহ ইনপুটগুলিকে আউটপুটে রূপান্তর করা। এর মানে হল যে ব্যবহারকারী চায় আউটপুটটি ইনপুটের কাছাকাছি হোক। এখানে আমাদের ইনপুট এবং আউটপুটের মধ্যে কয়েকটি স্তর যুক্ত করতে হবে এবং নিশ্চিত করতে হবে যে স্তরগুলির আকারগুলি ইনপুট স্তরগুলির চেয়ে ছোট। এটি একটি লেবেলবিহীন ইনপুট পায় যা পরে ইনপুট পুনর্গঠনের জন্য এনকোড করা হয়।

5. CNN এর বিভিন্ন স্তর ব্যাখ্যা কর?

সিএনএন-এ আমাদের চারটি স্তর রয়েছে, যথা,

  1. কনভোলিউশন লেয়ার: এটি কনভোলিউশন অপারেশন করে, ডেটার ওপরে যাওয়ার জন্য বেশ কয়েকটি ছোট ছবি উইন্ডো তৈরি করে।
  2. ReLu লেয়ার: এই স্তরটি নেটওয়ার্কে অ-রৈখিকতা আনতে সাহায্য করে এবং নেতিবাচক পিক্সেল (সমস্ত)কে শূন্যে রূপান্তর করে। প্রাপ্ত আউটপুট একটি সংশোধন বৈশিষ্ট্য মানচিত্র.
  3. পুলিং লেয়ার: এটি বৈশিষ্ট্য মানচিত্রের মাত্রিকতা হ্রাস করে।
  4. সম্পূর্ণভাবে সংযুক্ত স্তর: এটি প্রদত্ত চিত্রের বস্তুগুলিকে চিনতে এবং শ্রেণীবদ্ধ করে।

6. আপনি কি বিভিন্ন উদ্দেশ্যে কয়েকটি মেশিন লার্নিং লাইব্রেরির নাম দিতে পারেন?

বিভিন্ন উদ্দেশ্যে কয়েকটি মেশিন লার্নিং লাইব্রেরি নীচে তালিকাভুক্ত করা হয়েছে:

  1. টেনসরফ্লো
  2. NumPy
  3. SciPy
  4. পান্ডা
  5. ম্যাটপ্লটলিব
  6. কঠিন
  7. SciKit-শিখুন
  8. পাইটর্চ
  9. স্ক্র্যাপি
  10. সুন্দর স্যুপ

7. কৃত্রিম নিউরাল নেটওয়ার্ক ব্যাখ্যা কর?

কৃত্রিম নিউরাল নেটওয়ার্কগুলিকে অ্যালগরিদমের একটি নির্দিষ্ট সেট হিসাবে সংজ্ঞায়িত করা যেতে পারে যার একটি বিপ্লবী মেশিন লার্নিং রয়েছে। এই নেটওয়ার্কগুলি জৈবিক নিউরাল নেটওয়ার্ক দ্বারা অনুপ্রাণিত। নিউরাল নেটওয়ার্কগুলি ইনপুটগুলি পরিবর্তন করার জন্য অভিযোজিত হয় যাতে নেটওয়ার্কটি আউটপুট মানদণ্ডকে পুনরায় ডিজাইন না করেই সর্বোত্তম ফলাফল তৈরি করে।

8. বিভিন্ন ডিপ লার্নিং ফ্রেমওয়ার্কের নাম বল?

  1. চেইনার
  2. কঠিন
  3. কফি
  4. পাইটর্চ
  5. টেনসরফ্লো
  6. মাইক্রোসফট কগনিটিভ টুলকিট

9. মাল্টি-লেয়ার পারসেপ্ট্রন (MLP) ব্যাখ্যা কর?

MLP (মাল্টি-লেয়ার পারসেপ্ট্রন) হল ANN (কৃত্রিম নিউরন নেটওয়ার্ক) এর একটি শ্রেণী। এতে প্রধানত ইনপুট লেয়ার, লুকানো লেয়ার এবং আউটপুট লেয়ার রয়েছে। প্রতিটি নোড, ইনপুট নোড ছাড়া, একটি নন-লিনিয়ার অ্যাক্টিভেশন ফাংশন ব্যবহার করে।

MLP প্রশিক্ষণের জন্য ব্যাকপ্রোপগেশন নামে পরিচিত একটি তত্ত্বাবধানে শেখার কৌশল ব্যবহার করে। এটির একাধিক স্তর এবং নন-লিনিয়ার অ্যাক্টিভেশন ফাংশনের কারণে এটি রৈখিক উপলব্ধি থেকে আলাদা। এটি রৈখিকভাবে বিভাজ্য নয় এমন ডেটা আলাদা করতে ব্যবহৃত হয়।

10. গভীর শিক্ষায় যুগ, ব্যাচ এবং পুনরাবৃত্তির মধ্যে পার্থক্য ব্যাখ্যা কর?

Epoch পুরো ডেটা সেটের উপর একটি পুনরাবৃত্তি উপস্থাপন করতে ব্যবহৃত হয়।

ব্যাচ : এখানে, যখনই আমরা এক শটে নিউরাল নেটওয়ার্কে পুরো ডেটা সেটটি পাস করতে পারি না তখনই ডেটা সেটটি কয়েকটি ব্যাচে বিভক্ত হয়।

পুনরাবৃত্তি : এটি অ্যালগরিদম দেখেছে এমন ডেটার ব্যাচের সংখ্যা হিসাবে সংজ্ঞায়িত করা যেতে পারে।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

11. শক্তিবৃদ্ধি শিক্ষা ব্যাখ্যা কর?

শক্তিবৃদ্ধি শেখার একটি এলাকা হিসাবে সংজ্ঞায়িত করা হয় মেশিন লার্নিং . এটি মূলত একটি নির্দিষ্ট পরিস্থিতিতে পুরষ্কার সর্বাধিক করার জন্য প্রয়োজনীয় পদক্ষেপ নেওয়ার বিষয়ে। এটি বিভিন্ন সফ্টওয়্যার এবং মেশিন দ্বারা নিযুক্ত করা হয় সর্বোত্তম সম্ভাব্য আচরণ বা প্রদত্ত পরিস্থিতিতে এটি যে পথ বা উপায় গ্রহণ করা উচিত তা নির্ধারণ করতে।

রিইনফোর্সমেন্ট শেখার কিছু প্রধান বিষয় নিচে তালিকাভুক্ত করা হল:

  1. ইনপুট: ইনপুটটিকে একটি প্রাথমিক অবস্থা হিসাবে সংজ্ঞায়িত করা উচিত যেখান থেকে মডেলটি শুরু হবে
  2. আউটপুট: একটি নির্দিষ্ট সমস্যার বিভিন্ন সমাধান রয়েছে বলে অনেক সম্ভাব্য আউটপুট রয়েছে
  3. প্রশিক্ষণ: প্রশিক্ষণ প্রধানত ইনপুট উপর ভিত্তি করে, মডেল একটি রাষ্ট্র ফেরত, এবং ব্যবহারকারী আউটপুট উপর ভিত্তি করে মডেল পুরস্কৃত বা শাস্তি সিদ্ধান্ত নিতে হবে.
  4. মডেল শিখতে থাকে।
  5. সর্বাধিক পুরষ্কারের উপর ভিত্তি করে সর্বোত্তম সমাধানের সিদ্ধান্ত নেওয়া হয়।

12. ভ্যানিশিং গ্রেডিয়েন্ট কি?

গ্রেডিয়েন্ট-ভিত্তিক অপ্টিমাইজেশান পদ্ধতি ব্যবহার করে গভীর নিউরাল নেটওয়ার্কগুলিকে প্রশিক্ষণ দেওয়ার সময় সাধারণত ভ্যানিশিং গ্রেডিয়েন্টগুলি ঘটে। এটি প্রধানত ব্যাকপ্রপাগেশন অ্যালগরিদমের প্রকৃতির কারণে ঘটে যা নিউরাল নেটওয়ার্ককে প্রশিক্ষণ দিতে ব্যবহৃত হয়।

13. পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (RNNs) ব্যাখ্যা কর?

একটি পুনরাবৃত্ত নিউরাল নেটওয়ার্ককে একটি নিউরাল নেটওয়ার্ক হিসাবে সংজ্ঞায়িত করা হয় যা ডেটা x(t)= x(1), ক্রম প্রক্রিয়াকরণের জন্য বিশেষায়িত। . . , x(τ) টাইম স্টেপ ইনডেক্স টি সহ যা 1 থেকে τ পর্যন্ত। বক্তৃতা এবং ভাষার মতো অনুক্রমিক ইনপুট জড়িত প্রদত্ত কাজের জন্য, RNN ব্যবহার করা ভাল।

RNN-কে পৌনঃপুনিক বলা হয় কারণ তারা অনুক্রমের প্রতিটি উপাদানের জন্য একই নির্দিষ্ট কাজ সম্পাদন করে, পূর্ববর্তী গণনার উপর নির্ভরশীল আউটপুট সহ।

14. ব্যাক প্রোপাগেশনের রূপগুলি ব্যাখ্যা কর?

  1. স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট: এখানে, আমরা গ্রেডিয়েন্ট এবং আপডেট প্যারামিটারের গণনার জন্য একটি একক প্রশিক্ষণ উদাহরণ ব্যবহার করি।
  2. ব্যাচ গ্রেডিয়েন্ট ডিসেন্ট: এখানে, আমরা সমগ্র ডেটাসেটের জন্য গ্রেডিয়েন্ট গণনা করি এবং প্রতিটি পুনরাবৃত্তিতে আমরা আপডেটটি সম্পাদন করি।
  3. মিনি-ব্যাচ গ্রেডিয়েন্ট ডিসেন্ট: এটি সবচেয়ে পরিচিত অপ্টিমাইজেশান অ্যালগরিদমগুলির মধ্যে একটি। এটি স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্টের একটি বৈকল্পিক, এবং এখানে একটি একক প্রশিক্ষণ উদাহরণের পরিবর্তে, নমুনার একটি মিনি-ব্যাচ ব্যবহার করা হয়েছে।

15. লিনিয়ার রিগ্রেশন ব্যাখ্যা কর?

লিনিয়ার রিগ্রেশন সর্বনিম্ন বর্গ পদ্ধতি ব্যবহার করে। এখানে ধারণা হল সমস্ত প্লট করা ডেটা পয়েন্টের মাধ্যমে একটি রেখা আঁকা। লাইনটি এমনভাবে স্থাপন করা হয়েছে যে এটি সমস্ত ডেটা পয়েন্টের দূরত্ব কমিয়ে দেয়। দূরত্বটি অবশিষ্টাংশ বা ত্রুটি হিসাবে পরিচিত।

16. সিদ্ধান্ত গাছে ছাঁটাই ব্যাখ্যা কর?

ছাঁটাইকে মেশিন লার্নিং এবং অনুসন্ধান অ্যালগরিদমগুলিতে ডেটা সংকোচনের কৌশল হিসাবে সংজ্ঞায়িত করা হয় যা প্রদত্ত সিদ্ধান্ত গাছের আকারকে হ্রাস করতে পারে গাছের অংশ বা বিভাগগুলিকে অপসারণ করে যা দৃষ্টান্ত শ্রেণীবদ্ধ করার জন্য অ-গুরুত্বপূর্ণ এবং অপ্রয়োজনীয়।

ছাঁটাই চূড়ান্ত জটিলতা কমাতে সাহায্য করে শ্রেণিবিন্যাসকারী এবং এর দ্বারা হ্রাস দ্বারা ভবিষ্যদ্বাণীমূলক নির্ভুলতা উন্নত করে ওভারফিটিং .

17. SVM-এর বিভিন্ন কার্নেলের নাম বল?

আমাদের এসভিএম-এ চার ধরনের কার্নেল রয়েছে, যথা,

  1. লিনিয়ার কার্নেল
  2. বহুপদী কার্নেল
  3. রেডিয়াল ভিত্তি কার্নেল
  4. সিগময়েড কার্নেল

18. আপনি কি আমাদের লিনিয়ার মডেলের ত্রুটিগুলি বলতে পারেন?

লিনিয়ার মডেলের কিছু ত্রুটি হল:

  1. স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে রৈখিকতার পূর্বাভাস
  2. এটি গণনা ফলাফল বা বাইনারি ফলাফলের জন্য ব্যবহার করা যাবে না
  3. অনেক ওভারফিটিং সমস্যা রয়েছে যা এটি সমাধান করতে পারে না।
আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

19. আপনি কি বিস্তারিতভাবে সিদ্ধান্ত গাছ অ্যালগরিদম ব্যাখ্যা করতে পারেন?

ডিসিশন ট্রি অ্যালগরিদম হল একটি অ্যালগরিদম যা তত্ত্বাবধানে থাকা শেখার অ্যালগরিদমগুলির পরিবারের অন্তর্গত৷ অন্যান্য তত্ত্বাবধানে থাকা শেখার অ্যালগরিদম থেকে ভিন্ন, ডিসিশন ট্রি অ্যালগরিদম শ্রেণীবিভাগ সমস্যা এবং রিগ্রেশন সমস্যা সমাধানের জন্য ব্যবহার করা হয়।

ডিসিশন ট্রি-তে, একটি রেকর্ডের জন্য একটি নির্দিষ্ট শ্রেণির লেবেলের পূর্বাভাস দেওয়ার জন্য, আমাদের গাছের মূল থেকে শুরু করতে হবে। আমাদের রেকর্ডের বৈশিষ্ট্যের সাথে রুট অ্যাট্রিবিউটের মান তুলনা করতে হবে। তুলনার ভিত্তিতে, আমাদের সেই মান সম্পর্কিত শাখাটি অনুসরণ করতে হবে এবং পরবর্তী নোডে যেতে হবে।

ডিসিশন ট্রি ব্যবহার করার প্রধান লক্ষ্য হল একটি প্রশিক্ষণ মডেল তৈরি করা যা প্রশিক্ষণের ডেটা (আগের ডেটা) থেকে অনুমান করা সহজ সিদ্ধান্তের নিয়মগুলি শিখে লক্ষ্য পরিবর্তনশীলের মান বা শ্রেণির পূর্বাভাস দিতে ব্যবহার করা যেতে পারে।

20. ডিসিশন ট্রি অ্যালগরিদমে এনট্রপি এবং তথ্য লাভ কী?

এনট্রপি: ডিসিশন ট্রি একটি রুট নোড থেকে টপ-ডাউন তৈরি করা হয় এবং এতে প্রদত্ত ডেটাকে উপসেটে বিভাজন করা হয় যা অনুরূপ মান সহ উদাহরণ নিয়ে গঠিত। ID3 অ্যালগরিদম প্রদত্ত নমুনার একজাতীয়তা গণনা করতে এনট্রপি ব্যবহার করে। যদি সংগৃহীত নমুনা সম্পূর্ণরূপে সমজাতীয় হয়, তাহলে এনট্রপি শূন্য, এবং যদি নমুনাটি সমানভাবে বিভক্ত হয়, তবে এটির একটি এনট্রপি থাকে।

তথ্য লাভ: তথ্য লাভ প্রধানত একটি বৈশিষ্ট্যে ডেটাসেট বিভক্ত হওয়ার পরে এনট্রপি হ্রাসের উপর ভিত্তি করে। একটি সিদ্ধান্ত গাছ তৈরি করা হল এমন একটি বৈশিষ্ট্য খুঁজে বের করা যা সর্বোচ্চ তথ্য লাভ করে।

লাভ(টি, এক্স) = এনট্রপি(টি) - এনট্রপি(টি,এক্স)

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

21. সহযোগী ফিল্টারিং কি?

সহযোগিতামূলক ফিল্টারিংকে একাধিক এজেন্ট, ডেটা উত্স, দৃষ্টিভঙ্গি ইত্যাদির মধ্যে সহযোগিতা জড়িত কৌশল ব্যবহার করে তথ্য বা নিদর্শনগুলির জন্য ফিল্টার করার প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা যেতে পারে।

সহযোগিতামূলক ফিল্টারিংয়ের অ্যাপ্লিকেশনগুলি মূলত খুব বড় ডেটা সেট জড়িত।

সহযোগী ফিল্টারিং পদ্ধতিগুলি বিভিন্ন ধরণের ডেটাতে প্রয়োগ করা হয়েছে, যেমন খনিজ অনুসন্ধান, বৃহৎ অঞ্চলে পরিবেশগত সংবেদন বা একাধিক সেন্সর সহ ডেটা সেন্সিং এবং পর্যবেক্ষণ।

22. সুপারিশকারী সিস্টেম কি? ব্যাখ্যা করা?

একটি সুপারিশকারী সিস্টেম একটি সুপারিশ সিস্টেম হিসাবেও পরিচিত, এটি তথ্য ফিল্টারিং সিস্টেমের একটি উপশ্রেণি যা একজন ব্যবহারকারী একটি আইটেমকে দেওয়া রেটিং বা পছন্দের পূর্বাভাস দেয়।

সুপারিশকারী সিস্টেমগুলি চলচ্চিত্র, গবেষণা নিবন্ধ, সামাজিক ট্যাগ, সংবাদ, সঙ্গীত, পণ্য ইত্যাদিতে সর্বাধিক ব্যবহৃত হয়।

রেস্তোরাঁ এবং অনলাইন ডেটিং-এর মতো নির্দিষ্ট বিষয়গুলির জন্য সুপারিশকারী সিস্টেমগুলিও জনপ্রিয়৷

23. নির্বাচন পক্ষপাত কি?

নির্বাচন পক্ষপাত হল সেই পক্ষপাত যা বিশ্লেষণের জন্য ব্যক্তি, গোষ্ঠী বা ডেটা নির্বাচনের মাধ্যমে এমনভাবে প্রবর্তিত হয় যেখানে সঠিক র্যান্ডমাইজেশন অর্জিত হয় না, তাই নিশ্চিত করে যে প্রদত্ত নমুনাটি প্রাপ্ত করা হয়েছে তা বিশ্লেষণ করার উদ্দেশ্যে জনসংখ্যার প্রতিনিধি নয়। এটি নির্বাচন প্রভাব হিসাবেও উল্লেখ করা হয়। এটি পরিসংখ্যানগত বিশ্লেষণের বিকৃতি যা নমুনা সংগ্রহের পদ্ধতির ফলে হয়। আমরা যদি নির্বাচনের পক্ষপাতিত্ব বিবেচনায় না নিই, তাহলে অধ্যয়নের কিছু উপসংহার সঠিক নাও হতে পারে।

নির্বাচন পক্ষপাতের প্রকারগুলি হল:

  1. স্যাম্পলিং বায়াস: এটিকে একটি পদ্ধতিগত ত্রুটি হিসাবে সংজ্ঞায়িত করা হয় যা একটি জনসংখ্যার অ-এলোমেলো নমুনার কারণে ঘটেছে যার ফলে জনসংখ্যার কিছু সদস্যের অন্তর্ভুক্ত হওয়ার সম্ভাবনা অন্যদের তুলনায় কম হয় যার ফলে একটি পক্ষপাতমূলক নমুনা হয়।
  2. সময়ের ব্যবধান: একটি ট্রায়াল একটি চরম মূল্যে তাড়াতাড়ি শেষ করা যেতে পারে, কিন্তু প্রধান মানটি সবচেয়ে বড় ভ্যারিয়েন্স সহ ভেরিয়েবল দ্বারা পৌঁছায়, এমনকি সমস্ত ভেরিয়েবলের একটি সম্পর্কিত গড় থাকলেও।
  3. ডেটা: যখন ডেটার নির্দিষ্ট উপসেটগুলি পূর্বে বর্ণিত বা সাধারণভাবে সম্মত মানদণ্ড অনুসারে, ইচ্ছাকৃত ভিত্তিতে খারাপ ডেটার উপসংহার বা প্রত্যাখ্যানকে সমর্থন করার জন্য বেছে নেওয়া হয়।
  4. অ্যাট্রিশন: অ্যাট্রিশন পক্ষপাতকে এক ধরণের নির্বাচন পক্ষপাত হিসাবে সংজ্ঞায়িত করা হয় যা অংশগ্রহণকারীদের ক্ষতির কারণে ঘটে।

24. আপনি কি একটি ফাংশন লিখতে পারেন যা দুটি সাজানো তালিকা নেয় এবং একটি সাজানো তালিকা আউটপুট করে যা তাদের ইউনিয়ন?

|_+_| |_+_|

25. মাত্রিকতা হ্রাস কি?

একটি ডেটাসেটের জন্য প্রদত্ত ইনপুট ভেরিয়েবল বা বৈশিষ্ট্যের সংখ্যাকে ডাইমেনশ্যালিটি বলা হয়। মাত্রিকতা হ্রাস হল একটি কৌশল বা প্রক্রিয়া যা একটি নির্দিষ্ট ডেটাসেটে ইনপুট ভেরিয়েবলের সংখ্যা হ্রাস করে।

26. একটি বিভ্রান্তি ম্যাট্রিক্স কি?

এটি একটি মেশিন লার্নিং ক্লাসিফিকেশন সমস্যার জন্য পারফরম্যান্স পরিমাপ হিসাবে সংজ্ঞায়িত করা হয় যেখানে আউটপুট দুই বা তার বেশি ক্লাস হতে পারে। এটি মূলত ভবিষ্যদ্বাণী করা এবং প্রকৃত মানগুলির চারটি ভিন্ন সমন্বয় সহ একটি টেবিল।

ডেটা সায়েন্স ইন্টারভিউ - কনফিউশন ম্যাট্রিক্স

এটি প্রধানত রিকল, যথার্থতা, নির্ভুলতা, নির্দিষ্টতা এবং গুরুত্বপূর্ণভাবে AUC-ROC কার্ভ পরিমাপের জন্য উপযোগী।

সত্য ইতিবাচক: এখানে, এটি সেই সমস্ত রেকর্ডগুলিকে নির্দেশ করে যেখানে প্রদত্ত প্রকৃত মানগুলি সত্য, এমনকি পূর্বাভাসিত মানগুলিও সত্য৷ তাই এটি সমস্ত সত্য ইতিবাচক নির্দেশ করে।

মিথ্যা নেতিবাচক: এটি সেই সমস্ত রেকর্ডগুলিকে নির্দেশ করে যেখানে প্রদত্ত প্রকৃত মানগুলি সত্য, তবে প্রদত্ত পূর্বাভাসিত মানগুলি মিথ্যা।

মিথ্যা ইতিবাচক: এখানে, প্রদত্ত প্রকৃত মানগুলি মিথ্যা, তবে প্রদত্ত পূর্বাভাসিত মানগুলি সত্য৷

সত্য নেতিবাচক: এখানে, প্রদত্ত প্রকৃত মানগুলি মিথ্যা, এবং প্রদত্ত পূর্বাভাসিত মানগুলিও মিথ্যা৷

27. আপনি TF/IDF ভেক্টরাইজেশন ব্যাখ্যা করতে পারেন?

TF-IDF-কে সংক্ষেপে বলা হয় টার্ম ফ্রিকোয়েন্সি/ ইনভার্স ডকুমেন্ট ফ্রিকোয়েন্সি, যা প্রদত্ত টেক্সটকে সংখ্যার একটি অর্থপূর্ণ উপস্থাপনায় রূপান্তর করার জন্য একটি খুব জনপ্রিয় অ্যালগরিদম যা পরে ভবিষ্যদ্বাণী করার জন্য একটি মেশিন অ্যালগরিদমে ফিট করতে ব্যবহৃত হয়।

28. আপনি কি এমন একটি ফাংশন লিখতে পারেন যা, যখন একটি বাইনারি শ্রেণীবিভাগ মডেলের জন্য একটি বিভ্রান্তিকর ম্যাট্রিক্সের সাথে ডাকা হয়, তখন তার স্পষ্টতা এবং স্মরণ সহ একটি অভিধান প্রদান করে?

|_+_|

29. আপনি কি বিভ্রান্তি ম্যাট্রিক্স ব্যবহার করে বাইনারি শ্রেণীবিভাগের অ্যালগরিদমের নির্ভুলতা গণনা করার জন্য কোডটি লিখতে পারেন?

|_+_|

30. আপনি ডেটা সায়েন্সে স্ট্যাকিং ব্যাখ্যা করতে পারেন?

মডেল স্ট্যাকিং একটি দক্ষ এনসেম্বল পদ্ধতি হিসাবে সংজ্ঞায়িত করা হয় যেখানে বিভিন্ন মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে তৈরি করা ভবিষ্যদ্বাণীগুলি দ্বিতীয়-স্তর শেখার অ্যালগরিদমে ইনপুট হিসাবে ব্যবহার করা যেতে পারে। এই দ্বিতীয়-স্তর অ্যালগরিদমটিকে তারপর মডেল ভবিষ্যদ্বাণীগুলিকে সর্বোত্তমভাবে একত্রিত করার জন্য প্রশিক্ষিত করা হয় যাতে ভবিষ্যদ্বাণীগুলির একটি নতুন সেট তৈরি করা হয়।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

31. আপনি সুপারিশকারী সিস্টেমে বিষয়বস্তু-ভিত্তিক ফিল্টারিং ব্যাখ্যা করতে পারেন?

বিষয়বস্তু-ভিত্তিক ফিল্টারিং আইটেম বৈশিষ্ট্যগুলি ব্যবহার করে ব্যবহারকারীর পছন্দের অন্যান্য অনুরূপ আইটেমগুলির সুপারিশ করতে, তাদের পূর্ববর্তী ক্রিয়া বা স্পষ্ট প্রতিক্রিয়ার উপর ভিত্তি করে৷

32. ডেটা সায়েন্সে অনুপস্থিত ডেটা কীভাবে পরিচালনা করবেন তা ব্যাখ্যা করুন?

অনুপস্থিত ডেটা নিয়ে কাজ করার সময়, তথ্য বিজ্ঞানীরা ত্রুটি সমাধান করার জন্য দুটি প্রাথমিক পদ্ধতি ব্যবহার করুন।

অভিযোজন পদ্ধতি অনুপস্থিত ডেটার জন্য একটি যুক্তিসঙ্গত অনুমান তৈরি করে। এটি বেশিরভাগই ব্যবহৃত হয় যখন অনুপস্থিত ডেটার শতাংশ কম থাকে। যদি অনুপস্থিত ডেটার অংশটি খুব বেশি হয়, তবে ফলাফলগুলিতে প্রাকৃতিক বৈচিত্র্যের অভাব থাকে যা একটি কার্যকর মডেলে পরিণত হয়।

পরবর্তী বিকল্পটি ডেটা অপসারণ করা। যখন আমরা এলোমেলোভাবে অনুপস্থিত ডেটা নিয়ে কাজ করি, তখন পক্ষপাত কমাতে সংবাদদাতা ডেটা মুছে ফেলা যেতে পারে। নির্ভরযোগ্য বিশ্লেষণের জন্য পর্যাপ্ত পর্যবেক্ষণ না থাকলে ডেটা অপসারণ করা সর্বোত্তম বিকল্প নয়। কিছু পরিস্থিতিতে, বিশেষ ঘটনা বা কারণগুলির পর্যবেক্ষণ প্রয়োজন হতে পারে।

33. একটি ত্রুটি এবং একটি অবশিষ্ট ত্রুটির মধ্যে পার্থক্য ব্যাখ্যা করুন?

একটি ত্রুটি পর্যবেক্ষণ করা মান এবং সত্যিকারের মানগুলির মধ্যে পার্থক্য হিসাবে সংজ্ঞায়িত করা হয়।

একটি অবশিষ্টাংশকে পর্যবেক্ষণ করা মান এবং পূর্বাভাসিত মানগুলির মধ্যে পার্থক্য হিসাবে সংজ্ঞায়িত করা হয় (মডেল দ্বারা)।

ত্রুটিটি একটি তাত্ত্বিক ধারণা যা কখনই পরিলক্ষিত হয় না, যেখানে অবশিষ্টাংশটি একটি বাস্তব-বিশ্বের মান যা প্রতিবার রিগ্রেশন করার সময় গণনা করা হয়।

34. আপনি SVM অ্যালগরিদম বিস্তারিত ব্যাখ্যা করতে পারেন?

সাপোর্ট ভেক্টর মেশিন, অর্থাৎ (SVM), একটি তত্ত্বাবধানে মেশিন লার্নিং অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয় যা শ্রেণীবিভাগ বা রিগ্রেশন চ্যালেঞ্জের জন্য ব্যবহার করা যেতে পারে। এটি সাধারণত শ্রেণীবিভাগ সমস্যায় ব্যবহৃত হয়। এসভিএম অ্যালগরিদমে, আমাদের প্রতিটি ডেটা আইটেমকে এন-ডাইমেনশনাল স্পেসে একটি বিন্দু হিসাবে প্লট করতে হবে (যেখানে n আপনার অধিকারী বৈশিষ্ট্যের সংখ্যা নির্দেশ করে) প্রতিটি বৈশিষ্ট্যের মান যা একটি নির্দিষ্ট স্থানাঙ্কের মান হচ্ছে। এরপরে, আমাদেরকে হাইপার-প্লেন খুঁজে বের করে শ্রেণীবিভাগ করতে হবে যা দুটি শ্রেণীকে খুব ভালোভাবে আলাদা করে।

35. যথার্থতা কি?

ডেটা সায়েন্সে নির্ভুলতাকে সত্যিকারের ইতিবাচকের সংখ্যা হিসাবে সংজ্ঞায়িত করা যেতে পারে যেটিকে সত্য ইতিবাচকের সংখ্যা(n) এবং মিথ্যা পজিটিভের সংখ্যা দ্বারা ভাগ করা হয়।

36. ডিপ লার্নিং কি?

ডিপ লার্নিংকে মেশিন লার্নিংয়ের একটি উপসেট হিসাবে সংজ্ঞায়িত করা হয় যেখানে ডেটা একটি নির্দিষ্ট আউটপুট পাওয়ার জন্য বিভিন্ন অ-রৈখিক রূপান্তরের মধ্য দিয়ে যায়। গভীর এখানে এই ক্ষেত্রে একাধিক ধাপ বোঝায়। একটি ধাপে প্রাপ্ত আউটপুট হল আরেকটি ধাপের জন্য ইনপুট, এবং এটি নির্দিষ্ট চূড়ান্ত আউটপুট পেতে ক্রমাগত করা হয়।

ডিপ লার্নিংকে ডিপ নিউরাল নেটওয়ার্ক (DNN)ও বলা হয় কারণ এটি ডিপ লার্নিং প্রয়োগ করতে বহু-স্তরযুক্ত কৃত্রিম নিউরাল নেটওয়ার্ক ব্যবহার করে।

37. মাত্রিকতা হ্রাসের সুবিধা কী?

মাত্রিকতা হ্রাসের সুবিধাগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. এটি প্রয়োজনীয় সময় এবং স্টোরেজ স্পেস কমাতে ব্যবহৃত হয়।
  2. মাত্রিকতা হ্রাসের মাধ্যমে মাল্টিকোলিনিয়ারিটি অপসারণ মেশিন লার্নিং মডেলের প্যারামিটারের ব্যাখ্যাকে উন্নত করে।
  3. যখনই এটি 2D বা 3D এর মতো খুব কম মাত্রায় হ্রাস করা হয় তখন এটি ডেটাকে কল্পনা করা সহজ করে তুলেছে।
  4. এটি গোলমাল অপসারণ করে, এইভাবে একটি সহজ ব্যাখ্যা প্রদান করে।
  5. এটি মাত্রিকতার অভিশাপ প্রশমিত করে।

38. ROC বক্ররেখা কি?

ROC বক্ররেখা নামে পরিচিত একটি রিসিভার অপারেটিং বৈশিষ্ট্যযুক্ত বক্ররেখাকে গ্রাফিকাল প্লট হিসাবে সংজ্ঞায়িত করা হয় যা একটি বাইনারি ক্লাসিফায়ার সিস্টেমের ডায়গনিস্টিক ক্ষমতা প্রদর্শন করে কারণ এর বৈষম্যের প্রান্তিকে পার্থক্য রয়েছে। এই পদ্ধতিটি সামরিক রাডার রিসিভারের অপারেটরদের জন্য তৈরি করা হয়েছিল, তাই এটিকে ROC বক্ররেখা বলা হয়।

39. একটি স্বাভাবিক বন্টন কি?

স্বাভাবিক বন্টনকে পরিসংখ্যানের মূল ধারণা হিসাবে সংজ্ঞায়িত করা যেতে পারে। এটি তথ্য বিজ্ঞানের মেরুদণ্ড। যখন আমরা অনুসন্ধানমূলক ডেটা বিশ্লেষণ করি, প্রথমে আমরা ডেটা অন্বেষণ করি এবং তারপরে এর সম্ভাব্যতা বিতরণের লক্ষ্য রাখি, তাই না? সবচেয়ে সাধারণ এবং জনপ্রিয়ভাবে ব্যবহৃত সম্ভাব্যতা বন্টন হল সাধারণ বন্টন।

স্বাভাবিক বণ্টন একটি ঘণ্টা-আকৃতির বক্ররেখার আকারে যেখানে এখানে বণ্টনের গড় মধ্যকের সমান।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

40. কে-ফোল্ড ক্রস-ভ্যালিডেশন ব্যাখ্যা কর?

কে-ফোল্ড ক্রস-ভ্যালিডেশন হল হোল্ডআউট পদ্ধতি উন্নত করার একটি উপায়। এই পদ্ধতিটি আমাদের মডেলের স্কোরের গ্যারান্টি দেওয়ার জন্য ব্যবহার করা হয় যা আমরা যেভাবে ট্রেন এবং পরীক্ষার সেট বেছে নিয়েছি তার উপর নির্ভর করে না। এখানে ডেটা সেট কে উপসেটের k সংখ্যায় ভাগ করা হয়েছে এবং হোল্ডআউট পদ্ধতিটি k সংখ্যক বার পুনরাবৃত্তি করতে হবে। এটি একটি সীমিত প্রদত্ত ডেটা নমুনায় মেশিন লার্নিং মডেলগুলি মূল্যায়ন করতে ব্যবহৃত হয়

K-ভাঁজ ক্রস-বৈধকরণ

41. আপনি ব্যাখ্যা করতে পারেন কেন আমাদের সামারি ফাংশন ব্যবহার করতে হবে?

সারাংশ ফাংশনগুলি ডেটাসেটে পাওয়া সমস্ত রেকর্ডের সারাংশ তৈরি করতে বা বিভিন্ন গোষ্ঠীর রেকর্ডগুলির জন্য সাব-সারাংশ মানগুলি তৈরি করতে ব্যবহৃত হয়। সূত্রে একাধিক সারাংশ ফাংশন থাকতে পারে। অন্যান্য ফাংশনগুলির তুলনায়, সারাংশ ফাংশনগুলি আরও ধীরে ধীরে গণনা করে কারণ তারা রেকর্ডের একটি পরিসরের জন্য মান তৈরি করে।

42. কেন আমরা পি-মান ব্যবহার করি?

একটি p-মানকে সম্ভাব্যতার একটি পরিমাপ হিসাবে সংজ্ঞায়িত করা হয় যে একটি পর্যবেক্ষিত পার্থক্য কেবল এলোমেলো সুযোগে ঘটতে পারে। P-মান হাইপোথিসিস পরীক্ষার জন্য পূর্ব-নির্বাচিত আত্মবিশ্বাসের মাত্রার বিকল্প হিসাবে বা অতিরিক্ত হিসাবে ব্যবহৃত হয়।

43. আপনি SVM-এ কার্নেল ফাংশন ব্যাখ্যা করতে পারেন?

SVM অ্যালগরিদমগুলি গাণিতিক ফাংশনগুলির একটি সেট ব্যবহার করে যা কার্নেল নামে পরিচিত। কার্নেলের কাজ হল ডেটাকে ইনপুট হিসাবে গ্রহণ করা এবং ডেটাকে প্রয়োজনীয় ফর্মে রূপান্তর করা—উদাহরণস্বরূপ, রৈখিক, ননলিনিয়ার, রেডিয়াল বেসিস ফাংশন (RBF), বহুপদী এবং সিগমায়েড।

44. প্রত্যয়িত ডেটা সায়েন্টিস্ট হওয়ার জন্য যে দক্ষতাগুলি গুরুত্বপূর্ণ তা ব্যাখ্যা করুন?

একজন প্রত্যয়িত ডেটা বিজ্ঞানীর যে দক্ষতা থাকা উচিত তা নীচে তালিকাভুক্ত করা হয়েছে:

  1. ডেটা সায়েন্সের মৌলিক বিষয়
  2. পরিসংখ্যান ভালো কমান্ড. পরিসংখ্যানকে ডেটা বিজ্ঞানের ব্যাকরণ হিসাবে সংজ্ঞায়িত করা হয়।
  3. সাউন্ড প্রোগ্রামিং জ্ঞান: এটি মেশিন ভাষার সাথে যোগাযোগ করার একটি উপায় প্রদান করে।
  4. ডেটা ম্যানিপুলেশন এবং বিশ্লেষণ
  5. ডেটা ভিজ্যুয়ালাইজেশন: একজনকে হিস্টোগ্রাম, পাই চার্ট, বার চার্টের মতো প্লটগুলির সাথে পরিচিত হতে হবে এবং তারপরে জলপ্রপাত চার্ট, থার্মোমিটার চার্ট ইত্যাদির মতো উন্নত চার্টগুলিতে যেতে হবে
  6. মেশিন লার্নিং: এটি ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে ব্যবহৃত হয় এবং এটি একটি মূল দক্ষতা যা একজন ডেটা বিজ্ঞানীর থাকা উচিত।
  7. গভীর জ্ঞানার্জন
  8. বিগ ডেটা: ইন্টারনেট দ্বারা চালিত বিপুল পরিমাণ ডেটার কারণে, আমরা বিগ ডেটা প্রযুক্তি গ্রহণ করে এই ডেটা পরিচালনা করার চেষ্টা করছি যাতে এই ডেটা সঠিকভাবে এবং দক্ষতার সাথে সংরক্ষণ করা হয় এবং যখনই প্রয়োজন হয় তখন ব্যবহার করা হয়।
  9. সফ্টওয়্যার প্রকৌশল
  10. মডেল স্থাপন: এটি মেশিন লার্নিং লাইফসাইকেলের সবচেয়ে কম-রেটেড ধাপগুলির মধ্যে একটি
  11. যোগাযোগ দক্ষতা
  12. গল্প বলার দক্ষতা: এটি একজন তথ্য বিজ্ঞানী দ্বারা অর্জিত অত্যন্ত গুরুত্বপূর্ণ দক্ষতা।
  13. স্ট্রাকচার্ড থিঙ্কিং: একজন ডেটা সায়েন্টিস্টের সবসময় বিভিন্ন দৃষ্টিকোণ থেকে সমস্যাগুলো দেখা উচিত।
  14. কৌতূহল: একজনের আরও জানতে এবং নতুন জিনিস আবিষ্কার করার কৌতূহল থাকা উচিত।
আরো দেখুন শীর্ষ 100 উত্তরযোগ্য ইন্টারভিউ প্রশ্ন এবং উত্তর

45. LSTM এর পূর্ণরূপ কি? এর কাজ ব্যাখ্যা কর?

LSTM এর পূর্ণরূপ হল লং শর্ট-টার্ম মেমরি। LSTM একটি কৃত্রিম হিসাবে সংজ্ঞায়িত করা হয় পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (RNN) স্থাপত্য যা গভীর শিক্ষার ক্ষেত্রে ব্যবহৃত হয়। LSTM-এর ফিডব্যাক সংযোগ রয়েছে যা স্ট্যান্ডার্ড ফিডফরোয়ার্ড নিউরাল নেটওয়ার্কের মতো নয়।

LSTM শুধুমাত্র চিত্রের মতো একক ডেটা পয়েন্টগুলিই প্রক্রিয়া করতে পারে না কিন্তু বক্তৃতা বা ভিডিওর মতো ডেটার সম্পূর্ণ ক্রমগুলিও প্রক্রিয়া করতে পারে৷

উদাহরণস্বরূপ, LSTM বিভাগবিহীন, সংযুক্ত, এবং অসঙ্গতি সনাক্তকরণের মতো কাজের ক্ষেত্রে প্রযোজ্য নেটওয়ার্ক ট্রাফিক অথবা আইডিএস, যেমন অনুপ্রবেশ সনাক্তকরণ সিস্টেম বা হস্তাক্ষর স্বীকৃতি।

46. ​​ডেটা সায়েন্সে ভ্যারিয়েন্স শব্দটি কী?

ডেটা সায়েন্সের বৈচিত্র্যকে একটি সংখ্যাসূচক মান হিসাবে সংজ্ঞায়িত করা যেতে পারে যা দেখায় যে একটি সেট বা ডেটা গ্রুপের পৃথক পরিসংখ্যানগুলি গড় সম্পর্কে নিজেদের মধ্যে বিতরণ করে এবং এইভাবে গড় মান থেকে ডেটাসেটের প্রতিটি মানের পার্থক্য নির্দিষ্ট করে।

47. ডেটা সায়েন্সে খরচ ফাংশন কি?

ডেটা সায়েন্সে কস্ট ফাংশন হল একটি ফাংশন যা কোনো প্রদত্ত ডেটার জন্য মেশিন লার্নিং মডেলের কর্মক্ষমতা পরিমাপ করতে ব্যবহৃত হয়। খরচ ফাংশন পূর্বাভাসিত মান এবং প্রত্যাশিত মানগুলির মধ্যে ত্রুটির পরিমাণ নির্ধারণ করে এবং অবশেষে এটি একটি একক বাস্তব সংখ্যায় উপস্থাপন করে।

48. আপনি লজিস্টিক রিগ্রেশন শব্দটি ব্যাখ্যা করতে পারেন?

ডেটা সায়েন্সে লজিস্টিক রিগ্রেশন হল একটি শ্রেণিবিন্যাস অ্যালগরিদম যা ক্লাসের বিচ্ছিন্ন গোষ্ঠীতে পর্যবেক্ষণ বরাদ্দ করতে ব্যবহৃত হয়। শ্রেণীবিভাগের সমস্যাগুলির কয়েকটি উদাহরণ হল অনলাইন লেনদেন, জালিয়াতি বা না জালিয়াতি, টিউমার ম্যালিগন্যান্ট বা সৌম্য, ইমেল স্প্যাম বা স্প্যাম না। লজিস্টিক রিগ্রেশন সম্ভাব্যতার মান ফেরত দেওয়ার জন্য লজিস্টিক সিগমায়েড ফাংশন ব্যবহার করে তার আউটপুটকে রূপান্তরিত করে।

49. Random forest model শব্দটির ব্যাখ্যা কর?

এলোমেলো বন একটি তত্ত্বাবধানে শেখার অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয়। এটি যে বন তৈরি করে তা সিদ্ধান্ত গাছের একটি সংকলন হিসাবে সংজ্ঞায়িত করা হয় যা সাধারণত ব্যাগিং পদ্ধতিতে প্রশিক্ষিত হয়। ব্যাগিং পদ্ধতির পিছনে সাধারণ ধারণা হল শেখার মডেলগুলির সমন্বয় যা সামগ্রিক ফলাফল বৃদ্ধি করে

50. ডেটা সায়েন্সে বায়াস-ভ্যারিয়েন্স ট্রেড-অফ ব্যাখ্যা কর?

  1. বায়াসকে সহজীকরণ অনুমান হিসাবে সংজ্ঞায়িত করা হয় যা মডেল দ্বারা তৈরি করা হয় লক্ষ্য ফাংশনকে আনুমানিক করা সহজ করতে।
  2. বিভিন্ন প্রশিক্ষণের ডেটার সাথে প্রদত্ত লক্ষ্য ফাংশনের অনুমান পরিবর্তিত হবে এমন পরিমাণ হিসাবে পার্থক্যকে সংজ্ঞায়িত করা হয়।
  3. ট্রেড-অফকে সংজ্ঞায়িত করা হয় পক্ষপাত এবং প্রকরণ দ্বারা প্রবর্তিত ত্রুটির মধ্যে টান।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

51. আপনি ইউনিভেরিয়েট বিশ্লেষণ ব্যাখ্যা করতে পারেন?

পরিসংখ্যানগত ডেটা বিশ্লেষণ কৌশলের সবচেয়ে মৌলিক রূপ হিসাবে একক বিশ্লেষণকে সংজ্ঞায়িত করা যেতে পারে। যখন ডেটা বা তথ্য শুধুমাত্র একটি পরিবর্তনশীল ধারণ করে এবং সম্পর্কের কারণ বা প্রভাবের সাথে কাজ করে না, তখন আমরা ইউনিভেরিয়েট বিশ্লেষণ কৌশল ব্যবহার করি।

উদাহরণস্বরূপ, একটি সমীক্ষায়, গবেষক প্রাপ্তবয়স্ক এবং বাচ্চাদের সংখ্যা গণনা করতে খুঁজছেন। এই উদাহরণে, ডেটা সংখ্যা (একক পরিবর্তনশীল) এবং এর পরিমাণ প্রতিফলিত করে, যেমনটি নীচের টেবিলে দেখানো হয়েছে।

ইউনিভেরিয়েট বিশ্লেষণের উদ্দেশ্য হ'ল ডেটার মধ্যে নিদর্শনগুলি খুঁজে পেতে ডেটা বর্ণনা করা। এখানে, গড়, মধ্যক, মোড, বিচ্ছুরণ, প্রকরণ, পরিসর, মানক বিচ্যুতি, ইত্যাদি অনুসন্ধান করে করা হচ্ছে।

স্বতন্ত্র বিশ্লেষণ

ইউনিভেরিয়েট বিশ্লেষণ বিভিন্ন উপায়ে পরিচালিত হয়, যা বেশিরভাগই বর্ণনামূলক প্রকৃতির।

  1. ফ্রিকোয়েন্সি ডিস্ট্রিবিউশন টেবিল
  2. হিস্টোগ্রাম
  3. ফ্রিকোয়েন্সি বহুভুজ
  4. পাই চার্ট
  5. বার চার্ট

52. আপনি বাইভারিয়েট বিশ্লেষণ ব্যাখ্যা করতে পারেন?

বিভেরিয়েট বিশ্লেষণ ইউনিভেরিয়েট বিশ্লেষণের চেয়ে একটু বেশি বিশ্লেষণাত্মক। যখন ডেটা সেট দুটি ভেরিয়েবল নিয়ে গঠিত, এবং গবেষকরা দুটি ডেটা সেটের মধ্যে তুলনা করার লক্ষ্য রাখেন, তখন আমরা বিভেরিয়েট বিশ্লেষণের সাথে যেতে পারি।

উদাহরণস্বরূপ, একটি সমীক্ষায়, গবেষক তাদের লিঙ্গ সম্পর্কিত 95% এর উপরে স্কোর করা ছাত্রদের অনুপাত বিশ্লেষণ করতে খুঁজছেন। এই ক্ষেত্রে, আমাদের দুটি ভেরিয়েবল আছে যথা, লিঙ্গ = X (স্বাধীন পরিবর্তনশীল) এবং ফলাফল = Y (নির্ভরশীল পরিবর্তনশীল)। বাইভারিয়েট বিশ্লেষণ তারপরে দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক পরিমাপ করবে, যেমনটি নীচের সারণীতে দেখানো হয়েছে।

দ্বিমুখী বিশ্লেষণ

53. আপনি মাল্টিভারিয়েট বিশ্লেষণ ব্যাখ্যা করতে পারেন?

মাল্টিভেরিয়েট বিশ্লেষণকে পরিসংখ্যানগত বিশ্লেষণ কৌশলের আরও জটিল রূপ হিসাবে সংজ্ঞায়িত করা যেতে পারে এবং এটি বেশিরভাগ ক্ষেত্রে ব্যবহৃত হয় যখন ডেটা সেটে একাধিক ভেরিয়েবল থাকে।

54. আপনি কি সাধারণভাবে ব্যবহৃত মাল্টিভেরিয়েট বিশ্লেষণ কৌশলটির নাম বলতে পারেন?

সর্বাধিক ব্যবহৃত মাল্টিভেরিয়েট বিশ্লেষণ কৌশলগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. ফ্যাক্টর বিশ্লেষণ
  2. ক্লাস্টার বিশ্লেষণ
  3. বৈচিত্র্য বিশ্লেষণ
  4. বৈষম্যমূলক বিশ্লেষণ
  5. বহুমাত্রিক স্কেলিং
  6. প্রধান উপাদান বিশ্লেষণ
  7. রিডানডেন্সি বিশ্লেষণ

55. রিগ্রেশন বিশ্লেষণ ব্যাখ্যা কর?

রিগ্রেশন বিশ্লেষণ প্রধানত দুটি ভিন্ন ভেরিয়েবলের মধ্যে সম্পর্ক অনুমান করার জন্য ব্যবহৃত হয়। নির্ভরশীল ভেরিয়েবল এবং এক বা একাধিক (একাধিক) স্বাধীন ভেরিয়েবলের মধ্যে আন্তঃসম্পর্কের উপর ফোকাস করা হলে এটি একাধিক ভেরিয়েবলের মডেলিং এবং বিশ্লেষণ করার কৌশলগুলি অন্তর্ভুক্ত করে।

এটি আমাদের বুঝতে সাহায্য করে কিভাবে নির্ভরশীল ভেরিয়েবলের মান পরিবর্তন করা হয় যখন যেকোন একটি স্বাধীন চলক পরিবর্তন করা হয়।

এটি মূলত ভবিষ্যদ্বাণী এবং পূর্বাভাসের মতো উন্নত ডেটা মডেলিংয়ের উদ্দেশ্যে ব্যবহৃত হয়।

ব্যবহৃত রিগ্রেশন কৌশলগুলির কয়েকটি নীচে তালিকাভুক্ত করা হয়েছে:

  1. লিনিয়ার রিগ্রেশন
  2. সরল রিগ্রেশন
  3. বহুপদী রিগ্রেশন
  4. সাধারণ রৈখিক মডেল
  5. বিচ্ছিন্ন পছন্দ
  6. দ্বিপদ রিগ্রেশন
  7. বাইনারি রিগ্রেশন
  8. পণ্য সরবরাহ সংশ্লেষণ

56. ডেটাবেস ডিজাইন থেকে ডেটা মডেলিং কীভাবে আলাদা? ব্যাখ্যা করা?

ডেটা মডেলকে সংজ্ঞায়িত করা হয় বিমূর্তকরণ প্রক্রিয়ার একটি সেট হিসাবে যা একটি ডাটাবেস তৈরির জন্য বাস্তবতার অংশকে উপস্থাপন করতে ব্যবহৃত হয়। উদাহরণস্বরূপ, সত্তা-সম্পর্ক ডেটা মডেলে, আমরা সত্তা এবং তাদের মধ্যে সম্পর্কের সাথে বাস্তবতা উপস্থাপন করতে পারি; অবজেক্ট-ওরিয়েন্টেড ডেটা মডেলে আমরা অবজেক্ট এবং অ্যাগ্রিগেশন ক্লাস এবং ইনহেরিট্যান্স সম্পর্কিত পদ্ধতির মাধ্যমে বাস্তবতা উপস্থাপন করতে পারি; রিলেশনাল ডেটা মডেলে, বাস্তবতা কী, বিদেশী কী এবং অন্যান্য ধরনের সীমাবদ্ধতা ইত্যাদির সাহায্যে টেবিলের মাধ্যমে উপস্থাপন করা হয়।

ডেটাবেস মডেল হল বাস্তবতার মডেলের নাম, যা একটি নির্দিষ্ট ডেটা মডেল দিয়ে তৈরি, যার মানে এটি একটি নির্দিষ্ট ডেটাবেস ম্যানেজমেন্ট সিস্টেমের একটি নির্দিষ্ট স্কিমার সাথে সম্পর্কিত যা একটি নির্দিষ্ট বাস্তবতাকে উপস্থাপন করে। উদাহরণ স্বরূপ, একটি স্কুলের জন্য একটি ডেটাবেস মডেলে, আপনার সত্তা রয়েছে ছাত্র, অনুষদ, তাদের মধ্যে আরও কয়েকটি অ্যাসোসিয়েশন রয়েছে এবং তাদের প্রত্যেকটিতে বৈশিষ্ট্যের একটি নির্দিষ্ট সেট রয়েছে৷

57. আপনি ব্যাখ্যা করতে পারেন কিভাবে ডেটা সায়েন্স এবং মেশিন লার্নিং একে অপরের সাথে সম্পর্কিত?

ডেটা সায়েন্স হল এমন একটি ক্ষেত্র যার লক্ষ্য প্রদত্ত ডেটা থেকে অর্থ এবং অন্তর্দৃষ্টি বের করার জন্য একটি বৈজ্ঞানিক পদ্ধতির ব্যবহার করা। সহজ ভাষায়, ডেটা সায়েন্সকে তথ্য প্রযুক্তি, ব্যবসায়িক ব্যবস্থাপনা এবং মডেলিং এর সমন্বয় হিসাবে সংজ্ঞায়িত করা হয়।

মেশিন লার্নিং বলতে এমন একদল কৌশলকে বোঝায় যা ডেটা বিজ্ঞানীরা ব্যবহার করেন, যা কম্পিউটারকে ডেটা থেকে শেখার অনুমতি দেয়। এই কৌশলগুলি এমনভাবে ফলাফল তৈরি করার জন্য ডিজাইন করা হয়েছে যাতে তারা স্পষ্ট প্রোগ্রামিং নিয়ম ছাড়াই ভাল কাজ করে।

58. আপনি কি আমাদের GAN এর পূর্ণরূপ বলতে পারেন? GAN ব্যাখ্যা কর?

GAN এর পূর্ণরূপ নিম্নরূপ: জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক। এটি মেশিন লার্নিংয়ে একটি উত্তেজনাপূর্ণ নতুন উদ্ভাবন। GAN-গুলিকে উৎপন্ন মডেল হিসাবে সংজ্ঞায়িত করা হয় যা প্রশিক্ষণের ডেটার অনুরূপ নতুন ডেটা উদাহরণ তৈরি করে।

উদাহরণস্বরূপ, GAN গুলি এমন চিত্র তৈরি করে যা মানুষের মুখের ফটোগ্রাফের মতো দেখাবে, যদিও মুখগুলি বাস্তবে কোনও ব্যক্তির অন্তর্গত নয়।

59. মেশিন লার্নিং-এ Ensemble লার্নিং শব্দটি কী?

এনসেম্বল পদ্ধতিগুলিকে মেশিন লার্নিং কৌশল হিসাবে সংজ্ঞায়িত করা যেতে পারে যা একটি সর্বোত্তম ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে বেশ কয়েকটি বেস মডেলকে একত্রিত করতে ব্যবহৃত হয়।

60. সক্রিয়করণ ফাংশন শব্দটি ব্যাখ্যা কর?

নিউরাল নেটওয়ার্কগুলিতে, অ্যাক্টিভেশন ফাংশনটি প্রদত্ত নোড থেকে যোগ করা ওজনযুক্ত ইনপুটকে নোডের সক্রিয়করণে বা সেই ইনপুটের জন্য আউটপুটে রূপান্তর করতে ব্যবহৃত হয়। এখানে, সংশোধিত লিনিয়ার অ্যাক্টিভেশন ফাংশনটি অদৃশ্য হয়ে যাওয়া গ্রেডিয়েন্ট সমস্যাটি কাটিয়ে উঠতে সাহায্য করে, এইভাবে মডেলগুলিকে আরও ভাল পারফর্ম করতে দেয়।

অ্যাক্টিভেশন ফাংশনগুলির প্রকারগুলি নীচে তালিকাভুক্ত করা হয়েছে:

ধাপ ফাংশন: এটি সক্রিয়করণ ফাংশন সহজ ধরনের.

এখানে, আমাদের থ্রেশহোল্ডের মান বিবেচনা করা উচিত, এবং যদি নেট ইনপুটের মান, উদাহরণস্বরূপ, y, থ্রেশহোল্ডের চেয়ে বেশি হয়, তাহলে আমরা নিউরন সক্রিয় করি।

গাণিতিকভাবে এটি উপস্থাপন করা হয়:

f(x) = 1, যদি x>=0 হয়

f(x) = 0, যদি x<0

সিগময়েড ফাংশন: এটি হিসাবে সংজ্ঞায়িত করা হয় সক্রিয়করণ ফাংশন

ReLu: এটি f(x)= max(0,x) হিসাবে সংজ্ঞায়িত করা হয়

Leaky ReLU: এটি হিসাবে সংজ্ঞায়িত করা হয়

f(x) = কুঠার, x<0

f(x) = x, অন্যথায়

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

61. ডেটা সায়েন্সে ব্যাচ নরমালাইজেশন শব্দটি ব্যাখ্যা কর?

এখানে ধারণাটি হল, নেটওয়ার্কে ইনপুটগুলিকে স্বাভাবিক করার পরিবর্তে, আমরা সাধারণত নেটওয়ার্কের ভিতরে বা ভিতরের স্তরগুলিতে ইনপুটগুলিকে স্বাভাবিক করি, যা ব্যাচ নর্মালাইজেশন নামে পরিচিত কারণ, প্রশিক্ষণের সময়, আমরা সাধারণত প্রতিটি স্তরের ইনপুটগুলি ব্যবহার করে স্বাভাবিক করি। বর্তমান মিনি-ব্যাচে মানগুলির গড় এবং তারতম্য।

62. অটোএনকোডার সম্পর্কে ব্যাখ্যা কর?

অটোএনকোডারকে একটি তত্ত্বাবধানহীন কৃত্রিম নিউরাল নেটওয়ার্ক হিসাবে সংজ্ঞায়িত করা হয় যেটি কীভাবে সঠিকভাবে ডেটা সংকোচন এবং এনকোড করতে হয় তা শিখে এবং তারপরে শেখে কীভাবে ক্ষুদ্র এনকোডেড উপস্থাপনা থেকে উপস্থাপনা থেকে ডেটা পুনর্গঠন করা যায় যেটি যথাসম্ভব মূল ইনপুটের যথেষ্ট কাছাকাছি।

এগুলি হয় মাত্রা হ্রাসের জন্য বা একটি জেনারেটিভ মডেল হিসাবে ব্যবহৃত হয়, যার অর্থ তারা প্রদত্ত ইনপুট ডেটা থেকে নতুন ডেটা তৈরি করতে পারে।

63. বিভিন্ন ধরনের Ensemble লার্নিং এর নাম বল?

বিভিন্ন ধরনের Ensemble লার্নিং নিচে দেওয়া হল:

  1. বেইস সর্বোত্তম শ্রেণীবদ্ধকারী
  2. বুটস্ট্র্যাপ সমষ্টি
  3. বুস্টিং। মূল নিবন্ধ: বুস্টিং
  4. Bayesian মডেল গড়
  5. Bayesian মডেল সমন্বয়
  6. মডেলের বালতি
  7. স্ট্যাকিং
  8. রিমোট সেন্সিং

64. আপনি ডেটা বিশ্লেষণে ডেটা পরিষ্কারের ভূমিকা ব্যাখ্যা করতে পারেন?

ডেটা ক্লিনিংকে ভুল, অপ্রাসঙ্গিক, অসম্পূর্ণ, সদৃশ, বা ভুলভাবে ফর্ম্যাট করা ডেটা সংশোধন বা অপসারণের মাধ্যমে বিশ্লেষণের জন্য ডেটা প্রস্তুত করার প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা যেতে পারে। ডেটা বিশ্লেষণ করার সময় এই ডেটা সাধারণত সহায়ক হয় না কারণ এটি প্রক্রিয়াটিকে বাধা দেয় এবং এটি ভুল বা মিথ্যা ফলাফল প্রদান করে।

65. হাইপারপ্যারামিটার শব্দটি ব্যাখ্যা কর?

মেশিন লার্নিং-এ, একটি হাইপারপ্যারামিটারকে একটি প্যারামিটার হিসাবে সংজ্ঞায়িত করা যেতে পারে যার মান শেখার প্রক্রিয়া নিয়ন্ত্রণ করে। বিপরীতে, অন্যান্য পরামিতিগুলির মান প্রশিক্ষণের মাধ্যমে প্রাপ্ত হয়।

66. LSTM এর বিভিন্ন ধাপ ব্যাখ্যা কর?

LSTM-এর বিভিন্ন ধাপ নিচে তালিকাভুক্ত করা হয়েছে:

  1. নেটওয়ার্ক সংজ্ঞায়িত করুন: কেরাসে সংজ্ঞায়িত নিউরাল নেটওয়ার্কগুলি স্তরগুলির একটি ক্রম অনুসারে। এই স্তরগুলির জন্য ধারকটি অনুক্রমিক শ্রেণিতে উপস্থিত রয়েছে। এখানে প্রথম ধাপ হল সিকোয়েন্সিয়াল ক্লাসের একটি উদাহরণ তৈরি করা। তারপরে আমাদের স্তরগুলি তৈরি করতে হবে, এবং আমাদের সেগুলি যুক্ত করা উচিত যাতে তারা সংযুক্ত থাকে।
  2. কম্পাইল নেটওয়ার্ক: এখানে সংকলন একটি কার্যকর পদক্ষেপ। এটি কেরাস কনফিগারেশনের উপর নির্ভর করে আপনার GPU বা CPU-তে নির্বাহ করা হয় এমন একটি বিন্যাসে রূপান্তরিত ম্যাট্রিক্সের একটি অত্যন্ত দক্ষ সিরিজে সংজ্ঞায়িত স্তরগুলির সাধারণ ক্রমকে রূপান্তর করতে ব্যবহৃত হয়।
  3. ফিট নেটওয়ার্ক: একবার আমরা নেটওয়ার্ক কম্পাইল করলে, এটি ফিট হতে পারে, যার অর্থ একটি প্রশিক্ষণ ডেটাসেটে ওজন মানিয়ে নেওয়া।
  4. Evaluate Network: একবার নেটওয়ার্ক প্রশিক্ষিত হলে তার মূল্যায়ন করতে হবে। নেটওয়ার্কটিকে প্রশিক্ষণের ডেটাতে মূল্যায়ন করা হয় যেখানে এটি একটি ভবিষ্যদ্বাণীমূলক মডেল হিসাবে নেটওয়ার্কের কার্যকারিতার একটি দরকারী ইঙ্গিত প্রদান করে না।
  5. ভবিষ্যদ্বাণী করুন: যখন আমরা উপযুক্ত মডেলের কর্মক্ষমতা নিয়ে সন্তুষ্ট হই, তখন আমরা নতুন প্রতিষ্ঠিত ডেটাতে ভবিষ্যদ্বাণী করতে এটি ব্যবহার করতে পারি। এটি predict() ফাংশন কল করে সহজেই করা হয়।

67. আপনি কি যাচাইকরণ সেট এবং পরীক্ষা সেটের মধ্যে একটি তুলনা করতে পারেন?

সিস্টেমের সঠিক পরামিতি নির্বাচন করতে একটি বৈধতা সেট ব্যবহার করা হয়। এটি প্রশিক্ষণ সেটের একটি অংশ।

পরীক্ষার সেটটি পরীক্ষা করতে এবং সিস্টেমের নির্ভুলতা বলতে ব্যবহৃত হয়।

68. আপনি কি ওভারফিটিং এবং আন্ডারফিটিং এর মধ্যে তুলনা করতে পারেন?

ওভারফিটিং এমন একটি মডেলের সাথে সম্পর্কিত যা প্রশিক্ষণের ডেটাকে খুব ভালভাবে মডেল করে। ওভারফিটিং সাধারণত ঘটে যখন মডেলটি প্রশিক্ষণের ডেটাতে একটি নির্দিষ্ট পরিমাণে বিশদ এবং গোলমাল শিখে যা নতুন ডেটাতে মডেলের কার্যকারিতার উপর নেতিবাচক প্রভাব ফেলে।

এর অর্থ হল প্রশিক্ষণের ডেটাতে উপস্থিত গোলমাল বা এলোমেলো ওঠানামাগুলি তুলে নেওয়া হয় এবং সেগুলি মডেল দ্বারা ধারণা হিসাবে শেখা হয়৷

এখানে সমস্যা হল যে এই ধারণাগুলি নতুন ডেটাতে প্রযোজ্য নয়, এবং সেগুলি মডেলের সাধারণীকরণের ক্ষমতার উপর নেতিবাচক প্রভাব ফেলে৷

আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

আন্ডারফিটিংকে এমন একটি মডেল হিসাবে উল্লেখ করা যেতে পারে যা প্রশিক্ষণের ডেটাকে মডেল করে না বা এটি নতুন ডেটাতে সাধারণীকরণ করতে পারে না। একটি আন্ডারফিট মেশিন লার্নিং মডেল একটি উপযুক্ত মডেল হিসাবে বিবেচিত হয় না, এবং প্রশিক্ষণ ডেটাতে এটির কার্যকারিতা খারাপ হবে।

69. আপনি কি অনুগ্রহ করে একটি বিশ্লেষণমূলক প্রকল্পের সাথে জড়িত বিভিন্ন পদক্ষেপ ব্যাখ্যা করতে পারেন?

একটি ডেটা বিশ্লেষণ প্রকল্প সম্পূর্ণ করার জন্য সাতটি মৌলিক পদক্ষেপ রয়েছে এবং সেগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. ব্যবসা বুঝুন
  2. আপনার ডেটা পান
  3. আপনার ডেটা অন্বেষণ এবং পরিষ্কার করুন
  4. আপনার ডেটাসেট সমৃদ্ধ করুন।
  5. সহায়ক ভিজ্যুয়ালাইজেশন তৈরি করুন
  6. ভবিষ্যদ্বাণীপূর্ণ পান
  7. পুনরাবৃত্তি, পুনরাবৃত্তি, পুনরাবৃত্তি.

70. আপনি Eigenvectors এবং Eigenvalues ​​ব্যাখ্যা করতে পারেন?

Eigenvalues ​​এবং eigenvectors হল কম্পিউটিং এবং গণিতের মৌলিক বিষয়। এগুলি প্রায়শই বিজ্ঞানীরা ব্যবহার করেন।

Eigenvectors কে একক ভেক্টর হিসাবে সংজ্ঞায়িত করা হয়, যা নির্দিষ্ট করে যে তাদের দৈর্ঘ্য বা মাত্রা 1 এর সমান।

Eigenvalues ​​কে সহগ হিসাবে সংজ্ঞায়িত করা হয় যা eigenvectors এ প্রয়োগ করা হয় যা ভেক্টরকে তাদের প্রয়োজনীয় দৈর্ঘ্য বা মাত্রা দেয়।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

71. A/B পরীক্ষার লক্ষ্য ব্যাখ্যা কর?

A/B টেস্টিংকে পরিসংখ্যানগত হাইপোথিসিস টেস্টিং হিসাবে সংজ্ঞায়িত করা হয় যা একটি এলোমেলো পরীক্ষার জন্য বোঝানো হয় যার দুটি ভেরিয়েবল রয়েছে, A এবং B। A/B টেস্টিং এর মূল লক্ষ্য হল কিছু আগ্রহের ফলাফলের সম্ভাবনাকে সর্বাধিক করা। একটি ওয়েবপেজে কোনো পরিবর্তন। A/B টেস্টিং বিক্রয় ইমেল থেকে শুরু করে ওয়েবসাইট অনুলিপি, এবং বিজ্ঞাপন অনুসন্ধান সব কিছু পরীক্ষা করার জন্য নিযুক্ত করা হয়।

72. ক্লাস্টার স্যাম্পলিং এবং সিস্টেমেটিক স্যাম্পলিং শব্দগুলো ব্যাখ্যা কর?

পদ্ধতিগত নমুনা প্রদত্ত জনসংখ্যা থেকে এলোমেলো শুরু বিন্দু নির্বাচন করে, এবং তারপর একটি নমুনা প্রদত্ত জনসংখ্যার আকারের উপর নির্ভর করে নিয়মিত নির্দিষ্ট ব্যবধান থেকে নেওয়া হয়।

ক্লাস্টার স্যাম্পলিং সাধারণত জনসংখ্যাকে ক্লাস্টারে বিভক্ত করে এবং তারপর প্রতিটি ক্লাস্টার থেকে একটি সাধারণ র্যান্ডম নমুনা নেয়।

আমাদের কাছে দুটি ধরণের ক্লাস্টার স্যাম্পলিং রয়েছে:

  1. এক-পর্যায়ের ক্লাস্টার স্যাম্পলিং
  2. দুই-পর্যায়ের ক্লাস্টার স্যাম্পলিং।

73. টেনসর কি?

টেনসরগুলিকে এক ধরণের ডেটা স্ট্রাকচার হিসাবে সংজ্ঞায়িত করা হয় যা রৈখিক বীজগণিতে ব্যবহৃত হয় এবং ভেক্টর এবং ম্যাট্রিক্সের মতো, কেউ টেনসরের সাহায্যে গাণিতিক ক্রিয়াকলাপগুলি গণনা করতে পারে।

এগুলি ম্যাট্রিক্সের একটি সাধারণীকরণ এবং এগুলিকে n-মাত্রিক অ্যারে ব্যবহার করে উপস্থাপন করা হয়।

74. বহিরাগত মানগুলি ব্যাখ্যা করুন এবং আপনি তাদের সাথে কীভাবে আচরণ করবেন?

আউটলিয়ার মানগুলিকে পরিসংখ্যানের ডেটা পয়েন্ট হিসাবে সংজ্ঞায়িত করা হয় যা কোনও নির্দিষ্ট জনসংখ্যার অন্তর্গত নয়। একটি বহিরাগত মান একটি অস্বাভাবিক পর্যবেক্ষণ হিসাবে সংজ্ঞায়িত করা হয় যা সেটের অন্তর্গত অন্যান্য মান থেকে আলাদা।

আউটলিয়ার মোকাবেলা করতে, আপনাকে পদক্ষেপগুলি অনুসরণ করতে হবে:

  1. আপনাকে আপনার টেস্টিং টুলে একটি ফিল্টার সেট আপ করতে হবে
  2. পরীক্ষা-পরবর্তী বিশ্লেষণের সময় বহিরাগতগুলি সরান বা পরিবর্তন করুন
  3. Outliers মান পরিবর্তন
  4. অন্তর্নিহিত বিতরণ বিবেচনা করুন
  5. হালকা outliers মান বিবেচনা করুন

75. GAN এর গুরুত্বপূর্ণ উপাদানগুলোর নাম বল?

GAN-এর গুরুত্বপূর্ণ উপাদানগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. জেনারেটর
  2. বৈষম্যকারী

76. আপনি কি ব্যাচ এবং স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্টের মধ্যে পার্থক্য ব্যাখ্যা করতে পারেন?

ব্যাচ গ্রেডিয়েন্ট ডিসেন্টস্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট
বিশ্লেষণের উদ্দেশ্যে ভলিউম বড়.ব্যাচের তুলনায় বিশ্লেষণের উদ্দেশ্যে ভলিউম কম।
এটি ধীরে ধীরে ওজন আপডেট করে।এটি আরও ঘন ঘন ওজন আপডেট করে।
এটি উপলব্ধ সম্পূর্ণ ডেটা সেট ব্যবহার করে গ্রেডিয়েন্ট গণনা করতে সহায়তা করে।এটি শুধুমাত্র একটি নমুনা ব্যবহার করে গ্রেডিয়েন্ট গণনা করতে সাহায্য করে।

77. টেক্সট অ্যানালিটিক্সের জন্য পাইথন বা আর এর মধ্যে আপনি কোনটিকে পছন্দ করবেন?

পাইথন কারণ এর পান্ডাস লাইব্রেরি যা সহজে ব্যবহারযোগ্য ডেটা স্ট্রাকচার সরবরাহ করে এবং এটি উচ্চ-পারফরম্যান্স ডেটা বিশ্লেষণ সরঞ্জাম সরবরাহ করে।

78. কম্পিউটেশনাল গ্রাফ কি?

একটি গণনামূলক গ্রাফ হল এমন একটি উপায় যা গ্রাফ তত্ত্বের ভাষায় গাণিতিক ফাংশনকে উপস্থাপন করে। এখানে নোডগুলি হল ইনপুট মান বা ফাংশনগুলিকে একত্রিত করার জন্য; গ্রাফের মধ্য দিয়ে ডেটা প্রবাহিত হওয়ার সাথে সাথে প্রান্তগুলি তাদের নিজ নিজ ওজন গ্রহণ করে।

79. ইন্টারপোলেশন এবং এক্সট্রাপোলেশন শব্দটি ব্যাখ্যা কর?

এক্সট্রাপোলেশনকে মানের একটি অনুমান হিসাবে সংজ্ঞায়িত করা হয় মানগুলির পরিচিত ক্রম প্রসারিত করার উপর ভিত্তি করে বা নিশ্চিতভাবে পরিচিত ক্ষেত্রটির বাইরের ঘটনাগুলি।

ইন্টারপোলেশন হল মানের ক্রমানুসারে দুটি পরিচিত মানের মধ্যে মানের একটি অনুমান।

80. পরিসংখ্যানগত তথ্য সম্পর্কে P-মান কী বোঝায় তা ব্যাখ্যা করতে পারেন?

  1. যদি P-মান > 0.05 হয়, তাহলে এটি নাল হাইপোথিসিসের বিরুদ্ধে দুর্বল প্রমাণ বোঝায়, যার মানে আপনি নাল হাইপোথিসিস প্রত্যাখ্যান করতে পারবেন না।
  2. যদি P- মান<= 0.05, then it denotes a piece of strong evidence against the null hypothesis, which you can reject the NULL hypothesis.
  3. যদি P-মান=0.05 তাহলে, এটি প্রান্তিক মান ইঙ্গিত করে যে এটি যেকোনও পথে যাওয়া সম্ভব।

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

81. আপনি রিগ্রেশন মডেলে বক্স কক্স রূপান্তর ব্যাখ্যা করতে পারেন?

রিগ্রেশনে বক্স-কক্স ট্রান্সফরমেশনের মূল উদ্দেশ্য হল রিগ্রেশনের ভেরিয়েবলগুলিকে স্বাভাবিক ডিস্ট্রিবিউশন অনুসরণ করা নয় বরং ভেরিয়েবলের প্রভাবগুলিকে যুক্ত করা।

একটি বক্স কক্স রূপান্তরকে একটি পরিসংখ্যানগত কৌশল হিসাবে সংজ্ঞায়িত করা যেতে পারে যা নন-মরুলা নির্ভর ভেরিয়েবলকে স্বাভাবিক আকারে রূপান্তরিত করে। যে ডেটা দেওয়া হয় তা যদি স্বাভাবিক না হয়, তবে বেশিরভাগ পরিসংখ্যান কৌশল এটিকে স্বাভাবিক হিসাবে ধরে নেয়। বক্স কক্স ট্রান্সফরমেশন প্রয়োগ করা ইঙ্গিত দেয় যে আপনি বিস্তৃত সংখ্যক পরীক্ষা চালাতে পারেন।

82. আপনি কি আমাদের রিজ রিগ্রেশনের মতো নিয়মিতকরণ পদ্ধতি ব্যবহার করার সুবিধা এবং অসুবিধা বলতে পারেন?

রিজ রিগ্রেশন ব্যবহার করার সুবিধা হল:

  1. আপনি মডেল overfitting এড়াতে পারেন.
  2. তাদের নিরপেক্ষ অনুমানকারীদের প্রয়োজন হয় না।
  3. প্রকৃত জনসংখ্যার মানগুলির অনুমানকে যুক্তিসঙ্গতভাবে নির্ভরযোগ্য অনুমান করতে তারা যথেষ্ট পক্ষপাতিত্ব যুক্ত করে।
  4. তারা এখনও বৃহৎ মাল্টিভেরিয়েট ডেটার ক্ষেত্রে ভাল পারফরম্যান্স করে এবং ভবিষ্যদ্বাণীকারীর সংখ্যা যা পর্যবেক্ষণের সংখ্যার চেয়ে বেশি।

রিজ রিগ্রেশনের অসুবিধাগুলি হল:

  1. চূড়ান্ত মডেলে তৈরি করা সমস্ত ভবিষ্যদ্বাণী আইটি অন্তর্ভুক্ত করে।
  2. তারা বৈশিষ্ট্য নির্বাচন করতে সক্ষম হয় না.
  3. তারা সহগকে শূন্যের দিকে সঙ্কুচিত করে।
  4. তারা পক্ষপাতের জন্য বৈষম্য বাণিজ্য করে।

83. কিভাবে একটি ভাল লজিস্টিক মডেল মূল্যায়ন?

  1. আপনি সত্য নেতিবাচক এবং মিথ্যা ইতিবাচক দেখতে শ্রেণীবিভাগ ম্যাট্রিক্স ব্যবহার করতে পারেন.
  2. একটি সমঝোতা ঘটনা ঘটছে এবং ঘটছে না ঘটনার মধ্যে পার্থক্য করার জন্য লজিস্টিক মডেলের ক্ষমতা সনাক্ত করতে সহায়তা করে।
  3. লিফট কিছু র্যান্ডম নির্বাচনের সাথে তুলনা করে লজিস্টিক মডেলের মূল্যায়ন করতে আমাদের সাহায্য করে।

84. মাল্টিকোলাইন্যারিটি ব্যাখ্যা করুন এবং কিভাবে আপনি এটি অতিক্রম করতে পারেন?

মাল্টিকোলিনিয়ারিটি ঘটে যখন একটি রিগ্রেশন মডেলের স্বাধীন ভেরিয়েবলগুলি পারস্পরিক সম্পর্কযুক্ত হয়। এখানে, পারস্পরিক সম্পর্ক একটি সমস্যা হয়ে দাঁড়ায় কারণ স্বাধীন ভেরিয়েবলগুলি স্বাধীন হওয়া উচিত।

নিম্নে উল্লেখ করা হল মাল্টিকোলাইনিয়ারিটির সংশোধন:

  1. মাল্টিকোলিনিয়ারিটির ডিগ্রির সাথে সমস্যার তীব্রতা বৃদ্ধি পায়। অতএব, নিশ্চিত করুন যে আপনার কাছে শুধুমাত্র মাঝারি মাল্টিকোলিনিয়ারিটি আছে যাতে আপনাকে এটি সমাধান করার প্রয়োজন নাও হতে পারে।
  2. মাল্টিকোলিনিয়ারিটি শুধুমাত্র নির্দিষ্ট স্বাধীন ভেরিয়েবলগুলিকে প্রভাবিত করে যা পরস্পর সম্পর্কযুক্ত। এইভাবে, যদি আপনি বিশেষভাবে আগ্রহী যে স্বাধীন ভেরিয়েবলের জন্য মাল্টিকলিনিয়ারিটি উপস্থিত না থাকে, তাহলে এটি সমাধান করার কোন প্রয়োজন নেই।
  3. মাল্টিকোলাইন্যারিটি সহগ এবং পি-মানগুলিকে প্রভাবিত করে, তবে ভবিষ্যদ্বাণীগুলির সূক্ষ্মতা, ভবিষ্যদ্বাণীগুলির উপর এর প্রভাব নেই৷ যদি আপনার মূল লক্ষ্য ভবিষ্যদ্বাণী করা হয়, এবং আপনাকে প্রতিটি স্বাধীন পরিবর্তনশীলের ভূমিকা বুঝতে হবে না, তাহলে আপনাকে গুরুতর বহুসংখ্যা কমাতে হবে না।

85. আপনি কি func এবং func() এর মধ্যে পার্থক্য করতে পারেন?

ফাংশনfunc ()
একটি নির্দিষ্ট কাজ সম্পাদন করার জন্য একটি ফাংশনকে কোডের ব্লক হিসাবে সংজ্ঞায়িত করা যেতে পারে।এটি বস্তু/শ্রেণীর সাথে যুক্ত।
def functionName( arg1, arg2,….): ……. # ফাংশন_বডি ……..# ClassName: def method_name(): ………….. # পদ্ধতি_বডি ………………

86. পাইথনে পিকলিং শব্দটি দ্বারা আপনি কী বোঝেন?

Pickling একটি প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা হয় যেখানে Python অবজেক্ট হায়ারার্কি একটি বাইট স্ট্রীমে রূপান্তরিত হচ্ছে, এবং আনপিকলিংকে ইনভার্স অপারেশন হিসাবে সংজ্ঞায়িত করা হয়, যেখানে একটি বাইট স্ট্রীম আবার একটি অবজেক্ট হায়ারার্কিতে রূপান্তরিত হয়।

87. বিভিন্ন র‌্যাঙ্কিং অ্যালগরিদমের নাম বল?

লার্নিং টু র‍্যাঙ্ক (LTR) কে কৌশলের একটি শ্রেণী হিসাবে সংজ্ঞায়িত করা হয় যা সাধারণত র‌্যাঙ্কিং সমস্যা সমাধানের জন্য তত্ত্বাবধানে মেশিন লার্নিং (ML) প্রয়োগ করে।

বিভিন্ন র্যাঙ্কিং অ্যালগরিদম নীচে তালিকাভুক্ত করা হয়েছে:

RankNet: RankNet-এর খরচ ফাংশনগুলির লক্ষ্য হল র‍্যাঙ্কিং-এ ইনভার্সশনের সংখ্যা কমিয়ে আনা। এখানে ইনভার্সন বলতে বোঝায় ফলাফলের জোড়ার মধ্যে একটি ভুল ক্রম, অর্থাৎ, যখন আমরা র‍্যাঙ্ক করা তালিকায় একটি উচ্চ রেটেড ফলাফলের উপরে একটি নিম্ন-রেটেড ফলাফলকে র‍্যাঙ্ক করি। এটি স্টোকাস্টিক গ্রেডিয়েন্ট ডিসেন্ট ব্যবহার করে খরচ ফাংশন অপ্টিমাইজ করে।

LambdaRank: এখানে, আপনার খরচের প্রয়োজন নেই। মডেল স্কোরের ক্ষেত্রে আপনার শুধুমাত্র খরচের গ্রেডিয়েন্ট (λ) প্রয়োজন। আমরা এই গ্রেডিয়েন্টগুলিকে ছোট তীর হিসাবে মনে করি যা র‌্যাঙ্ক করা তালিকার প্রতিটি নথির সাথে সংযুক্ত থাকে, এইভাবে নির্দেশ করে যে আমরা সেই নথিগুলিকে কোন দিকে সরাতে চাই।

LambdaMart: এটি LambdaRank এবং MART এর সংমিশ্রণ, অর্থাৎ একাধিক সংযোজনী রিগ্রেশন ট্রি। যেখানে MART ভবিষ্যদ্বাণী কাজের জন্য গ্রেডিয়েন্ট বুস্টেড ডিসিশন ট্রি ব্যবহার করে, সেখানে LambdaMART একটি খরচ ফাংশন ব্যবহার করে গ্রেডিয়েন্ট বুস্টেড ডিসিশন ট্রি ব্যবহার করে যা র‍্যাঙ্কিং টাস্ক সমাধানের জন্য LambdaRank থেকে প্রাপ্ত। পরীক্ষামূলক ডেটাসেটের ভিত্তিতে, LambdaMART LambdaRank এবং আসল RankNet-এর চেয়ে ভাল কর্মক্ষমতা দেখিয়েছে।

88. আপনি একটি বক্স প্লট এবং একটি হিস্টোগ্রামের মধ্যে পার্থক্য করতে পারেন?

হিস্টোগ্রাম এবং বক্স প্লট হল সাংখ্যিক ডেটা মানের ফ্রিকোয়েন্সির জন্য গ্রাফিকাল উপস্থাপনা।

তাদের প্রধান উদ্দেশ্য হল ডেটা বা তথ্য বর্ণনা করা এবং উন্নত পরিসংখ্যান বিশ্লেষণ কৌশল ব্যবহার করার আগে কেন্দ্রীয় প্রবণতা এবং পরিবর্তনশীলতা অন্বেষণ করা।

হিস্টোগ্রামগুলি সাধারণত বার চার্ট যা আমাদেরকে একটি সংখ্যাসূচক ভেরিয়েবলের মানের ফ্রিকোয়েন্সি দেখায় এবং সেগুলি ভেরিয়েবলের সম্ভাব্যতা বন্টন আনুমানিক করতে ব্যবহৃত হয়। এটি আমাদের দ্রুত বিতরণের আকৃতি, সম্ভাব্য বহিরাগত, এবং প্রকরণ বুঝতে দেয়।

বক্সপ্লটগুলি ডেটা বিতরণের বিভিন্ন দিকগুলির সাথে যোগাযোগ করতে ব্যবহৃত হয়।

89. ক্রস-ভ্যালিডেশন কি?

ক্রস-ভ্যালিডেশনকে পরিসংখ্যানগত বিশ্লেষণ কীভাবে স্বাধীন ডেটা সেটে সাধারণীকরণ করে তা মূল্যায়ন করার জন্য ব্যবহৃত একটি কৌশল হিসাবে সংজ্ঞায়িত করা হয়। এটি এমন একটি কৌশল যা মেশিন লার্নিং মডেলের মূল্যায়ন করার জন্য উপলব্ধ ইনপুট তথ্যের প্রদত্ত উপসেটের উপর বেশ কয়েকটি মডেলকে প্রশিক্ষণ দিয়ে এবং ডেটার একটি পরিপূরক উপসেটের ভিত্তিতে মূল্যায়ন করে।

90. কিভাবে মেট্রিক্স সংজ্ঞায়িত বা নির্বাচন করবেন?

মেট্রিক্স বিভিন্ন কারণের উপর নির্ভর করে যেমন:

  1. এটা কি রিগ্রেশন বা শ্রেণীবিভাগ টাস্ক?
  2. আপনার ব্যবসার উদ্দেশ্য কি?
  3. লক্ষ্য পরিবর্তনশীল বন্টন কি হবে?

ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন ও উত্তর

90. NLP শব্দটি ব্যাখ্যা কর?

NLP মানে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ। এটি ভাষাবিজ্ঞান, কৃত্রিম বুদ্ধিমত্তা এবং কম্পিউটার বিজ্ঞানের একটি উপক্ষেত্র যা কম্পিউটার এবং মানুষের ভাষার মধ্যে মিথস্ক্রিয়াগুলির সাথে সম্পর্কিত, বিশেষ করে কীভাবে কম্পিউটারগুলিকে প্রচুর পরিমাণে প্রাকৃতিক ভাষা তথ্য প্রক্রিয়াকরণ এবং বিশ্লেষণ করতে প্রোগ্রাম করতে হয়।

91. মাত্রা হ্রাসের সুবিধা ব্যাখ্যা কর?

মাত্রিকতা হ্রাসের সুবিধাগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. এটি গণনার সময় হ্রাস করে।
  2. এটি মাল্টিকোলিনিয়ারটির যত্ন নেয়, যা মডেলের কর্মক্ষমতা উন্নত করে
  3. এটি অপ্রয়োজনীয় বৈশিষ্ট্যগুলি অপসারণ করতেও সাহায্য করে,
  4. এটি অনুরূপ গণনা সম্পাদনের জন্য প্রয়োজনীয় সময়কে বেঁধে দেয়।

92. কার্নেল কি?

কার্নেলকে সাধারণত কার্নেল ট্রিক বলা হয়, এমন একটি পদ্ধতি যা নন-লিনিয়ার সমস্যা সমাধানের জন্য লিনিয়ার ক্লাসিফায়ার ব্যবহার করে। এটি রৈখিকভাবে অবিচ্ছেদ্য ডেটাকে রৈখিকভাবে বিভাজ্য ডেটাতে রূপান্তর করতে সহায়তা করে।

93. বুস্টিং শব্দটি ব্যাখ্যা কর?

মেশিন লার্নিং-এ, বুস্টিং হল এমন একটি ধারণা যা প্রাথমিকভাবে পক্ষপাত কমানোর জন্য এবং তত্ত্বাবধানে থাকা শিক্ষার বৈচিত্র্যের জন্য একটি সমন্বিত মেটা-অ্যালগরিদম। এটি মেশিন লার্নিং অ্যালগরিদমগুলির একটি পরিবারের অন্তর্গত যা দুর্বল শিক্ষার্থীদেরকে শক্তিশালীদের মধ্যে রূপান্তর করে।

94. আপনি মার্কভ চেইন বর্ণনা করতে পারেন?

একটি মার্কভ চেইনকে একটি স্টোকাস্টিক মডেল হিসাবে সংজ্ঞায়িত করা হয় যা সম্ভাব্য ইভেন্টগুলির একটি ক্রম বর্ণনা করে যেখানে প্রতিটি ঘটনার সম্ভাব্যতা মূলত পূর্ববর্তী ইভেন্টে অর্জিত অবস্থার উপর নির্ভর করে।

95. কেন্দ্রীয় সীমা উপপাদ্যের সংজ্ঞা দাও?

কেন্দ্রীয় সীমা উপপাদ্যটি সংজ্ঞায়িত করে যে যদি আমাদের কাছে গড় μ এবং একটি আদর্শ বিচ্যুতি σ থাকে যা প্রতিস্থাপনের সাথে প্রদত্ত জনসংখ্যা থেকে পর্যাপ্ত পরিমাণে বড় এলোমেলো নমুনা নিতে পারে, তাহলে নমুনার অর্থের বিতরণ প্রায় স্বাভাবিকভাবে বিতরণ করা হবে।

96. পরিসংখ্যানগত শক্তি শব্দটি ব্যাখ্যা কর?

পরিসংখ্যানগত শক্তি একটি হাইপোথিসিস পরীক্ষার শক্তিকে বোঝায়, যা সম্ভাব্যতা হিসাবে সংজ্ঞায়িত করা হয় যে পরীক্ষাটি শূন্য অনুমানকে সঠিকভাবে প্রত্যাখ্যান করবে। এখানে, এটি একটি সত্যিকারের ইতিবাচক ফলাফলের সম্ভাবনা। শূন্য অনুমান প্রত্যাখ্যান করা হলেই এটি সহায়ক।

97. নমুনা নেওয়ার সময় যে তিন ধরনের পক্ষপাত ঘটতে পারে তার নাম বলতে পারবেন?

  1. নির্বাচন পক্ষপাত
  2. কভারেজ পক্ষপাত অধীনে
  3. বেঁচে থাকার পক্ষপাতিত্ব

98. পক্ষপাত কি?

ডেটা সায়েন্সে, পক্ষপাতকে প্রদত্ত ডেটাতে প্রত্যাশা থেকে বিচ্যুতি হিসাবে সংজ্ঞায়িত করা হয়। সহজ ভাষায়, পক্ষপাত বলতে ডেটাতে একটি ত্রুটি বোঝায়। কিন্তু, ত্রুটি প্রায়ই অলক্ষিত হয়.

99. আপনি একটি Naive Bayes অ্যালগরিদমে 'Naive' ব্যাখ্যা করতে পারেন?

নেভ বেইস অ্যালগরিদম মডেলটি বেশিরভাগই বেইস থিওরেমের উপর ভিত্তি করে। এটি একটি ইভেন্টের সম্ভাবনা নির্দিষ্ট করে। এটি সেই নির্দিষ্ট ইভেন্টের সাথে সম্পর্কিত হতে পারে এমন শর্তগুলির পূর্ব জ্ঞানের উপর ভিত্তি করে।

100. ব্যাক প্রোপাগেশন কি?

ব্যাক-প্রচার যে কোন নিউরাল নেট প্রশিক্ষণের সারাংশ। এটি এমন একটি পদ্ধতি যা একটি নিউরাল জালের ওজনকে সুর করে যা পূর্ববর্তী যুগে প্রাপ্ত ত্রুটির হারের উপর নির্ভর করে। সঠিক টিউনিং আমাদের ত্রুটির হার কমাতে এবং এর সাধারণীকরণ বাড়িয়ে তাদের আরও নির্ভরযোগ্য মডেলে পরিণত করতে সাহায্য করে।

সচরাচর জিজ্ঞাস্য

সাধারণত ব্যবহৃত তত্ত্বাবধানে শেখার অ্যালগরিদমের নাম বল?

সিদ্ধান্ত গাছ, লজিস্টিক রিগ্রেশন, সমর্থন ভেক্টর মেশিন

উপসংহার

আপনার ডেটা সায়েন্স ইন্টারভিউয়ের জন্য সৌভাগ্য কামনা করছি, এবং আমরা আশা করি আমাদের ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন এবং উত্তরগুলি আপনার জন্য কিছু সহায়ক ছিল। এছাড়াও আপনি আমাদের চেক আউট করতে পারেন কল সেন্টার ইন্টারভিউ প্রশ্ন এবং উত্তর , যা আপনাকে সাহায্য করতে পারে।