সাক্ষাৎকার প্রশ্ন

শীর্ষ 70 ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন এবং উত্তর

জানুয়ারী 2, 2022

ডেটা ইঞ্জিনিয়ারের প্রধান কাজ হল ডেটা সেটগুলির প্রবণতা খুঁজে বের করা এবং এন্টারপ্রাইজের জন্য কাঁচা ডেটাকে আরও উপযোগী করার জন্য অ্যালগরিদম তৈরি করা। ডেটা ইঞ্জিনিয়াররা কাঁচা ডেটাতে সহজে অ্যাক্সেস দেওয়ার জন্য অ্যালগরিদম তৈরি করার জন্য দায়ী, তবে এটি করার জন্য, তাদের কোম্পানির বা ক্লায়েন্টের উদ্দেশ্যগুলি বুঝতে হবে।

আপনার কাছে যদি ডেটা ইঞ্জিনিয়ার ইন্টারভিউ নির্ধারিত থাকে, তাহলে আপনাকে অবশ্যই ইন্টারভিউয়ের জন্য নিজেকে প্রস্তুত করতে হবে। একটি সাক্ষাত্কারের জন্য প্রস্তুতি একটি সহজ কাজ নয়. তাই আপনি সাক্ষাত্কারে উপস্থিত হওয়ার আগে, নিশ্চিত করুন যে আপনি ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন এবং উত্তরগুলি দিয়ে গেছেন যাতে আপনি সহজেই ইন্টারভিউটি ক্র্যাক করতে পারেন।

সুচিপত্র

শীর্ষ ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

1. ডেটা ইঞ্জিনিয়ারিংকে সহজ ভাষায় ব্যাখ্যা কর?

ডেটা ইঞ্জিনিয়ারিং যেমন টুলস ব্যবহার করে এসকিউএল এবং পাইথন তথ্য বিজ্ঞানীদের জন্য তথ্য প্রস্তুত করতে. ডেটা ইঞ্জিনিয়ারিং মূলত ডেটা বিজ্ঞানীদের সাথে কাজ করে তাদের কাজের জন্য তাদের নির্দিষ্ট প্রয়োজনীয়তা বোঝার জন্য। তারা ডেটা পাইপলাইনগুলি তৈরি করবে যা বিশ্লেষণের জন্য প্রয়োজনীয় কাঙ্খিত কাঠামোতে ডেটার উৎস এবং রূপান্তর করবে।

2. পাইথন কোন উপায়ে ডেটা ইঞ্জিনিয়ারদের সাহায্য করে?

ডেটা ইঞ্জিনিয়াররা পাইথন ব্যবহার করে ডেটা পাইপলাইন তৈরি করতে, ETL স্ক্রিপ্ট লিখতে এবং পরিসংখ্যানগত মডেল সেট আপ করতে এবং R-এর মতো বিশ্লেষণ সম্পাদন করে, যা ডেটা সায়েন্স এবং ডেটা ইঞ্জিনিয়ারিংয়ের জন্য একটি গুরুত্বপূর্ণ ভাষা। এটি ইটিএল, মেশিন লার্নিং অ্যাপ্লিকেশন এবং ডেটা বিশ্লেষণের জন্য গুরুত্বপূর্ণ।

3. ডেটা গুদাম এবং অপারেশনাল ডেটাবেসের মধ্যে পার্থক্য করুন?

অপারেশনাল ডাটাবেস তথ্য ভাণ্ডার
এগুলি উচ্চ-ভলিউম লেনদেন প্রক্রিয়াকরণকে সমর্থন করার জন্য ডিজাইন করা হয়েছে।এগুলি সাধারণত OLAP-এর মতো উচ্চ-ভলিউম বিশ্লেষণাত্মক প্রক্রিয়াকরণকে সমর্থন করার জন্য ডিজাইন করা হয়েছে।
তারা বর্তমান তথ্য নিয়ে উদ্বিগ্ন।তারা ঐতিহাসিক তথ্য নিয়ে উদ্বিগ্ন।
এখানে ডেটা মূলত প্রয়োজন অনুযায়ী নিয়মিত আপডেট করা হয়।অ-উদ্বায়ী, নতুন ডেটা নিয়মিত যোগ করা হবে। একবার যোগ করা হলে, এটি খুব কমই পরিবর্তন করা হবে।
এগুলি রিয়েল-টাইম ব্যবসায়িক লেনদেন এবং প্রক্রিয়াগুলির জন্য ডিজাইন করা হয়েছে।এগুলি বিষয় এলাকা, বৈশিষ্ট্য এবং বিভাগ দ্বারা ব্যবসায়িক পরিমাপ বিশ্লেষণের জন্য ডিজাইন করা হয়েছে।
কম সংখ্যক ডেটা অ্যাক্সেস করা হয়।বিপুল সংখ্যক ডেটা অ্যাক্সেস করা হয়।

4. ডেটা মডেলিং সংজ্ঞায়িত করুন?

ডেটা মডেলিংকে এমন একটি কৌশল হিসাবে সংজ্ঞায়িত করা যেতে পারে যা সংস্থাগুলির সংশ্লিষ্ট তথ্য সিস্টেমের সুযোগের মধ্যে ব্যবসায়িক প্রক্রিয়াগুলিকে সমর্থন করার জন্য প্রয়োজনীয় ডেটা প্রয়োজনীয়তাগুলিকে সংজ্ঞায়িত এবং বিশ্লেষণ করতে ব্যবহৃত হয়। ডেটা মডেলিং কেবল ডেটা উপাদানগুলিই নয়, তাদের কাঠামো এবং তাদের মধ্যে সম্পর্কও সংজ্ঞায়িত করে।

আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

5. রিলেশনাল বনাম নন-রিলেশনাল ডাটাবেসের মধ্যে পার্থক্য করুন?

সম্পর্কিত তথ্য ভাণ্ডার নন-রিলেশনাল ডাটাবেস
এগুলিকে রিলেশনাল ডাটাবেস ম্যানেজমেন্ট সিস্টেমও বলা হয় ( আরডিবিএমএস ) বা SQL ডাটাবেস।এগুলিকে NoSQL ডেটাবেসও বলা হয়।
জনপ্রিয় রিলেশনাল ডেটাবেসগুলি হল Microsoft SQL সার্ভার, ওরাকল ডেটাবেস, IBM DB2, এবং মাইএসকিউএল .সবচেয়ে জনপ্রিয় নন-রিলেশনাল ডেটাবেস হল মঙ্গোডিবি, ডকুমেন্টডিবি, ক্যাসান্দ্রা, এইচবেস, রেডিস এবং কোচবেস।
RDBMS গুলি সাধারণত বড় এন্টারপ্রাইজ পরিস্থিতিতে ব্যবহৃত হয়, যা বেশিরভাগ ওয়েব অ্যাপ্লিকেশনের জন্য ডেটা সংরক্ষণ করতে ব্যবহৃত হয়।তারা কোনো কাঠামো ছাড়াই বিপুল পরিমাণ ডেটা সঞ্চয় করে।

6. Do *args এবং **kwargs এর সংজ্ঞা দাও?

* args এবং **kwargs বিশেষ কীওয়ার্ড যা ফাংশনকে পরিবর্তনশীল-দৈর্ঘ্যের আর্গুমেন্ট নিতে দেয়। **কোয়ার্গস কীওয়ার্ড আর্গুমেন্ট অভিধানের পরিবর্তনশীল সংখ্যাকে সেই ফাংশনে পাস করতে ব্যবহৃত হয় যার উপর একটি অভিধানের অপারেশন সঞ্চালিত হয়। * args এবং **kwargs সাধারণত ফাংশন নমনীয় করা.

7. ডেটা মডেলিং-এ বিভিন্ন ধরনের ডিজাইন স্কিমা উল্লেখ করুন?

ডেটা মডেলিংয়ে দুই ধরনের স্কিমা রয়েছে:

  1. তারকা সময়সূচী
  2. স্নোফ্লেক স্কিমা।

8. একজন ডেটা ইঞ্জিনিয়ার হতে কী কী প্রযুক্তিগত দক্ষতা প্রয়োজন?

  1. ডাটাবেস সিস্টেম (SQL এবং NoSQL)
  2. ডেটা গুদামজাতকরণ সমাধান
  3. ETL টুলস
  4. মেশিন লার্নিং
  5. ডেটা API
  6. পাইথন, জাভা এবং স্কালা প্রোগ্রামিং ভাষা
  7. বিতরণ সিস্টেমের বুনিয়াদি বোঝা
  8. অ্যালগরিদম এবং ডেটা স্ট্রাকচারের জ্ঞান

9. স্ট্রাকচার্ড এবং আনস্ট্রাকচার্ড ডেটার মধ্যে পার্থক্য করুন?

স্ট্রাকচার্ড ডেটা অসংগঠিত তথ্য
এটি একটি পরিষ্কারভাবে সংজ্ঞায়িত এবং অনুসন্ধানযোগ্য ধরণের ডেটাএখানে, ডেটা সাধারণত তার নেটিভ ফরম্যাটে সংরক্ষণ করা হয়।
স্ট্রাকচার্ড ডেটা পরিমাণগত।অসংগঠিত ডেটা গুণগত।
স্ট্রাকচার্ড ডেটা ডাটা গুদামে সংরক্ষণ করা হয়।অসংগঠিত ডেটা ডেটা লেকে সংরক্ষণ করা হয়।
এটি অনুসন্ধান এবং বিশ্লেষণ করা সহজ।এটি প্রক্রিয়া এবং বোঝার জন্য আরও কাজ প্রয়োজন।

10. ডেটা ইঞ্জিনিয়ারদের জন্য প্রয়োজনীয় ফ্রেমওয়ার্ক এবং অ্যাপ্লিকেশনের নাম বলুন?

  1. স্পার্ক
  2. বিবেচনাযোগ্য
  3. কাফকা
  4. ইলাস্টিক অনুসন্ধান
  5. PostgreSQL/Redshift
  6. বাতাসের প্রবাহ

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

11. একটি Hadoop অ্যাপ্লিকেশনের উপাদান ব্যাখ্যা করুন?

  1. Hadoop কমন: এটি Hadoop দ্বারা ব্যবহৃত ইউটিলিটি এবং লাইব্রেরিগুলির একটি সেট হিসাবে সংজ্ঞায়িত করা যেতে পারে।
  2. HDFS: Hadoop অ্যাপ্লিকেশনটি ফাইল সিস্টেমকে বোঝায় যেখানে Hadoop ডেটা সংরক্ষণ করা হয়। এটি একটি বিতরণকৃত ফাইল সিস্টেম যার একটি উচ্চ ব্যান্ডউইথ রয়েছে।
  3. Hadoop MapReduce: এটি বড় আকারের ডেটা প্রক্রিয়াকরণের বিধানের জন্য অ্যালগরিদমের উপর ভিত্তি করে।
  4. Hadoop সুতা: এটি প্রধানত Hadoop ক্লাস্টারের ভিতরে সম্পদ ব্যবস্থাপনার জন্য ব্যবহৃত হয়। এটি ব্যবহারকারীদের জন্য টাস্ক শিডিউলিংয়ের জন্যও ব্যবহৃত হয়।

12. একজন ডেটা ইঞ্জিনিয়ার এবং ডেটা সায়েন্টিস্টের মধ্যে পার্থক্য করুন?

ডেটা ইঞ্জিনিয়ার ডেটা সায়েন্টিস্ট
তারা মূলত তথ্য উৎপাদনের জন্য অবকাঠামো এবং স্থাপত্য নির্মাণের উপর ফোকাস করে।তারা উন্নত গণিত এবং উৎপন্ন ডেটার পরিসংখ্যানগত বিশ্লেষণের উপর ফোকাস করে।
তারা অবকাঠামো এবং সরঞ্জাম সরবরাহ করে ডেটা বিজ্ঞানী এবং বিশ্লেষকদের সমর্থন করে যা ব্যবসায়িক সমস্যার শেষ থেকে শেষ সমাধান প্রদান করতে ব্যবহৃত হয়।তারা ডেটা ইঞ্জিনিয়ারদের দ্বারা নির্মিত এবং রক্ষণাবেক্ষণ করা ডেটা পরিকাঠামোর সাথে মিথস্ক্রিয়ায় নিযুক্ত থাকে।

13. NameNode সংজ্ঞায়িত করুন?

নেমেনোডকে মাস্টার নোড হিসাবে সংজ্ঞায়িত করা যেতে পারে যা ক্লাস্টারে একটি পৃথক নোডে চলবে। এটি ফাইল সিস্টেমের নামস্থান পরিচালনা করে যা ফাইল এবং ডিরেক্টরিগুলির ফাইল সিস্টেম ট্রি। এটি ফাইলের জন্য ফাইলের মালিক, ফাইলের অনুমতি ইত্যাদির মতো তথ্য সংরক্ষণ করে।

14. একজন ডেটা ইঞ্জিনিয়ারের দৈনন্দিন দায়িত্ব কি কি?

ডেটা ইঞ্জিনিয়ারের দায়িত্ব হল:

  1. তারা স্থাপত্যের বিকাশ, নির্মাণ, পরীক্ষা এবং রক্ষণাবেক্ষণ করে।
  2. তথ্য অর্জন
  3. ডেটা সেট প্রক্রিয়াগুলি বিকাশ করুন
  4. ব্যবসার প্রয়োজনীয়তার সাথে আর্কিটেকচার সারিবদ্ধ করুন
  5. তারা শিল্প এবং ব্যবসায়িক প্রশ্নের জন্য গবেষণা পরিচালনা করে
  6. ভবিষ্যদ্বাণীমূলক এবং প্রেসক্রিপটিভ মডেলিংয়ের জন্য ডেটা প্রস্তুত করুন
  7. স্বয়ংক্রিয় হতে পারে এমন কাজগুলি আবিষ্কার করতে তারা ডেটা ব্যবহার করে
  8. তারা ব্যবসায়িক সমস্যা সমাধানের জন্য বড় ডেটা সেট ব্যবহার করে।
  9. তারা ডেটা ব্যবহার করে লুকানো নিদর্শন খুঁজে পায়।

15. Hadoop স্ট্রিমিং কি?

Hadoop স্ট্রিমিং একটি ইউটিলিটি যা সাধারণত Hadoop বিতরণের সাথে আসে। এই ইউটিলিটি আমাদেরকে ম্যাপার বা রিডুসার হিসাবে যেকোন এক্সিকিউটেবল বা স্ক্রিপ্টের সাহায্যে ম্যাপ তৈরি এবং চালাতে বা কাজগুলি হ্রাস করতে দেয়।

16. আপনি কি ডেটা মডেলিং এর ডিজাইন স্কিমা ব্যাখ্যা করতে পারেন?

স্কিমা সম্পূর্ণ ডাটাবেসের যৌক্তিক বিবরণ হিসাবে সংজ্ঞায়িত করা যেতে পারে।

ডেটা মডেলিংয়ের কিছু স্কিমা হল:

তারকা সূচি : তারকা স্কিমার প্রতিটি মাত্রা শুধুমাত্র একটি মাত্রা সারণী দিয়ে সংজ্ঞায়িত করা হয়। এই মাত্রা সারণী বৈশিষ্ট্যগুলির একটি সেট নিয়ে গঠিত।

স্নোফ্লেক স্কিমা : স্নোফ্লেক স্কিমার মাত্রা সারণি স্বাভাবিক করা হয়। এই স্বাভাবিককরণ ডেটাকে অতিরিক্ত টেবিলে ভাগ করে। স্টার স্কিমার বিপরীতে, স্নোফ্লেক স্কিমার মাত্রা টেবিল স্বাভাবিক করা হয়।

ফ্যাক্ট কনস্টেলেশন স্কিমা : একটি ফ্যাক্ট নক্ষত্রমণ্ডলে সাধারণত একাধিক ফ্যাক্ট টেবিল থাকে। একে গ্যালাক্সি স্কিমাও বলা হয়।

17. HDFS এর পূর্ণরূপ কি?

হ্যাডোপ ডিস্ট্রিবিউটেড ফাইল সিস্টেম হল একটি ডিস্ট্রিবিউটেড ফাইল সিস্টেম যা কমোডিটি হার্ডওয়্যারে চালানোর জন্য ডিজাইন করা হয়েছে।

18. HDFS-এ ব্লক এবং ব্লক স্ক্যানারের ধারণা ব্যাখ্যা কর?

ব্লক : এটি পঠিত বা লিখিত ডেটার সর্বনিম্ন পরিমাণ হিসাবে সংজ্ঞায়িত করা হয়।

HDFS-এ ব্লকের ডিফল্ট আকার হল 64MB।

ব্লক স্ক্যানার : এটি DataNode-এ উপস্থিত সমস্ত ব্লকের তালিকা ট্র্যাক করে এবং যেকোন ধরনের চেকসাম ত্রুটি খুঁজে বের করতে এটি তাদের যাচাই করে।

19. NameNode DataNode থেকে যে দুটি বার্তা পায় তার নাম বল?

NameNodes সাধারণত বার্তা বা সংকেত আকারে DataNodes থেকে ডেটা সম্পর্কে তথ্য পায়। তারা হল:

    রিপোর্ট সংকেত ব্লক করুন: এগুলি হল ডেটা ব্লকের তালিকা যা ডেটানোড এবং এর কার্যকারিতায় সংরক্ষণ করা হয়।হার্টবিট সংকেত: এটি একটি পর্যায়ক্রমিক প্রতিবেদন যা NameNode ব্যবহার করতে হবে কিনা তা নির্ধারণ করে। যদি এই সংকেত পাঠানো না হয়, তাহলে এর মানে হল DataNode কাজ করা বন্ধ করে দিয়েছে।

20. ব্লক স্ক্যানার একটি দূষিত ডেটা ব্লক শনাক্ত করলে যে পদক্ষেপগুলি ঘটে তা সংজ্ঞায়িত করুন?

একটি ব্লক স্ক্যানার দ্বারা একটি দূষিত ডেটা ব্লক সনাক্ত করা হলে নীচের পদক্ষেপগুলি ঘটবে:

  1. DataNode দূষিত ব্লক NameNode এ রিপোর্ট করবে।
  2. NameNode তারপরে অন্যান্য ডেটানোডগুলিতে উপস্থিত একটি দূষিত ব্লকের সঠিক প্রতিরূপ ব্যবহার করে নতুন প্রতিরূপ তৈরি করার প্রক্রিয়া শুরু করবে।
  3. সঠিক প্রতিলিপিগুলির প্রতিলিপি গণনা প্রতিলিপি ফ্যাক্টরের সাথে মিল না হওয়া পর্যন্ত দূষিত ডেটা ব্লক মুছে ফেলা হয় না।
  4. এই সম্পূর্ণ প্রক্রিয়াটি HDFS কে ডেটার অখণ্ডতা বজায় রাখার অনুমতি দেয় যখন ক্লায়েন্ট রিড অপারেশন সম্পাদন করে।
আরো দেখুন শীর্ষ 100 উত্তরযোগ্য ইন্টারভিউ প্রশ্ন এবং উত্তর

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

21. হ্রাসকারী পর্যায়গুলি এবং তাদের মূল পদ্ধতিগুলি ব্যাখ্যা কর?

Hadoop Reducer ম্যাপারের ডেটা আউটপুট প্রক্রিয়া করে এবং এটি HDFS-এ সংরক্ষিত চূড়ান্ত আউটপুট তৈরি করে।

রিডুসারের প্রধানত 3টি পর্যায় রয়েছে:

    অদলবদল: এখানে, ম্যাপার থেকে আউটপুট এলোমেলো করা হয় এবং এটি রিডুসারের ইনপুট হিসাবে কাজ করে।শ্রেণীবিভাজনশাফলিং করার সময় করা হয়, এবং একই সময়ে, বিভিন্ন ম্যাপার থেকে আউটপুট সাজানো হয়।কমিয়ে দিন: এখানে, Reduces কী-মান জোড়াকে একত্রিত করে এবং আউটপুট দেয়, যা পরে HDFS-এ সংরক্ষিত হয় এবং পরবর্তীতে সাজানো হয় না।

Reducer এর মূল পদ্ধতি আছে:

    সেটআপ:এটি বিভিন্ন পরামিতি কনফিগার করে, যেমন ইনপুট ডেটা আকার।কমিয়ে দিন: এটা Reducer প্রধান অপারেশন হিসাবে সংজ্ঞায়িত করা হয়. এখানে, সংশ্লিষ্ট কী-এর জন্য একটি টাস্ক সংজ্ঞায়িত করা হয়েছে।পরিষ্কার কর:এই পদ্ধতিটি টাস্কের শেষে অস্থায়ী ফাইলগুলি পরিষ্কার করে।

22. Hadoop-এ বিভিন্ন XML কনফিগারেশন ফাইল উল্লেখ করুন?

Hadoop এ XML কনফিগারেশন ফাইল:

  1. ম্যাপ্রেড-সাইট
  2. মূল-সাইট
  3. HDFS-সাইট
  4. সুতা-সাইট

23. ব্যাখ্যা করুন কিভাবে একটি বড় ডেটা সমাধান স্থাপন করতে হয়?

বড় ডেটা সমাধান স্থাপনের জন্য ব্যবহৃত তিনটি উল্লেখযোগ্য পদক্ষেপ হল:

    ডেটা ইন্টিগ্রেশন/ইনজেশন: এখানে, RDBMS, Salesforce, SAP, MySQL এর মতো ডেটা উত্স ব্যবহার করে ডেটা নিষ্কাশন করা হয়।তথ্য ভান্ডার: এখানে, নিষ্কাশিত ডেটা HDFS বা NoSQL ডাটাবেসে সংরক্ষণ করা হয়।তথ্য প্রক্রিয়াজাতকরণ: এটিই শেষ ধাপ যা MapReduce, Pig, এবং Spark এর মতো প্রক্রিয়াকরণ কাঠামো ব্যবহার করে সমাধানটি স্থাপন করা উচিত।

24. বড় ডেটার চারটি V উল্লেখ কর?

চারটি V হল:

  1. বেগ
  2. বৈচিত্র্য
  3. আয়তন
  4. সত্যতা

25. ক্লাউড কম্পিউটিংয়ে কাজ করার সুবিধা এবং অসুবিধাগুলি তালিকাভুক্ত করুন?

সুবিধা:

  1. কোনো প্রশাসনিক বা ব্যবস্থাপনার ঝামেলা নেই
  2. সহজলভ্যতা
  3. ব্যবহার প্রতি অর্থ প্রদান
  4. নির্ভরযোগ্যতা
  5. বিশাল মেঘ স্টোরেজ
  6. স্বয়ংক্রিয় সফ্টওয়্যার আপডেট

অসুবিধা:

  1. অবকাঠামোর সীমিত নিয়ন্ত্রণ
  2. সীমাবদ্ধ বা সীমিত নমনীয়তা
  3. চলমান খরচ
  4. নিরাপত্তা
  5. প্রযুক্তিগত সমস্যা

26. হাদুপের কিছু বৈশিষ্ট্য ব্যাখ্যা কর?

Hadoop এর কয়েকটি গুরুত্বপূর্ণ বৈশিষ্ট্য হল:

  1. Hadoop একটি মুক্ত উৎস জাভা ভিত্তিক প্রোগ্রামিং ফ্রেমওয়ার্ক। ওপেন-সোর্স নির্দেশ করে যে এটি অবাধে উপলব্ধ, এবং কেউ আপনার প্রয়োজন অনুযায়ী এর সোর্স কোড পরিবর্তন করতে পারে।
  2. দোষ সহনশীলতা: রেপ্লিকা তৈরির কৌশল দ্বারা Hadoop নিয়ন্ত্রণ ত্রুটি. ক্লায়েন্ট যখন HDFS-এ একটি ফাইল সংরক্ষণ করে, তখন Hadoop ফ্রেমওয়ার্ক ফাইলটিকে ব্লকে ভাগ করে।বিতরণ প্রক্রিয়া: এটি HDFS-এ বিতরণ করা পদ্ধতিতে প্রচুর পরিমাণে ডেটা সঞ্চয় করে। এটি নোডের ক্লাস্টারে সমান্তরালভাবে ডেটা প্রক্রিয়া করে।মাপযোগ্যতা: ইতিমধ্যেই বলা হয়েছে, Hadoop হল একটি ওপেন সোর্স প্ল্যাটফর্ম৷ যা এটি একটি অত্যন্ত স্কেলযোগ্য প্ল্যাটফর্ম করে তোলেনির্ভরযোগ্যতা: ডেটার প্রতিলিপির কারণে মেশিনের ব্যর্থতা সত্ত্বেও এখানে ডেটা নির্ভরযোগ্যভাবে মেশিনের ক্লাস্টারে সংরক্ষণ করা হয়। সুতরাং, যদি কোনও নোড ব্যর্থ হয় তবে আপনি নির্ভরযোগ্যভাবে ডেটা সংরক্ষণ করতে পারেন।উচ্চ প্রাপ্যতা: ডেটার একাধিক কপির কারণে, হার্ডওয়্যার ব্যর্থতা সত্ত্বেও এখানে ডেটা অত্যন্ত উপলব্ধ এবং অ্যাক্সেসযোগ্য৷অর্থনৈতিক: এটি খুব ব্যয়বহুল নয় কারণ এটি কমোডিটি হার্ডওয়্যারের একটি ক্লাস্টারে চলে৷

27. দক্ষ ডেটা প্রক্রিয়াকরণের জন্য আপনি যে পাইথন লাইব্রেরিগুলি ব্যবহার করবেন তার নাম বলুন?

  1. NumPy
  2. SciPy
  3. পান্ডা
  4. কঠিন
  5. SciKit-শিখুন
  6. পাইটর্চ
  7. টেনসরফ্লো

28. COSHH এর পূর্ণরূপ কি?

COSHH মানে ভিন্নধর্মী Hadoop সিস্টেমের জন্য শ্রেণিবিন্যাস এবং অপ্টিমাইজেশন-ভিত্তিক সময়সূচী।

29. তালিকা এবং tuples মধ্যে পার্থক্য?

তালিকা টিপলস
তারা পরিবর্তনশীল।তারা অপরিবর্তনীয়।
তালিকাটি সন্নিবেশ এবং মুছে ফেলার মতো ক্রিয়াকলাপ সম্পাদনের জন্য পছন্দ করা হয়।Tuple ডেটা টাইপ উপাদানগুলি অ্যাক্সেস করার জন্য উপযুক্ত।
তাদের বেশ কয়েকটি অন্তর্নির্মিত পদ্ধতি রয়েছে।তাদের অনেক বিল্ট-ইন পদ্ধতি নেই।
এটি আরও মেমরি খরচ করে।তারা তালিকার তুলনায় কম মেমরি গ্রহণ করে।

30. তারকা স্কিমা সংজ্ঞায়িত করুন?

স্টার স্কিমাকে ডেটা মার্ট স্কিমার মধ্যে মৌলিক স্কিমা হিসাবে সংজ্ঞায়িত করা যেতে পারে এবং এটি সবচেয়ে সহজ। এই স্কিমাটি মূলত ডাইমেনশনাল ডাটা মার্ট এবং ডাটা গুদাম তৈরি বা তৈরি করতে ব্যবহৃত হয়; এটিতে এক বা একাধিক ফ্যাক্ট টেবিল রয়েছে যা যেকোন সংখ্যক মাত্রিক সারণীকে ইন্ডেক্স করে।

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

31. কিভাবে একটি এসকিউএল ক্যোয়ারীতে ডুপ্লিকেট ডেটা পয়েন্ট মোকাবেলা করবেন?

  1. আমরা যেকোনো ডুপ্লিকেট সারি সরাতে SQL RANK ফাংশন ব্যবহার করি। এসকিউএল র‍্যাঙ্ক ফাংশনটি ডুপ্লিকেট সারিটিকে উপেক্ষা করে প্রতিটি সারির জন্য একটি অনন্য সারি আইডি দেয়।
  2. আমরা একটি SSIS প্যাকেজে সর্ট অপারেটর ব্যবহার করি সদৃশ সারিগুলি সরাতে।
  3. সাধারণ টেবিল এক্সপ্রেশন (CTE) ব্যবহার করে এসকিউএল ডুপ্লিকেট সারি মুছে দেয়
  4. এসকিউএল গ্রুপ বাই এবং ক্লজ ব্যবহার করে ডুপ্লিকেট সারি মুছে দেয়

32. স্নোফ্লেক স্কিমা সংজ্ঞায়িত করুন?

একটি ডেটা গুদামে স্নোফ্লেক স্কিমাকে বহুমাত্রিক ডাটাবেসে টেবিলের যৌক্তিক বিন্যাস হিসাবে এমনভাবে সংজ্ঞায়িত করা যেতে পারে যাতে ইআর ডায়াগ্রামটি একটি তুষারকণার আকারের মতো দেখায়। এটি স্টার স্কিমার এক্সটেনশন এবং অতিরিক্ত মাত্রা যোগ করে। মাত্রা টেবিল স্বাভাবিক করা হয়, যা তারপর অতিরিক্ত টেবিলে ডেটা বিভক্ত করে।

33. কিভাবে ডেটা অ্যানালিটিক্স ব্যবসার বৃদ্ধি এবং আয় বৃদ্ধিতে সাহায্য করে?

  1. এটা আপনাকে বাস্তবসম্মত লক্ষ্য সেট করতে সাহায্য করে।
  2. এটি সিদ্ধান্ত গ্রহণকে সমর্থন করে।
  3. এটি আপনাকে আপনার আদর্শ জনসংখ্যার সন্ধান করতে সহায়তা করে।
  4. আপনি আপনার দর্শকদের ভাগ করতে পারেন।
  5. এটি আপনাকে ভর ব্যক্তিগতকরণ তৈরি করতে সহায়তা করে।
  6. এটি আপনার আয় বাড়াতে এবং আপনার খরচ কমাতে সাহায্য করে।
  7. আপনি আপনার সদস্যতা বৃদ্ধি করতে পারেন.
  8. এটি আপনাকে সামাজিক মিডিয়া নিরীক্ষণ করতে সহায়তা করে।

34. FSCK এর সংজ্ঞা দাও?

সিস্টেম ইউটিলিটি ফাইল সিস্টেমের ধারাবাহিকতা পরীক্ষা ( fsck ) হল একটি টুল যা ইউনিক্স এবং ইউনিক্স-এর মতো অপারেটিং সিস্টেমে ফাইল সিস্টেমের সামঞ্জস্য পরীক্ষা করার জন্য ব্যবহৃত হয়, যেমন লিনাক্স, ম্যাকওএস এবং ফ্রিবিএসডি।

35. OLTP এবং OLAP এর মধ্যে পার্থক্য কর?

ওএলটিপি ওলাপ
OLTP হল লেনদেন প্রক্রিয়াকরণ।OLAP একটি অনলাইন সিস্টেম হিসাবে সংজ্ঞায়িত করা যেতে পারে যা বহুমাত্রিক বিশ্লেষণাত্মক প্রশ্ন যেমন আর্থিক প্রতিবেদন, পূর্বাভাস ইত্যাদির রিপোর্ট করে।
এটি এমন একটি সিস্টেম যা এটিএমের মতো ইন্টারনেটে লেনদেন-ভিত্তিক অ্যাপ্লিকেশন পরিচালনা করতে পারে।OLAP সমাধানটি সামগ্রিক ডেটা এবং ব্যবসায়িক গণনার সাথে ডেটা গুদামকে উন্নত করে।
এটি একটি অনলাইন ডাটাবেস পরিবর্তন করার সিস্টেম।এটি একটি অনলাইন ডাটাবেস প্রশ্নের উত্তর দেওয়ার সিস্টেম।
OLTP-তে ছোট লেনদেন আছে।OLAP এর দীর্ঘ লেনদেন আছে।
OLTP ডাটাবেসের টেবিলগুলি স্বাভাবিক করা হয় (3NF)।OLAP ডাটাবেসের টেবিলগুলি স্বাভাবিক করা হয় না।

36. স্টার স্কিমা এবং স্নোফ্লেক স্কিমার মধ্যে পার্থক্য করুন?

তারকা সূচি স্নোফ্লেক স্কিমা
এখানে, শুধুমাত্র একটি একক যোগ ফ্যাক্ট টেবিল এবং ডাইমেনশন টেবিলের মধ্যে সম্পর্ক তৈরি করে।ডেটা আনতে অনেক যোগদানের প্রয়োজন।
ডেটা রিডানডেন্সির উচ্চ স্তরখুব নিম্ন-স্তরের ডেটা রিডানডেন্সি
সাধারণ ডিবি ডিজাইন।খুব জটিল ডিবি ডিজাইন
একটি একক মাত্রা সারণীতে সমষ্টিগত ডেটা রয়েছে।এখানে, ডেটা বিভিন্ন মাত্রা টেবিলে বিভক্ত করা হয়েছে।

37. ইয়ারনের সংক্ষিপ্ত নাম কি?

ইয়ার্নের পূর্ণ রূপ: তবুও অন্য সম্পদ আলোচক

আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

38. Apache Hadoop এর ফ্রেমওয়ার্কের পিছনে মূল ধারণাটি কী?

এটি মূলত MapReduce অ্যালগরিদমের উপর ভিত্তি করে। এখানে, এই অ্যালগরিদমে, একটি বড় ডেটা সেট প্রক্রিয়া করার জন্য, আমরা মানচিত্র ব্যবহার করি এবং ক্রিয়াকলাপ হ্রাস করি। এটি ডেটা ম্যাপ, ফিল্টার এবং সাজায় যখন রিডুস ডেটা সংক্ষিপ্ত করে। মাপযোগ্যতা এবং দোষ সহনশীলতা এই ধারণার গুরুত্বপূর্ণ পয়েন্ট। আমরা MapReduce এবং মাল্টি-থ্রেডিং দক্ষতার সাথে প্রয়োগ করে Apache Hadoop-এ এই বৈশিষ্ট্যগুলি অর্জন করি।

39. Hadoop এর বিভিন্ন ব্যবহার পদ্ধতির নাম বল?

Hadoop দ্বারা ব্যবহৃত তিনটি ভিন্ন মোড হল:

  1. স্বতন্ত্র মোড
  2. ছদ্ম বিতরণ মোড
  3. সম্পূর্ণরূপে বিতরণ মোড

40. কিভাবে আমরা Hadoop এ নিরাপত্তা অর্জন করতে পারি?

  1. প্রথম ধাপে, আমাদের সার্ভারে ক্লায়েন্টের প্রমাণীকরণ চ্যানেল সুরক্ষিত করতে হবে। আপনাকে ক্লায়েন্টকে টাইম স্ট্যাম্প প্রদান করতে হবে।
  2. এর পরে, ক্লায়েন্ট পরিষেবা টিকিটের জন্য TGS-কে অনুরোধ করতে প্রাপ্ত সময়-স্ট্যাম্প ব্যবহার করে।
  3. অবশেষে, ক্লায়েন্ট নির্দিষ্ট সার্ভারে স্ব-প্রমাণিকরণের জন্য একটি পরিষেবা টিকিট ব্যবহার করে।

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

41. একটি বিগ ডেটা সমাধান স্থাপন করার সময় কী কী পদক্ষেপগুলি অনুসরণ করতে হবে?

একটি বিগ ডেটা সমাধান স্থাপন করার সময় যে পদক্ষেপগুলি অনুসরণ করতে হবে:

    ডেটা ইনজেশন: এটি বিভিন্ন উৎস থেকে তথ্য সংগ্রহ বা স্ট্রিমিং করার কৌশল যেমন লগ ফাইল, SQL ডাটাবেস এবং সামাজিক মাধ্যম নথি পত্র. এটি তিনটি গুরুত্বপূর্ণ চ্যালেঞ্জের মুখোমুখি: ইনজেশন স্কিমা পরিবর্তন, উৎসে বড় টেবিল ইনজেশন এবং ডেটা ক্যাপচার পরিবর্তন। তথ্য ভান্ডার-: ডেটা ইনজেশনের পর এক্সট্রাক্ট করা ডাটা কোথাও সংরক্ষণ করতে হয়। এটি HDFS বা NoSQL ডাটাবেসে সংরক্ষণ করা উচিত। র্যান্ডম রিড বা রাইট অ্যাক্সেসের জন্য HBase-এর মাধ্যমে অনুক্রমিক অ্যাক্সেসের জন্য HDFS সবচেয়ে ভাল কাজ করে। তথ্য প্রক্রিয়াজাতকরণ: এটি একটি বিগ ডেটা সলিউশনে স্থাপনের শেষ ধাপ। ডেটা স্টোরেজের পরে, পিগ বা ম্যাপরিডুসের মতো প্রধান ফ্রেমওয়ার্কগুলির মধ্যে একটির মাধ্যমে ডেটা প্রক্রিয়া করা হয়।

42. হাডুপে পোর্ট ট্র্যাকার, নেমনোড এবং টাস্ক ট্র্যাকারের জন্য ডিফল্ট পোর্ট নম্বরগুলির নাম বলুন?

  1. টাস্ক ট্র্যাকারের ডিফল্ট পোর্ট রয়েছে: 50060
  2. NameNode এর ডিফল্ট পোর্ট আছে: 50070
  3. জব ট্র্যাকারের ডিফল্ট পোর্ট রয়েছে: 50030

43. Hadoop এ NAS এবং DAS এর মধ্যে পার্থক্য করুন?

মধ্যে যে
এটি ইথারনেট বা TCP/IP ব্যবহার করে ডেটা প্রেরণ করে।এটি IDE/SCSI ব্যবহার করে ডেটা প্রেরণ করে।
প্রতি জিবি এর ব্যবস্থাপনা খরচ মাঝারি।প্রতি জিবি এর ব্যবস্থাপনা খরচ বেশি।

44. NameNode-এ সংরক্ষিত ডেটার সংজ্ঞা দাও?

NameNode প্রধানত HDFS-এর জন্য প্রয়োজনীয় সমস্ত মেটাডেটা তথ্য নিয়ে গঠিত, যেমন নামস্থানের বিবরণ এবং পৃথক ব্লক তথ্য।

45. HDFS ক্লাস্টারে NameNode ক্র্যাশ হলে কি হবে?

HDFS ক্লাস্টারে সাধারণত শুধুমাত্র একটি NameNode থাকে এবং এটি DataNode-এর মেটাডেটা বজায় রাখতে ব্যবহৃত হয়। শুধুমাত্র একটি NameNode থাকা HDFS ক্লাস্টারগুলিকে ব্যর্থতার একক পয়েন্ট দেয়।

NameNode ক্র্যাশ হলে, সিস্টেমগুলি অনুপলব্ধ হয়ে যাবে। এটি প্রতিরোধ করার জন্য, আপনাকে একটি সেকেন্ডারি NameNode নির্দিষ্ট করতে হবে যা HDFS ফাইল সিস্টেমে পর্যায়ক্রমিক চেকপয়েন্ট নিতে পারে, কিন্তু এটি NameNode-এর ব্যাকআপ নয়। কিন্তু আমরা নেমনোড পুনরায় তৈরি করতে এবং এটি পুনরায় চালু করতে এটি ব্যবহার করি।

46. ​​তাক সচেতনতা সংজ্ঞায়িত করুন?

র্যাক সচেতনতা হ্যাডুপকে র্যাকের মধ্যে স্থানান্তরের চেয়ে র্যাকের মধ্যে ব্লকের স্থানান্তরকে সমর্থন করে নেটওয়ার্ক ব্যান্ডউইথ সর্বাধিক করার অনুমতি দেয়। র্যাক সচেতনতার সাথে, YARN MapReduce কাজের কর্মক্ষমতা অপ্টিমাইজ করবে। এটি নেটওয়ার্ক টপোলজির পরিপ্রেক্ষিতে ডেটার কাছাকাছি থাকা নোডগুলিতে কাজগুলি বরাদ্দ করবে।

47. ডেটা ইঞ্জিনিয়ারদের ব্যবহৃত গুরুত্বপূর্ণ ভাষার নাম বল?

ডেটা ইঞ্জিনিয়ার দ্বারা ব্যবহৃত কয়েকটি ক্ষেত্র হল:

  1. মেশিন লার্নিং
  2. প্রবণতা বিশ্লেষণ এবং রিগ্রেশন
  3. সম্ভাবনার পাশাপাশি রৈখিক বীজগণিত
  4. হাইভ QL এবং SQL ডাটাবেস

48. একটি হার্টবিট বার্তা কি?

Hadoop নাম নোড এবং ডেটা নোড হার্টবিট ব্যবহার করে যোগাযোগ করে। তাই হার্টবিট হল একটি সংকেত যা ডেটা নোড দ্বারা নেমনোডে পাঠানো একটি নিয়মিত ব্যবধানের পরে এর উপস্থিতি নির্দেশ করতে (এটি জীবিত রয়েছে তা নির্দেশ করতে)।

49. বিগ ডেটার সংজ্ঞা দাও?

বিগ ডেটা হল এমন একটি শব্দ যা ডেটার বিশাল পরিমাণ (গঠিত এবং অসংগঠিত উভয়) বর্ণনা করতে ব্যবহৃত হয় যা প্রতিদিনের ভিত্তিতে একটি ব্যবসাকে ছাড়িয়ে যায়। সংস্থাগুলি গুরুত্বপূর্ণ ডেটা দিয়ে যা করে তা। বিগ ডেটা বিশ্লেষণ করা হয় অন্তর্দৃষ্টিগুলির জন্য যা কৌশলগত ব্যবসায়িক পদক্ষেপ এবং আরও ভাল সিদ্ধান্তের দিকে পরিচালিত করে।

50. Hadoop এ কনটেক্সট অবজেক্টের সংজ্ঞা দাও?

কনটেক্সট অবজেক্ট ম্যাপার বা রিডুসারকে বাকি Hadoop সিস্টেমের সাথে যোগাযোগ করতে দেয়। এতে কাজের জন্য কনফিগারেশন ডেটা এবং ইন্টারফেসগুলি রয়েছে যা এটিকে আউটপুট নির্গত করার অনুমতি দেয়। অ্যাপ্লিকেশনগুলি প্রসঙ্গ ব্যবহার করে: অগ্রগতির প্রতিবেদন করতে।

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

51. FIFO সময়সূচী সংজ্ঞায়িত করুন?

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন - FIFO সময়সূচী

জবট্র্যাকারের মধ্যে একত্রিত করা আসল হ্যাদুপ জব শিডিউলিং অ্যালগরিদম হল FIFO৷ একটি প্রক্রিয়া হিসাবে, জবট্র্যাকার কাজের সারি থেকে কাজগুলিকে টেনে নিয়ে যায়, যা বলে সবচেয়ে পুরানো কাজ। এটি Hadoop FIFO শিডিউলিং নামে পরিচিত।

52. Hadoop ইকোসিস্টেমে আমরা Hive কি ব্যবহার করি?

Hive হল Hadoop বাস্তুতন্ত্রের একটি বিট এবং Hadoop কে SQL-এর মত ইন্টারফেস প্রদান করে। এটি Hadoop-এর জন্য ডেটা গুদাম ব্যবস্থা যা অ্যাড-হক কোয়েরি, সহজ ডেটা সংক্ষিপ্তকরণ এবং Hadoop সামঞ্জস্যপূর্ণ ফাইল সিস্টেমে সংরক্ষিত বিশাল ডেটাসেটগুলির বিশ্লেষণের সুবিধা দিতে পারে।

53. Hadoop এ দুটি নোডের মধ্যে দূরত্ব কিভাবে সংজ্ঞায়িত করা হয়?

দূরত্বটি নিকটতম নোডগুলির দূরত্বের সমষ্টির সমান হিসাবে সংজ্ঞায়িত করা হয়। আমরা দুটি নোডের মধ্যে দূরত্ব গণনা করতে getDistance() পদ্ধতিটি ব্যবহার করি।

54. হাইভে আমরা মেটাস্টোর কি ব্যবহার করি?

মেটাস্টোরকে Apache Hive মেটাডেটার কেন্দ্রীয় সংগ্রহস্থল হিসাবে সংজ্ঞায়িত করা যেতে পারে। এটি একটি রিলেশনাল ডাটাবেসে হাইভ টেবিল এবং পার্টিশনের জন্য মেটাডেটা সংরক্ষণ করতে ব্যবহৃত হয়। ক্লায়েন্টরা মেটাস্টোর পরিষেবা API ব্যবহার করে এই তথ্য অ্যাক্সেস করতে পারে।

55. Hadoop-এ কমোডিটি হার্ডওয়্যারের সংজ্ঞা দাও?

এটি কম্পিউটার হার্ডওয়্যার যা সাশ্রয়ী মূল্যের এবং প্রাপ্ত করা সহজ। মূলত, এটি একটি নিম্ন-কর্মক্ষমতা সিস্টেম এবং এটি আইবিএম পিসি-সামঞ্জস্যপূর্ণ, এবং এটি চলতে সক্ষম লিনাক্স , Microsoft Windows, বা MS-DOS কোনো বিশেষ ডিভাইস বা সরঞ্জাম ছাড়াই।

ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন ও উত্তর

56. Hive ডেটা মডেলে উপলব্ধ উপাদানগুলির নাম বল?

Hive এর উপাদান:

  1. বালতি
  2. টেবিল
  3. পার্টিশন

57. HDFS-এ রেপ্লিকেশন ফ্যাক্টর কী?

রেপ্লিকেশন ফ্যাক্টরটি মূলত হ্যাডূপ ফ্রেমওয়ার্ক প্রতিটি ডেটা ব্লকের প্রতিলিপি করার সংখ্যা। ত্রুটি সহনশীলতা প্রদান করার জন্য ব্লক প্রতিলিপি করা হয়. ডিফল্ট রেপ্লিকেশন ফ্যাক্টর তিনটি হবে, যা প্রয়োজন অনুযায়ী কনফিগার করা যেতে পারে; এটি 2 এ পরিবর্তন করা যেতে পারে বা বাড়ানো যেতে পারে।

58. একটি পৃথক ডেটা ফাইলের জন্য কি একক টেবিলের বেশি তৈরি করা সম্ভব?

হ্যাঁ, কেউ একটি ডেটা ফাইলের জন্য একাধিক টেবিল তৈরি করতে পারে। হাইভে, স্কিমাগুলি মেটাস্টোরে সংরক্ষণ করা হয়। সুতরাং, সংশ্লিষ্ট ডেটার জন্য ফলাফল পাওয়া সহজ।

59. আপনি কি একজন ডেটা ইঞ্জিনিয়ারের দৈনন্দিন কাজ ব্যাখ্যা করতে পারেন?

  1. সংস্থার মধ্যে ডেটা পরিচালনা করা।
  2. ডেটা এবং স্টেজিং এলাকার উত্স সিস্টেম বজায় রাখা।
  3. ETL এবং ডেটা ট্রান্সফরমেশন করা।
  4. ডেটা পরিষ্কার করা সহজ করা এবং ডেটা ডি-ডুপ্লিকেশন এবং বিল্ডিং উন্নত করা।
  5. তাদের অ্যাড-হক ডেটা কোয়েরি বিল্ডিং এবং এক্সট্রাকশন করতে হবে।

60. Hive-এ উপস্থিত সংগ্রহগুলি তালিকাভুক্ত করুন?

Hive-এর নীচে উল্লিখিত সংগ্রহ বা ডেটা প্রকার রয়েছে:

  1. অ্যারে
  2. মানচিত্র
  3. গঠন
  4. মিলন

61. Hadoop এ কম্বাইনার কি?

একটি কম্বিনার, যাকে সেমি-রিডুসারও বলা হয়, এটি একটি ঐচ্ছিক ক্লাস যা ম্যাপ ক্লাস থেকে ইনপুট গ্রহণ করে পরিচালিত হয় এবং তারপর এটি আউটপুট কী-মান জোড়াকে রেডুসার ক্লাসে প্রেরণ করে। একটি কম্বিনারের কাজ হল একই কী দিয়ে মানচিত্রের আউটপুট রেকর্ডগুলিকে সংক্ষিপ্ত করা।

62. Hive মধ্যে Skewed টেবিল কি?

যোগদানের কলামে যখন তির্যক ডেটা সহ একটি টেবিল থাকে, তখন আমরা তির্যক যোগদান বৈশিষ্ট্যটি ব্যবহার করি। এটি এমন একটি টেবিল যা অন্যান্য ডেটার সাথে তুলনা করার সময় টেবিলে প্রচুর পরিমাণে মান রয়েছে।

63. HDFS-এ নিরাপদ মোড সংজ্ঞায়িত করুন?

NameNode-এর জন্য Safemode হল HDFS ক্লাস্টারের জন্য একটি পঠনযোগ্য মোড, যেখানে এটি ফাইল সিস্টেম বা ব্লকে অন্য কোনো পরিবর্তনের অনুমতি দেয় না।

64. Hive-এ উপস্থিত টেবিল তৈরি ফাংশনের নাম বল?

নীচে টেবিল তৈরির কিছু ফাংশন উল্লেখ করা হল মৌচাক:

  1. বিস্ফোরণ (অ্যারে)
  2. বিস্ফোরণ (মানচিত্র)
  3. JSON_tuple()
  4. স্ট্যাক()

ছাড়াও প্রযুক্তিগত প্রশ্ন , ইন্টারভিউয়ার আপনাকে কিছু দৃশ্য-ভিত্তিক প্রশ্ন জিজ্ঞাসা করবে যেগুলির উত্তর আপনাকে আপনার অভিজ্ঞতার ভিত্তিতে এবং ডেটা ইঞ্জিনিয়ারিং-এ আপনার দখলের উপর ভিত্তি করে দিতে হবে। আমি কয়েকটি পরিস্থিতি-ভিত্তিক এবং সাধারণ প্রশ্ন তালিকাভুক্ত করেছি যা আপনি আপনার সাক্ষাত্কারে সম্মুখীন হতে পারেন, নিশ্চিত করুন যে আপনি নীচের-উল্লেখিত প্রশ্নগুলির সাথেও প্রস্তুত হয়েছেন।

65. আপনি কি আপনার ক্ষেত্রে কাউকে প্রশিক্ষণ দিয়েছেন? আপনি কি চ্যালেঞ্জ সম্মুখীন হয়েছে?

66. আপনি Hadoop ফ্রেমওয়ার্ক নিয়ে কাজ করেছেন?

67. কোন ETL টুলগুলির সাথে আপনি পরিচিত?

68. আমাদের একটি দৃশ্য বলুন যেখানে আপনি বিভিন্ন উত্স থেকে ডেটা একত্রিত করার কথা ছিল কিন্তু কিছু অপ্রত্যাশিত সমস্যার সম্মুখীন হয়েছেন এবং আপনি কীভাবে এটি সমাধান করেছেন?

69. আপনার মতে, ডেটা ইঞ্জিনিয়ার হওয়ার সবচেয়ে কঠিন জিনিস কি?

70. আপনি কেন ডেটা ইঞ্জিনিয়ারিং পড়তেন?

আপনার ডেটা ইঞ্জিনিয়ার ইন্টারভিউয়ের জন্য সৌভাগ্য কামনা করছি, এবং আমরা আশা করি আমাদের ডেটা ইঞ্জিনিয়ার ইন্টারভিউ প্রশ্ন এবং উত্তরগুলি আপনার জন্য কিছু সহায়ক ছিল। আপনি আমাদের চেক করতে পারেন ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর , যা আপনার কিছু সহায়ক হতে পারে।