Tổng hợp câu hỏi phỏng vấn Data Engineer sưu tầm

Cho big job

  • Làm thế nào để có thể xây dựng một hệ thống ETL hiệu quả?

  • Big data lưu rất nhiều dữ liệu để phân tích theo dạng phi cấu trúc vậy thì Dữ liệu phi cấu trúc được lưu như thế nào ạ?

  • Cloud có vai trò gì đối với lưu trữ dữ liệu ?

  • Các hướng đi của BigData ở Việt Nam?

  • Khởi đầu của anh là vị trí gì ạ. Vì e thấy đa phần các anh em mà e gặp bắt đầu từ vị trí Backend Engineer

  • Mình muốn tìm hiểu về triển vọng và cơ hội việc làm của ngành dữ liệu nói chung, hy vọng sẽ được diễn giả giải đáp.

  • Kiến thức cần có để apply vào các vị trí BD sử dụng cloud

  • Xử lý big data có thể tốn kém. Có những chiến lược nào để quản lý và tối ưu hóa chi phí trên AWS?

  • Dạ cho em hỏi là cách thức hoạt động của data trong công việc ạ

  • Em cần tham khảo những kênh thông tin nào để tìm hiểu hơn về Big Data ạ

  • Aws là gì? Triển khai các giải pháp big data trên cloud với Aws như thế nào? Cách hoạt động của aws như thế nào để 1 dự án big data được thành công? Em xin cảm ơn ạ.

  • Nên theo mảng nào trong lĩnh vực về data hiện này và có tiềm năng phát triển cao hơn và sau ạ.

  • Hiện nay sự canh tranh việc làm trong ngành IT rất lớn, vài năm sau lúc em ra trường thì sự cạnh tranh nó sẽ càng cao hơn bây giờ rất nhiều, vậy em nên làm những gì để đảm bảo mình có được một công việc ổn định

  • Em xin hỏi là Big Data là gì? Nó bao gồm những ngành nghề gì? Và những ví dụ thực tiễn nào có Big Data ạ?

  • Em chào thầy ạ, thầy nghĩ sao về tình trạng nhân lực của Big Data, và cơ hội việc làm c ủa ngành ạ?

  • BA trong các doanh nghiệp hiện nay như thế nào

  • Trong thời buổi hiện nay, người học Bigdata đang gặp phải những khó khăn gì?

Cho job vừa vừa

Phỏng vấn INDA

Xem ở đây nha

Job FPT (6 - 8 tr)

Hỏi về database

  • Các chuẩn
  • Unique Key khác gì so với PRIMARY KEY (PRIMARY KEY không thể chứa giá trị null còn Unique Key thì có thể)
  • Các quan hệ 1 - n, n - n (hỏi trong cái dự án mình đã làm)
  • Trong một bảng có những gì
  • Một bảng có thể có nhiều khóa chính không (câu này hơi bị trol nha)

Hỏi về Cấu trúc dữ liệu và giải thuật

  • Các thuật toán sắp xếp, độ phức tạp, lấy ví dụ hình dung.
  • Queue, Stack, lấy ví dụ hình dung.
  • Tìm kiếm nhị phân, độ phức tạp, các hoạt động
  • Cây cối

Hỏi về sql

  • Các lệnh
  • Truy vấn
  • Sự khác nhau các join, ví dụ

Job Hebela (1200$)

Người phỏng vấn mình là một anh Lead sn 2000

  • Giới thiệu về bản thân
  • Ước mơ là gì
  • Dự định sau khi ra trường
  • Đã làm được gì rồi
  • Sau đó hỏi về các cái liên quan mình đã làm
  • Thích cái gì
  • Tại sao lại chọn công việc này
  • Kế hoạch sắp tới 1-2 năm, 3-5 năm
  • Trên trường học giỏi nhất môn gì, yêu thích nhất môn gì? Tại sao?
  • Đã tìm hiểu gì về công ty chưa, văn hóa, …
  • Đã đọc qua cái mô tả công việc chưa, Nếu được vào làm luôn thì có thể làm ngay được công việc nào
  • Mong muốn mức lương bao nhiêu (Mé job 1200$ lỡ mồm bảo muốn lương 5 chịu)
  • Có câu hỏi gì không

Liệu có phải job to rồi nên chỉ hỏi về cá nhân thôi ko.

Trả lời hết đống trên hết 10p xong đi về :>

Job DE Cty MH SOLUTION

Hỏi về các công việc đã làm, làm về tài chính làm ở worldquant viết code như nào, tại sao, hỏi 1 loằng dài, xong a hỏi bảo là a biết thừa cái worldquant, viết alpha như nào, có các chỉ số nào, kiếm tiền như nào. tại sao lại ko làm ở đây nữa.

-> XOng kết luận như mấy thằng trader :))))

  • HỎi về bootcamp, học gì, kể ra… xong hỏi xoay quanh…

  • Em có biết kiến trức microservice ko, nó hoạt động như nào, như nào là một kiến trúc microservice tốt

  • So sánh Postgre và Mysql, thích cái nào hơn, tại sao, hỏi về Engen gì đó. Đoạn này chém gió hơi ác :>

  • So sánh MongoDB và Casandra

  • So sánh Airflow với Kestra, so sánh 2 cái vừa rồi với step function, tại sao, 1 đống cái tại sao…

  • So sánh PowerBI, Tablue, Looker. Cái nào tốt hơn, cái nào phù hợp cho doanh nghiệp nào, tại sao bank dùng cái nào tại sao cty khác dùng cái kia

  • So sánh Doris với gì đó, câu này mình lắc đầu luôn.

  • So sánh HADOP với S3, hỏi 1 loạt liên quan đến HDFS, …

  • Zabbix để làm gì, monitor cái gì, monitor như nào

  • Phân biệt có cấu trúc với ko có cấu trúc (câu này méo hiểu ông đấy hỏi gì ấy, vòng vo cực)

  • Biết gì về cloud, Các services,… Biết EKS ko, dùng EKS trong dự án nào rồi, usecase…

  • Hỏi 1 đống về AWS cứ dùng cái này dùng cái kia chưa

  • Hỏi về terraform, làm gì với nó rồi, cho bài toán thực tế, cài terraform trên aws như nào, đã cài gì rồi, …

  • Đam mê Crawl ko, crawl gì rồi, chỉ làm crawl được được ko

  • Biết crawl telegram ko.

  • Ở lab làm những gì, với ai, biết những gì, làm dự án gì, mô tả

  • Học đại số quan hệ chưa, quan hệ là gì (? ko hiểu sao quan hệ là các bảng) - Mẹe bh mới nhớ ra là ông đấy hỏi đại số quan hệ trong database :))))

  • Code C/C++ nhiều chưa, hỏi về project C/C++ trong cv

  • Hỏi các dự án ghi trong cv

  • Hỏi đồ án 1, tại sao, xong bảo luyên thuyên :))))

  • Tại sao lại chọn DE, hiểu biết gì về DE, DE thường làm gì,…

  • Muốn lương bao nhiêu, tuần đi làm được mấy buổi.

–> Chốt lại là mày làm DE thì phí, anh thấy mày nên theo hướng SA thì hơn sau phải đi thuyết phục người ta dùng công cụ nào công cụ kia, với nên viết cv ít tools thôi, nay a còn hỏi nhẹ, a mà hỏi sâu như mấy thằng HR khác là m đi lâu rồi

Top Câu Hỏi Phỏng Vấn Git và Câu Trả Lời Cho Tất Cả Level

  1. Kho lưu trữ Git là gì?
    Một kho lưu trữ Git là nơi lưu trữ các tệp của một dự án và lịch sử sửa đổi của chúng, giúp quản lý phiên bản bằng cách theo dõi các thay đổi theo thời gian. Nó có thể được đặt cục bộ trong một thư mục trên thiết bị của bạn hoặc trên một nền tảng trực tuyến như GitHub. Điều này cho phép người dùng cộng tác, quay lại các phiên bản trước đó và quản lý hiệu quả quá trình phát triển dự án bằng các lệnh như commit, push và pull.

  2. Git hoạt động như thế nào?
    Git hoạt động bằng cách ghi lại các thay đổi được thực hiện đối với các tệp và thư mục trong một dự án, chụp các ảnh chụp tức thời về tình trạng phát triển của nó. Người dùng có thể theo dõi các thay đổi, tạo các nhánh để phát triển đồng thời, hợp nhất các nhánh và quay lại các trạng thái trước đó nếu cần. Nó cũng thúc đẩy sự hợp tác và đảm bảo quản lý phiên bản hiệu quả trong các dự án phát triển phần mềm.

  3. Lệnh git add là gì?
    Lệnh git add được sử dụng trong Git để chuẩn bị các thay đổi cho việc đưa vào commit tiếp theo. Nó chuẩn bị các sửa đổi, thêm hoặc xóa được thực hiện đối với các tệp trong thư mục làm việc, đánh dấu chúng để bao gồm trong ảnh chụp commit sắp tới. Lưu ý rằng lệnh này không thực sự commit các thay đổi mà chỉ chuẩn bị chúng cho quá trình dàn xếp.

  4. Lệnh git push là gì?
    Lệnh git push được sử dụng trong Git để tải nội dung của kho lưu trữ cục bộ lên một kho lưu trữ từ xa. Nó chuyển các thay đổi đã được commit từ kho lưu trữ cục bộ lên một kho lưu trữ từ xa, thường là trên một máy chủ như GitHub hoặc GitLab. Lệnh này cho phép cộng tác bằng cách cho phép người dùng chia sẻ các thay đổi của họ với những người khác trong cùng một dự án.

  5. Lệnh git status là gì?
    Lệnh git status hiển thị trạng thái hiện tại của kho lưu trữ trong Git. Nó cung cấp thông tin về các tệp đã được sửa đổi, những tệp đã được chuẩn bị cho commit tiếp theo và những tệp chưa được theo dõi. Nó giúp người dùng theo dõi tiến độ công việc của họ và xác định bất kỳ thay đổi nào cần được commit hoặc chuẩn bị.

  6. Commit trong Git là gì?
    Một commit là một ảnh chụp tức thời về các thay đổi được thực hiện đối với các tệp trong một kho lưu trữ tại một thời điểm cụ thể. Khi bạn commit các thay đổi trong Git, bạn đang thực sự lưu trữ trạng thái hiện tại của các tệp và có thể cung cấp một thông điệp mô tả các thay đổi đã thực hiện (điều này được khuyến nghị).
    Mỗi commit tạo ra một mã định danh duy nhất, cho phép bạn theo dõi lịch sử thay đổi trong kho lưu trữ. Commit đóng vai trò quan trọng trong việc quản lý phiên bản, vì chúng cung cấp cách để quay lại các trạng thái trước đó của dự án, xem xét lịch sử thay đổi và cộng tác với người khác bằng cách chia sẻ các cập nhật.

  7. Phân nhánh trong Git là gì?
    Phân nhánh là việc tạo ra một nhánh riêng biệt từ dòng phát triển chính (thường được gọi là nhánh “master”) để làm việc trên các tính năng mới, sửa lỗi hoặc thử nghiệm mà không ảnh hưởng đến cơ sở mã chính. Nó cho phép nhiều dòng phát triển song song tồn tại trong cùng một kho lưu trữ.
    Mỗi nhánh đại diện cho một dòng phát triển riêng biệt với tập hợp các commit của riêng nó, cho phép các nhà phát triển làm việc trên các tính năng hoặc sửa lỗi khác nhau cùng một lúc. Phân nhánh tạo điều kiện thuận lợi cho sự hợp tác, thử nghiệm và tổ chức trong một dự án, vì các thay đổi được thực hiện trong một nhánh có thể được hợp nhất trở lại với cơ sở mã chính khi chúng hoàn thành và được kiểm tra.