Theory

  • DA is developmenter, bult, test and contain knowledge: database, process big system
  • DA process raw data contain error of people, machine or tool.

Tools, language and software

Foreign

  • SAP, Oracle, Cassandra, MySQL, Redis, Riak, PostgreSQL, MongoDB, neo4j, Hive, and Sqoop
  • A point the same with Data science is Scala, Java, C#
  • Have a lot of knowlegde about computer engineering, operate, sensitive(nhạy bén) in business

Domestic(Nội địa)

  • Data warehouse $ ETL(Extract, Transform, Load—Trích suất-Biến đổi—Tải)
  • Advance Knowledge Program
  • Analyst based on Hadoop
  • Knowledge in-depth about SQL / data base
  • Data architecture $ pipelining, process data folow string, make song song or folow time
  • Machine learing
  • write the script(kịch bản), report, visualization

Role

  • Development, test, and contain knowledge
  • Knowledgeable about program and complication(sự phức tạp) of algorithm
  • Deploy ML & statistical model and flexible(tính linh hoạt) data
  • Bult pipelines for actives ETL diffcilt
  • Make sure accuracy

Salary

Up to 124k$ / year. And maximum of it 341k$ / year

what do you need to do

  • we can’t deverlop cái gì mới hơn thay vào đó hay tận dụng những cái mà người ta đã thành công rồi.
  • cta phải tìm đc cách để hỏi, nhiều khi người ta ko biết là người ta muốn gì

code data pipeline, build datawarehouse, data platform, data quality.
Sql ngôn ngữ truy vấn dữ liệu
Khi thu thập dữ liệu xong phải làm sạch dữ liệu, khám phá nó tìm hiểu dữ liệu thỏa mãn câu hỏi chưa. Xây dựng các model đánh giá kiểm định lại xem phù hợp hay chưa