Theory
- DA is developmenter, bult, test and contain knowledge: database, process big system
- DA process raw data contain error of people, machine or tool.
Tools, language and software
Foreign
- SAP, Oracle, Cassandra, MySQL, Redis, Riak, PostgreSQL, MongoDB, neo4j, Hive, and Sqoop
- A point the same with Data science is Scala, Java, C#
- Have a lot of knowlegde about computer engineering, operate, sensitive(nhạy bén) in business
Domestic(Nội địa)
- Data warehouse $ ETL(Extract, Transform, Load—Trích suất-Biến đổi—Tải)
- Advance Knowledge Program
- Analyst based on Hadoop
- Knowledge in-depth about SQL / data base
- Data architecture $ pipelining, process data folow string, make song song or folow time
- Machine learing
- write the script(kịch bản), report, visualization
Role
- Development, test, and contain knowledge
- Knowledgeable about program and complication(sự phức tạp) of algorithm
- Deploy ML & statistical model and flexible(tính linh hoạt) data
- Bult pipelines for actives ETL diffcilt
- Make sure accuracy
Salary
Up to 124k$ / year. And maximum of it 341k$ / year
what do you need to do
- we can’t deverlop cái gì mới hơn thay vào đó hay tận dụng những cái mà người ta đã thành công rồi.
- cta phải tìm đc cách để hỏi, nhiều khi người ta ko biết là người ta muốn gì
code data pipeline, build datawarehouse, data platform, data quality.
Sql ngôn ngữ truy vấn dữ liệu
Khi thu thập dữ liệu xong phải làm sạch dữ liệu, khám phá nó tìm hiểu dữ liệu thỏa mãn câu hỏi chưa. Xây dựng các model đánh giá kiểm định lại xem phù hợp hay chưa
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Comment