Xin chào các bạn, Mình là M1shka, hiện tại mình đang theo học Data analytics cũng như Business Analytics tại Deakin University. Hiện tại mình thấy có khá nhiều nhầm lẫn trong các khái niệm về DA, DS, BA kể cả trên các bài báo lớn. Nhân dịp có forum mới mình xin được mạn phép đăng một bài phân biệt các khái niệm này dựa trên cơ sở những gì mình học được từ cả 2 chương trình. Mong các bạn và các anh chị chỉ giáo thêm.
Chẳng phải ngẫu nhiên mà Article của Harvard Business Review liên tục được nhắc đi nhắc lại để nói về sự hấp dẫn của một ngành khoa học/ một nghề nghiệp mới và gọi nó với 1 cái tên rất gợi cảm – The sexiest job of the 21st century. Trong một diễn biến khác, người ta lại nhắc đến cái nghề này như tình dục tuổi teen vậy.
Thực tế thì khá nhiều người nhầm lẫn về công việc của 1 Data Scientist và luôn luôn nhầm lẫn họ với những người làm việc với Big Data khác. Điều này cũng không thể tránh khỏi vì trên thực tế, tùy vào tình hình của từng công ty mà một người xử lý Big Data sẽ phải làm một hoặc nhiều công việc. Điều này là đương nhiên vì với một công ty lớn, họ sẵn sàng thuê nhiều người để chuyên môn hóa từng công việc một, ngược lại, đối với một công ty nhỏ, họ sẽ chỉ có thể thuê ít người hơn và những người đó phải làm nhiều công việc hơn.Do đó, khá nhiều người, đa số là các bạn trẻ mong muốn làm việc trong ngành có thể nói là ngôi sao đang lên trong cuộc cách mạng công nghiệp 4.0 thường hay nhầm lẫn và nhiều khi trang bị kiến thức bị thiếu hoặc thừa so với công việc mà họ hướng tới. Sau đây là một vài khái niệm và sự phân biệt giữa các công việc cụ thể được chia theo từng giai đoạn xử lý Big Data.
1. Data Engineering – Data Analytics – Data Science
3 công việc trên tương ứng với 3 giai đoạn xử lý dữ liệu, cũng tương ứng với ba hướng phát triển nghề nghiệp trong lĩnh vực Big Data.
Data Engineering: Đây là phần công việc liên quan đến xử lý dữ liệu đầu vào, bao gồm thu thập, lưu trữ, phân quyền truy cập và có thể là cleansing dữ liệu trước khi đưa vào quá trình phân tích. Data Engineering về thực chất có công việc khá giống với quản trị hệ thống thông tin trước đây (Information System Management system). Tuy nhiên họ cần phải communicate khá tốt với bộ phân Analytics về việc dữ liệu nào cần thiết cho quá trình phân tích và cleansing dữ liệu ra sao.
Data Analytics: Đây là phần công việc có lẽ là best of both world và gần như đa số các bạn nghĩ về Big Data sẽ hướng tới công việc này trong tương lai. Công việc của 1 Data Analyst sẽ là dùng trí tưởng tượng và sự tò mò của mình để thu thập được càng nhiều insight từ Data càng tốt. Kỹ năng của Data Analyst được chia làm 2 nhánh chính là Descriptive Analytics và Predictive Analytics. Đối với Descriptive Analytics, chủ yếu Analyst cần phải trình bày báo cáo một cách khoa học bằng các visualization của Data. Đối với Predictive Analytics, Analyst cần hiểu được các thuật toán dự báo, đọc các tham số trả về để điều chỉnh các thuật toán nhằm dự đoán được kết quả chính xác nhất. Tuy nhiên Data Analyst cũng chưa phải là nghề được trả lương cao nhất trong lĩnh vực Big Data. Thực tế, Data Analyst áp dụng các thuật toán có sẵn được built in sẵn trong code hoặc phần mềm. Vậy ai là người phát triển những thuật toán đó, bạn thử đoán xem!
Data Scientist: Vâng, đây chính là bộ não của Big Data, họ là những người được nhận lương cao nhất trong lĩnh vực này. Mức lương khởi điểm của 1 Data Scientist có thể lên tới hơn 100k Mẽo tệ một năm. Thường những người được điểm danh trong danh sách này đều có ít nhất 1 bằng PhD. Công việc của họ chính là phát triển những thuật toán cho các Data Analyst sử dụng. Một công việc tốn vô cùng nhiều não và nhiều năm rèn luyện. Đây mới chính là phần “sexy” mà bài viết của Harvard Business Review nhắc tới.
2. Data Analytics vs Business Analytics
Phần này mình muốn nhắc tới vì mình cũng từng học qua cả 2 ngành này ở trường. Sau kỳ đầu tiên học Business Analytics mình chuyển sang học Data Analytics ngay lập tức. Nhiều bạn có thể nhìn vào 2 cái tên này sẽ thấy chẳng có nhiều khác biệt giữa hai ngành này lắm, và cũng sẽ nghĩ công việc nó như nhau hết. Thực ra thì về cơ bản hai ngành cũng khá giống nhau, đều học những kỹ thuật phân tích descriptive và predictive. Tuy nhiên những điểm khác nhau giữa hai ngành lại thuộc về tính chất công việc của hai ngành cụ thể như sau:
Business Analytics: Trọng tâm công việc như cái tên nói lên tất cả đó là đi vào phân tích dữ liệu kinh doanh, phát hiện ra những insight trong kinh doanh để đưa ra quyết định. Chính vì vậy ngành này đào tạo chuyên sâu vào kỹ năng thu thập, xử lý thông tin, data từ kinh doanh và phương pháp ra quyết định dựa trên các phân tích đó.
Data Analytics: Đây có thể nói là ngành rộng của Biz Analytics vì chương trình học hướng tới việc phân tích các loại Data chứ không riêng gì dữ liệu trong kinh doanh. Vì thế những kỹ thuật phân tích sâu hơn về Data được truyền đạt trong chương trình này, thay vì các kỹ năng về Business Intelligence hay Decision making. Do tính chất của Data trong kinh doanh là cần được đưa ra nhanh và xử lý rất nhanh để có thể kịp thời hành động vì vậy thường những kỹ thuật quá cao cấp không cần và cũng không nên đụng đến vì tốn quá nhiều thời gian vì vậy nó được skip đối với các Business Analyst.