Business Analyst, Data Analyst, Data Scientist, what are the differences?


#1

Xin chào các bạn, Mình là M1shka, hiện tại mình đang theo học Data analytics cũng như Business Analytics tại Deakin University. Hiện tại mình thấy có khá nhiều nhầm lẫn trong các khái niệm về DA, DS, BA kể cả trên các bài báo lớn. Nhân dịp có forum mới mình xin được mạn phép đăng một bài phân biệt các khái niệm này dựa trên cơ sở những gì mình học được từ cả 2 chương trình. Mong các bạn và các anh chị chỉ giáo thêm.

Chẳng phải ngẫu nhiên mà Article của Harvard Business Review liên tục được nhắc đi nhắc lại để nói về sự hấp dẫn của một ngành khoa học/ một nghề nghiệp mới và gọi nó với 1 cái tên rất gợi cảm – The sexiest job of the 21st century. Trong một diễn biến khác, người ta lại nhắc đến cái nghề này như tình dục tuổi teen vậy.

Thực tế thì khá nhiều người nhầm lẫn về công việc của 1 Data Scientist và luôn luôn nhầm lẫn họ với những người làm việc với Big Data khác. Điều này cũng không thể tránh khỏi vì trên thực tế, tùy vào tình hình của từng công ty mà một người xử lý Big Data sẽ phải làm một hoặc nhiều công việc. Điều này là đương nhiên vì với một công ty lớn, họ sẵn sàng thuê nhiều người để chuyên môn hóa từng công việc một, ngược lại, đối với một công ty nhỏ, họ sẽ chỉ có thể thuê ít người hơn và những người đó phải làm nhiều công việc hơn.

Do đó, khá nhiều người, đa số là các bạn trẻ mong muốn làm việc trong ngành có thể nói là ngôi sao đang lên trong cuộc cách mạng công nghiệp 4.0 thường hay nhầm lẫn và nhiều khi trang bị kiến thức bị thiếu hoặc thừa so với công việc mà họ hướng tới. Sau đây là một vài khái niệm và sự phân biệt giữa các công việc cụ thể được chia theo từng giai đoạn xử lý Big Data.

1. Data Engineering – Data Analytics – Data Science

3 công việc trên tương ứng với 3 giai đoạn xử lý dữ liệu, cũng tương ứng với ba hướng phát triển nghề nghiệp trong lĩnh vực Big Data.

Data Engineering: Đây là phần công việc liên quan đến xử lý dữ liệu đầu vào, bao gồm thu thập, lưu trữ, phân quyền truy cập và có thể là cleansing dữ liệu trước khi đưa vào quá trình phân tích. Data Engineering về thực chất có công việc khá giống với quản trị hệ thống thông tin trước đây (Information System Management system). Tuy nhiên họ cần phải communicate khá tốt với bộ phân Analytics về việc dữ liệu nào cần thiết cho quá trình phân tích và cleansing dữ liệu ra sao.

Data Analytics: Đây là phần công việc có lẽ là best of both world và gần như đa số các bạn nghĩ về Big Data sẽ hướng tới công việc này trong tương lai. Công việc của 1 Data Analyst sẽ là dùng trí tưởng tượng và sự tò mò của mình để thu thập được càng nhiều insight từ Data càng tốt. Kỹ năng của Data Analyst được chia làm 2 nhánh chính là Descriptive Analytics và Predictive Analytics. Đối với Descriptive Analytics, chủ yếu Analyst cần phải trình bày báo cáo một cách khoa học bằng các visualization của Data. Đối với Predictive Analytics, Analyst cần hiểu được các thuật toán dự báo, đọc các tham số trả về để điều chỉnh các thuật toán nhằm dự đoán được kết quả chính xác nhất. Tuy nhiên Data Analyst cũng chưa phải là nghề được trả lương cao nhất trong lĩnh vực Big Data. Thực tế, Data Analyst áp dụng các thuật toán có sẵn được built in sẵn trong code hoặc phần mềm. Vậy ai là người phát triển những thuật toán đó, bạn thử đoán xem!

Data Scientist: Vâng, đây chính là bộ não của Big Data, họ là những người được nhận lương cao nhất trong lĩnh vực này. Mức lương khởi điểm của 1 Data Scientist có thể lên tới hơn 100k Mẽo tệ một năm. Thường những người được điểm danh trong danh sách này đều có ít nhất 1 bằng PhD. Công việc của họ chính là phát triển những thuật toán cho các Data Analyst sử dụng. Một công việc tốn vô cùng nhiều não và nhiều năm rèn luyện. Đây mới chính là phần “sexy” mà bài viết của Harvard Business Review nhắc tới.

2. Data Analytics vs Business Analytics

Phần này mình muốn nhắc tới vì mình cũng từng học qua cả 2 ngành này ở trường. Sau kỳ đầu tiên học Business Analytics mình chuyển sang học Data Analytics ngay lập tức. Nhiều bạn có thể nhìn vào 2 cái tên này sẽ thấy chẳng có nhiều khác biệt giữa hai ngành này lắm, và cũng sẽ nghĩ công việc nó như nhau hết. Thực ra thì về cơ bản hai ngành cũng khá giống nhau, đều học những kỹ thuật phân tích descriptive và predictive. Tuy nhiên những điểm khác nhau giữa hai ngành lại thuộc về tính chất công việc của hai ngành cụ thể như sau:

Business Analytics: Trọng tâm công việc như cái tên nói lên tất cả đó là đi vào phân tích dữ liệu kinh doanh, phát hiện ra những insight trong kinh doanh để đưa ra quyết định. Chính vì vậy ngành này đào tạo chuyên sâu vào kỹ năng thu thập, xử lý thông tin, data từ kinh doanh và phương pháp ra quyết định dựa trên các phân tích đó.

Data Analytics: Đây có thể nói là ngành rộng của Biz Analytics vì chương trình học hướng tới việc phân tích các loại Data chứ không riêng gì dữ liệu trong kinh doanh. Vì thế những kỹ thuật phân tích sâu hơn về Data được truyền đạt trong chương trình này, thay vì các kỹ năng về Business Intelligence hay Decision making. Do tính chất của Data trong kinh doanh là cần được đưa ra nhanh và xử lý rất nhanh để có thể kịp thời hành động vì vậy thường những kỹ thuật quá cao cấp không cần và cũng không nên đụng đến vì tốn quá nhiều thời gian vì vậy nó được skip đối với các Business Analyst.


#2

Cảm ơn những thông tin hữu ích của bạn. Ngoài những sự khác biệt trên, những Data professions này cũng có những skills khác nhau. Mặc dù vậy Data Analyst là gần với Data Scientits nhất. Thông tin cụ thể hơn: http://blog.udacity.com/wp-content/uploads/2017/06/Data-Career-Guide-Udacity-2017-06-13.pdf


#3

Em chào Anh/ Chị M1shka,

Sắp tới em có dự định học Master ngành Big Data Analysis ở Ba Lan, tuy nhiên do e học bachelor ngành tài chính ngân hàng, trường bên Balan có entry test, em ko rõ đề thi đầu vào ngành này sẽ hỏi những vấn đề gì ạ?


#4

Thực ra phần đau đầu nhất của Data Scientist là làm sao manipulate được dữ liệu, vì thời điểm hiện tại, hầu hết nhắc đến Data Science là nhắc đến Big Data. Data Scientist mà chỉ biết mỗi Algorithm thì chỉ nên gọi là machine learning researcher. Làm DS thì scope phải nắm đc là rất rộng. Phân tách rạch ròi ra 3 roles là DE, DA và DS gọi là cho dễ chia task, chứ bản chất hiện tại DS đều phải cân đc cả 3 món:

  1. Làm sao để lọc tách, xử lý được tập dữ liệu cỡ lớn, gán nhãn dữ liệu.
  2. Visualize phân bố của dữ liệu, visualize kết quả.
  3. Xây dựng và thử nghiệm các thuật toán, trình bày kết quả với phía client. Nếu nói DS là phần tốn vô cùng nhiều não thì đang nói đến việc DS phải nắm đc cả 3 đoạn này. Chứ nếu chỉ spend time vào phần thử nghiệm model thì nó cũng không mất quá nhiều năm kinh nghiệm như vậy. Trong industry thì ràng buộc bởi nhiều yếu tố, nên ko phải chỉ chăm chăm cải thiện model performance mà còn rất nhiều metrics khác phải tính đến. DS trong industry ko phải làm việc với dataset sạch sẽ chỉ tầm vài GB như trên kaggle, cũng ko phải chỉ cần quan tâm đến mấy chỉ số Precision, Recall, F1, MSE, MAE… Tóm lại, ý mình là: DS là một nghề yêu cầu rất nhiều skills (thế nên nó mới đc trả lương cao như vậy), và cũng ko nên phân tách rạch ròi ra DS chỉ làm model, phần visualize có DA, phần data có DE.

#5

Cảm ơn bài viết bổ ích của bạn trong việc phân tích sự khác nhau giữa các vị trí khác nhau. Mình thật sự gặp rất nhiều trường hợp đang nhầm lẫn giữa những vị trí này đặc biệt là Data Analyst và Business Analyst. Vậy nên mình cũng muốn chia sẻ thêm thông tin cụ thể về công việc cũng như là yêu cầu của một Data Analyst để các bạn mới hiểu rõ hơn về nghề này. Bài viết khá dài nên các bạn tham khảo tại blog này nhé Data-Fun.com.

Nội dung sẽ bao gồm:

  1. Lương của Data Analyst là bao nhiêu (Data Analyst Salary)?
  2. Cụ thể Data Analysis là gì?
  3. Phải học gì để có thể trở thành Data Analyst?
  4. Công việc cụ thể của một Data Analyst là gì?
  5. Cơ hội phát triển nghề nghiệp ra sao?
  6. Tại sao bạn nên theo ngành Data Analyst?