LÀM SAO ĐỂ TRỞ THÀNH MỘT NGƯỜI LÀM PHÂN TÍCH DỮ LIỆU – ANALYTICS PROFESSIONAL (BA/DA/BI)?

Đầu tiên, nếu bạn chưa hiểu rõ sự khác nhau giữa các khái niệm Business Analyst (BA), Data Analyst (DA), Business Intelligence (BI), mình đề xuất bạn dành thời gian đọc kỹ bài viết “BỨC TRANH TOÀN CẢNH CÁC CÔNG VIỆC XOAY QUANH PHÂN TÍCH DỮ LIỆU”. Bạn không nhất thiết phải đọc bài viết kia để có thể hiểu hết phần còn lại của bài viết này.

Một cách tóm lược, BI là một quá trình chuyển hóa dữ liệu thành thông tin hỗ trợ ra quyết định. BA có thể hiểu là chức danh chuyên viên phân tích của từng bộ phận chức năng cụ thể. Tại Việt Nam, chúng ta sẽ dễ dàng bắt gặp các chức danh công việc như chuyên viên phân tích kinh doanh (Sales Analyst), vận hành (Ops Analyst), sản phẩm (Product Analyst), tài chính (Financial Analyst) và thậm chí có nhiều chức danh công việc không có chữ phân tích hay dữ liệu nào nhưng mô tả công việc lại bao hàm việc sử dụng thành thạo dữ liệu để thực hiện công việc được giao. DA có thể hiểu là chức danh chuyên viên phân tích hỗ trợ toàn tổ chức ở tầng quản lý trở lên. DA cũng thường được gọi là BI Analyst và cũng được xem là vị trí bậc tiếp theo của BA khi đi chuyên sâu về phân tích dữ liệu.

Giá trị cốt lõi của việc phân tích

Tiếp theo, bạn có thể thấy rằng, việc tổ chức cần đến sự có mặt của những người làm phân tích là một điều đã trở nên khá hiển nhiên vì những lợi ích to lớn mà dữ liệu mang lại để giúp tổ chức phát triển vượt bậc trong tương lai. Cụ thể hơn, các cá nhân làm phân tích dữ liệu được kỳ vọng là có khả năng:

  1. Tập hợp được dữ liệu cần thiết
  2. Thể hiện dữ liệu một cách dễ hiểu
  3. Đưa ra những đề xuất hỗ trợ ra quyết định

Miễn là bạn đáp ứng được 3 kỳ vọng trên (mình tạm gọi là “giá trị cốt lõi của việc phân tích”) thì bạn đã có thể tự tin vào khả năng phân tích dữ liệu của mình dù cho bạn sử dụng bất kỳ công cụ, ngôn ngữ lập trình, hay kỹ thuật mô hình hóa chuyên sâu nào. Bạn sẽ rất dễ bắt gặp những cuộc tranh luận hết sức gay cấn về việc một người làm phân tích thì phải biết các ngôn ngữ lập trình như SQL và Python, v.v hay chỉ cần Excel và Power BI, v.v là đủ để làm việc. Trước khi đi vào chi tiết để đánh giá xem bạn sẽ cần học cái gì là phù hợp nhất, mình xin kể bạn nghe một câu chuyện về một cuộc đối thoại ngắn giữa (A) trưởng nhóm chăm sóc khách hàng – Customer Experience Leader và (B) nhà khoa học dữ liệu – Data Scientist.

  • A: Nhìn này, báo cáo đang chỉ ra rằng có sự liên quan mật thiết giữa “độ dài cuộc hội thoại của nhân viên và khách hàng” với “tỉ lệ khách hàng đặt hàng” và nó cho thấy chúng ta có vấn đề vì tỉ lệ khách đặt hàng sau khi nói chuyện với nhân viên chăm sóc khách hàng đang rất thấp.
  • B: Để mình và các đồng đội trong phòng phân tích sẽ triển khai một trợ lý ảo thông minh có khả năng đề xuất cho nhân viên chăm sóc khách hàng các câu trả lời phù hợp với cuộc hội thoại hiện tại dựa vào cách thức mà khách hàng đang giao tiếp. Việc này sẽ giúp nhân viên giao tiếp đúng trọng tâm hơn, và từ đó sẽ giúp chỉ số đặt hàng của công ty chúng ta tăng trưởng.
  • A: Tuyệt vời. Mình sẽ làm một phân tích theo dõi để so sánh trước và sau khi chúng ta triển khai trợ lý ảo này.

Trong cuộc đối thoại trên, bạn thấy rằng mình hoàn toàn không đề cập tới một công cụ cụ thể nào mặc dù bạn có thể tự mặc định là A đang xem Dashboard trên Power BI với dữ liệu được trích xuất từ Database thông qua ngôn ngữ SQL. Còn B sẽ ứng dụng ngôn ngữ lập trình Python cũng như kiến thức chuyên sâu hơn về Machine Learning để tạo ra trợ lý ảo.

Liệu bạn có nghĩ rằng đây chỉ là một cuộc hội thoại bình thường trong một tổ chức mà không phải là công ty start-up công nghệ hay ngân hàng? A hoàn toàn có thể sử dụng Excel để tạo ra những bản phân tích trước và sau thay đổi. Còn B thì có thể chẳng hề viết lấy một dòng lệnh nào mà sử dụng các nền tảng dịch vụ chuyên sâu của Microsoft, Google, Amazon, v.v để kéo và thả ra được trợ lý ảo với các điều kiện như đã trao đổi trong cuộc đối thoại trên.

Yếu tố thứ 1: Môi trường làm việc

Điểm mấu chốt mà mình muốn nói đến đó là vấn đề mà tổ chức đang cần giải quyết và nguồn lực mà tổ chức đang có ra sao. Nếu bạn ở trong một tổ chức thuộc nhóm công ty start-up công nghệ hay tài chính ngân hàng, thì bạn đang sống trong một môi trường mà cơ sở dữ liệu tồn tại rất nhiều. Để có thể trích xuất dữ liệu được từ các hệ thống vận hành trong các tổ chức này, bạn sẽ có thể được yêu cầu là biết về ngôn ngữ SQL hay Python nếu bạn là một DA. Còn nếu bạn là một BA, đội ngũ IT hoặc DA sẽ chuẩn bị dữ liệu bao gồm tất cả những gì bạn cần và bạn chỉ việc lấy cái đó ra với một dòng lệnh SQL cơ bản là “SELECT * FROM clean_table” dưới dạng một File CSV hoặc vào thẳng Excel thông qua Power Query. Sau khi dữ liệu được trích xuất thành công, bạn sẽ cần phải trình bày dữ liệu này cho cấp trên hoặc có khi là cho chính bản thân bạn. Công cụ bạn cần có sẽ có thể vẫn chỉ là Excel hoặc là Power BI hoặc thậm chí bạn thích dùng Python thì bạn có thể dùng. Miễn là bạn luôn hướng về “giá trị cốt lõi của việc phân tích” như đã đề cập ở trên.

Nếu bạn ở trong một tổ chức không thuộc nhóm trên và cũng không phải là chi nhánh của các tập đoàn đa quốc gia, thế giới của bạn sẽ không tồn tại cơ sở dữ liệu để mà sử dụng SQL đâu. Hoặc nếu có tồn tại thì cơ sở dữ liệu đó thường là một phần đi kèm của một hệ thống vận hành nào đó mà bạn cũng không thể truy cập được vì nhiều lý do kỹ thuât (mình đề xuất bạn dành thời gian đọc kỹ bài viết “TẠI SAO AI CŨNG NÊN HỌC KỸ NĂNG PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS)?” để hiểu về 3 nhóm tổ chức mà mình đang phân loại dựa vào giai đoạn phân tích mà tổ chức đó khả năng cao là đang trải qua). Như vậy, dữ liệu của bạn đang ở nhiều phòng ban, trong nhiều File Excel khác nhau, và điểm quan trọng là mọi người xung quanh bạn đang giao tiếp với nhau bằng File Excel. Liệu biết Python để tổng hợp dữ liệu và trình bày trên một ứng dụng khá chuyên biệt như Jupiter Notebook sẽ khiến mọi người xung quanh nể phục. Xác xuất cao là bạn sẽ cảm thấy mình cực kỳ lạc lỏng.

Yếu tố thứ 2: Cảm nhận kinh doanh

Làm cách nào mà để từ các con số hay các biểu đồ mà có thể đưa ra đề xuất hoặc quyết định kinh doanh?

Đây là câu hỏi mà có thể bạn trăn trở khá nhiều vào những ngày đầu theo đuổi nghề nghiệp phân tích dữ liệu. Khi nói tới việc đưa ra đề xuất hay một quyết định kinh doanh cụ thể, bạn bắt buộc cần phải hiểu được mô hình kinh doanh của tổ chức mà bạn đang làm việc bao gồm các yếu tố như

  1. Các sản phẩm chủ đạo mà tổ chức bạn đang kinh doanh là gì?
  2. Các đối tượng khách hàng tiềm năng mà tổ chức bạn đang hướng tới là ai?
  3. Các kênh phân phối của sản phẩm tới khách hàng gồm những gì?
  4. Các phương thức truyền thông tiếp cận khách hàng ra sao?
  5. Các đối tác làm việc cùng với tổ chức bạn là ai?
  6. Các hoạt động và quy trình vận hành chủ đạo diễn ra trong tổ chức bạn như thế nào?
  7. Cơ cấu tổ chức của bạn đang chia ra như thế nào?
  8. Cơ cấu doanh thu của tổ chức bạn ra sao?
  9. Cơ cấu chi phí của tổ chức bạn ra sao?

Bạn hãy đọc thêm về “Business Model Canvas” để tăng cường độ nhạy với hoạt động kinh doanh của mình (còn gọi là “Business Sense”). Đây là một phạm trù mà bạn sẽ cần hiểu rất rõ trong vòng vài tháng tới vài năm để có thể sẵn sàng lên vị trí quản lý trong mảng phân tích dữ liệu.

Tư duy (Mindset) và cách tiếp cận vấn đề (Framework) cần có là gì để có thể định hướng trả lời nhanh chóng cho các vấn đề sử dụng dữ liệu?

Công cụ thì có thể học rất dễ dàng, nhưng khi nói tới tư duy hay cách tiếp cận vấn đề thì bạn sẽ cần phải được tiếp cận và tự trải nghiệm. Tức là biết về khái niệm và thực hành khái niệm đó.

Tiếp cận có nghĩa là bạn cần phải biết và hình dung được điều mà bạn chưa biết (“Bạn không biết rằng bạn không biết”). Nghe thì có vẻ rất trừu tượng nhưng bạn có thể hình dung nó qua ví dụ đơn giản sau. Nếu bạn chưa từng nghe nói tới các cạm bẫy phân tích (Decision Biases) nghĩa là có một phần tư duy quan trọng của người làm phân tích mà bạn chưa được tiếp cận. Hay khi bạn chưa từng nghe tới 4 loại phân tích (Analytics Type), bạn sẽ không hình dung được mình đang làm gì và còn phải làm gì.

Tự trải nghiệm nghĩa là dù bạn đã tiếp cận được phần tư duy này rồi, nó không có nghĩa là bạn đã làm chủ và thực hành thành thạo nó. Khác với học sử dụng công cụ, khi bạn đã học là bạn đã biết dùng gần như là thành thạo cái chức năng mà bạn đã học. Tư duy và cách tiếp cận vấn đề cần thời gian để thành thạo.

Yếu tố thứ 3: Các kỹ năng thiết yếu

Những kỹ năng thiết yếu để bạn theo đuổi nghề nghiệp phân tích chuyên nghiệp không chỉ có kỹ năng sử dụng công cụ hay phần mềm cụ thể nào đó. Bạn còn cần phải trau dồi thêm về:

  1. Tư duy phản biện và phương pháp đặt câu hỏi (critical thinking)
  2. Tư duy làm việc với dữ liệu (data-driven mindset)
  3. Tư duy học hỏi liên tục (growth mindset)
  4. Kỹ năng giải quyết vấn đề và thiết kế giải pháp tổng hợp (problem solving)
  5. Kỹ năng vẽ phác thảo cơ bản (sketching)
  6. Kỹ năng giao tiếp và phản biện (communication and debate)
  7. Kỹ năng quản lý dự án (project management)
  8. Kiến thức về hệ thống lưu trữ và quản lý dữ liệu (DBMS: Azure, Bigquery, v.v)
  9. Kiến thức về các công cụ chuyên dụng khi làm việc với dữ liệu (Excel, Power BI, v.v)
  10. Kiến thức cơ bản về ngôn ngữ lập trình, ngôn ngữ truy vấn dữ liệu có cấu trúc bảng và không có cấu trúc bảng (VBA, SQL, Python, v.v)

Yếu tố thứ 4: Công cụ chuyên dụng

Phần lớn mọi người khi bắt đầu hoặc chuyển hướng sang các nghề về phân tích dữ liệu thường hay rơi vào “vòng xoáy công cụ”, tức là học hết công cụ này tới công cụ khác mà không thực sự hiểu một cách sâu xa rằng khi nào thì mới phải dùng tới công cụ này. Một lời khuyên cho bạn đó là có rất nhiều công cụ có chức năng tương tự nhau được áp dụng vào trong mảng phân tích dữ liệu trong doanh nghiệp. Nếu muốn học cụ thể thì cần phải biết chính xác công ty đó dùng công cụ gì. Chính vì vậy mà bạn chỉ nên học công cụ có tính phổ quát cao nhất để kiến thức có thể dễ dàng áp dụng chuyển đổi theo tình hình thực tế. Ngoài ra, nếu có “Người hướng dẫn” (Mentor) thì việc hỏi và nhận câu trả lời sẽ giúp tăng tốc khả năng tự học lẫn khả năng tra cứu Google lên gấp nhiều lần so với việc tự mày mò hoặc tự đăng ký học một khóa nào đó về công cụ mà không có sự hướng dẫn và tìm hiểu đầy đủ.

Việc sử dụng công cụ gì phụ thuộc vào mục đích mà bạn đang muốn thực hiện. Một cách nói khác đó là bạn đang ở bước nào của quy trình chuyển hóa dữ liệu thành thông tin hỗ trợ ra quyết định. Để ghi nhớ một cách cô đọng thì quy trình này gồm có 3 bước chính:

  1. Chuẩn bị dữ liệu: bao gồm các công việc liên quan tới tự động hóa làm sạch và chuyển đổi dữ liệu.
    1. Data Profiling: định danh dữ liệu
    2. Data Cleaning: làm sạch dữ liệu
    3. Data Storing: lưu trữ dữ liệu
  2. Tổ chức dữ liệu: bao gồm các công việc liên quan tới tự động hóa liên kết và tính toán.
    1. Data Consolidating: tổng hợp dữ liệu
    2. Data Formulating: tính toán dữ liệu
    3. Data Pipelining: cập nhật dữ liệu
  3. Phân tích dữ liệu: bao gồm các công việc liên quan tới tự động hóa biểu đồ và cập nhật.
    1. Data Visualizing: thể hiện dữ liệu
    2. Data Analyzing: phân tích dữ liệu
    3. Decision Making Using Data: ra quyết định bằng dữ liệu.

Công cụ có tính phổ quát và thứ tự ưu tiên nghiên cứu

  1. Đối với bước 1, Excel Power* > SQL > Python
  2. Đối với bước 2, Excel Power* > Power BI > Python
  3. Đối với bước 3, Excel Power* > Power BI > Python

(Excel Power* là một tập hợp các chức năng chuyên sâu trên Excel cho mục đích làm việc với dữ liệu và phân tích bao gồm có Power Query, Power Pivot và Power Visual – Đây không phải là các kiến thức Excel thông dụng).

Như vậy, nếu bạn là một người mới, hoàn toàn chưa có kinh nghiệm gì về làm việc chuyên sâu và phân tích dữ liệu. Bạn nên chọn phát triển kỹ năng Excel Power vì bản chất là Microsoft đã thiết kế hết sức công phu và cực kỳ thành công trong việc giới thiệu các khái niệm đặc thù về mảng này thông qua các chức năng mới trên một công cụ mà hầu hết mọi người đều có thể tiếp cận được và phổ biến toàn cầu đó là Excel. Không phải tự nhiên mà Excel lại có mặt trong danh sách các công cụ chuyên dụng về Business Intelligence. Và càng không phải tự nhiên mà số lượng người dùng công cụ này một cách chuyên sâu trên toàn thế giới lại cực kỳ đông đảo. Bạn có thể dễ dàng trao đổi các chủ đề này với các chuyên gia quốc tế và trên các diễn đàn quốc tế của Microsoft.

Lộ trình trở thành một người làm phân tích dữ liệu – Analytics Professional (BA/DA/BI)

Để giúp bạn hiểu được phần còn lại của bài viết này một cách tốt nhất thì bạn thật sự cần phải đọc qua 2 bài viết “TẠI SAO AI CŨNG NÊN HỌC KỸ NĂNG PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS)?”“BỨC TRANH TOÀN CẢNH CÁC CÔNG VIỆC XOAY QUANH PHÂN TÍCH DỮ LIỆU”.

Cho tới thời điểm này, để bắt đầu hành trình trở thành một người làm phân tích dữ liệu chuyên nghiệp, bạn cần xem xét 2 yếu tố sau:

  1. Nền tảng kiến thức và kinh nghiệm hiện tại của bạn ra sao?
  2. Môi trường làm việc mà bạn hướng tới là ở đâu?

Bản đồ ngành nghề bên dưới giúp bạn nhìn thấy được tương quan giữa các vị trí khi xem xét 2 yếu tố để giúp bạn xác định điểm đến tiếp theo cho phù hợp.

(1) Tỉ trọng trên tổng thời gian làm việc dành cho các công việc phân tích thuần túy và

(2) Yêu cầu về khả năng làm việc với dữ liệu và phân tích

Nhóm 1,2,3

Nếu bạn thấy công việc hiện tại của mình nằm ngoài vùng nhóm 4. Bạn nên phát triển theo lộ trình sau:

  • Vị trí hiện tại
  • Lên BA
  • Lên DA
  • Lên AnM
LỘ TRÌNH A

Nhóm 4 – BA

Nếu bạn thấy công việc hiện tại của mình nằm trong vùng nhóm 4 và có tính chất giống BA. Theo lộ trình sau:

  • BA
  • Lên DA
  • Lên AnM
  • Freelancer
LỘ TRÌNH B

Nhóm 4 – DE

Nếu bạn nghĩ mình đang làm DA nhưng bạn đang đọc bài này, rất tiếc phải nói rằng bạn có lẽ đang là DE. Theo lộ trình sau:

  • DE
  • Lên DA
  • Lên Junior DS
  • Lên Senior DS
LỘ TRÌNH C

Trả lời