TẠI SAO DATA SCIENCE ĐANG DẦN MẤT ĐI VỊ THẾ CỦA NÓ?

Khoa học dữ liệu đã từng được xem là một trong những nghề nghiệp “quyến rũ nhất mọi thời đại”

Trước đây thì hầu hết các sinh viên ngành Khoa học máy tính đều có mong muốn về việc theo đuổi ngành Data Science. Không những thế Data Science cũng thu hút sinh viên từ nhiều ngành khác theo học. Trong khi đó thì số lượng công việc thực sự cho một Data Scientist thì lại không có nhiều trên thị trường lao động.

TẠI SAO DATA SCIENCE ĐANG DẦN MẤT ĐI VỊ THẾ CỦA NÓ? 1

Khoảng 20 năm về trước đã xảy ra một cuộc cách mạng trong cộng đồng Data Science. Sự phát triển mạnh sẽ trong suốt 20 năm là một hiện tượng mà chính nó đã ảnh hưởng tới tất cả mọi người xung quanh. Ứng dụng của ngành Data Science có thể được sử dụng trong tất cả các ngành, lĩnh vực khác nhau. Do đó, nó đã tác động làm tăng nhu cầu nghề nghiệp đối với ngành này.

Tuy nhiên, xu hướng này đã thay đổi trong những năm gần đây. Nhu cầu việc làm trong lĩnh vực Data Science không còn nhiều như trước. Có thể bạn vẫn thấy về nhu cầu việc làm cho Data Scientist, hay thậm chí là một số người có kĩ năng thấp hơn. Tuy nhiên bài viết dưới này tôi sẽ liệt kê ra một số nguyên nhân vì sao Data Science đang dần mất đi vị thế của nó.

Làm ơn hãy ngừng khuyên nhủ các bạn trẻ “Theo đuổi đam mê của bạn”

1. Chúng ta không có cơ hội để có thể thực sự làm việc trong lĩnh vực này

Trong hầu hết mọi trường hợp thì các vị trí Data Scientist thường yêu cầu kinh nghiệm làm việc từ hai cho đến ba năm. Vì vậy, đối với các sinh viên mới ra trường thường không có hoặc có rất ít cơ hội để có thể bắt đầu công việc của một Data Scientist khi mới tốt nghiệp. Thay vì đó, sinh viên phải bắt đầu với một công việc ở vị trí khác.

Bên cạnh đó, các công ty cũng không sẵn lòng bỏ thời gian và tiền bạc cho một “new incoming talent”. Họ thường có xu hướng muốn thuê một nhân viên đã có kĩ năng và kinh nghiệm ở trong lĩnh vực.

Trong khi hầu hết các công ty công nghệ đều có một phòng ban về Data Science, thì đối với các công ty trong lĩnh vực khác họ hoàn toàn không có phòng ban này. Điều này dễ dàng lý giải vì sao họ luôn yêu cầu một người có nhiều kinh nghiệm để có thể xây dựng mọi thứ từ con số không.

Có một giải pháp cho các bạn sinh viên là: hãy cố gắng tìm các công việc internship khi còn ngồi trên ghế nhà trường. Cố hết sức có thể để tích lũy kinh nghiệm. Nhờ thế mà có thể đạt được yêu cầu của các nhà tuyển dụng trong tương lai.

Tham gia chương trình Young Talent – Chương trình đào tạo nguồn nhân lực chất lượng cao tại đây

Một lý do khác nữa là những người có hứng thú với nghề Data Scientist đang không thực sự hiểu về sự khác biệt của nghề này với các nghề khác trong cùng lĩnh vực.

Mọi người đều mong muốn có một công việc mang tên Data Scientist trong khi đó lại không hiểu nghề này đang làm gì. Thường thì mọi người sẽ cho rằng Data Analyst, Business Analyst và Data Scientist tương tự nhau.

Khi ứng tuyển vào một vị trí mà ngay cả bạn cũng chưa thực sự hiểu, thì kết quả trắng tay ra về là một điều khá hiển nhiên.

3. Bạn có nghĩ rằng Data Science dễ xơi

Theo như quan sát của tôi thì mọi người thường bắt đầu học về Data Science bằng cách làm việc trên các thuật toán, điều chỉnh dữ liệu nhưng lại không hiểu ý nghĩa đằng sau của các thuật toán là gì. Đừng nghĩ rằng chỉ với lượng kiến thức trung bình về lập trình và các thuật toán Machine Learning là bạn đã có thể sẵn sàng “đối mặt” với các vấn đề thực tế ngoài kia.

Người học cũng có xu hướng bỏ qua phần thống kê, bởi vì nó thực sự nhàm chán. Data science là một lĩnh vực phát triển không ngừng. Ta có thể thấy sự phát triển vượt bậc của Natural Language Processing trong hai đến ba năm gần đây. Đó là lý do vì sao Data Science luôn cần được cập nhật liên tục các state-of-the-art models.

Một lý do khác nữa là mọi người thường nghĩ Data Science dễ là do chưa có cơ hội được làm việc với dữ liệu thực tế. Trong suốt những năm học tập, thì học sinh được thực hành trên các loại dữ liệu đã được cấu trúc (structured) hoặc là dữ liệu đã được làm sạch nhằm phục vụ cho việc dạy học.

Nhưng trên thực tế thì 99% dữ liệu thực tế là dữ liệu chưa được cấu trúc (unsturctured). Một người là Data Scientist phải dành rất nhiều thời gian để có thể làm sạch dữ liệu. Từ dó mới có thể phân tích và đưa ra những insight có giá trị.

Chuyên viên phân tích dữ liệu thường phải trả lời những câu hỏi như thế nào?

4. AutoML là một trong những nguyên nhân khiến cho đường Data Scientist trở nên khó khăn hơn

Ngay khi các gã khổng lồ công nghệ như Google, Microsoft tung ra Auto Machine Learning thì ngay lập tức nó đã gây sự chú ý đối với các nhà Data Scientist. Sự quan tâm, tò mò của các công ty đổ dồn vào AutoML dấy lên một nỗi lo về mất việc đối với Data Scientist.

AutoML đang tự động hóa quá trình áp dụng máy học (Machine Learning) cho các tập dữ liệu (dataset). AutoML có thể xử lý trước và chuyển đổi dữ liệu. Nó thực hiện toàn bộ quy trình từ làm việc trên dữ liệu thô đến triển khai các thuật toán học máy.

AutoML rất giỏi trong việc xây dựng các model nhưng khi nói đến quá trình pre-processing, chúng chưa thể thay thế được con người. Công việc chính của Data Scientist nằm trong phần pre-processing. Rõ ràng là cho đến nay AutoML không thể thay thế Data Scientist.

Nhưng có một sự thật không thể bàn cãi là chi phí duy trì AutoML rẻ hơn. Trung bình một Data Scientist ở Mỹ có mức lương là 120k USD, trong khi đó Google và Microsoft chỉ phải bỏ ra từ 4k đến 40k cho phí duy trì AutoML.

Mặc dù vậy chúng ta cũng không thể phủ nhận vai trò của Data Scientist trong việc sử lý dữ liệu tại giai đoạn pre-processing. Bởi vì trên thực tế dữ liệu thường có dạng phi cấu trúc và đòi hỏi rất nhiều công sức để xử lý.

Tôi làm ở bộ phận kế toán tài chính thì có theo đuổi nghề phân tích được không?

(Theo Harshit Ahuja).

Tham khảo nhiều bài viết hữu ích của Uniace tại chuyên mục Phát triển nghề nghiệp.

  • Mục tiêu nghề nghiệp của bạn trong 3-5 năm tới.
  • Em chỉ mới đi làm khoảng 6 tháng thì liệu có cơ hội để trở thành một data analyst.
  • Chuyên viên phân tích dữ liệu thường phải trả lời những câu hỏi như thế nào.
5/5 - (1 bình chọn)