Hiện tại, tôi đang là một Data Scientist và gặt hái được những thành quả như tăng gấp đôi thu nhập từ kiến thức về Data Science. Thành thật mà nói, thực sự không có bí quyết nào để đạt được điều này ngoài một chút may mắn và rất nhiều việc khó khăn.
Bài viết này phản ánh nhiều hơn những gì tôi đã làm để có được vị trí ngày hôm nay. Tôi không gợi ý rằng bạn sẽ đạt được điều tương tự bằng cách làm tương tự, nhưng tôi thấy điều này có thể cung cấp cho bạn một góc nhìn độc đáo có thể bạn chưa từng nghĩ đến trước đây.
Với tất cả những điều đó, hãy bắt đầu!
Trong những năm gần đây, người ta nói rằng Data Science là “công việc quyến rũ nhất của thế kỷ 21”. Nhưng tại sao nghề này lại thành công như hiện nay?
Câu trả lời ngắn gọn – và rõ ràng nhất – là sự bùng nổ trong thập kỷ qua về lượng dữ liệu do các doanh nghiệp và cá nhân sở hữu và tạo ra – cái gọi là “Big Data “.
Một nhà khoa học dữ liệu có thể được định nghĩa là phiên bản người lớn của một đứa trẻ luôn hỏi “Tại sao? “. Họ chịu trách nhiệm tìm hiểu về dữ liệu và xác định phải làm gì với nó, là người có thể thực hiện những việc tốt những việc sau:.
Thứ tự của các nhiệm vụ này là có chủ đích và phản ánh vòng đời của một dự án khoa học dữ liệu. Thành thật mà nói, danh sách này nên bắt đầu bằng “0. Dọn dẹp dữ liệu”, đây có thể là một trong những công việc tốn nhiều thời gian nhất đối với một nhà khoa học dữ liệu.
Sau khi nhận thấy được tầm quan trọng của Data Science, tôi đã vận dụng kiến thức Data Science mà mình có được như thế nào? Đọc tiếp bài chia sẻ nhé!
Bí quyết x2 thu nhập từ kiến thức về Data Science
Có ba điều chính mà tôi đã làm để tăng gấp đôi thu nhập của mình:.
Nâng cao kỹ năng (trong Data Science).
Viết blog (về data science).
Freelancing (dự án khoa học dữ liệu ).
1. Nâng cao kỹ năng
Ngày nay, nhiều người có xu hướng tìm kiếm các khoản đầu tư rủi ro cao mà phần thưởng lớn như Bitcoin với nỗ lực “làm giàu nhanh chóng”, nhưng như Warren Buffett đã nói, khoản đầu tư tốt nhất bạn có thể thực hiện là chính mình. Điều này đặc biệt đúng đối với những người không có tiền để đầu tư nhưng muốn cải thiện tài chính của họ.
Chỉ cần nâng cao kỹ năng và học thêm kiến thức data science, tôi đã tăng 40% lương trong khoảng thời gian một năm.
Có ba lĩnh vực chính mà tôi tập trung vào trong năm qua:.
Thao tác dữ liệu (SQL / Pandas)
Thao tác dữ liệu với SQL và Pandas là lĩnh vực quan trọng và mang lại cho tôi nhiều lợi ích nhất. Theo kinh nghiệm bản thân, phần lớn thời gian được dành để truy vấn, khám phá và xử lý dữ liệu, tất cả đều yêu cầu SQL và Pandas.
Trong tất cả các công việc liên quan đến data của tôi (Growth marketing analyst, data analyst, data scientist), SQL là mẫu số chung và được cho là kỹ năng quan trọng nhất đối với một chuyên gia dữ liệu.
Đây là những tài nguyên mà tôi đã sử dụng để tự học SQL và Pandas:.
Mode’s SQL Tutorial: sẽ đóng vai trò như kim chỉ nam tuyệt vời cho những concepts cần học, để vận dụng chúng tốt nhất thì việc chia nhỏ các ý tưởng thành các mức độ khác nhau sẽ giúp tạo ra nhiều điều bất ngờ.
Mode’s SQL case studies: cho phép bạn áp dụng những gì bạn đã học được và suy nghĩ nghiêm túc về cách bạn sẽ tiếp cận các tình huống trong thế giới thực.
LeetCode database questions: Tôi luôn sử dụng chúng như nguồn tài nguyên – đặc biệt khi tìm kiếm công việc mới. Đó là một cách tuyệt vời để thực hành các buổi coding interviews liên quan đến SQL.
Pandas practice problems: Cú pháp của Pandas không trực quan lắm (ít nhất là không giống SQL) và nó chưa bao giờ thực sự xuất hiện trong đầu tôi cho đến khi tôi bắt gặp kho các vấn đề để thực hành này!
Scripting (Python)
Tôi bắt đầu với Python từ trường học, và có lẽ tôi sẽ gắn bó với Python trong suốt phần đời còn lại. Nó đã vượt xa về những đóng góp về mã nguồn mở và rất dễ tìm hiểu.
Có hai nguồn chính tôi thực sự khuyên dùng để phát triển các kỹ năng của bạn bằng Python (ngoài việc thực hiện các dự án phụ):.
LeetCode algorithms problems:Tương tự như SQL, tôi đã sử dụng LeetCode để học cách viết (phần nào) các tập lệnh Python hiệu quả cho các vấn đề khác nhau.
Tech with Tim: Tech with Tim là một kênh YouTube – miễn phí nhưng tốt hơn hầu hết các khóa học trả phí và chương trình đào tạo hiện có. Tôi thực sự khuyên bạn nên xem qua các video và follow anh ấy.
Machine Learning
Nhưng tất nhiên, điều thú vị là trở thành data scientist mà không cần học machine learning! Dưới đây là hai nguồn quan trọng nhất tôi đã sử dụng khi bắt đầu sự nghiệp.
Kaggle’s Intro to Machine Learning: Nếu bạn giống tôi và không thực sự hiểu chính xác cách hoạt động của machine learning hoặc bạn không thực sự biết cách nó được triển khai trong code, thì bạn thực sự nên xem qua phần này.
StatQuest: StatQuest khá thú vị và giúp cho việc hiểu được cách hoạt động của các mô hình machine learning. Một khi bạn hiểu lý thuyết, việc triển khai nó trong code sẽ trở nên đơn giản.
2) Data Science Blogging
Một số người có thể biết tôi đã bắt đầu một sáng kiến cá nhân gọi là “52 tuần khoa học dữ liệu”, nơi tôi học, viết code và viết về thứ gì đó liên quan đến data science mỗi tuần trong suốt cả năm. Điều này chủ yếu để tôi có thể giữ cho mình trách nhiệm học hỏi điều gì đó mới một cách nhất quán.
Tôi từng không quá rõ về việc viết trên Medium thực sự là một cách kiếm tiền sinh lợi. Sau khi viết hơn 100 bài báo và xây dựng lượng người theo dõi hơn 20.000 độc giả, viết bài trên Medium hiện chiếm khoảng 25% tổng thu nhập của tôi.
Dưới đây là một số điểm cần lưu ý để viết các bài báo về Data Science trên Medium:.
Vì thời gian đọc của thành viên là dấu hiệu rõ ràng nhất để chứng tỏ nội dung hữu ích và mang lại thu nhập tốt hơn.
Nói chung, bài viết càng dài thì càng có nhiều khả năng kiếm được tiền.
Dường như không có sự khác biệt đáng kể giữa các bài báo khách quan và chủ quan.
3) Freelancing Projects
Phần thu nhập còn lại của tôi đến từ các dự án Freelance liên quan đến kiến thức data science mà tôi đã thực nghiệm. Các dự án tôi đảm nhận bao gồm viết các tài liệu kỹ thuật, viết content marketing và xây dựng mô hình dữ liệu về các kiến thức Data Science mà tôi đang sở hữu.
Khi mới bắt đầu, tôi chỉ kiếm được khoản lương tối thiểu từ chúng. Điều này có ý nghĩa vì bản thân không có nhiều kinh nghiệm và cũng không biết mình đáng giá bao nhiêu. Tuy nhiên, đến cuối năm, tôi đã có thể tính phí lên tới 50 đô la một giờ.
Phần lớn thu nhập của tôi đến từ những khách hàng quen thuộc trong lĩnh vực công nghệ. Thực sự tôi cũng không phải liên hệ với bất kỳ ai khác – tôi đã có thể thu hút sự chú ý của khách hàng thông qua blog data science và tôi nghĩ đó là điểm mấu chốt của bài viết này.
Blog chia sẽ kiến thức data science không chỉ giúp tôi học hỏi một cách nhất quán mà còn giúp bản thân xây dựng cơ sở người theo dõi và một số khách hàng làm freelance.
Trên đây là nội dung chia sẻ của Mr. Terence Shin đã chia sẻ trên Medium mà Uniace đã được biên soạn lại từ Uniace, hy vọng bạn đọc sẽ nhận được một số thông tin nội dung từ bài viết trên.
Tham khảo nhiều bài viết hữu ích của Uniace tại chuyên mục Phát triển nghề nghiệp.