VÌ SAO BẠN NÊN HỌC R?

Đặt vấn đề:

Mỗi lần mở Facebook hoặc lướt web trên mạng, bạn thường gặp những cụm từ thời thượng như là khoa học dữ liệu/data science, phân tích dữ liệu/data analytics, kỹ sư dữ liệu/data engineer, R, Python, SQL, rồi thì machine learning, AI với big data, cùng với chuyển đổi kỹ thuật số ... vân vân và mây mây. Bạn cảm thấy mọi thứ quá phức tạp, mệt mỏi và không biết chuyện gì mà cả xã hội đang ồn ào như vậy.

Nếu bạn muốn biết rõ câu chuyện này, từ góc nhìn của mình, cũng là một người như bạn, tự đi tìm câu trả lời cho chuyện "Nên học kỹ năng gì để sinh tồn trong thời đại kỹ thuật số này?" nhằm vững vàng lập trường không bị lạc lối giữa rừng marketing về data science với bao nhiêu lời hứa hẹn có cánh về mức lương cao ngất cũng như cảnh báo về chuyện AI thay thế con người trong hầu hết mọi việc (cụ thể là lập trình) thì đây là bài viết trả lời những câu hỏi đó.


Warning: Bài viết này không có mục đích marketing về R cũng như không nhằm làm cho mọi người nghĩ rằng data science là lĩnh vực đơn giản, ai làm cũng được. Đây là bài viết từ góc nhìn cá nhân cùng với một số thông tin tham khảo để bạn từ đó đọc tiếp và ghép ra bức tranh cho chính mình về thực trạng xã hội hiện nay để có sự chuẩn bị tốt nhất cho những gì đang diễn ra.

Làm rõ các định nghĩa:

1) Data science là gì? 

Nói một cách ngắn gọn, Data Science là câu chuyện bạn tìm ra câu trả lời cho [câu hỏi nghiên cứu] thông qua việc phân tích dữ liệu mà bạn có thể tiếp cận được để tạo ra (output) là hình ảnh, bảng biểu, báo cáo giúp trả lời cho [câu hỏi nghiên cứu] đã đặt ra lúc đầu. Như vậy, khi bạn có data và có câu hỏi nghiên cứu thì bạn dùng bất kỳ phương tiện nào từ bút/viết/giấy đến Excel hay SAS hay R hay Python làm sao đó để xử lý, phân tích dữ liệu bạn có mà trả lời được yêu cầu đặt ra thì bạn đang làm data science rồi đó. Không có gì cao siêu hay bí ẩn ở đây, chỉ là chuyện bạn biết làm hay không biết làm mà thôi.

Chuyện này mình có phân tích qua ở bài viết Data Science Pipeline ở đây. 

https://www.facebook.com/groups/tuhocr/posts/891515478587831/

Vấn đề chỉ khác nhau ở chuyện dữ liệu mà bạn đang phân tích thì nó ít hay nhiều sẽ phải có cách tiếp cận khác nhau cũng như phải sử dụng phương tiện và các kỹ năng/kiến thức về phương tiện đó để bạn có thể thao tác được trên bộ dữ liệu rất lớn từ hàng triệu đến hàng tỉ record chẳng hạn. Nhưng bản chất data science cũng là từ science mà ra, đó là bạn cần có tinh thần của một người tìm tòi, khám phá, thử nghiệm thì bắt nhịp vào lĩnh vực khoa học dữ liệu này bạn cứ thế mà triển khai, chủ đề hay lĩnh vực nào không biết thì sẽ tìm chỗ mà học là được.

Câu hỏi quan trọng: Học những kỹ năng nàotrong bao lâu thì làm việc được ở lĩnh vực data science ở mức lương cao?

Trong câu hỏi này thì cụm từ [mức lương cao] là động lực chính khiến nhiều người tìm hiểu về data science cũng như học các khóa đào tạo đang nở rộ hiện nay. Mình sẽ không trả lời câu hỏi này mà thay vào đó đưa ra vài nhận định để bạn tự tìm câu trả lời phù hợp nhất với hoàn cảnh, khả năng và thế mạnh của bạn nhé.

Trước hết cần làm rõ là [mức lương cao] trong bất kỳ ngành nghề nào cũng đòi hỏi khả năng/kỹ năng của người đó phải ở đẳng cấp rất cao mà ít ai làm được việc đó thì công ty họ mới trả lương chứ. Vậy nên bạn phải hết sức thực tế là không thể có nhà trường nào dạy xong là học viên ra làm ở mức lương cao hơn bình thường được, vì kiến thức bạn được học hay được training là để giải quyết những case study rất cụ thể và cũng khá căn bản/đơn giản còn trong thực tế công việc mà bạn được tuyển dụng thì chính công việc đó sẽ đòi hỏi bạn có những kiến thức nền (domain knowledge) về chủ đề đó để biết cách ứng dụng các kỹ năng data science vào nhằm tạo ra giá trị cho công ty.

Do vậy, câu hỏi trên nên được hỏi lại cho đúng bản chất là: Nên học những kỹ năng nào để làm việc trong lĩnh vực mà công ty nào làm về data science đang triển khai (ví dụ data science trong lĩnh vực tài chính hay trong lĩnh vực tin sinh học) để đáp ứng được yêu cầu công việc?

Lúc này bạn sẽ không còn mơ hồ nữa, vì căn cứ trên kiến thức nền của bạn đã có (ví dụ bạn có nhiều kinh nghiệm làm wetlab về biology) giờ muốn chuyển sang làm drylab về bioinformatics với mục đích kiếm được job lương cao, thì bạn lên lộ trình học những kỹ năng liên quan mà job đó yêu cầu (ở mục tuyển dụng các công ty lĩnh vực này đều list ra rất cụ thể các skillset mà ứng viên nếu có sẽ là lợi thế lớn). Khi đó bạn mới gọi là đủ bằng cấp, hồ sơ, kỹ năng để tạm coi là bước chân vào lĩnh vực đó rồi sau mới hãy tính đến việc làm lương cao.

Sau khi bạn xem đến đây thì bạn đã hiểu là vì sao phong trào học data science thì muôn hình vạn trạng nhưng vẫn luôn khát nhân lực trình độ cao (tương ứng là được lương cao). Bởi vì để training ra 1 người có khả năng phân tích và phản biện vấn đề (chưa nói đến làm data science nhé) thì đòi hỏi cá nhân đó phải thật sự xuất sắc về mặt tư duy, rồi thì chuyện thiếu gì học đó cũng là rất tự nhiên như nước chảy mây trôi vậy.

2) Xu hướng xã hội sắp tới diễn ra như thế nào?

Để biết gần chính xác xu hướng xã hội đang diễn ra như thế nào thì không gì đáng tin cậy hơn là bạn đọc các báo cáo của các tổ chức uy tín vì những thông tin này đều được tổng hợp từ chuyên gia trong ngành viết ra. Ở đây mình chia sẻ thông tin về Báo cáo tình hình công việc tương lai do Diễn đàn kinh tế thế giới thực hiện. Bạn có thể xem ở link này.

Trong đó trang 39 có trình bày danh sách những kỹ năng chủ chốt trong năm 2023 đang được nhà tuyển dụng recommend.

Như vậy bạn thấy là xu hướng chuyển đổi số, số hóa, tạo ra rất nhiều kho dữ liệu lớn là đang diễn ra và dĩ nhiên sẽ có rất nhiều job liên quan đến việc phân tích, xử lý dữ liệu từ các database này. Đây là nơi mà bạn sẽ apply công việc, sau khi đã trang bị những kỹ năng cần thiết để làm việc trong lĩnh vực data science.

3) Vì sao bạn nên học R ngay từ thời điểm này?

Như bạn thấy hình ảnh mình để minh họa cho bài viết là 1 người đang đứng một mình trên 1 ngọn núi. Xung quanh cũng toàn là núi với núi bạt ngàn. Đó cũng là hình ảnh, theo mình, minh họa rõ nhất tâm lý/tâm thế của chúng ta trên hành trình trang bị kiến thức ở một lĩnh vực nào đó. Nói gì thì nói, dù bạn có được mentor training chu đáo như nào thì sau cùng bạn vẫn phải tự thân vận động cho mọi công việc mà bạn đang thực hiện. Vì vậy, nếu bạn cảm thấy việc học là một hành trình khám phá kiến thức đầy thử thách thì bạn sẽ tìm ra niềm vui trong đó thay vì đặt ra áp lực quá lớn về chuyện phải học cái ABC để đi làm việc XYZ nhằm có mức lương $$$ như tâm lý ở thời điểm bạn chưa hiểu rõ câu chuyện.

OK, bây giờ câu chuyện đã rất rõ. Đó là lý do vì sao khi mở Internet ra trong thời gian qua và sắp tới các cụm từ data science từ vi mô đến vĩ mô sẽ còn lặp đi lặp lại với rất nhiều lời chào mời màu hồng về lĩnh vực nóng bỏng này (bạn cũng không thể bắt những người làm marketing về lĩnh vực này stop được, vì đây là thị trường kinh doanh rồi).

Thay vào đó, bạn hiểu rõ qua câu số 2) ở báo cáo về tình hình công việc trong tương lai của WEF rằng các kỹ năng cần thiết để làm việc sắp tới bao gồm (những chỗ mình highlight màu vàng).

Vậy để phát triển những kỹ năng này (tất nhiên bạn hoàn toàn thêm/bớt kỹ năng nào là do chọn lựa cá nhân) thì việc bạn chọn học kỹ năng xử lý dữ liệu với R là một lựa chọn gần như fit trọn vẹn các mảnh ghép này. Cụ thể vì sao nên học R? Thì mình có phân tích ở bài viết sau: https://www.tuhocr.com/faqs/why-r

Mến chào bạn,

Mình là Đức Nguyễn, từ website www.tuhocr.com, background từ nghiên cứu công nghệ sinh học, chuyển qua training kỹ năng R cho nhà nghiên cứu cũng như các bạn có nhu cầu trang bị kỹ năng này một cách căn bản và có hệ thống. Khi bạn chọn học R với mình thì bạn đã chọn học theo hình thức mọi thứ đi từ căn bản, từ gốc rồi build lên từ từ có chiều sâu. Mình không hứa hẹn chuyện bạn học R xong là sẽ làm được công việc data science với lương khủng, mình chỉ cam kết là bạn học R với mình sẽ hiểu rõ về R cũng như về data science để bạn hình thành tư duy logic về chủ đề này và lộ trình để học tiếp những mảnh ghép còn lại (với các chuyên gia khác) để vững vàng trên con đường data science mà bạn chọn. Nói thêm một chút cho công bằng là, data science cũng là một trong n con đường để chúng ta kiếm thu nhập từ chất xám mà thôi. Hãy đặt mọi thứ xuống đất để hiểu nó trước rồi ta sẽ tìm cách xây dựng ngôi nhà mơ ước cho chính mình, trên mảnh đất mà mình khai hoang.