Khi sử dụng R để xử lý dữ liệu thì bạn sẽ gặp khá nhiều tình huống cần tạo vòng loop để trích xuất và tính toán nhanh dãy số liệu mà không cần phải run thủ công. Việc nắm vững kỹ thuật xây dựng lệnh loop trong R là cột mốc chính thức giúp bạn nắm vững R ở mức độ chuyên nghiệp vì có thể coding nhanh và có hiệu suất hơn so với bình thường.

Tuy nhiên trở ngại lớn nhất khi bạn áp dụng lệnh loop là nếu dataset và function mà lệnh loop sử dụng không được thiết kế chặt chẽ thì khả năng xảy ra lỗi rất cao, dẫn đến liên tục bị gián đoạn và làm bạn cảm thấy loop khó sử dụng, và do đó không thể đẩy xa hơn các ứng dụng mạnh mẽ của R vào thực tế công việc.

Phần lớn các bài hướng dẫn về lệnh loop trong R trên internet chủ yếu dừng ở dataset đơn giản cũng như function rất căn bản nên khi bạn học xong thì áp dụng vào real case vẫn còn trở ngại rất nhiều. Vì vậy mình đã thực hiện mini series gồm 3 video (tổng thời lượng khoảng 2 tiếng) để hướng dẫn kỹ lưỡng việc áp dụng lệnh loop trên dataset thực tế của FAOSAT (3 triệu dòng dữ liệu) để chia sẻ nhiều kinh nghiệm thực tế không chỉ trong lệnh loop mà còn good practice nên thực hiện khi bạn muốn subset data theo tên hay theo index column cũng như cần rất kỹ nếu reshape dữ liệu từ long sang wide...

Tóm lại, đây là chuyên đề nhỏ trong chuyên đề 1+ để giúp trang bị cho bạn kiến thức vững chắc về việc xây dựng lệnh loop một cách hoàn chỉnh để khi bạn triển khai trong thực tế thì sẽ giảm thiểu sai sót xuống thấp nhất và tạo cơ sở xây dựng các quy trình xử lý dữ liệu tự động chặt chẽ và logic.

Khi bạn đăng ký chuyên đề 1 thì sẽ được mình bonus thêm chuyên đề 1+ để nắm vững về R coding, mục tiêu chung vẫn là giúp bạn sớm master được kỹ năng R rất mạnh này vào thực tế công việc.

Thông tin chi tiết chuyên đề 1+

Hướng dẫn đăng ký học viên

Chuyên đề 1+ phát sinh từ thực tế các công đoạn xử lý dữ liệu sẽ diễn ra như thế nào trên 1 bộ dataset cụ thể. Ở đây mình chọn dữ liệu từ FAOSTAT để triển khai phân tích dữ liệu từ đầu đến cuối gồm:

1/ Hướng dẫn cách download dataset FAOSTAT về máy tính (bài 2)

2/ Quy trình làm sạch dữ liệu đầu vào (bài 3 đến 6)

3/ Cách xử lý dữ liệu để vẽ đồ thị bằng base R graphics (ví dụ cho heatmap) (bài 7 đến 11)

4/ Làm rõ các lệnh nâng cao khi modify margin trong base R graphics (bài 12 đến 16)

5/ Cách xử lý problem khi render file Rmarkdown và đóng gói project (bài 17 và 18)

6/ Các lệnh vẽ đồ thị ggplot2 làm rõ cơ chế và cách save file ảnh đúng chuẩn (bài 19 đến 25)

7/ Giải bài tập chuyên đề xây dựng function filter dataset FAOSTAT (bài 26)

8/ Hướng dẫn cách xây dựng lệnh loop chặt chẽ trên dataset FAOSTAT (kết quả này là 1 function filter trong package tuhocr) (bài 27 đến 31)

9/ Hướng dẫn xây dựng function vẽ đồ thị tự động (bài 32)

Cùng các template đồ thị để các bạn thực hành chi tiết. Khi đi qua được các chủ đề này thì việc sử dụng R trong thực tế sẽ thuận lợi hơn rất nhiều, bạn sẽ biết cách giải quyết n tình huống khác nhau phát sinh cũng như biết cách hỏi đúng bản chất của problem bạn mắc phải. Chúc các bạn sớm master được kỹ năng R, not only R but high level mindset to tame powerful programming tools.