CÂU HỎI THƯỜNG GẶP

Ngắn gọn thì R là một phần mềm xử lý dữ liệu đa chức năng với thế mạnh trong việc phân tích số liệu và vẽ đồ thị cực kỳ hữu ích cho các lĩnh vực nghiên cứu khoa học, tin sinh học cũng như kinh doanh, quản lý nhân sự, hay thống kê kiểm định chất lượng sản phẩm, ... 

Việc nắm vững kỹ năng R sẽ thay thế các phần mềm thương mại xử lý dữ liệu khác, giúp mở ra cho bạn nhiều cơ hội việc làm và thăng tiến dựa trên hiểu biết sâu sắc về cách xử lý dữ liệu và tối ưu, tự động hóa công việc hiện tại lên tầm cao hơn.

Bạn có thể tìm hiểu thêm ở đây: https://www.r-project.org/about.html | https://data-flair.training/blogs/why-learn-r/


2. TẠI SAO NÊN HỌC R?

1/ R là phần mềm mã nguồn mở nên MIỄN PHÍ. Mình không phải loay hoay tìm cách sử dụng phần mềm đó ở trạng thái lo lắng bị vi phạm bản quyền qua các phiên bản bẻ khóa.

2/ Nhờ đặc điểm mã nguồn mở nên R cung cấp cho người dùng khả năng xử lý và nâng cấp rất mạnh theo sát nhu cầu thực tế. Không phải phụ thuộc vào các tính năng được cung cấp sẵn như các phần mềm thương mại.

3/ Ngôn ngữ R khá khó hiểu giai đoạn đầu khi chúng ta (ngoài ngành IT) mà tiếp cận nhưng khi đã hiểu được logic của các dòng lệnh trong R, đặc điểm cấu trúc dữ liệu thì mình cảm thấy R rất logic và chặt chẽ trong cách tư duy xử lý vấn đề. Việc này giúp bộ não của mình chạy nhanh hơn khi cùng 1 dataset mình có thể tùy biến xử lý theo các kiểu khác nhau rất sáng tạo.

4/ Mình đặc biệt thích xây dựng các dòng lệnh chạy tự động khi xử lý các công việc lặp đi lặp lại. Vì như vậy tiết kiệm thời gian vô cùng, chất xám của mình giờ chỉ tập trung ở chỗ sắp xếp file dữ liệu thô và làm sạch dữ liệu cho phù hợp để đưa vào R xử lý theo các khuôn mẫu mình thiết lập sẵn. Mọi việc hoàn toàn trong tầm kiểm soát của mình, khác hẳn với trước đây bị ngộp trong các thể loại file dữ liệu khác nhau.

5/ Còn nhiều lý do nữa mà một bài viết này không thể nói hết, mình chỉ chia sẻ là sau 3 năm học và ứng dụng R vào thực tế công việc thì mình mở ra skill ở mảng IT (bên cạnh chuyên môn nghiên cứu có sẵn) giúp cho mình khi đọc và hiểu các database hay nhìn các ứng dụng chạy bằng ngôn ngữ khác như Python, Java thì hoàn toàn dễ hình dung cơ chế đằng sau các ứng dụng đó, và biết cách để tận dụng tối đa các phần mềm hay đoạn code được cung cấp sẵn để áp dụng vào thực tế công việc. Ý là khi bạn đã giỏi tiếng Anh thì bắt nhịp qua học một ngôn ngữ khác thì cũng thuận lợi vì có nhiều điểm tương tự.

Mình hy vọng mọi người quan tâm hơn đến các kỹ năng data science nói chung (không chỉ riêng R), các hệ sinh thái và cộng đồng sử dụng phần mềm mã nguồn mở cũng như các ứng dụng ngày càng đa dạng, hữu ích được cung cấp từ các package như ggplot2, forecast, stringr, ... giúp rút ngắn thời gian, tối ưu và tự động hóa quy trình làm việc của chúng ta, từ đó nâng cao chất lượng làm việc và cuộc sống lên nhiều hơn.

Hành trình ngàn dặm bắt đầu từ bước chân đầu tiên.

Chào mừng các bạn trang bị kỹ năng data science, có thể căn bản từ R để mở rộng ra các chủ đề khác.

3. R CÓ KHÓ HỌC KHÔNG?

R khó học khi chúng ta học theo kiểu tay ngang, trực tiếp vào mà bỏ qua các lệnh căn bản.

R dễ học khi chúng ta dành thời gian tìm hiểu các lệnh căn bản và cơ chế của các lệnh này. Đó là lý do vì sao mình mở khóa Tự Học R trang bị đủ kiến thức nền tảng về R giúp các bạn dễ dàng học R về lâu dài vì đã hiểu được nguyên tắc và logic của lập trình trong R.

4. MẤT BAO NHIÊU LÂU ĐỂ SỬ DỤNG R THÀNH THẠO?

Nếu bạn tham khảo các khóa học online và offline cũng như tự học thì thời gian ngắn hay dài tùy vào mức độ cố gắng của bạn.

Tuy nhiên khi bạn tham gia vào khóa học Hướng dẫn sử dụng R để xử lý dữ liệu do mình thiết kế từ A-Z để đảm bảo cho người mới bắt đầu học R nhanh chóng hiểu những khái niệm trong lập trình và ứng dụng vào công việc qua từng bài giảng video step-by-step thực hành trực tiếp trên RStudio thì bạn cần khoảng 20 tiếng để xem qua trên 60 video cho chuyên đề Coding in R là đủ để trang bị các kỹ năng cần thiết nhằm tự học R về lâu dài.

Mình thiết kế video theo phong cách giảng dạy Cầm Tay Chỉ Việc để đảm bảo người chưa có kiến thức về mảng IT hay lập trình cũng nhanh chóng tiếp cận, tốc độ bài giảng nhanh gọn, rõ ràng, đi vào trọng tâm và súc tích để học viên lĩnh hội kiến thức về R và lập trình nói chung và logic trong xử lý dữ liệu nói riêng, từ đó giúp học viên thực sự tự tin áp dụng R vào công việc của mình, cải tiến quy trình làm việc ngày càng chặt chẽ và hiệu suất cao hơn.

5. SỨC MẠNH CỦA R CỤ THỂ NHƯ THẾ NÀO?

Các bạn có thể search theo từ khóa R application để tìm hiểu các ứng dụng của R rất mạnh mẽ và đa dạng trên mọi lĩnh vực. Ở đây mình chọn ví dụ đơn giản là khi trích xuất dữ liệu từ một file dataset rất lớn, chứa 2 triệu dòng dữ liệu, để vẽ đồ thị cột. Nếu sử dụng Excel thì thời gian load file và lọc dữ liệu theo ngày tháng là rất lâu. Nhưng trong R thì chỉ mất 7 dòng lệnh là đã thực hiện được ngay trong vòng chưa đến 3 giây tùy vào tốc độ CPU máy tính.

Do vậy việc nắm vững kỹ năng R sẽ giúp rút ngắn thời gian xử lý dữ liệu của các bạn, giúp giải quyết rất nhiều công việc trong thời gian ngắn.

6. NÊN HỌC KỸ NĂNG NÀO ĐỂ TĂNG TÍNH CẠNH TRANH TRONG CÔNG VIỆC?

Nếu bạn đặt câu hỏi như trên, thì mình chân thành chia sẻ là bạn nên học kỹ năng xử lý dữ liệu với R. Vì:

[1]. Học kỹ năng xử lý dữ liệu với R, bạn sẽ học về nguyên tắc và kiến thức chung khi làm việc với dữ liệu để xử lý theo đúng quy chuẩn nhằm xuất ra báo cáo (hình ảnh, đồ thị, số liệu) một cách bài bản, chuyên nghiệp hơn trước đây. Giúp tăng lợi thế cạnh tranh cho bản thân, thăng tiến trong công việc.

[2]. Khi học R, dù bạn có tham gia khóa training R online hay offline thì sau khóa học đó, bạn cũng sẽ tiếp tục tự học R để đáp ứng nhu cầu cho mình. Đó là hành trình rèn luyện bản thân trở nên đa chức năng (như phần mềm R) trong việc thiết kế các app, function, script giúp tự động hóa các khâu làm việc thường ngày, giúp tiết kiệm thời gian và công sức hơn rất nhiều!

[3]. Giáo trình học R phần lớn là tài liệu tiếng Anh do vậy khi bạn học R thì cũng đồng nghĩa các bạn học tiếng Anh một cách thực tế (học/đọc để hiểu và ứng dụng) chứ không phải loay hoay trong những cú pháp và từ vựng trong những chủ đề lan man. 

[4]. Vì R là phần mềm máy tính nên các bạn hoàn toàn đưa ra dãy số liệu mô phỏng các câu chuyện trong thực tế, xây dựng mô hình rồi chạy phân tích để đánh giá trước kết quả muốn thu nhận. Đây là công cụ tuyệt vời để các bạn làm nghiên cứu xây dựng sẵn các quy trình thí nghiệm và test trước những tình huống xảy ra trước khi bỏ công sức làm thí nghiệm trong thực tế rồi mới phải fix lại mô hình lý thuyết. R là công cụ rất mạnh cho khối nghiên cứu khoa học, hãy trang bị R ngay khi bạn có thời gian!

[5]. Vì R không dễ dàng tiếp cận nếu chúng ta học theo kiểu tay ngang, không nắm vững căn bản. Vì vậy mình cung cấp khóa học Hướng dẫn sử dụng R https://www.tuhocr.com/r-courses để giúp mọi người đi qua giai đoạn KHÓ NHẤT của việc học R là GIAI ĐOẠN MỚI BẮT ĐẦU, nhằm tạo đà cho các bạn tự học về sau dễ dàng hơn, vì bản thân mình đã trải qua giai đoạn rất vất vả tự học R nên mình hướng dẫn các bạn đi vào trọng tâm và căn bản R nhằm rút ngắn thời gian mò mẫm ban đầu.

[6]. Bạn lăn tăn giữa việc học R và Python thì nên học cái nào?? Mình đề nghị bạn nên học R trước, vì nó đơn giản hơn Python rất nhiều và được thiết kế để phân tích dữ liệu, trực quan hóa số liệu qua đồ thị cũng như xử lý thống kê. Sau khi đã có nền tảng lập trình R thì bạn bắt nhịp qua các ngôn ngữ lập trình khác như Python hay ngôn ngữ truy vấn cấu trúc SQL là rất thuận tiện, vì mỗi ngôn ngữ lập trình đều mang tính chất bổ trợ cho nhau trong tầm nhìn đáp ứng nhu cầu người sử dụng. Chỉ là cùng 1 lúc bạn không nên học 2 ngôn ngữ lập trình vì như vậy sẽ tiến rất chậm hơn là tập trung học 1 món cho đến nơi.

Năm 2022 sắp kết thúc, năm 2023 sắp đến. Hy vọng rằng với nỗ lực gieo trồng kỹ năng xử lý dữ liệu với R hiện tại thì sang năm các bạn sẽ gặt hái được nhiều thành quả!

Mời bạn tham gia thảo luận về R dành cho người mới bắt đầu ở đây https://www.facebook.com/groups/tuhocr

Thân mến #RProgramming #training #dataanalytics

7. data visualization là gì?

Data visualization là gì? 

Hay còn gọi: trực quan hóa dữ liệu.

Hay hiểu đơn giản là: vẽ đồ thị từ dữ liệu cho trước để truyền đạt thông điệp nào đó.

OK.

1/ Nên chọn công cụ nào để trực quan hóa dữ liệu?

Trả lời: Bạn hãy chọn công cụ nào để vẽ được đồ thị mình cần.

https://clauswilke.com/dataviz/choosing-visualization-software.html

2/ Vì sao nên học R để trực quan hóa dữ liệu?

Trả lời: Vì R là công cụ được sinh ra để tính xác suất thống kê và vẽ đồ thị. Do đó chọn học R để vẽ đồ thị là đúng hướng.

3/ Làm rõ:

• Cùng 1 dataset hoàn toàn có thể vẽ được những loại đồ thị khác nhau.

• Cùng 1 dạng đồ thị hoàn toàn có thể vẽ bằng các phần mềm khác nhau.

4/ Giới hạn của R trong việc vẽ đồ thị là gì?

Trả lời: Tùy vào nhu cầu của bạn ở dạng đồ thị hình học cụ thể, khi đó vẽ bằng R sẽ hơi phức tạp thì bạn có thể chọn những phần mềm khác để vẽ cho đơn giản hơn. Không nhất thiết phải luôn vẽ trong R nếu có công cụ khác làm được đồ thị bạn cần với thời gian nhanh hơn.

5/ Ý nghĩa của việc học coding để vẽ đồ thị là gì? Sao không vẽ trong Excel cho nhanh?

Trả lời: Các phần mềm vẽ đồ thị theo kiểu interactive (trực quan, tương tác chỉnh sửa ngay trên đồ thị) thì rất khó xây dựng quy trình vẽ đồ thị tự động (autogenerate) hoàn toàn. Do đó đồ thị xuất ra sẽ không đồng bộ và chuẩn chỉnh như trên R hay các phần mềm command line (giao diện dòng lệnh) để vẽ đồ thị.

Điểm mấu chốt là khả năng tái lập (reproducible), khả năng lập lại (repeatability) khi vẽ đồ thị. Vì chỗ đó mới gọi là công nghệ cao, khỏi mất time làm thủ công như trên Excel.

6/ Để học trực quan hóa dữ liệu thì tham gia khóa học Trực quan hóa dữ liệu là vẽ đồ thị ngon lành không?

Trả lời: Maybe.

Nếu bạn đã có nền tảng lập trình của ngôn ngữ R rồi (hiểu rõ cách coding, xây dựng function, các lệnh họ apply, if-else, for-loop, subset, cấu trúc dữ liệu ...) thì việc học khóa chuyên đề Data visualization thì bạn sẽ nắm được các để vẽ đồ thị ngay sau khóa học đó.

Còn nếu bạn chưa hiểu gì về R mà muốn vẽ đồ thị bằng R thì nên học khóa R căn bản để hiểu cơ chế, lập trình everything trong R cái đã. Rồi hãy học các khóa chuyên đề Data visualization thì hiệu quả ứng dụng R vào công việc sẽ cao hơn.

Mình chuyên đào tạo R căn bản để các bạn mới bắt đầu hiểu kỹ logic trong R thì khi đó các bạn muốn vẽ đồ thị hay xử lý thống kê thì hoàn toàn tự học hoặc tham gia khóa chuyên đề sẽ hiệu quả hơn.

Mình có tổng kết chủ đề Data visualization ở đây, các bạn tham khảo nhé.

Mindmap:https://www.tuhocr.com/faqs/dataviz

Dù cho sử dụng công cụ gì để vẽ đồ thị thì quan trọng nhất khi vẽ đồ thị là bạn muốn truyền đạt thông điệp gì đến người tiếp nhận. Do đó ý nghĩa của đồ thị là nằm trong thông điệp, còn công cụ như R chỉ là phương tiện giúp bạn thực hiện điều đó một cách chuyên nghiệp, tự động, chuẩn mực mà thôi. Ý nghĩa vẫn là ở bạn.

Tham khảo cách vẽ đồ thị từ source code

8. ĐIỀU KIỆN ĐỂ NHẬN CHỨNG CHỈ 

Các bạn hỏi mình học R ở www.tuhocr.com có được cấp chứng chỉ hay không? Câu trả lời là Có và Không.

Có: là chắc chắn bạn sẽ được cấp chứng chỉ sau khi hoàn thành từng chuyên đề nhé. Như ở chuyên đề 1 thì bạn hoàn thành bài tập project, còn chuyên đề 1+ thì chỉ cần bạn xem hết toàn bộ video (completion progress 100%) là đủ điều kiện để mình cấp chứng chỉ. Bạn dễ dàng verify chứng chỉ theo đường link trên website để confirm với các bạn trong team là bạn đã hoàn thành được khóa học R dài hơi này với mình. Ví dụ ở link sau:

https://www.tuhocr.com/certificate/2022r0022cdr

Không: chắc chắn đây chỉ là chứng chỉ mang tính "kỷ niệm" giữa học viên với Tự Học R thôi vì mình cũng tương tự như các Thầy/Cô dạy IELTS tư nhân vậy, training cho học viên nắm vững kỹ năng nào đó để các bạn đủ sức thi các chứng chỉ official xịn xò cao cấp sau này. Vì vậy chứng chỉ của mình là cây nhà lá vườn ko phải official như Coursera nha (hiển nhiên rồi).

Như vậy thì học R với Tự Học R muốn có chứng chỉ official như các khóa R programming trên Coursera để đưa vào CV công việc thì sao?

Trả lời: Sau khi bạn đã học qua 2 chuyên đề 1 và 1+ khoảng trên 100 video và 4 bài tập project hack não cùng một loạt các bài tập nho nhỏ khác thì bạn hoàn toàn học nhanh-gọn-lẹ các thể loại chứng chỉ R programming trên Coursera nhé. Vì thực chất mình cũng đã học từ trên Coursera về R programming (đã có chứng chỉ như mình để trên website) và thấy nội dung trên đó vẫn còn nhiều điểm cần bổ sung sâu hơn giúp người học hiểu rõ R nên mình mới biên soạn hẳn khóa học R dành cho người Việt nhanh chóng nắm vững được kỹ năng rất quan trọng này.

Nếu bạn có ý muốn thi các chứng chỉ R programming ở các nguồn official mà gặp khó khăn gì trong việc giải bài tập project trên đó thì mình sẽ support bạn maximum để hoàn thành các bài tập ấy nhé. Qua quá trình thảo luận về bài tập project, bạn sẽ có dịp hiểu kỹ hơn về logic hoạt động của R trong xử lý dữ liệu cũng như kết nối, mở rộng thêm contact về mảng này. Đó là ý nghĩa thực sự có giá trị mà các khóa học online mang lại để khi bạn ứng dụng trong thực tế nếu gặp problem gì thì bạn sẽ luôn biết cách để giải quyết hoặc biết tìm đúng người để hỏi cách xử lý.

Chúc các bạn hăng hái, mạnh mẽ, triệt để học sâu hơn vào R cũng như các công nghệ, kỹ thuật liên quan đến xử lý dữ liệu, phân tích thống kê nhằm trở nên đa năng hơn nữa trong công việc, trở thành nhân tố tạo ra sự tích cực và thúc đẩy hiệu suất làm việc cho đội nhóm.

Mình là Duc Nguyen, chuyên đào tạo R căn bản sẽ đồng hành cùng bạn trong giai đoạn khởi đầu nhập môn rất quan trọng (dễ bỏ cuộc) này để bạn đi đến đoạn hiểu-được-R thì mới dùng được R có hiệu quả. Together we grow with much love and thanks. 

9. LỘ TRÌNH ĐÀO TẠO R TỪ TRANG GIẤY TRẮNG 

Sau thời gian training các bạn học viên từ năm 2022 đến hiện tại, mình đúc kết ra lộ trình training R cũng như các kỹ năng xử lý dữ liệu, xác suất thống kê, vẽ đồ thị chuyên môn như sau. Ta có sự kết hợp giữa 3 yếu tố:


1/ Tự học qua video bài giảng (tiếng Việt) súc tích ngắn gọn để học viên nắm chắc cơ chế của R treat các lệnh căn bản (những nội dung này dù mình có giảng lại 1:1 qua zoom tuy nhiên sẽ không thể đầy đủ cặn kẽ như qua các video mình đã ghi hình sẵn nên các bạn xem song song sẽ nắm vững về R). Khi tự học qua video sẽ tối ưu thời gian vì bạn có thể học 24/7 ở bất kỳ thiết bị pc, laptop, điện thoại.


2/ Trong quá trình tự học R này, thực tế là để bạn áp dụng R vào công việc chuyên môn nên sẽ cần xem lại các giáo trình thống kê và bài báo chuyên ngành. Mình có liệt kê nhiều tài liệu quan trọng về thống kê và R mà mình đúc kết được qua các khóa training theo chuyên đề ở phần thư viện học viên. Bạn có thể tham khảo từ đó để nắm chắc kiến thức và thuật toán mà R áp dụng để xử lý dữ liệu chuyên môn.


3/ Sau cùng là bạn có rất nhiều câu hỏi từ very basics đến very complicated mà bạn cần có sự thảo luận 1:1 giữa người với người (bạn cũng dùng chatgpt rồi đó, nhưng nó không thể hiểu nỗi những thắc mắc mà chỉ có người mới giải thích được cặn kẽ cho bạn). Vì vậy mình luôn welcome các buổi trao đổi chuyên môn qua zoom có record lại để hai bên cùng khui ra hết những vướng mắc trong chuyên môn khi tìm cách áp dụng R vào xử lý. Đây là bước khu trú lại vấn đề và ta sẽ phát hiện ra problem chính nằm ở thuật toán chuyên môn (này mình cũng không hiểu) chứ không phải R căn bản (này là mình cover được) để giúp bạn đặt ra các câu hỏi chính xác hơn để lên đường hỏi tiếp các anh chị chuyên môn trong ngành (hay là các tác giả package chuyên môn R) để thu được kiến thức cặn kẽ về chủ đề bạn đang nghiên cứu.


Tự Học R www.tuhocr.com được thành lập để đồng hành cùng bạn qua từng sự kiện chuyên môn trong công việc, mình sẽ training lại bạn từ trang giấy trắng, để một-lần-nữa, ta làm lại câu chuyện cho chuẩn nhất có thể. You can count on R. ❤