Phân tích dữ liệu (Data Analyst) là làm gì? Chia sẻ link tải nhanh những khóa học Data Analytics tốt nhất 2020
Phân tích dữ liệu (Data Analyst) là gì-Data Analytics course
Chia sẻ làm thế nào trở thành một chuyên gia phân tích dữ liệu (Data Analyst) và chia sẻ link download nhanh những khóa học Data Analytics tốt nhất hiện nay.
Mục lục nội dung:
Phân tích dữ liệu Data Analyst và Business Analyst
Data Analyst và Business Analyst là những công việc đang được tuyển dụng nhiều nhất trong nhóm ngành về phân tích dữ liệu. Hai vị trí làm việc này thường xuyên tiếp xúc với công việc kinh doanh cũng như người phụ trách kinh doanh.
Nếu làm việc ở vị trí này, hầu như bạn thường xuyên phải tìm câu trả lời cho những câu hỏi đại loại như doanh số bán hàng tháng này tăng hay giảm ? Căn cứ vào đâu để khẳng định tăng/giảm?… Để trả lời các câu hỏi này rạch ròi, data analyst và business analyst sẽ sử dụng dữ liệu của công ty được lưu ở Data Warehouse để phân tích doanh số tăng, giảm, lý do tại sao, cũng như làm thế nào để khắc phục. (Có thể hình dung Data Warehouse như là cái biển dữ liệu thập cẩm, chằng chéo, một cái mỏ quặng dữ liệu thô sơ chưa được khai thác).
Vì vậy, ở vị trí data analyst và business analyst, bạn cần phải hiểu cả về tính chất công việc, đặc điểm doanh nghiệp và có kiến thức cùng kỹ năng phân tích dữ liệu.
Nói một cách cụ thể hơn, vị trí này yêu cầu bạn không chỉ có kỹ năng xử lý dữ liệu, để lôi được từ mỏ dữ liệu thô sơ, đồ sộ kia (Data Warehouse) những thông tin giá trị. Đồng thời phải hiểu được công việc kinh doanh và hình thức vận hành của doanh nghiệp, hoạt động như thế nào, hoạt động theo hướng A hay hướng B, khác với đối thủ ở chỗ nào…từ đó xây dựng mô hình phân tích phù hợp nhất. Khối lượng dữ liệu cần được xử lý vừa lớn, vừa khác biệt, nên cũng khá là nhức đầu. Mỗi giai đoạn kinh doanh, mỗi doanh nghiệp phù hợp với một mô hình phân tích khác nhau, bạn không thể áp dụng mô hình phân tích doanh nghiệp bán lẻ hàng tiêu dùng để phân tích doanh số của một cửa hàng cà phê.
Business Intelligence Analyst
Business Intelligence Analyst, viết tắt là BI, cũng tương tự với lại business analyst, data analyst nhưng công việc này yêu cầu kỹ năng phân tích cao hơn.
Ví dụ như, data analyst bạn chỉ cần làm 1, 2 report hay 4 report 1 tuần, nhưng đối với BI, bạn cần làm nhiều hơn (rất nhiều) và mức độ phức tạp của bản báo cáo (report) cũng lớn hơn nhiều.
Nếu như một phần công việc của data analyst có thể được xử lý bằng Excel, thì ở business intelligence analyst bạn rất khó để làm như vậy. Lý do chính: lượng dữ liệu lớn nên Excel xử lý lâu và bạn sẽ không có đủ thời gian để làm report. Lúc này bạn bắt buộc phải sử dụng các công cụ khác nhau để tự động động hóa quá trình phân tích, xây dựng những report lớn, dashboard lớn. Các công cụ này sẽ tự động refresh theo ngày, theo tuần để đảm bảo yêu cầu công việc của một BI là tạo ra được số lượng report nhiều hơn và chi tiết hơn so với các data analyst.
Chính vì tập trung nhiều cho việc làm report nên các bạn làm BI thường có ít chuyên môn về công việc kinh doanh (business) so với các bạn làm data analyst. Data analyst hầu như làm việc trực tiếp với ‘sếp’ nhiều hơn nên sẽ hiểu về business hơn. Nhiều khi bạn làm data analysis sẽ đưa ra lời khuyên rất hữu ích cho các bạn làm BI.
Data Engineer
Theo đánh giá của mình, các bạn làm data engineer thì không nhất thiết biết nhiều về business. Công việc chính của data engineer là đảm bảo làm sao thu thập được nhiều dữ liệu. Nói cách khác, data engineer chính là người xây dựng data warehouse, đảm bảo data được cập nhật thường xuyên, liên tục và đầy đủ, đảm bảo tốc độ truy xuất vào kho dữ liệu này đủ nhanh để các bạn làm BI sẽ sử dụng vào công việc phân tích dữ liệu được thuận tiện.
Vì thế data engineer sẽ chuyên sâu hơn về kỹ thuật: xây dựng cơ sở dữ liệu, làm thế nào để tối ưu hóa cơ sở dữ liệu, tối ưu hóa hệ thống…
Sự khác biệt giữa Data Analyst và Data Scientist
Đây là công việc mình không làm trực tiếp nên cũng không nắm rõ. Mình sẽ chỉ chia sẻ một vài hiểu biết của mình về công việc này thôi nhé.
Data scientist cũng không làm việc làm việc trực tiếp với business, tức là không quan tâm đến doanh số tăng/giảm, tiến trình thực hiện của các hoạt động kinh doanh. Công việc chính của data scientist là làm sao tối ưu hóa hệ thống. Không hẳn là tối ưu theo kiểu của các bạn làm data engineer mà là tối ưu chức năng cụ thể, chẳng hạn, ở Netflix thì nhiệm vụ data scientist là làm sao xây dựng được mô hình truy xuất dữ liệu, xây dựng được thuật toán (tối ưu) để việc tìm kiếm các phim, hay đề xuất phim cho người xem được nhanh hơn, chính xác hơn và phù hợp hơn với sở thích người dùng hơn. Do đó, data scientist phải học toán khá nhiều (thậm chí rất nhiều).
Học gì để trở thành chuyên viên phân tích dữ liệu Data Analyst?
Từ trải nghiệm của mình thì mình cho rằng muốn làm tốt công việc phân tích dữ liệu data analyst thì bạn phải có kiến thức về hai lĩnh vực là thống kê và lập trình.
Để làm Data Analyst bạn cần có kiến thức về Thống kê và Lập trình.
Về bản chất, data analyst là phân tích dựa trên thống kê, do đó, gần như bắt buộc bạn phải có kiến thức căn bản về thống kê.
Thứ hai, bạn phải có kiến thức căn bản về lập trình. Tại sao thì mình sẽ giải thích ngay sau đây.
Khi học lý thuyết, bạn xử lý mẫu dữ liệu (sample size) có kích thước khá nhỏ, vài trăm, đến nghìn là cùng, khi đó, bạn không cần biết lập trình vì các phần mềm như Excel hay SCSS có thể giúp bạn phân tích dễ dàng. Nhưng khi số lượng dữ liệu cần xử lý lớn (hàng chục nghìn, hàng trăm nghìn mẫu…) thì các phần mềm này hoặc là xử lý chậm, hoặc là rất khó xử lý. Lúc này, nếu bạn biết lập trình, bạn có thể xử lý nhanh hơn.
Hai ngôn ngữ lập trình bạn cần (nên, phải) biết khi làm data analyst là R và Python.
Như vậy với kiến thức căn bản về thống kê và lập trình bạn có thể bắt đầu dấn thân vào con đường trở thành một data analyst chuyên nghiệp. Lúc này kiến thức thực tế rất quan trọng, hãy làm và tự rút ra kinh nghiệm cho riêng mình. Và nhớ là làm thực tế càng sớm càng tốt, data analyst là ‘phân tích thực tế’.
Khóa học về phân tích dữ liệu Data Analytics
Hiện nay bạn có thể học về thống kê, R và Python ở các trang dạy lập trình online hoặc ở các trung tâm, các các trường đại học trong và ngoài nước. Trên Udemy có nhiều khóa học về thống kê rất chất lượng mà mình sẽ gửi link tải cho bạn ở cuối bài viết này.
Còn để học lập trình hiệu quả với R và Python thì tốt hơn nên học trên các trang web dạy lập trình online ví dụ như Datacamp, Dataquest, Codecademy…
Mình thấy học lập trình trên các trang này rất hiệu quả. Vì những trang dạy lập trình online này thường tổ chức bài học theo cấu trúc: một bên là hướng dẫn lý thuyết, một bên là thực hành (chia đôi cửa sổ màn hình máy tính) nên học đến đâu, đọc đến đâu, bạn thực hành và nhìn thấy kết quả luôn. Và học từng bước một (step by step), nên bạn sẽ nắm chắc kỹ năng lập trình hơn và nhanh hơn.
Mình biết có rất nhiều cuốn sách dạy phân tích dữ liệu với R và Python, nhưng đối với mình việc đọc sách không có hiệu quả bằng việc mình tự học và thực hành từng bước một.
Dùng phần mềm nào để học lập trình? Bạn không cần cài phần mềm nào cả, các trang mình giới thiệu ở trên đã “tích hợp” luôn trình biên dịch code vào trình duyệt, nói cho dễ hiểu, là bạn gõ đoạn code nào thì trình duyệt xử lý luôn đoạn code đó, rất tiện lợi và nhanh chóng. Hai trang ưa thích của mình là Dataquest và Datacamp.
Nếu bạn muốn tập trung vào SQL thì có thể học trên trang này https://academy.vertabelo.com/ – chuyên sâu về SQL. (Trang Vertabelo thì chưa phổ biến lắm, chắc một thời gian ngắn nữa sẽ “nổi tiếng” thôi). Nói chung, chọn học trang nào thì còn tùy mục đích của bạn là học gì, R, Python hay SQL.
Dù một trang web dạy lập trình có hỗ trợ bạn tốt đến đâu cũng là không đủ, vì thế khả năng tìm kiếm thông tin trên Google là rất quan trọng. Khi bạn đi làm thì chẳng có thầy nào hướng dẫn cho bạn cả, bạn phải search, tìm hướng dẫn ở một nơi nào đó rất xa mà nếu không có Google thì khá là…tắc tịt.
Nếu bạn không thích hợp với việc tự học thì có thể tham gia một số chương trình kiểu “học nhóm” – các chương trình bootcamp.
- Ở Nhật hiện nay cách học này khá phổ biến. Bootcamp hiểu nôm na là “học cùng nhau”, học chung với người có trình độ hơn mình, có người hướng dẫn. Các chương trình bootcamp ở Nhật có thời gian trung bình là 3 tháng, với mức học phí khoảng …10.000 đô la (hic) và yêu cầu học full-time.
- Dù mức học phí đắt đỏ nhưng trải nghiệm bootcamp sẽ rất có ích cho công việc tương lai của bạn. Ngoài việc có người học chung, có người hướng dẫn cho bạn, cuối khoá bạn sẽ có một dự án (thực tế) để làm. Sau khi bạn làm xong dự án, bạn sẽ (được) giới thiệu thành quả của dự án với các công ty tuyển dụng (PR khả năng làm việc của mình luôn), để nhanh chóng tìm kiếm cơ việc làm ngay sau kết thúc khóa học. Cũng có chương trình bootcamp học part-time, tức là học online, trong quá trình học cũng có người hướng dẫn. Tuy nhiên mức học phí cũng không rẻ hơn là bao so với học full-time. Tóm lại: Nếu bạn có điều kiện thì rất nên tham gia các chương trình học bootcamp.
Download một số khóa học Data Analytics tốt nhất hiện nay (cập nhật bổ sung liên tục)
- Business Analysis Fundamentals
Set yourself up for success, learn the key business analysis concepts to thrive in your Business Analyst career ( 23,699 ratings/83,118 students). Link đăng ký: https://www.udemy.com/course/business-analysis-ba/
Link tải OneDrive:
- Fundamentals of Business Analysis
Get the foundation in business analysis you need to solve your organization’s biggest problems. Link đăng ký: https://www.udemy.com/course/businessanalysis/
Link tải OneDrive:
- Python for Financial Analysis and Algorithmic Trading – Bestseller
Learn numpy , pandas , matplotlib , quantopian , finance , and more for algorithmic trading with Python! Link đăng ký: https://www.udemy.com/course/python-for-finance-and-trading-algorithms/ Link tải OneDrive:
- SAP ABAP Programming For Beginners – Online Training – Bestseller
Learn SAP ABAP Programming With Peter Moxon. Help Study For Certification – Life Time Access + Updates! Link tải: https://www.udemy.com/course/sap-abap-programming-for-beginners
Link tải OneDrive:
- Lynda-The Data Science of Marketing
- Lynda- Customer Insights and Consumer Analytics for Organizations Tools and Analysis
Link tải:
- Learning Python for Data Analysis and Visualization -Bestseller
Learn python and how to use it to analyze,visualize and present data. Includes tons of sample code and hours of video! Link đăng ký: https://www.udemy.com/course/learning-python-for-data-analysis-and-visualization/
Link tải OneDrive:
- Một số ebook hay (Amazon Kindle) về phân tích dữ liệu:
- Business Analysis and Valuation Using Financial Statements, Text and Cases (with Thomson Analytics Printed Access Card) 5th Edition
- Discovering Statistics Using IBM SPSS Statistics
- IBM SPSS Statistics 26 Step by Step A Simple Guide and Reference 16th Edition
- IBM SPSS Tips and Tricks to Learn and Study Statistics using IBM SPSS from A-Z
- Python for Data Analysis Data Wrangling with Pandas, NumPy, and IPython by Wes McKinney
- Structural Equation Modelling Application for Research and Practice (with AMOS and R) (Studies in Systems, Decision and Control Book 285) 1st ed. 2020 Ed
- Statistical Data Analysis – 1 Step by Step Guide to SPSS & MINITAB
- The PMI Guide to Business Analysis
Link tải tất cả ebook trên (OneDrive):
Nếu những khóa học trên đây chưa phù hợp với bạn, bạn có thể yêu cầu ở dưới phần bình luận bài viết này nhé, mình sẽ bổ sung thêm các khóa học phân tích dữ liệu theo thời gian. Link tải là link download OneDrive, hoặc Google Drive để các bạn có thể tải về nhanh nhất và dễ nhất.
Nếu bạn cần sử dụng tài khoản Datacamp, Dataquest… mời bạn xem các gói combo premium tại đây.
- Share CrocoBlock key trọn đời Download Crocoblock Free
- Cung cấp tài khoản nghe nhạc đỉnh cao Tidal Hifi – chất lượng âm thanh Master cho anh em mê nhạc.
- Thủ thuật cài bài hát yêu thích làm nhạc chuông cực nhanh cho iPhone Thủ thuật
- Chia sẽ khóa học KT City 2021 full tất cả các khóa
- Hướng dẫn sửa lỗi không xuống dòng được trong Excel nhanh chóng – Thegioididong.com
- Nằm mơ thấy mình bị rượt đuổi là điềm báo gì? Nên đánh con gì?
- Folder Lock 7.8.0 – Phần mềm khóa folder, bảo vệ dữ liệu miễn phí