Trước khi chúng ta học cách thực hiện hồi quy đa biến trong Excel, điều quan trọng là phải có một sự bổ sung về hồi quy nói chung và hồi quy đa biến nói riêng.
Một trong những điểm nổi bật của trí thông minh con người là khả năng nhận biết các mô hình xung quanh chúng ta. Đó là điều khiến chúng ta nhận ra khi nào hai hoặc nhiều thứ có vẻ kết nối với nhau và khi một thứ có thể là nguyên nhân hoặc kết quả của một thứ khác.
Hồi quy đa biến trong Excel
Ví dụ: giả sử bạn quyết định thu thập dữ liệu về nhiệt độ trung bình và lượng mưa trung bình ở một địa điểm cụ thể trong cả năm, thu thập dữ liệu mỗi ngày. Sau đó, bạn vẽ dữ liệu về nhiệt độ và lượng mưa trung bình trên một tờ giấy biểu đồ. Bạn có thể vẽ biểu đồ nhiệt độ trung bình trên trục x và số liệu lượng mưa trung bình trên trục y. Mỗi dấu chấm trên biểu đồ phân tán này sẽ có tọa độ: tọa độ x và tọa độ y. Các tọa độ này sẽ định vị nó ở một vị trí đặc biệt trên biểu đồ.
Khi bạn vẽ các dấu chấm, bạn có thể bắt đầu thấy một hình mẫu xuất hiện. Có vẻ như - với nhiệt độ trung bình ngày càng tăng - thì lượng mưa trung bình ở vị trí bạn đang thu thập dữ liệu tăng lên. Về mặt kỹ thuật, hai phần dữ liệu bạn đang thu thập được gọi là biến. Trong trường hợp này, nhiệt độ trung bình là biến độc lập trong khi lượng mưa trung bình là biến phụ thuộc.
Khi bạn nhận thấy rằng hai biến được kết nối với nhau, chúng tôi nói rằng chúng tương quan. Mối tương quan có thể có nhiều dạng. Nếu một biến số tăng trong khi biến số kia giảm xuống, thì đó là mối tương quan âm. Nếu một biến tăng song song với biến kia, thì đó là một mối tương quan thuận. Nếu dường như không có bất kỳ xu hướng rõ ràng nào trong các biến, thì chúng tôi nói rằng không có mối tương quan.
Dữ liệu và Tương quan
Một mối tương quan thuận hoàn hảo được cho một giá trị là +1 trong khi mối tương quan âm hoàn hảo được cho một giá trị là -1. 0, ở giữa hai giá trị này, không thể hiện mối tương quan nào cả. Do đó, dữ liệu có thể nhận giá trị tương quan ở bất kỳ đâu trong phạm vi đó. Giá trị chính xác của mối tương quan đó được gọi là hệ số tương quan, được tính bằng công thức thống kê đặc biệt tồn tại trong danh sách hàm Excel của bạn.
Lưu ý rằng các nhà thống kê thích phân biệt giữa tương quan và nhân quả. Chỉ vì hai điều tương quan không có nghĩa là chúng có mối quan hệ nhân quả. Trong ví dụ của chúng tôi ở trên, thực tế là sự gia tăng nhiệt độ trung bình tương ứng với sự gia tăng lượng mưa trung bình không có nghĩa là cái này gây ra cái kia. Nó chỉ có thể là một yếu tố ẩn thứ ba gây ra cả hai.
Trong trường hợp này, các nhà khí tượng học đều biết rằng sự gia tăng độ ẩm dẫn đến sự gia tăng cả nhiệt độ cảm nhận và lượng mưa. Đó là lý do tại sao điều quan trọng là phải hiểu sự phân biệt. Lập bản đồ các mối tương quan cho bạn thấy nơi các mẫu tồn tại; để nói rằng nó cho bạn thấy nguyên nhân dẫn đến những gì sẽ vượt quá sự ngắn gọn của nó.
Bạn có thể không cảm thấy vui khi có một âm mưu phân tán. Có lẽ có một dòng thông qua dữ liệu cho thấy mối quan hệ trông như thế nào sẽ dễ hiểu hơn. Những gì bạn đang tìm kiếm là dòng hồi quy hoặc dòng phù hợp nhất với dữ liệu bạn có trước bạn. Điều này liên quan đến việc sử dụng một công thức hồi quy sử dụng hệ số tương quan để tìm đường hồi quy tốt nhất.
Một và nhiều biến
Niềm vui không kết thúc ở đó. Các công thức trên dành cho một biến độc lập và một biến phụ thuộc. Tuy nhiên, như chúng ta đã thảo luận ở trên, đôi khi có thể có nhiều hơn một biến độc lập trong phương trình.
Ví dụ, chúng tôi đã chỉ ra rằng chỉ vẽ biểu đồ nhiệt độ trung bình so với lượng mưa trung bình không đưa ra bức tranh hoàn chỉnh. Độ ẩm trung bình là một biến số độc lập khác ảnh hưởng đến cả nhiệt độ trung bình và lượng mưa trung bình. Sẽ không tuyệt nếu có một cách nào đó chúng ta có thể vẽ biểu đồ lượng mưa trung bình dưới dạng một biến phụ thuộc so với hai biến độc lập là lượng mưa trung bình và độ ẩm trung bình?
Hóa ra, đó chính xác là tất cả những gì về hồi quy đa biến. Nó cho phép bạn liên hệ một biến phụ thuộc duy nhất với nhiều biến độc lập mà bạn đã đo lường và thu thập dữ liệu.
Phân tích hồi quy đa biến
Hồi quy đa biến là một dạng phân tích dữ liệu rất mạnh mẽ và chính xác hơn khi áp dụng vào thế giới thực. Đặc biệt, trong thế giới kinh doanh, các tình huống hiếm khi bị ảnh hưởng bởi một yếu tố duy nhất. Thông thường, có rất nhiều yếu tố phối hợp với nhau để tạo ra kết quả. Khi bạn thu thập dữ liệu về các nhóm điều kiện nhất định, loại phân tích dữ liệu này sẽ cho phép bạn dự đoán dữ liệu trong các điều kiện liên quan.
Với sức mạnh của hồi quy đa biến, bạn sẽ có thể hiểu rõ hơn về thị trường của mình và những khách hàng tồn tại trong đó.
Phân tích hồi quy trong Excel
Trước khi vội vàng mua phần mềm thống kê tiên tiến nhất trên thị trường, bạn sẽ rất vui khi biết rằng mình có thể thực hiện phân tích hồi quy trong Excel.
Khởi chạy Excel
Để bắt đầu phân tích đa biến trong Excel, khởi chạy Microsoft Excel. Nhấp chuột trên tab có nhãn "Tập tin" và sau đó nhấp chuột trên nút có nhãn "Tùy chọn." Một hộp thoại sẽ mở ra.
Bấm vào các tùy chọn
Ở phía bên trái của hộp thoại là một danh sách với các tùy chọn. Nhấp chuột trên các tùy chọn được gắn nhãn “Thêm vào." Bạn sẽ có thể thấy Phần bổ trợ Ứng dụng. Trong danh sách các phần bổ trợ không hoạt động, bạn sẽ thấy một mục có nhãn “Phân tích ToolPak.”Nhấp chuột trên đó, sau đó nhấp chuột trình đơn thả xuống “Phần bổ trợ Excel.”Nhấp chuột trên nút có nhãn "Đi" ở dưới cùng và một hộp thoại khác có nhãn "Thêm vào"sẽ xuất hiện.
Kiểm tra hộp
Phía trước tùy chọn có nhãn “Công cụ phân tích” là một hộp kiểm. Nhấp chuột trên đó và sau đó nhấp chuột trên nút ở bên phải của hộp thoại có nhãn "ĐỒNG Ý." Thao tác này sẽ bật tùy chọn bạn vừa chọn.
Thực hiện hồi quy
Bây giờ đã đến lúc thực hiện hồi quy. Các cột của bạn sẽ cần có tiêu đề, bạn có thể nhập vào hàng 1. Dữ liệu nằm dưới tiêu đề. Có một cột cụ thể cho biến phụ thuộc của bạn. Nó phải là cột đầu tiên hoặc cột cuối cùng. Các biến độc lập có thể điền vào các cột khác và phải theo thứ tự liên tiếp.
Tab dữ liệu
Trên dải băng, nhấp chuột trên tab có nhãn "Dữ liệu." Trong nhóm có nhãn "Phân tích" nhấp chuột trên mặt hàng có nhãn "Phân tích dữ liệu." Một hộp thoại sẽ được khởi chạy.
hồi quy
bên trong Công cụ phân tích trong hộp thoại, tìm Hồi quy và nhấp vào nó, sau đó nhấp chuột trên "ĐỒNG Ý."
Biến phụ thuộc
Bây giờ, hãy nhập vị trí của phạm vi ô có biến phụ thuộc của bạn vào trường có nhãn “Phạm vi Y đầu vào.”
Biến độc lập
Bây giờ, hãy nhập vị trí của phạm vi ô có biến độc lập của bạn vào trường có nhãn “Phạm vi đầu vào X.”
Kiểm tra hộp
Để đảm bảo rằng Excel biết rằng hàng đầu tiên không có gì ngoài nhãn_, nhấp_ vào hộp kiểm có nhãn "Nhãn."
Nhấp vào Phạm vi đầu ra
Trong phần có nhãn Tùy chọn đầu ra, có một nút radio được gắn nhãn "Phạm vi đầu ra."Nhấp chuột trên đó và nhập một phạm vi cho dữ liệu của bạn trong lần đầu tiên để xác định vị trí đầu ra của phân tích hồi quy sẽ xuất hiện. Trong trường hợp bạn muốn kết quả của mình xuất hiện trong một trang tính riêng biệt, nhấp chuột trên nút radio có nhãn “Bảng tính Ply.” Nếu bạn muốn chúng hoàn toàn trong một tệp mới, nhấp chuột trên nút radio có nhãn “Sổ làm việc mới.”
Phần dư
Có một phần của hộp thoại hồi quy có nhãn "Phần còn lại." Đây là những tóm tắt về kết quả từ phân tích của bạn để xem xét các kết quả theo từng trường hợp. Họ so sánh dự đoán với kết quả thực tế. Phần dư được Chuẩn hóa sẽ lấy độ lệch chuẩn của Phần dư của bạn và sửa nó thành 1.
Nhấp chuột trên hộp kiểm trên tùy chọn có nhãn "Âm mưu," và kết quả của bạn sẽ được vẽ biểu đồ. Nếu bạn chọn “Lô đất còn lại” sau đó chỉ các phần dư sẽ được vẽ đồ thị. Nếu bạn chọn “Lô phù hợp đường thẳng,” thì dự đoán sẽ được vẽ dựa trên kết quả thực tế. Nhấp chuột trên "ĐỒNG Ý," và hồi quy của bạn sẽ bắt đầu xử lý. Bạn có thể xem kết quả sau đó ở vị trí mà bạn đã chỉ định trước đó.