Tin tức và phân tích của tất cả các thiết bị di động

Cái gì, như thế nào và tại sao [+ 5 Learning Resources]

Kiểm tra giả thuyết là một phương pháp được nhiều nhà phân tích trong khu vực tư nhân và chính phủ sử dụng để đưa ra những tuyên bố hoặc giả định hợp lý về dữ liệu dân số.

Nếu bạn đã từng xử lý hoặc nghiên cứu dữ liệu về dân số, chắc hẳn bạn đã từng sử dụng công cụ kiểm tra giả thuyết quan trọng này.

Nhiều phương pháp có thể được sử dụng để đưa ra các giả định, nhưng không phải tất cả đều chính xác hơn.

Và nếu bạn không chắc chắn về dữ liệu của mình nhưng vẫn muốn sử dụng nó thì điều đó có thể gây rủi ro cho tổ chức của bạn.

Kiểm tra giả thuyết là một chiến lược tốt để đạt được mức độ chính xác cao hơn. Ông đóng một vai trò quan trọng trong việc phân tích dân số.

Trong bài viết này, tôi sẽ thảo luận về việc kiểm tra giả thuyết là gì, nó hoạt động như thế nào, ưu điểm và trường hợp sử dụng của nó là gì.

Vì vậy, không dài dòng nữa, hãy bắt đầu!

Kiểm tra giả thuyết là gì?

Kiểm tra giả thuyết là một phương pháp suy luận thống kê mà các nhà phân tích sử dụng để kiểm tra xem dữ liệu tổng thể có sẵn có đủ hỗ trợ cho một giả thuyết nhất định hay không và rút ra các giả định từ nó.

Với phương pháp này, các nhà phân tích có thể dễ dàng đánh giá một giả thuyết và xác định mức độ chính xác của giả định đó dựa trên dữ liệu có sẵn.

Nói một cách đơn giản hơn, đó là một quy trình thử nghiệm suy luận thống kê cho phép bạn đưa ra phán quyết về dữ liệu dân số dựa trên dữ liệu mẫu được thu thập.

Nói chung, các nhà phân tích gần như không thể tìm ra một đặc tính hoặc bất kỳ tham số cụ thể nào của toàn bộ tổng thể. Nhưng với việc kiểm tra giả thuyết, bạn có thể đưa ra dự đoán sáng suốt và đưa ra quyết định dựa trên dữ liệu mẫu và độ chính xác của dữ liệu đó.

Các loại thử nghiệm giả thuyết

Các loại thử nghiệm giả thuyết khác nhau là:

  • Giả thuyết Null: Các số liệu thống kê cho thấy dữ liệu mẫu là đột ngột và không có mối tương quan giữa hai biến trong dữ liệu dữ liệu mẫu.
  • Giả thuyết thay thế: Chứng minh luận điểm ban đầu và phản đối giả thuyết khống. Đây là động lực chính của quá trình thử nghiệm vì nó cho thấy mối tương quan giữa hai biến trong dữ liệu mẫu.
  • Giả thuyết không định hướng: Loại thử nghiệm giả thuyết này đóng vai trò như một giả thuyết hai đuôi. Nó cho thấy không có hướng nào giữa hai biến trong dữ liệu mẫu và giá trị thực không giống với giá trị dự đoán.
  • Giả thuyết định hướng: Giả thuyết định hướng trình bày một số mối quan hệ giữa hai biến. Ở đây, một biến trong dữ liệu mẫu có thể ảnh hưởng đến các biến khác.
  • Giả thuyết thống kê: Giúp các nhà phân tích đánh giá liệu dữ liệu và giá trị có đáp ứng một giả thuyết cụ thể hay không. Điều này rất hữu ích khi đưa ra các nhận định và giả định về kết quả của một tham số tổng thể mẫu.

Tiếp theo, hãy thảo luận về các phương pháp kiểm tra giả thuyết.

Phương pháp kiểm định giả thuyết

Để đánh giá liệu một giả thuyết nhất định có đúng hay không, với tư cách là một nhà phân tích, bạn sẽ cần rất nhiều bằng chứng đáng tin cậy để đưa ra kết luận. Trong quá trình thử nghiệm này, các giả thuyết không và giả thuyết thay thế được thiết lập trước khi bắt đầu đánh giá.

Việc kiểm tra giả thuyết không chỉ liên quan đến một phương pháp mà còn nhiều phương pháp để đánh giá liệu dữ liệu mẫu có mang lại lợi ích hay không. Là một nhà phân tích, bạn phải xem xét dữ liệu và cỡ mẫu và chọn phương pháp thích hợp để kiểm tra các giả thuyết.

Kiểm tra tính bình thường

Đây là phương pháp kiểm tra giả thuyết tiêu chuẩn để phân tích phân bố đều đặn trong dữ liệu mẫu. Trong quá trình thử nghiệm, nó sẽ được kiểm tra xem các điểm dữ liệu được nhóm xung quanh giá trị trung bình ở dưới hay trên giá trị trung bình.

Trong bài kiểm tra thống kê này, xác suất các điểm trên hoặc dưới mức trung bình là như nhau. Một đường cong hình chuông được hình thành phân bố đều ở cả hai phía của giá trị trung bình.

thử nghiệm Z

Đây là một loại thử nghiệm giả thuyết khác được sử dụng khi dữ liệu dân số có phân phối chuẩn. Kiểm tra xem phương tiện của hai tham số tổng thể riêng biệt có khác nhau hay không khi biết phương sai của dữ liệu.

Khi phân tích dữ liệu dân số, rất có thể bạn sẽ sử dụng loại này khi cỡ mẫu dữ liệu của bạn vượt quá ba mươi. Hơn nữa, định lý giới hạn trung tâm là một lý do khác giải thích tại sao phép thử Z lại phù hợp vì định lý này phát biểu rằng khi kích thước mẫu tăng lên thì các mẫu có phân phối chuẩn.

kiểm tra T

Kiểm định giả thuyết T-Test sẽ được sử dụng khi cỡ mẫu bị hạn chế và có phân bố điển hình. Nói chung, khi cỡ mẫu nhỏ hơn 30 và bạn không biết độ lệch chuẩn của tham số thì nó chủ yếu được sử dụng.

Khi bạn thực hiện kiểm tra T, bạn đang thực hiện việc đó để tính khoảng tin cậy cho dữ liệu tổng thể cụ thể.

kiểm định chi bình phương

Kiểm tra chi bình phương là một quy trình kiểm tra giả thuyết phổ biến thường được sử dụng để đánh giá sự phù hợp và tính toàn vẹn của phân phối dữ liệu.

Nguồn: wikipedia.org

Tuy nhiên, lý do chính khiến bạn sử dụng loại giả thuyết này là để kiểm tra phương sai tổng thể so với phương sai tổng thể của một giá trị giả định hoặc đã biết. Nhiều thử nghiệm chi bình phương khác nhau được thực hiện, nhưng loại phổ biến nhất là thử nghiệm chi bình phương về phương sai và tính độc lập.

Thử nghiệm ANOVA

Viết tắt là Phân tích phương sai, đây là một phương pháp kiểm tra thống kê giúp bạn so sánh các tập dữ liệu từ hai mẫu. Tuy nhiên, nó cho phép bạn so sánh nhiều hơn hai mức trung bình cùng một lúc.

Nó cũng giải thích biến phụ thuộc và biến độc lập của dữ liệu mẫu. Việc sử dụng ANOVA khá giống với việc sử dụng Z-test và T-test, nhưng hai phương pháp sau chỉ giới hạn ở hai phương tiện.

Việc kiểm tra giả thuyết hoạt động như thế nào?

Bất kỳ nhà phân tích nào sử dụng thử nghiệm giả thuyết đều sử dụng các mẫu dữ liệu ngẫu nhiên để phân tích và đo lường. Trong quá trình thử nghiệm, dữ liệu từ một mẫu ngẫu nhiên được sử dụng để kiểm tra giả thuyết khống và giả thuyết thay thế.

Như chúng ta đã thảo luận trước đó, giả thuyết không và giả thuyết thay thế hoàn toàn loại trừ lẫn nhau và khi được kiểm tra, chỉ một trong số chúng có thể đúng.

Tuy nhiên, có những trường hợp giả thuyết không bị bác bỏ; giả thuyết thay thế không phải lúc nào cũng đúng.

Nguồn: các bước phân tích

giá trị p: Khi quá trình thử nghiệm bắt đầu, có giá trị p hoặc giá trị xác suất cho biết kết quả có quan trọng hay không. Không chỉ vậy, giá trị p còn cho thấy xác suất xảy ra sai sót trong việc bác bỏ hoặc không bác bỏ giả thuyết khống trong quá trình thử nghiệm. Giá trị p thu được là 0 hoặc 1 và sau đó được so sánh với mức ý nghĩa hoặc mức alpha.

Mức ý nghĩa ở đây xác định rủi ro có thể chấp nhận được của việc bác bỏ giả thuyết không trong quá trình thử nghiệm. Lưu ý rằng kết quả của việc kiểm tra giả thuyết có thể dẫn đến hai loại lỗi:

  • Lỗi loại 1 xảy ra khi kết quả kiểm tra bác bỏ giả thuyết không mặc dù nó đúng.
  • Lỗi gõ 2 xảy ra khi giả thuyết không được kết quả mẫu chấp nhận mặc dù nó sai.

Tất cả các giá trị khiến giả thuyết khống bị bác bỏ đều được lưu trữ trong vùng tới hạn. Và chính giá trị tới hạn sẽ phân biệt các vùng quan trọng với các vùng khác.

Các bước thực hiện kiểm tra giả thuyết

nguồn: phương tiện truyền thông

Kiểm tra giả thuyết chủ yếu bao gồm bốn bước:

  • Xác định các giả thuyết: Trong bước đầu tiên, công việc của bạn với tư cách là một nhà phân tích là xác định hai giả thuyết để chỉ một giả thuyết có thể đúng. Giả thuyết không sẽ là không có sự khác biệt về chỉ số BMI trung bình, trong khi giả thuyết thay thế sẽ là có sự khác biệt đáng kể về chỉ số BMI trung bình.
  • Kế hoạch: Trong bước tiếp theo, bạn sẽ cần thiết kế một kế hoạch phân tích về cách bạn có thể phân tích dữ liệu mẫu. Điều rất quan trọng là thực hiện một số mẫu và thu thập dữ liệu mẫu để đảm bảo dữ liệu đó nhằm mục đích kiểm tra giả thuyết của bạn.
  • Phân tích dữ liệu mẫu: Khi bạn đã quyết định cách đánh giá dữ liệu của mình, đã đến lúc bắt đầu quá trình. Bạn sẽ phải phân tích cú pháp vật lý dữ liệu mẫu để không bị dư thừa. Khi phân tích dữ liệu, hãy kiểm tra xem các mẫu có độc lập với nhau không và cả hai mẫu đều đủ lớn.
  • Tính toán số liệu thống kê kiểm tra: Trong bước này, bạn sẽ cần tính toán số liệu thống kê kiểm tra và tìm giá trị p. Giá trị p sẽ được xác định với giả định rằng giả thuyết khống là đúng.
  • Đánh giá kết quả: Bước cuối cùng, bạn sẽ phải đánh giá kết quả kiểm định giả thuyết. Tại đây, bạn sẽ quyết định nên bác bỏ giả thuyết không hay kiểm tra nó dựa trên dữ liệu mẫu.

Bây giờ chúng ta sẽ khám phá những lợi ích của việc kiểm tra giả thuyết.

Lợi ích của việc kiểm tra giả thuyết

Lợi ích của việc kiểm tra giả thuyết là:

  • Giúp phân tích sức mạnh của yêu cầu quyết định dữ liệu.
  • Là một nhà phân tích, nó cho phép bạn tạo một môi trường đáng tin cậy để quyết định dữ liệu mẫu.
  • Xác định xem dữ liệu mẫu được sử dụng để kiểm tra các giả thuyết có ý nghĩa thống kê hay không.
  • Điều này có lợi cho việc đánh giá độ tin cậy và giá trị của kết quả kiểm tra trong bất kỳ quy trình kiểm tra hệ thống nào.

Nó giúp ngoại suy dữ liệu từ giai đoạn mẫu đến tổng thể lớn hơn theo yêu cầu.

Các trường hợp sử dụng thử nghiệm giả thuyết

Kiểm tra giả thuyết được sử dụng trong nhiều lĩnh vực khác nhau để dự đoán đầy đủ tính chính xác của dữ liệu mẫu. Một số ví dụ thực tế về kiểm tra giả thuyết là:

# 1. Xét nghiệm lâm sàng

Thử nghiệm giả thuyết được sử dụng rộng rãi trong các thử nghiệm lâm sàng vì nó giúp các bác sĩ quyết định liệu một loại thuốc, phương pháp điều trị hoặc quy trình mới có hiệu quả hay không dựa trên dữ liệu mẫu.

Bác sĩ có thể nghĩ rằng việc điều trị có thể làm giảm nồng độ kali ở một số bệnh nhân. Bác sĩ có thể đo nồng độ kali của một nhóm bệnh nhân trước khi thực hiện thủ thuật và kiểm tra lại mức độ này.

Sau đó, bác sĩ đưa ra giả thuyết trong đó H0:Upo=Pre, nghĩa là mức kali sau khi điều trị vẫn giống như trước. Một giả thuyết khác chỉ ra Ha:Upo

Vì vậy, nếu giá trị p nhỏ hơn mức ý nghĩa, bác sĩ có thể kết luận rằng việc điều trị có thể làm giảm mức kali.

#2. Sản xuất

Thử nghiệm giả thuyết được sử dụng trong các cơ sở sản xuất để giúp người giám sát quyết định xem một phương pháp hoặc kỹ thuật mới có hiệu quả hay không.

Ví dụ: một số đơn vị sản xuất có thể sử dụng thử nghiệm giả thuyết để xác định xem liệu phương pháp mới có giúp họ giảm số lượng sản phẩm bị lỗi trên mỗi lô hay không. Giả sử số lượng sản phẩm bị lỗi là 300 sản phẩm mỗi đợt.

Nhà sản xuất phải xác định giá trị trung bình của tổng số sản phẩm bị lỗi sản xuất ra trước và sau khi áp dụng phương pháp. Họ có thể thực hiện kiểm tra giả thuyết và sử dụng giả thuyết H0: Upo = Prior, trong đó giá trị trung bình của các sản phẩm bị lỗi được tạo ra sau khi áp dụng phương pháp mới là giống như trước đây.

Một giả thuyết khác cho rằng HA:Upo không bằng Upbefor, nghĩa là tổng số sản phẩm lỗi tạo ra sau khi áp dụng phương pháp mới không giống nhau.

Sau khi thử nghiệm, khi giá trị p nhỏ hơn mức ý nghĩa, đơn vị sản xuất có thể kết luận rằng số lượng sản phẩm bị lỗi sản xuất ra đã thay đổi.

#3. Nông nghiệp

Thử nghiệm giả thuyết thường được sử dụng để xác định xem phân bón hay thuốc trừ sâu có làm cho cây trồng phát triển và chống chịu hay không. Các nhà sinh học có thể sử dụng các thử nghiệm để chứng minh rằng một loại cây nhất định có thể phát triển hơn 15 inch sau khi bón một loại phân bón mới.

Một nhà sinh vật học có thể bón phân trong một tháng để thu thập mẫu dữ liệu. Khi nhà sinh vật học tiến hành thí nghiệm, một trong những giả thuyết là H0 U=15 inch, điều này cho thấy phân bón không cải thiện được chiều cao trung bình của cây.

Một giả thuyết khác là HA:U > 15 inch, nghĩa là phân bón làm tăng chiều cao trung bình của cây. Sau khi kiểm tra khi giá trị p nhỏ hơn mức ý nghĩa, nhà sinh vật học hiện có thể chứng minh rằng phân bón gây ra tăng trưởng nhiều hơn trước.

Phương pháp giáo dục

# 1. Thống kê: Giới thiệu từng bước từ Udemy

Udemy cung cấp khóa học thống kê giới thiệu từng bước về số liệu thống kê bao gồm các giả thuyết kiểm tra. Khóa học này có các ví dụ và bài học từ một cựu nhà khoa học dữ liệu của Google để giúp bạn nắm vững khoảng tin cậy, kiểm tra giả thuyết, v.v.

#2. Số liệu thống kê cần thiết cho phân tích dữ liệu Udemy

Khóa học Thống kê cơ bản cho phân tích dữ liệu của Udemy này sẽ giúp bạn tìm hiểu số liệu thống kê thông qua các dự án trong thế giới thực, các hoạt động vui nhộn, kiểm tra giả thuyết, phân phối xác suất, phân tích hồi quy, v.v.

#3. Thống kê cho khoa học dữ liệu và phân tích kinh doanh

Udemy cung cấp khóa học Thống kê về Khoa học dữ liệu và Kinh doanh thông minh này để giúp bạn tìm hiểu cách kiểm tra các giả thuyết. Nó bao gồm nhiều chủ đề thống kê khác nhau, cho phép các nhà khoa học dữ liệu và nhà phân tích kinh doanh tìm hiểu và nắm vững chúng. Nó bao gồm các thống kê suy luận và mô tả cùng với phân tích hồi quy.

#4. Kiểm tra giả thuyết của Jim Frost

Cuốn sách này có sẵn trên Amazon và là hướng dẫn trực quan giúp các nhà phân tích đưa ra quyết định dựa trên dữ liệu.

Bao gồm cách hoạt động của các thử nghiệm giả thuyết, lý do bạn cần chúng, cách sử dụng hiệu quả khoảng tin cậy, giá trị p, mức ý nghĩa và nhiều chủ đề khác.

#5. Kiểm tra giả thuyết của Scott Hartshorn

Cuốn sách này độc đáo với các ví dụ trực quan và phù hợp nhất cho những người mới bắt đầu đang tìm kiếm hướng dẫn nhanh để kiểm tra giả thuyết.

Nó sẽ giới thiệu cho bạn tầm quan trọng của số liệu thống kê, các loại và cách chúng hoạt động. Nó không yêu cầu kiến ​​thức chuyên sâu về thống kê nhưng giải thích mọi thứ một cách trực quan.

Tư cuôi cung

Kiểm tra giả thuyết giúp xác nhận một giả định và sau đó tạo ra dữ liệu thống kê dựa trên đánh giá. Nó được sử dụng trong nhiều lĩnh vực, từ sản xuất và nông nghiệp đến nghiên cứu lâm sàng và CNTT. Phương pháp này không chỉ chính xác mà còn giúp bạn đưa ra quyết định dựa trên dữ liệu trong tổ chức của mình.

Sau đó kiểm tra các tài nguyên đào tạo để trở thành một nhà phân tích kinh doanh.