Tin tức và phân tích của tất cả các thiết bị di động

Kỹ thuật hỗn loạn đang gia tăng là gì?

Kỹ thuật hỗn loạn là một chiến lược kỹ thuật nhằm ngăn chặn sự hỗn loạn mà hệ thống sẽ gặp phải trong trường hợp hệ thống phần mềm gặp sự cố, nghĩa là làm cho hệ thống bền hơn và đáng tin cậy hơn.

Làm thế nào để tạo ra phần mềm đáng tin cậy? Gần đây, số lượng chương trình không thể hoạt động ngày càng gia tăng đến mức mọi người chắc chắn bắt đầu tìm kiếm câu trả lời cho câu hỏi này. lỗ hổng, sự cố, lỗi, rò rỉ dữ liệu; chúng đã chiếm một vị trí trong cuộc sống hàng ngày của chúng ta đến mức chúng không còn thu hút được sự chú ý nữa.

Các công cụ hiện có như kiểm tra đơn vị, giám sát hiệu suất ứng dụng hoạt động ở một mức độ nào đó, nhưng rõ ràng chúng không cung cấp thuốc chữa bách bệnh. Ngược lại, có một phong trào đang hình thành xung quanh một lĩnh vực mới được gọi là ‘kỹ thuật hỗn loạn’, được thiết kế để tối đa hóa chất lượng và độ tin cậy của các dịch vụ được cung cấp.

Kolton Andrus, một trong những người truyền bá phong trào này, là giám đốc của Gremlin, một công ty kinh doanh cung cấp các dịch vụ kỹ thuật hỗn loạn. Andrus, người cũng là người sáng lập công ty, trước đây Amazon và với các nhóm phần mềm tại Netflix trong nhiều năm, ông đã truyền lại những gì có vẻ là nguyên tắc của kỹ thuật hỗn loạn ngày nay.

Phương pháp kỹ thuật hỗn loạn, có khái niệm đơn giản, đặt ra những thách thức nghiêm trọng trong thực tế. Các hệ thống phần mềm ngày nay rất phức tạp và có mối liên hệ chặt chẽ với nhau. Điều này làm cho một trang web trở nên sống động, chẳng hạn như với hàng trăm cơ sở dữ liệu, tệp, hình ảnh và các yêu cầu khác. Theo Andrus, có một tình huống “nhiều vụ nổ” xảy ra đối với các nhóm kỹ thuật ưa thích kiến ​​trúc microservice.

Kỹ thuật hỗn loạn giải quyết sự phức tạp của các hệ thống như vậy. Phản ứng và hiệu suất của hệ thống được quan sát bằng cách tạo hoạt ảnh cho các tình huống bất thường, hỗn loạn hoặc đổi mới trên hệ thống. Vì vậy, các hệ thống được kiểm tra một cách tổng thể. Ví dụ: điều gì xảy ra nếu máy chủ đĩa đột nhiên gặp sự cố hoặc lưu lượng truy cập mạng bị gián đoạn đột ngột do một cuộc tấn công DDoS? Hoặc nếu cả hai tình huống xảy ra cùng một lúc? Sau khi nhóm kỹ sư đã thu thập được dữ liệu liên quan, họ có thể sử dụng dữ liệu đó để thiết kế lại hệ thống sao cho bền hơn.

Tại thời điểm này, Andrus trích dẫn một trang thông tin dành riêng cho video Netflix làm ví dụ. Nếu trang web phát video ngừng hoạt động thì đương nhiên là không thể truy cập được phim. Nhưng nếu trang có dữ liệu về lượt xem không thể truy cập được thì người dùng vẫn có thể xem video. Nếu Netflix có thể biết được thành phần nào trên một trang có thể bị tắt mà không ảnh hưởng đến người dùng thì điều đó có thể làm tăng độ tin cậy cho hệ thống của họ.

Hiện tại có một trang web, cộng đồng và các sự kiện được tổ chức về kỹ thuật hỗn loạn trên toàn thế giới. Andrus nói rằng những người đầu tiên nắm bắt được các vấn đề gặp phải trong kỹ thuật hỗn loạn là các kỹ sư phải can thiệp vào cuộc khủng hoảng xảy ra vào tối thứ Sáu và không muốn đối mặt với lỗi hệ thống.

Mặc dù Gremlin mới ra mắt công chúng gần đây nhưng công ty đã công bố vào tháng 12. 7.5 đã hỗ trợ tài chính hàng triệu đô la.

Những sai sót này không phải là nguyên nhân duy nhất dẫn tới sự sụp đổ của xã hội hiện đại trong lĩnh vực phần mềm. Đồng thời, tình trạng này là do ngày càng có nhiều cộng đồng kỹ thuật chuẩn bị các thử nghiệm không thành công để tạo ra các hệ thống đáng tin cậy hơn. Nếu may mắn, hỗn loạn hơn một chút có thể giúp phần mềm của chúng tôi ổn định hơn.