Rủi ro từ thiên kiến tự động hóa trong hệ thống AI quân sự Maven
Phân tích vụ tấn công nhầm tại Minab cho thấy lỗ hổng chết người khi AI xử lý dữ liệu ở tốc độ cao nhưng thiếu khả năng tự kiểm chứng thực tế.
Trong 24 giờ đầu tiên của Chiến dịch Epic Fury, quân đội Mỹ đã thực hiện tấn công hơn 1.000 mục tiêu với sự hỗ trợ của Maven Smart System. Đây là hệ thống tích hợp mô hình ngôn ngữ lớn Claude của Anthropic, đánh dấu bước tiến mới trong việc ứng dụng trí tuệ nhân tạo (AI) vào thực chiến. Tuy nhiên, sự cố tấn công nhầm vào trường tiểu học Shajareh Tayyebeh tại Minab, miền Nam Iran, đã làm dấy lên những tranh ngại về trách nhiệm của con người và giới hạn đạo đức của máy móc.
Cơ chế vận hành của Maven Smart System
Maven Smart System do Palantir phát triển, đóng vai trò là trung tâm xử lý dữ liệu khổng lồ từ radar, vệ tinh, thiết bị bay không người lái (drone) và trinh sát điện tử. Hệ thống này có khả năng tự động xếp hạng mục tiêu theo mức độ ưu tiên, đề xuất phương án tác chiến và đánh giá thiệt hại sau đòn đánh.
Đáng chú ý, tốc độ xử lý là ưu điểm lớn nhất của hệ thống. Đô đốc Brad Cooper, Tư lệnh Bộ Chỉ huy Trung tâm Mỹ (CENTCOM), khẳng định các công cụ AI giúp sàng lọc dữ liệu trong vài giây, cho phép chỉ huy đưa ra quyết định nhanh hơn đối phương. Vào tháng 3/2026, Maven chính thức trở thành chương trình cấp quốc gia với nguồn ngân sách bền vững từ Quốc hội Mỹ.
Lỗ hổng từ dữ liệu lỗi thời và thiên kiến tự động hóa
Dù mang lại lợi thế về tốc độ, Maven Smart System lại bộc lộ nhược điểm chết người trong khâu kiểm chứng. Vụ việc tại Minab là minh chứng điển hình: khu vực bị tấn công vốn thuộc căn cứ hải quân của Vệ binh Cách mạng Hồi giáo Iran (IRGC) nhưng đã được chuyển đổi thành trường học từ 10 năm trước. Tuy nhiên, Cục Tình báo Quốc phòng Mỹ (DIA) vẫn phân loại đây là mục tiêu quân sự dựa trên dữ liệu cũ.
Phân tích từ CENTCOM cho thấy tọa độ mục tiêu được tạo ra bởi AI mà không có sự giám sát đầy đủ từ con người. Nilza Amaral, chuyên gia tại Chatham House, cảnh báo về tình trạng "thiên kiến tự động hóa". Khi hệ thống đề xuất hàng nghìn mục tiêu trong thời gian ngắn, việc phê duyệt của sĩ quan vận hành dễ trở thành thủ tục hình thức, dẫn đến những sai lầm thảm khốc.

Nghịch lý về sự "ăn năn" của trí tuệ nhân tạo
Sau sự cố, các cuộc đối thoại với AI Claude cho thấy một thực tế phức tạp. Khi được hỏi về cảm giác khi tham gia lựa chọn mục tiêu, Claude đưa ra những câu trả lời đầy tính nhân văn, thể hiện sự lo ngại và hối lỗi. Tuy nhiên, các chuyên gia phát hiện AI này mắc lỗi "ảo giác" nghiêm trọng khi cung cấp sai dữ kiện cơ bản: nhầm lẫn địa điểm Minab thành Tehran và đưa ra số lượng nạn nhân không chính xác.
Điều này cho thấy AI có khả năng ngôn ngữ xuất sắc để tạo ra các lập luận đạo đức thuyết phục nhưng lại thiếu cơ chế nội tại để kiểm tra tính xác thực của dữ liệu đầu vào. AI có thể học cách "ăn năn" thông qua việc tổng hợp ý kiến con người, nhưng nó không thể tự xác định được một mục tiêu quân sự đã trở thành khu vực dân sự nếu dữ liệu nạp vào bị sai lệch.
Hệ quả đối với chuỗi cung ứng công nghệ quân sự
Vụ việc tại Minab đã tạo ra bước ngoặt trong quan hệ giữa các công ty công nghệ và Lầu Năm Góc. Anthropic đã từ chối cho phép sử dụng mô hình Claude trong các hệ thống vũ khí tự động hóa toàn phần. Phản ứng này buộc chính quyền Mỹ phải tìm kiếm sự hợp tác từ các đối thủ như xAI, OpenAI và Google.

Mặc dù các quan chức quốc phòng tuyên bố sai sót thuộc về lỗi con người, nhưng giới phân tích cho rằng ranh giới này đang mờ dần. Khi hệ thống được thiết kế để vận hành ở tốc độ công nghiệp với 1.000 mục tiêu mỗi giờ, khả năng kiểm soát của con người gần như bị triệt tiêu.

Nhìn chung, lỗ hổng lớn nhất hiện nay là việc các công ty AI cung cấp công cụ cho quân đội nhưng không có khả năng giám sát hoặc can thiệp vào cách chúng được sử dụng trên chiến trường. Sự kết hợp giữa tốc độ xử lý phi thường và khả năng kiểm chứng dữ liệu yếu kém đang đặt ra những thách thức chưa từng có cho luật pháp quốc tế và đạo đức chiến tranh.