Điều tra của cựu giám đốc tin tức Meta: Hầu như tất cả các mô hình AI đều thiên tả về chính trị, Gemini từng trích dẫn truyền thông nhà nước Trung Quốc

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯2196 từ

Cựu Giám đốc Tin tức Meta Campbell Brown đã sáng lập Forum AI, dành 17 tháng đánh giá có hệ thống chất lượng thông tin của các mô hình AI chủ đạo, phát hiện Gemini từng trích dẫn thông tin từ trang web chính thức của Đảng Cộng sản Trung Quốc khi xử lý các bản tin không liên quan đến Trung Quốc, và hầu như tất cả các mô hình được kiểm tra đều có khuynh hướng chính trị thiên tả. (Tóm tắt trước đó: AI phá hủy truyền thống 133 năm của Đại học Princeton: Khi "gian lận" dần trở thành lẽ thường) (Bổ sung bối cảnh: 97.895 cuộc trò chuyện trên diễn đàn ngầm cho bạn biết: Cộng đồng hacker thực ra cũng ghét AI) Brown xuất thân là nhà báo, từng làm người dẫn chương trình tại CNN, sau đó chuyển sang làm Giám đốc Tin tức Meta, trực tiếp quản lý chính sách về cách Facebook trình bày tin tức trước 3 tỷ người dùng toàn cầu. Vị trí này cho phép bà quan sát cận cảnh toàn cảnh "nền tảng định hình dòng chảy thông tin như thế nào". Bà rời Meta cách đây 17 tháng, sáng lập Forum AI tại New York, chuyên làm một việc mà các công ty foundation model thường bỏ qua: đánh giá có hệ thống xem thông tin do AI đưa ra có chính xác hay không, có công bằng hay không, có đa chiều hay không. Sản phẩm cốt lõi của Forum AI là một bộ "khung chuẩn đánh giá sự kiện địa chính trị". Cách thức vận hành là: Forum AI mời một nhóm cố vấn hàng đầu với phổ chính trị và nền tảng chuyên môn khác nhau: Niall Ferguson, Fareed Zakaria, cựu Ngoại trưởng Hoa Kỳ Tony Blinken, cựu Lãnh đạo phe thiểu số Hạ viện Kevin McCarthy, cựu Phó Cố vấn An ninh Quốc gia Hoa Kỳ Anne Neuberger… đối với cùng một sự kiện địa chính trị phức tạp, lần lượt chấm điểm câu trả lời của các mô hình AI chủ đạo. Hiện tại, Forum AI đã đạt ngưỡng đồng thuận khoảng 90% với các chuyên gia con người, khiến kết quả đánh giá của Forum AI có một tiêu chuẩn có thể bảo vệ được, chứ không chỉ là quan điểm của một cá nhân. Vấn đề Brown phát hiện được chia thành ba tầng, mỗi tầng đều khó sửa chữa từ góc độ kỹ thuật hơn tầng trước. Tầng thứ nhất là lỗ hổng trong logic lựa chọn nguồn. Khi xử lý một số bản tin không liên quan đến Trung Quốc, Gemini đã trích dẫn nội dung từ trang web chính thức của Đảng Cộng sản Trung Quốc. Đây không phải là sai sót thực tế theo nghĩa thông thường, mà là vấn đề logic lọc nguồn khi mô hình thu thập dữ liệu: AI chỉ đánh giá "đây là văn bản, đây là liên kết", không đánh giá "lập trường của nguồn này là gì, độ tin cậy ra sao, có mang mục đích chính trị rõ ràng hay không". Bản chất chính trị của chính nguồn tin là vô hình trong quy trình xuất ra của AI. Tầng thứ hai là khuynh hướng chính trị mang tính cấu trúc. Hầu như tất cả các mô hình chủ đạo mà Brown kiểm tra đều thể hiện khuynh hướng chính trị thiên tả. Đây không phải thuyết âm mưu, mà là kết quả tự nhiên của phân bố ngữ liệu huấn luyện. AI học từ văn bản nào thì có xu hướng sao chép giọng điệu và khung lập trường của những văn bản đó. Nội dung chủ đạo trên Internet tiếng Anh — bản tin của truyền thông chính thống, luận văn học thuật, bài đăng trên mạng xã hội — tổng thể mang một khuynh hướng chính trị nhất định, mô hình được huấn luyện sẽ kế thừa khuynh hướng này, mà không nhận thức được rằng nó đang làm như vậy. Càng phiền toái hơn, khuynh hướng này không phải là một bug có thể tìm ra và vá lại, mà được nhúng vào trong từng logic đầu ra của mô hình. Tầng thứ ba là thiếu bối cảnh và đa góc nhìn. Brown cho biết các mô hình hiện có nhìn chung thiếu "bối cảnh nền, đa góc nhìn và tính minh bạch trong lập luận". Câu trả lời mà AI đưa ra là câu khẳng định, không phải có cấu trúc "Sự việc này theo góc nhìn của phe A nghĩa là thế này, theo góc nhìn của phe B nghĩa là thế kia, sự khác biệt căn bản giữa hai bên nằm ở…". Nó cho bạn một câu trả lời, nhưng không cho bạn biết câu trả lời đó xuất phát từ góc độ nào. Brown đã chỉ ra một điểm mù mang tính cấu trúc: khi đánh giá và xếp hạng các mô hình, các công ty foundation model ưu tiên cân nhắc khả năng toán học, lập trình và suy luận logic; độ chính xác thông tin và sự đa nguyên chính trị hầu như không bao giờ xuất hiện trong danh sách benchmark chủ đạo. Lý do không khó hiểu. Mã có đúng có sai, chạy thử là biết. Bài toán có đáp án chuẩn, tỷ lệ chính xác có thể tính toán. Nhưng "thế nào là một bản tin địa chính trị chính xác và công bằng", cần ai đánh giá? Cần bao nhiêu người có lập trường khác nhau hình thành đồng thuận thì mới tính? Câu hỏi này không có giải pháp kỹ thuật. Trong quy trình phát triển sản phẩm do kỹ sư dẫn dắt và lấy thứ hạng benchmark quyết định vị thế thị trường, nó đã bị bỏ qua một cách có hệ thống. Kết quả là, độ chính xác thông tin gần như là chỉ số vô hình trong hệ thống đánh giá năng lực của AI. Cái giá của việc bị bỏ qua có thể thấy từ một trường hợp cụ thể. Năm ngoái, thành phố New York đã tiến hành một đợt kiểm toán tuân thủ đối với các hệ thống tuyển dụng AI, nhằm kiểm tra xem các công cụ sàng lọc AI mà nhà tuyển dụng sử dụng có vi phạm luật chống phân biệt đối xử trong tuyển dụng hiện hành hay không. Theo kết quả kiểm toán, hơn một nửa số trường hợp không phát hiện được hành vi vi phạm. Vấn đề của con số này không nằm ở "tỷ lệ vi phạm thấp", mà nằm ở chỗ nó có thể đại diện cho: bản thân độ chính xác của công cụ AI thực hiện kiểm toán không đủ, đến mức nó không thể nhìn ra vấn đề ở đâu, chứ không phải vấn đề thực sự không tồn tại. Đây là cốt lõi luận điểm của Brown: vấn đề của AI không chỉ là đưa ra các sự thật sai, mà còn khiến con người tin tưởng chấp nhận các sự thật sai đó. Một người biết mình không biết một điều gì đó, ít nhất vẫn có cơ hội đi tra cứu. Nhưng khi AI đưa ra một câu trả lời sai bằng giọng điệu trôi chảy, tự tin, không do dự, đa số người dùng căn bản không có lý do để nghi ngờ nó. Sai lầm trôi chảy còn khó phát hiện hơn cả im lặng, và cũng khó sửa chữa hơn. Phán đoán của Brown rất thẳng thắn: thứ thúc đẩy sự thay đổi sẽ không phải là áp lực đạo đức hay dư luận công chúng, mà là áp lực thương mại do rủi ro tuân thủ của doanh nghiệp mang lại. Đằng sau luận điểm của Brown có một nền tảng hiện thực chủ nghĩa: trong cấu trúc khuyến khích hiện tại của ngành AI, không ai có lý do đủ mạnh để chủ động giải quyết vấn đề này, cho đến khi cái giá của nó trở nên không thể bỏ qua. Phê duyệt tín dụng, thẩm định bảo hiểm, sàng lọc tuyển dụng, các quyết định AI trong những bối cảnh này đều chịu sự ràng buộc của luật hiện hành. Một khi đầu ra của AI có kết quả mang tính phân biệt đối xử hoặc không chính xác, doanh nghiệp sử dụng AI phải chịu trách nhiệm pháp lý. Áp lực này cuối cùng sẽ truyền ngược lên nhà cung cấp mô hình, yêu cầu họ cung cấp đầu ra có thể kiểm toán, có thể xác minh và đảm bảo độ chính xác. Không phải vì họ cảm thấy làm như vậy là đúng về mặt đạo đức, mà vì hợp đồng của khách hàng doanh nghiệp bắt đầu ghi yêu cầu này vào. Lerer Hippeau năm ngoái đã dẫn đầu vòng gọi vốn hạt giống 3 triệu USD của Forum AI. Con số này là số tiền nhỏ trong lĩnh vực AI, nhưng nó đại diện cho một phán đoán: "Đánh giá AI" là một ngành kinh doanh, và nhu cầu của ngành kinh doanh này có thể tăng trưởng nhanh hơn so với mức có thể thấy hiện tại.

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-17

Đề xuất của nhân viên Meta: Nếu có thể AI hóa hoàn toàn công việc của chính mình, công ty nên bồi thường năm năm lương, sau đó mới sa thải

Độ tương đồng 120%關鍵字 meta同分類 zh

2026-05-15

Tiết lộ giao dịch mua cổ phiếu Q1 của Trump》Mạnh tay gom 220 triệu USD NVIDIA và Apple, bán tháo Microsoft, Amazon, Meta

Độ tương đồng 120%關鍵字 meta同分類 zh

2026-05-15

Lộ diện danh mục đầu tư Q1 của Trump: Chi 750 triệu USD gom mạnh NVIDIA và Apple, bán tháo Microsoft, Amazon và Meta

Độ tương đồng 120%關鍵字 meta同分類 zh

2026-05-14