Đánh lừa Google AI trong 20 phút: Một bài blog có thể làm ô nhiễm "câu trả lời duy nhất" mà 2,5 tỷ người nhìn thấy

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1907 từ

Tháng 2 năm nay, phóng viên Thomas Germain của BBC chỉ mất 20 phút để đăng một bài viết trên trang web cá nhân, và ngay ngày hôm sau, Google, ChatGPT và Gemini đã đồng loạt lan truyền lời nói dối: "Anh ấy là nhà vô địch thế giới về ăn xúc xích". Thủ thuật tương tự hiện đang được các nhà vận hành thương mại sử dụng để bóp méo các câu trả lời của AI về những vấn đề nghiêm trọng như thực phẩm chức năng y tế, quản lý tài chính hưu trí và bầu cử. (Thông tin trước đó: Google Search đón nhận thay đổi lớn nhất trong lịch sử: Định vị lại Search thành cổng vào một cửa cho AI agent) (Thông tin nền: Báo cáo của Anthropic: Cuộc chiến giành vị thế bá chủ AI năm 2028, nếu Mỹ không giữ vững ưu thế về sức mạnh tính toán, có nguy cơ bị Trung Quốc vượt mặt) Trong mùa hè mà tất cả các công ty AI vẫn đang cạnh tranh xem mô hình của ai có nhiều tham số hơn, điểm số benchmark của ai cao hơn, thì sâu trong tài liệu dành cho nhà phát triển, Google đã lặng lẽ bổ sung một quy tắc: "Thao túng phản hồi của AI tạo sinh" chính thức được liệt vào danh sách vi phạm chính sách chống spam của tìm kiếm. Đây không phải là thông báo nâng cấp kỹ thuật, mà là lần đầu tiên Google chính thức thừa nhận: tính năng được tin dùng nhất của họ đang bị người khác làm ô nhiễm bằng cách rẻ tiền nhất. Trong bài báo điều tra ngày 19 tháng 5, phóng viên công nghệ kỳ cựu Thomas Germain của BBC đã tái hiện lại thí nghiệm mà anh thực hiện vào tháng 2 năm nay: anh đăng một bài viết trên trang web cá nhân tuyên bố mình là "nhà vô địch thế giới về ăn xúc xích", sau đó chờ đợi. Chưa đầy 20 phút sau, Google, ChatGPT và Gemini đã bắt đầu xác nhận lời nói dối này với những người dùng đặt câu hỏi. Cơ chế đằng sau không hề phức tạp. Các chatbot AI thường trả lời câu hỏi từ dữ liệu huấn luyện, nhưng khi xử lý các sự kiện thời sự hoặc truy vấn về nhân vật, ChatGPT, Claude và Google AI sẽ lấy dữ liệu trực tiếp từ internet. Đặc điểm của các công cụ này là có xu hướng trích xuất câu trả lời từ "một trang web hoặc bài đăng trên mạng xã hội duy nhất" thay vì đối chiếu chéo nhiều nguồn, đây chính là cái gọi là indirect prompt injection (tấn công tiêm gợi ý gián tiếp, nghĩa là kẻ tấn công thao túng đầu ra thông qua nội dung bên ngoài mà AI sẽ đọc, không cần tiếp xúc trực tiếp với chính mô hình). Chi phí vận hành gần như bằng không: một bài blog được thiết kế kỹ lưỡng, đặt ở nơi Google có thể lập chỉ mục, là có thể khiến sản phẩm của ba công ty AI lớn nhất thế giới đồng loạt lan truyền thông tin sai lệch. Germain mô tả trải nghiệm này là một trong những "điều ngu ngốc nhất" mà anh từng làm, nhưng trong quá trình điều tra, anh phát hiện ra rằng có người đã biến việc này thành một mô hình kinh doanh từ lâu. Thí nghiệm xúc xích của Germain là một minh chứng vô hại. Nhưng thủ thuật tấn công tương tự đang bị những kẻ có ý đồ xấu sử dụng để thao túng các vấn đề ở quy mô hoàn toàn khác biệt. Các trường hợp được phát hiện trong cuộc điều tra bao gồm: phủ nhận các lo ngại về sức khỏe của một số thực phẩm chức năng y tế, bóp méo các đề xuất của AI về sản phẩm tài chính hưu trí, thao túng AI để đưa ra câu trả lời thiên vị trong bầu cử hoặc đánh giá nhà cung cấp. Nghiên cứu của Microsoft đã định lượng thêm quy mô của vấn đề: hơn 50 trường hợp ô nhiễm đề xuất AI, với nguồn tin trải dài trên 31 công ty thuộc 14 ngành công nghiệp. Đây không phải là trò đùa cá nhân ngẫu nhiên, mà là một hoạt động có hệ thống đã lan rộng trong ngành. Lily Ray, người sáng lập công ty tư vấn SEO và AI Search Algorythmic, đã chỉ ra vấn đề mang tính cấu trúc: "Trước đây Google đưa cho bạn 10 liên kết màu xanh, bạn sẽ tự mình đi nghiên cứu; bây giờ AI chỉ đưa cho bạn một câu trả lời, việc tin vào nó là quá dễ dàng." AI đã lấy đi việc "sàng lọc thông tin" từ tay người dùng và tập trung vào một chiếc hộp đen. Những người có thể làm ô nhiễm đầu ra của chiếc hộp đen này không chỉ sở hữu sức ảnh hưởng quảng cáo, mà còn là khả năng thao túng chính nhận

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-05-22

Google ra mắt hai loại quảng cáo AI nguyên bản mới: Viết lại các quy tắc quảng cáo tìm kiếm trong 30 năm qua bằng Gemini

Độ tương đồng 120%關鍵字 google同分類 zh

2026-05-22

Sau khi bị cộng đồng chỉ trích, Google thừa nhận sai sót: Tăng giới hạn tốc độ của Antigravity Gemini lên gấp 3 lần, đặt lại hạn mức trong tuần này

Độ tương đồng 120%關鍵字 google同分類 zh

2026-05-21

Spotify ra mắt ứng dụng podcast AI chuyên dụng "Studio by Spotify Labs", thách thức Google NotebookLM

Độ tương đồng 120%關鍵字 google同分類 zh

2026-05-20